Popular science work
在生物學研究中,人工智能(AI)可以篩選數十萬個基因組數據點,識別出潛在治療靶點。但科學家仍不確定AI模型是如何得到這些結果的。據最新一期《自然·機器智能》雜志報道,一種名為SQUID的新系統已經出現,它能“撬開”AI模糊的內部邏輯的“黑匣子”。
SQUID全稱是“深度網絡替代定量可解釋性”,是美國冷泉港實驗室(CSHL)科學家創造的一種計算工具,旨在幫助解釋AI模型如何分析基因組。與其他分析工具相比,SQUID減少了背景噪音,可以更準確地預測基因突變的影響。
研究人員解釋說,SQUID能發揮作用的關鍵原因在于“訓練”。此次科學家對SQUID所做的訓練,是利用數十年的定量遺傳學知識來幫助人們理解這些深度神經網絡正在學習什么。
SQUID的原理是首先生成一個包含10萬多個變異DNA序列的數據庫,然后用一個名為MAVE-NN(變異效應神經網絡多重分析)的程序來分析庫中的突變及其影響。該工具讓科學家能同時進行數千個虛擬實驗,最終“釣出”預測最準確的AI算法。盡管計算機虛擬實驗無法替代真實的實驗室操作,但它們可以提供非常豐富的信息,幫助科學家理解基因組特定區域如何運作、突變會產生什么影響。
AI領域的模型數量巨大,研究人員希望SQUID能幫助科學家找到最符合他們需求的模型。例如人類基因組研究領域,SQUID可以幫助推動新發現向臨床醫療應用的轉化。