在未來人工智能(AI)將會大大改變?nèi)祟愌芯炕蚪M學和基因編輯的方式,使研究過程更快、成本更低、更準確,其中基于基因的個性化醫(yī)療預計到2023年規(guī)模將達到870億美元。到2021年,咨詢公司Frost&Sullivan預計人工智能系統(tǒng)應用于全球醫(yī)療保健業(yè)務中將產(chǎn)生67億美元的收入。
機器學習顯著發(fā)展的一個領域是基因組學,研究生物體內(nèi)完整基因組。雖然人類很關注健康,但基因測序和分析也可以成為農(nóng)業(yè)和畜牧業(yè)發(fā)展的突破口。當研究人員能夠對DNA進行測序和分析時,人工智能系統(tǒng)能夠更快、成本更低、更準確地進行測序和分析,人們可以利用人工智能對特定的基因藍圖進行觀察,從而協(xié)調(diào)該生物體的所有活動。通過這種分析,他們可以得到相關的醫(yī)療信息,未來有機體可能會受到什么疾病的影響,哪些突變可能導致不同的疾病以及如何為未來做好準備等。
基因組測序和基因編輯
由于生物體在一生中經(jīng)歷的疾病在很大程度上取決于他們的遺傳基因,因此多年來人們對基因構成有著濃厚的興趣。但是相關研究因需要評估數(shù)據(jù)的復雜性和巨大性而停滯不前。隨著人工智能和機器學習應用技術的進步,研究人員能夠通過基因組測序和基因編輯更好地解釋和處理基因組數(shù)據(jù)。
基因組序列是活生物體DNA結構單元(四種堿基:A、T、C及G)的特定順序,人類基因組由20000個基因和超過30億個堿基對組成。對基因組進行測序是了解基因組的關鍵,也是第一步。最新技術高通量測序(HTS),可以在一天內(nèi)完成DNA的測序,而這個過程在人類首次完成時花了十年時間。
當在細胞水平上改變DNA的序列時,這就是基因編輯。
個性化醫(yī)療
基因技術最令人期待的前景之一是精準或個性化醫(yī)療的發(fā)展。該領域的發(fā)展可以針對患者或一群基因相似個體實行干預措施,預計到2023年規(guī)模將達到870億美元。從歷史上看,成本和技術限制了個性化醫(yī)療的實施,但機器學習技術有助于克服這些障礙。機器可以識別遺傳數(shù)據(jù)集的基因圖譜,然后計算機模型可以預測個體患病或干預成功的幾率。
谷歌推出了一款工具DeepVariant,可以使用最新的人工智能技術將高通量測序轉化為更準確的全基因組圖像。雖然自2000年代以來科學界就開始使用這種方法,但DeepVariant能夠將小突變從隨機錯誤中區(qū)分開來。而DeepVariant的深度學習技術也非常關鍵且有效。
雖然我們現(xiàn)在可以快速讀取和測序基因,但我們幾乎無法理解它代表的內(nèi)容。加拿大初創(chuàng)公司Deep Genomics使用其AI平臺解碼基因組的含義,可以根據(jù)細胞中的DNA信息來確定個體的最佳藥物治療方式。該公司的學習軟件可以分析突變情況,并基于數(shù)十萬個突變實例的內(nèi)容來預測突變的影響。
新的癌癥病例每年高達數(shù)百萬,但化學療法和藥物效果對于不同的人并不一致。初創(chuàng)公司Sophia Genetics希望通過使用人工智能來識別基因突變,幫助醫(yī)生能夠為每個患者開出最佳的藥物治療方案。
編輯基因的潛力和風險
一些公司正致力于通過在細胞水平上改變DNA來支持基因編輯的技術。CRISPR是一種基因編輯技術,是計算機科學家和生物學家合作研發(fā)?!熬庉嫛被蚩赡軙е聜€體患病,也可能產(chǎn)生高產(chǎn)優(yōu)良作物,但也可能造成復雜的道德、品德和法律問題。大多數(shù)人都可以通過編輯突變基因來看到“改善”健康的好處,但是當我們開始“改善”人類基因時,問題就更加復雜了。
專家在基因編輯過程中努力解決的另一個問題是脫靶效應——編輯工具因為錯誤基因跟目標基因相似而進行了錯誤編輯。
人工智能和機器學習可以幫助基因編輯計劃向更準確、成本更低和操作更容易的方向發(fā)展。
未來人工智能應用于基因的技術預計將包括藥物基因組學、新生兒遺傳篩查工具以及農(nóng)業(yè)改良技術等。雖然我們無法預測未來,但有一件事可以肯定:人工智能和機器學習將加速我們對人類基因構成和其他生物體的了解。