據英國《金融時報》報道,一群頂級科學家和醫學統計學家上周五警告稱,在一些生物醫學領域使用人工智能技術會得出一些不準確的結論。
“利用機器學習技術分析大數據得出的研究結論,很多都無法獲得我的信任。”萊斯大學貝勒醫學院副教授Genevera Allen在美國科學促進會年會上警告說。
機器學習已經被用來研究科學和醫學數據與一些現象之間的關系,比如基因和疾病之間的關系。在精準醫療中,研究人員會尋找DNA相似的患者,這樣治療方案就可以針對特定的致病基因。
"許多技術被用來做預測."艾倫說,“但我從不回到‘我不知道’或‘我什么也沒發現’的結論,因為他們在設計過程中沒有考慮到這種情況?!?
她不愿意指出具體案例,但表示機器學習得到的癌癥數據的研究結論就是一個很好的例子。
“有很多情況是不能重復的?!卑瑐愓f,“一項研究中發現的集群與另一項研究中發現的集群完全不同。為什么會這樣?因為今天大部分的機器學習技術都會說,‘我發現了一個群體?!怯袝r候,如果換一種說法會更有幫助,你可以說,‘我覺得他們中的一些人真的分組了,但我不確定其他人。"
一旦機器學習發現患者的基因與疾病的特征之間存在特定的聯系,人類研究人員就可能為相應的發現提供合理的科學解釋。但這并不意味著這些發現是正確的。
艾倫說,“你總能找到一些基因被組合在一起的原因。”
直到最近,科學家們才開始意識到這個問題,這可能會導致醫學研究人員走上錯誤的道路,浪費資源來確認不可重復的結果。
艾倫和她的同事正在努力改進統計技術和機器學習技術,以便人工智能可以批評自己的數據分析,并指出一些發現是真實的概率,而不是立即相關的。
“有一種想法是專門打亂數據,看看結果是否會保持不變?!彼f。