跳到主要內容
第1821期
2025-12-05

【記者林家慶報導】新藥開發分秒必爭,誰能更快讀懂蛋白質,就能搶占先機。國立陽明交通大學生物科技學系副教授羅惟正和團隊開發出SARST2演算法,能大幅提升蛋白質分析的效率,有助加速新藥研發、改良生質能源製程等領域,該研究成果也被刊登在《自然通訊》期刊上。

蛋白質的功能取決於其立體結構,透過結構預測及分析,能理解蛋白質運作的方式、與之互動的分子類型,以及它們在不同環境中可能產生的變化。羅惟正透露,COVID-19疫情爆發時,各國能快速研製出疫苗,幕後功臣之一就是蛋白質結構預測。然而,3D結構的預測在過去是一大難題,一種蛋白質的結構常須花費數年才能以生化實驗解析完成,若用電腦預測則精準度不足40%。

諾貝爾化學獎得主瓦謝爾(左一)與團隊實體首次實體討論如何開發出更高效的蛋白質結構分析演算法。 圖/羅惟正提供

諾貝爾化學獎得主瓦謝爾(左一)與團隊實體首次實體討論如何開發出更高效的蛋白質結構分析演算法。 圖/羅惟正提供

2020年Google DeepMind開發出AI預測系統AlphaFold,能生成出可能的蛋白質結構並建置資料庫,精準度也提升到87%,使蛋白質結構資訊量巨幅提升,羅惟正與其指導教授國立清華大學生物資訊與結構生物研究所博士呂平江推出的第一代SARST,以及此前開發的其他演算法不敷使用。AlphaFold資料庫就像一座巨型圖書館,由於累積了多達2億筆結構資料,要從中找出符合需求的目標宛如大海撈針。羅惟正團隊在此背景下嘗試研發高效的演算法,幫助後續的分析篩選,他補充道:「如果Google真的把蛋白質結構全部都預測出來,那資料量將暴漲千倍。」凸顯出演算法效率的重要性。

SARST2的原理是把3D結構變成文字資訊,透過比對字串就能簡便地分析結構。羅惟正進一步解釋設計思路,它會先依照結構指標做篩選,「先排除幾乎不可能的雜魚,再從剩餘的蛋白質挑出有幫助的菁英。」此策略減少了運算時間和負擔,目前版本的SARST2只須消耗約2GB的記憶體,可把超過2億筆結構資料壓縮成0.5TB,並完成比對搜尋。團隊指出,大部分的市售電腦都足以因應這樣的效能,無須仰賴高階伺服器。

實驗室用退役的個人電腦,和無外殼的普通電風扇散熱,開發出SARTS2,資源有限卻更顯團隊的堅毅刻苦。 圖/羅惟正提供

實驗室用退役的個人電腦,和無外殼的普通電風扇散熱,開發出SARTS2,資源有限卻更顯團隊的堅毅刻苦。 圖/羅惟正提供

與大多數人對資工領域的想像不同,羅惟正的實驗室裡沒有算力強大的超級電腦和冷卻系統,他笑著說:「我們實驗室沒錢沒人,只靠破舊的個人電腦,但有時詛咒也是一種祝福。」這樣的劣勢迫使團隊設計出實驗室電腦「跑得動」的系統,反而成為SARST2的亮點,讓它能在一般個人電腦上執行運算。但是研究團隊沒有因此滿足,參與研究的陽明交大資訊及系統生物研究所碩士生翁詩玟表示,「老師的演算法一直在優化更新,我們就要重新做實驗,只為了有更好的結果。」他說明,現在的SARST2相較於剛發表時,效率約已提升兩倍。羅惟正指出,科技的飛速進步對團隊而言猶如逆水行舟,不進則退,「蛋白質資料每兩年就翻倍,所以運算效率還是不夠高,我們仍會持續優化。」

國立清華大學智慧生醫博士班學程主任楊立威提到,因AlphaFold資料相當龐大,有人質疑預測出的蛋白質是否真實存在,而SARTS2可用於快速驗證AlphaFold資料庫的真實性,比對經實驗證實存在的蛋白質後,若AlphaFold預測的蛋白質與之有很多結構相似,則有高機率真實存在。楊立威表示,台灣生物資訊領域的挑戰是投入研究的人才不足,「要同時懂生物和程式的人不好找。」但他認為在AI出現後,生物資訊領域仍充滿已知與未知,有無數具研究價值的問題值得探討。

台灣雖然資工領域人才濟濟,但同時通曉生物的學生有限,因此生物資訊領域也面臨招收人才的問題。 圖/羅惟正提供

台灣雖然資工領域人才濟濟,但同時通曉生物的學生有限,因此生物資訊領域也面臨招收人才的問題。 圖/羅惟正提供

置頂