李游將電腦上密密麻麻的符號(hào)數(shù)據(jù),運(yùn)用到新藥篩選上來。
提到程序員,人們往往瞬間聯(lián)想到格子襯衫、雙肩包、坐在電腦前敲代碼等畫面,而提到生物藥企實(shí)驗(yàn)室的工作人員,人們眼前又可能會(huì)浮現(xiàn)出白大褂、護(hù)目鏡以及一堆冰冷的實(shí)驗(yàn)器材。如果程序員與生物藥企實(shí)驗(yàn)室工作人員結(jié)合呢?很多人會(huì)覺得難以想象。
其實(shí),在成都先導(dǎo)藥物開發(fā)有限公司(以下簡稱“成都先導(dǎo)”),就有一批“程序員”活躍其中。成都先導(dǎo)有一個(gè)在生物藥企不常見的部門——“干實(shí)驗(yàn)室”,其成員幾乎全部是“程序員”。但與傳統(tǒng)意義上程序員不同的是,他們的工作主要是以成都先導(dǎo)的DNA編碼化合物庫為平臺(tái),結(jié)合生物和化學(xué)專業(yè)知識(shí),利用人工智能,高效地找到新藥研發(fā)所需的小分子化合物,從而大大減少新藥篩選的時(shí)間和成本。在這個(gè)過程中,他們也要像程序員那樣寫代碼,建立相關(guān)的數(shù)據(jù)模型。
“程序員”參與新藥研發(fā) 用AI揪出潛在匹配目標(biāo)
4月24日,記者走進(jìn)成都先導(dǎo)“干實(shí)驗(yàn)室”。與一般的實(shí)驗(yàn)室不同,這里看不見身穿白大褂的實(shí)驗(yàn)人員,沒有瓶瓶罐罐的實(shí)驗(yàn)器材,也沒有各種名稱復(fù)雜的化學(xué)試劑。辦公桌、電腦便是實(shí)驗(yàn)室的全部配備。一眼看過去,無論是工作人員的穿著還是辦公場(chǎng)地的布置,很難從中看出傳統(tǒng)生物藥企的影子。
然而,通過實(shí)驗(yàn)室工作人員李游的介紹,深藏在平凡表面背后的生物醫(yī)藥特點(diǎn)絲絲縷縷浮現(xiàn),“你眼前看到的這些電腦,就是我們的實(shí)驗(yàn)器材。”李游說,這些電腦是用來幫助實(shí)驗(yàn)室人員在新藥篩選過程中進(jìn)行數(shù)據(jù)分析的。
“我的工作就是數(shù)據(jù)分析、算法研發(fā)、大數(shù)據(jù)分析平臺(tái)搭建和應(yīng)用。”李游說,DNA編碼化合物庫新藥篩選,發(fā)現(xiàn)與相關(guān)靶點(diǎn)匹配的先導(dǎo)化合物,一般要經(jīng)過7個(gè)步驟,數(shù)據(jù)分析是其中一個(gè)步驟。“數(shù)據(jù)分析主要是結(jié)合AI,通過序列解析和大數(shù)據(jù)分析找出與靶點(diǎn)匹配的潛在小分子化合物。”
李游打了一個(gè)比方——“每個(gè)小分子化合物有一個(gè)DNA標(biāo)記。打個(gè)比方,這里有一盒糖紙包裝統(tǒng)一、但口味不同的糖果。在沒有品嘗前,你并不知道隨手拿到的糖果會(huì)是什么口味。但如果給不同口味的糖果設(shè)計(jì)帶有身份標(biāo)記的二維碼,吃之前先掃一掃二維碼,便能找到你想吃的那顆糖果。”在這個(gè)比喻里,糖果便是小分子化合物,二維碼是DNA標(biāo)記,掃碼的過程就是實(shí)驗(yàn)室“程序員”進(jìn)行數(shù)據(jù)解析的過程。李游說,成都先導(dǎo)DNA編碼化合物已達(dá)到千億級(jí),從中找到目標(biāo)對(duì)象,猶如在汪洋大海里尋找一粒沙子。“不過,通過大數(shù)據(jù)分析,定位與靶標(biāo)蛋白相互作用的小分子化合物的過程卻很快,一般3天左右即可完成。”
每周處理幾十億條DNA數(shù)據(jù) 新藥篩選減少2/3的時(shí)間
在李游的工作電腦上,滿屏都是符號(hào)與數(shù)據(jù),讓人有一種看“天書”的茫然,更別說將其運(yùn)用到新藥篩選上來。但在李游眼里,這些“天書”是世界上最美妙的語言之一。
“我本科是動(dòng)物醫(yī)學(xué),但因?yàn)椴幌矚g做生物實(shí)驗(yàn)擺弄瓶瓶罐罐,所以后來碩博都選了生物信息專業(yè)。”博士畢業(yè)后,李游來到成都先導(dǎo),成為“干實(shí)驗(yàn)室”中的一員。在成都先導(dǎo)任職一年多來,前前后后參與新藥篩選也有20多個(gè)項(xiàng)目了,“目前針對(duì)所有內(nèi)部和客戶的新藥篩選項(xiàng)目,每周至少需處理兩張測(cè)序芯片約幾十億條DNA數(shù)據(jù)。”李游介紹,經(jīng)過數(shù)據(jù)分析,再由實(shí)驗(yàn)室進(jìn)行化合物合成、活性驗(yàn)證等幾個(gè)步驟,整個(gè)新藥篩選過程才算完成。
“傳統(tǒng)的化合物庫合成與篩選需要9到18個(gè)月左右,但有了‘干實(shí)驗(yàn)室’以后,只需要3到6個(gè)月時(shí)間,減少了約2/3的時(shí)間。”成都先導(dǎo)研發(fā)中心化學(xué)總監(jiān)劉觀賽說,藥物研發(fā)速度慢,失敗率高,一直是全世界藥物研發(fā)企業(yè)希望解決的問題,而通過大數(shù)據(jù)和人工智能,讓數(shù)據(jù)的計(jì)算模擬新藥篩選、藥品研發(fā)過程,預(yù)測(cè)藥品的效果,可以極大避免代價(jià)高昂的臨床試驗(yàn)失敗。在劉觀賽看來,人工智能應(yīng)用與生物醫(yī)藥,將為制藥業(yè)甚至整個(gè)社會(huì)帶來翻天覆地的變化,在新藥研發(fā)領(lǐng)域大放異彩,為患者帶來更多治愈疾病的好藥。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com