組學(xué)技術(shù)的快速迭代,開(kāi)創(chuàng)了疾病治療的精準(zhǔn)醫(yī)學(xué)時(shí)代。以TCGA和ICGC為代表的國(guó)際基因組項(xiàng)目大大增加了可操作的癌癥突變數(shù)量,基因編輯技術(shù)實(shí)現(xiàn)了突變位點(diǎn)的高通量功能驗(yàn)證。然而,傳統(tǒng)藥物研發(fā)的低效性和種種挑戰(zhàn)大大阻礙了精準(zhǔn)醫(yī)學(xué)的應(yīng)用,包括臨床相關(guān)靶點(diǎn)的發(fā)現(xiàn)、生物標(biāo)志物的鑒定、腫瘤耐藥性、藥物功效和安全性等。近年來(lái),基于生物信息學(xué)方法進(jìn)行多組學(xué)數(shù)據(jù)的挖掘,為一些問(wèn)題的解決提供了合理的方案。已有研究表明基因組學(xué)支持的靶點(diǎn)發(fā)現(xiàn)可以使臨床開(kāi)發(fā)的成功率翻倍[1][2]。
圖1. 藥物研發(fā)中組學(xué)數(shù)據(jù)的應(yīng)用
靶點(diǎn)發(fā)現(xiàn)
傳統(tǒng)的靶點(diǎn)發(fā)現(xiàn)通常基于文獻(xiàn)檢索、單個(gè)基因功能研究、快速跟進(jìn)已經(jīng)獲批或正在開(kāi)發(fā)中的靶點(diǎn)等方法。而組學(xué)數(shù)據(jù)挖掘靶點(diǎn)的方法,通過(guò)多維度組學(xué)數(shù)據(jù)的整合和高通量功能篩選能夠更加系統(tǒng)的發(fā)現(xiàn)與臨床密切相關(guān)的靶點(diǎn)。以TCGA為代表的癌癥基因組圖譜數(shù)據(jù),通過(guò)分析頻發(fā)突變、功能影響、預(yù)后影響等發(fā)現(xiàn)腫瘤驅(qū)動(dòng)變異。以GEO和GTEx為代表的轉(zhuǎn)錄組數(shù)據(jù),通過(guò)比較組別間的差異表達(dá)基因、構(gòu)建基因調(diào)控網(wǎng)絡(luò)分析基因集的變化模式。以ENCODE為代表的基因組功能元件數(shù)據(jù),通過(guò)分析功能元件與組織特異性和甲基化圖譜之間關(guān)系,可以發(fā)現(xiàn)特定適應(yīng)癥靶點(diǎn)。
如下圖示例,采用OmicSoft繪制了TCGA Pan-Cancer研究[3]中低級(jí)別膠質(zhì)瘤(LGG)預(yù)后差Cluster 4和預(yù)后較好Cluster 5基因表達(dá)熱圖,并按照熱點(diǎn)突變IDH1 R132H進(jìn)行分組。統(tǒng)計(jì)檢驗(yàn)結(jié)果表明,在預(yù)后差的Cluster 4中ETV7在IDH1突變組中顯著低表達(dá)。
圖2. LGG預(yù)后差Cluster 4和預(yù)后好Cluster 5基因表達(dá)熱圖
進(jìn)一步采用QIAGEN IPA構(gòu)建了ETV7與貝伐珠單抗藥物靶點(diǎn)Vegf和VEGFA之間的調(diào)控網(wǎng)絡(luò)。結(jié)果發(fā)現(xiàn),如果ETV7被激活劑活化(紅色代表激活,藍(lán)色代表抑制),同樣可以抑制Vegf和VEGFA活性,與貝伐珠單抗具有協(xié)同作用。
圖3. ETV7與貝伐珠單抗靶點(diǎn)之間的調(diào)控網(wǎng)絡(luò)
高通量功能驗(yàn)證
基因功能評(píng)估是靶點(diǎn)篩選中另外一個(gè)關(guān)鍵環(huán)節(jié),可以進(jìn)一步驗(yàn)證靶點(diǎn)與癌癥之間的因果關(guān)系。功能驗(yàn)證通常采用RNAi或CRISPR對(duì)全基因組進(jìn)行功能缺失篩查,從而系統(tǒng)評(píng)估靶點(diǎn)與癌癥之間的依賴值(dependency score)。CCLE和DepMap數(shù)據(jù)庫(kù)已經(jīng)收錄了上萬(wàn)個(gè)基因通過(guò)CRISPR敲除和RNAi干擾后在幾百種細(xì)胞系中的依賴值,OmicSoft也對(duì)該數(shù)據(jù)進(jìn)行了人工整理和收錄。
如下圖示例,在OmicSoft CCLE Land中檢索ETV7基因并篩選神經(jīng)系統(tǒng)來(lái)源的細(xì)胞系,發(fā)現(xiàn)與ETV7依賴性較高的兩個(gè)細(xì)胞系均來(lái)自膠質(zhì)瘤樣本(Gene Dependency Score越小依賴性越高)。
圖4. 基于CCLE數(shù)據(jù)庫(kù)計(jì)算ETV7與不同細(xì)胞系之間的依賴值
先導(dǎo)化合物發(fā)現(xiàn)
基于組學(xué)數(shù)據(jù)進(jìn)行先導(dǎo)化合物的發(fā)現(xiàn),代表性策略是采用連接圖(Connectivity Map)方法[4]來(lái)比較基因、疾病和藥物對(duì)應(yīng)的轉(zhuǎn)錄組圖譜之間的相似性。其中藥物處理細(xì)胞系對(duì)應(yīng)的表達(dá)譜數(shù)據(jù)通常來(lái)自LINCS數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)收錄了130萬(wàn)個(gè)表達(dá)譜數(shù)據(jù),涉及19,811種化合物處理3~77種細(xì)胞系的數(shù)據(jù)。如下圖示例,采用QIAGEN IPA軟件,首先獲取厄洛替尼(Erlotinib)處理EGFR突變的HCC515細(xì)胞系表達(dá)譜數(shù)據(jù);然后將該表達(dá)譜數(shù)據(jù)與LINCS數(shù)據(jù)庫(kù)進(jìn)行匹配分析,找到與其表達(dá)譜模式相似的數(shù)據(jù)集。該示例中case.treatment一列顯示pelitinib、AZD8330、trametibib等藥物處理細(xì)胞系后具有類(lèi)似的表達(dá)譜模式;最后,將篩選的藥物處理細(xì)胞系表達(dá)譜與疾病組(EGFR突變 vs 正常樣本)表達(dá)譜數(shù)據(jù)進(jìn)行比較,找到與疾病組表達(dá)模式相反的藥物處理細(xì)胞系組。
圖5. 厄洛替尼處理EGFR突變HCC515細(xì)胞系與LINCS數(shù)據(jù)庫(kù)匹配分析結(jié)果
揭示藥物分子機(jī)理
基于組學(xué)數(shù)據(jù)探索生物標(biāo)志物和關(guān)鍵生物學(xué)通路的變化對(duì)于藥物分子機(jī)理的研究至關(guān)重要。QIAGEN IPA軟件可以將不同處理組與對(duì)照組進(jìn)行全面的比較,從調(diào)控因子、生物學(xué)通路、功能、基因數(shù)等角度比較其變化趨勢(shì)。如下圖示例,來(lái)自AstraZeneca開(kāi)發(fā)的心力衰竭藥物髓過(guò)氧化物酶抑制劑(AZD4831)[5],可以顯著抑制心力衰竭相關(guān)生物標(biāo)志物和通路的活性(1-4是安慰劑治療組,5是AZD4831治療組,橘色表示活性激活,藍(lán)色表示活性抑制)。
圖6. AZD4813藥物處理組與對(duì)照組生物標(biāo)志物變化比較
參考文獻(xiàn):
1.Nelson, M.R. et al. (2015) The support of human genetic evidence for approved drug indications. Nat. Genet 47 (8), 856–860
2.Hingorani, A.D. et al. (2019) Improving the odds of drug development success through human genomics: modelling study. Sci. Rep. 9 (1), 18911
3.Thorsson et al. (2018) The Immune Landscape of Cancer. Immunity 48 (4), 812-830
4.Lamb, J. et al. (2006) The Connectivity Map: using gene-expression signatures to connect small molecules, genes, and disease. Science 313 (5795), 1929–1935
5.Erik Michaelsson et al. (2023) Myeloperoxidase Inhibition Reverses Biomarker Profiles Associated With Clinical Outcomes in HFpEF, JACC Heart Fail 11 (7), 775-787
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com