空間轉(zhuǎn)錄組學技術,尤其是華大時空組學技術Stereo-seq的出現(xiàn),能夠準確反映細胞的空間排布和RNA的原位表達,幫助科研人員從時間和空間維度上認知每個基因、每個細胞,有望帶來生命科學領域的第三次科技革命,成為重新認知器官結(jié)構、生命發(fā)育、物種演化和定義疾病的底層工具。
對于時空組學技術生產(chǎn)的原始數(shù)據(jù),需結(jié)合算法工具進行處理、分析,進而找到在空間分布上具有意義的細胞和基因表達。然而,由于該技術的創(chuàng)新性,現(xiàn)有工具包大多僅側(cè)重于空間原位信號的可視化,而缺乏系統(tǒng)性分析數(shù)據(jù)的方法。
2024年11月11日,華大生命科學研究院聯(lián)合斯坦福大學醫(yī)學院、武漢大學電子信息學院等機構在國際頂尖學術期刊 Cell 上發(fā)表了題為:Spatiotemporal modeling of molecular holograms 的研究論文,推出了最新時空算法工具包。
研究團隊團隊借鑒了物理學、地理學、經(jīng)濟學等多個跨學科領域的數(shù)學模型,開創(chuàng)性開發(fā)了三維時空建模工具包——Spateo,使空間轉(zhuǎn)錄組學技術能夠精細地重構器官三維結(jié)構、系統(tǒng)地量化時空動態(tài)過程。該工具包的發(fā)布標志著時空組學研究迎來革新性突破,可全面支撐胚胎發(fā)育、腦科學、疾病等領域研究,為實現(xiàn)高精度時空生命全景觀研究邁出了極為關鍵的一步。
Spateo工具包提供多種算法選擇,具備三維重建、區(qū)域數(shù)字化、細胞間相互作用推斷、“形態(tài)計量向量場”以及用于交互式操作的可視化界面等獨特優(yōu)勢。為驗證其性能,研究團隊以小鼠胚胎和果蠅發(fā)育的研究為例,探索了三維空間中隨時間變化的器官生態(tài)形成機制,并構建了小鼠胚胎發(fā)育的“3D分子全息圖”,證實了Spateo將顯著提高我們對發(fā)育過程中器官形成的理解。
Spateo整體功能示意圖
如果說以往的時空算法工具包更多的是輔助研究者觀察數(shù)據(jù),Spateo則具備系統(tǒng)性的統(tǒng)計能力與強大的分析能力??梢哉f,Spateo工具包是當前時空算法工具領域“天花板”級別的存在,將為生命科學的未來研究奠定重要基礎。下文選取Spateo工具包中的四種核心創(chuàng)新性算法為大家介紹。
三維重建算法:普適性強,更高精度、更低成本實現(xiàn)三維重建
Spateo工具包提供的三維重建算法,能夠幫助科研人員以更低成本、更低難度(更少、更遠距離的組織切片)獲取更高精度的三維重建結(jié)果,可廣泛適用于胚胎發(fā)育、腦科學、疾病、植物等多領域研究。
首先,對于空間組學中經(jīng)典的三維重建問題,Spateo巧妙地將切片間的配準任務轉(zhuǎn)化為“生成”問題。切片間的配準,是將二維圖像進行精確對齊,以便于后續(xù)的三維重建和分析。作為空間組研究中的基礎問題,配準的準確度將直接影響研究結(jié)果的判斷??深惐壤斫鉃?,醫(yī)院檢查拍攝的CT影像越精準, 醫(yī)生也就能更好地理解和診斷患者的病情。
具體而言,研究人員獲取了兩張組織切片A和B之后,Spateo可根據(jù)切片A生成一個虛擬的A'切片,使其與B切片足夠相似。A'切片的生成過程由高斯過程建模,并通過變分推斷求解,實現(xiàn)高效且穩(wěn)定的計算,并且能夠處理切片形變和部分缺失等難題。同時,Spateo還設計了多切片聯(lián)合優(yōu)化算法以及表面糾正算法,進一步提升了三維重建的精度。鑒于此,即便切片A和B距離較遠、或時間跨度較長,甚至是跨物種的切片,也能借助Spateo推斷出兩者間的映射關系。
生成算法示意圖和小鼠腦胚胎重建效果(c-d:之前發(fā)表的方法偏向于重建成“一團”組織,而Spateo準確還原了三維精細結(jié)構和基因空間分布)
此外,研究團隊采用多個空間組學數(shù)據(jù)集對Spateo進行驗證,包括小鼠腦、人類淋巴瘤、猴腦和小鼠胚胎。結(jié)果顯示,Spateo成功重建了各種組織類型的三維結(jié)構,展示了其處理復雜數(shù)據(jù)集的強大能力,在準確性、計算速度、內(nèi)存消耗、可重建的切片間距和可處理的細胞數(shù)量等方面均優(yōu)于當前國際上主流的重建算法。
更具創(chuàng)意的是,Spateo的三維重建算法在拓展到兩個甚至多個完成重建的三維胚胎的配準工作時,能夠自然地捕捉跨時間點的細胞遷移、凋亡和分裂分化事件。該方法在細胞層面完美解決了胚胎形態(tài)發(fā)生學的關鍵問題,為后續(xù)的形態(tài)計量算法奠定了堅實基礎。
區(qū)域數(shù)字化和細胞互作算法:識別細胞上下游調(diào)控網(wǎng)絡,有望助力臨床應用
生物發(fā)育的過程中,有一個確保發(fā)育精確性和對稱性的關鍵步驟,叫“軸線發(fā)育”,即組織和器官沿特定軸進行有序分化與發(fā)育,如頭-尾軸、背-腹軸或左右軸。軸向發(fā)育為組織和器官的位置、形態(tài)及功能提供空間上的指引,因此該過程也被稱為“區(qū)域化”。
Spateo的區(qū)域數(shù)字化算法借鑒了物理學中的勢能場概念,可對任意形態(tài)的組織、沿任意軸向生成等高線進行數(shù)字化分割,進而識別出具有顯著軸向表達特征的關鍵基因。此方法尤其適用于研究具有分層結(jié)構的發(fā)育問題,例如大腦皮層(人類大腦皮層分為6個層次)、皮膚、血管壁等。
第11.5天小鼠腦中丘腦限制帶研究(a: 小鼠腦不同腦區(qū)是如何發(fā)育而成的 g:影響不同腦區(qū)功能的細胞互作網(wǎng)絡)
通過區(qū)域數(shù)字化算法挖掘出一系列具有空間特征的基因之后,Spateo的細胞互作算法能夠構建目標基因的上下游調(diào)控關系網(wǎng)絡,進一步探討目標基因的表達如何受到自身及周圍細胞的調(diào)控。此兩種算法結(jié)合使用,在三維發(fā)育研究中具有重要應用價值,有助于理解控制細胞行為的動態(tài)過程,此外,在疾病研究中能幫助找到關鍵基因及其互作網(wǎng)絡,有望為腫瘤等疾病的治療提供新思路。
形態(tài)計量向量場算法:關聯(lián)宏觀組織與微觀基因,為發(fā)育、疾病研究提供新見解
Spateo中最令人振奮、最 具創(chuàng)意的算法是利用形態(tài)計量向量場算法,開創(chuàng)性地將宏觀組織的形態(tài)變化與微觀的基因表達變化關聯(lián)起來,這是以往工具未能實現(xiàn)的。該算法實現(xiàn)了對影響器官發(fā)生的關鍵基因進行分子層面的推斷,為研究發(fā)育過程、疾病發(fā)生發(fā)展等問題提供了極具優(yōu)勢的新途徑。
具體而言,組織形態(tài)學變化通過物理空間中跨時間點的細胞遷移向量場進行微分幾何計算,包含三維旋度、加速度、曲率、撓率(物體扭曲程度)和散度等物理量,這些量與生物發(fā)育過程密切相關。同時,通過向量場中表達量的變化,可以挖掘出與這些物理度量高度相關的“形態(tài)計量”基因。
以小鼠心臟的非對稱發(fā)育研究為例,我們可以觀察到小鼠左心室的各種形態(tài)計量都比較保守,而主要發(fā)育自第二心場的右心房、右心室、還有左心房則有各自顯著的宏觀上的形態(tài)變化,Spateo能夠以物理度量的方式,找出與不同形態(tài)變化高度關聯(lián)的關鍵基因。此外,研究團隊還開展了果蠅發(fā)育的研究,結(jié)果表明Spateo對幫助我們更好地理解先天性心臟缺陷等疾病具有重要意義。
小鼠心臟的非對稱發(fā)育研究(g:左心室在各種物理度量下都最保守,而其它的腔室有各自特異的顯著變化 h:算法鑒定出宏觀形態(tài)學變化所對應的關鍵基因表達)
隨著空間技術的不斷成熟并廣泛應用,研究團隊預見到單細胞基因組學的許多方法可以轉(zhuǎn)化為空間基因組學,能夠在原位和三維空間中實現(xiàn)多視角、時空分辨的譜系解析和擾動解析的細胞狀態(tài)動態(tài)。此外,Spateo的應用將助力理解多種生物系統(tǒng)問題,舉例而言,通過生成空間分辨的跨物種細胞圖譜,比較不同物種間器官的三維模型,進而揭示組織結(jié)構的進化過程,如脊椎動物的四腔心臟是如何從無脊椎動物的單腔心臟演變而來的。
論文通訊作者、華大生命科學研究院白寅琪博士表示,Spateo采用數(shù)學建模的方式,可廣泛適用于空間組學領域各種科學問題的研究,為生命科學領域提供了革新性、系統(tǒng)性的整體研究方案。此外,Spateo工具包已開源,兼容目前包括華大時空組學技術Stereo-seq在內(nèi)所有的空間組學技術,我們歡迎各領域科研工作者使用,共同推動時空組學生命研究進展。
論文第一作者、斯坦福醫(yī)學院邱肖杰教授認為,Spateo代表了我們在創(chuàng)建預測性虛擬胚胎模型的道路上的重要里程碑。與其它方法不同,Spateo能夠?qū)⑸锵到y(tǒng)視為一個相互連接的整體,而不僅僅是單個細胞,這在揭示先天性疾病背后的分子機制方面具有巨大的潛力,對促進人類健康具有深遠的影響。
文章通訊作者、華大研究院院長徐訊研究員表示,時空組學技術給生物學研究帶來了巨大的機遇,而對時空組學大數(shù)據(jù)分析是當前的巨大挑戰(zhàn)。Spateo是一個重大飛躍,我們借鑒了多個學科的理論知識,通過算法彌補了實驗技術無法解決的問題,譬如切片的細微形變、需要克服不連續(xù)間斷取樣造成的數(shù)據(jù)丟失問題,還解決了跨時間點重構發(fā)育過程中的細胞分化、遷移等難題。隨著時空技術的進步和普及,相信Spateo這樣的前瞻性算法研究,能為我們真正從時空維度系統(tǒng)研究生命的過程奠定基礎。
華大生命科學研究院白寅琪博士、劉石平研究員、徐訊研究員,武漢大學馬佳義教授及斯坦福醫(yī)學院邱肖杰教授為該論文共同通訊作者。斯坦福醫(yī)學院邱肖杰教授、麻省理工學院博士生Daniel Y. Zhu、武漢大學博士生盧意帆、華大生命科學研究院與西北大學聯(lián)合培養(yǎng)本科生姚佳俊、華大生命科學研究院-中國科學院大學博士生荊澤華、Ginkgo Bioworks研究人員Kyung Hoi Min、華大生命科學研究院博士后成夢南為論文共同第一作者。
該項目通過倫理審查等相關審批,嚴格遵循相關法規(guī)和倫理準則執(zhí)行。國際合作僅限于計算建模與數(shù)據(jù)分析,不涉及任何物質(zhì)或財務資源。項目中的所有軟件開發(fā)均以透明方式進行,并可在GitHub上公開訪問,該研究中使用的數(shù)據(jù)現(xiàn)已公開訪問。
Spateo使用教程:https://spateo-release.readthedocs.io/en/latest/
論文鏈接:https://www.cell.com/cell/fulltext/S0092-8674(24)01159-0
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com