北航新聞網8月5日電(通訊員 張晨曦)自2022年Open AI推出ChatGPT以來,生成式人工智能技術便迎來了其迅猛的發展浪潮。這些技術在處理文本、圖像、視頻等單一模態數據時,已經展現出了深遠的影響力,成為了推動領域自動化、革新生產方式和輔助人類決策的重要手段。然而,在基礎科學與人工智能的交叉領域,特別是在AI for Science、空間組學、腦科學等研究領域,依賴單一模態的數據分析往往難以充分揭示生物組織的復雜性。為了更深入地理解生物組織不同區域的功能和聯系,在統一的空間坐標上整合來自不同技術的多模態數據一個能夠整合多模態數據的生成式模型顯得尤為關鍵。
基于團隊在多模態數據融合(Nature Biotechnology 2022)的工作積累,2024年8月2日,北京航空航天大學人工智能學院鄧岳教授團隊和清華大學自動化系戴瓊海院士團隊合作在《Nature Communications》上發表了文章《Tissue characterization at an enhanced resolution across spatial omics platforms with deep generative model》。文章提出了一種多模態融合的統一生成式模型,通過對圖像數據與空間組學進行聯合生成式建模,實現了對包括腦在內的復雜生物組織的精確刻畫,為空間組學的研究提供了新的工具和方法。
這項研究中提出的空間組學統一生成模型(spatial omics scope,soScope)整合了來自多種觀測技術中的形態學、組學以及空間位置信息,對從高分辨生物組織中采集低分辨觀測數據過程進行生成式建模。這一過程被建模為:低分辨率的空間組學觀測值是由高分辨率空間組學的集合和隨機擾動共同影響的結果;而高分辨率空間組學的表達量不僅與特定區域的隱狀態緊密相關,還與高分辨率的形態學特征息息相關。基于這種關聯,soScope模型能夠將不同的空間組學觀測結果,通過一個統一的生成過程來綜合描述(圖1a)。網絡通過整合低分辨率組學信息的空間關系和高分辨率圖像特征,推斷并采樣出高空間分辨率下的空間組學特異性概率分布,實現了對生物組織結構的精確刻畫(圖1)。
利用提出的方法,文章在多種技術產生的數據上進行了實驗。研究團隊首先選擇了空間轉錄組數據領域內廣為應用的平臺——Visium和Xenium,構建了低分辨率的仿真數據集。在此基礎上,他們運用soScope模型進行了數據恢復實驗,旨在測試和驗證模型的性能。實驗結果顯示,soScope不僅成功地恢復了人類腸道組織和小鼠大腦的精細結構(圖2a),而且在恢復精度上達到了最高水平(圖2b)。這一結果證明了soScope在處理空間轉錄組數據時的建模精確性,為空間組學研究提供了強有力的支持,證實了soScope作為一種新型工具的潛力和可靠性。
在進一步的實驗中,該研究利用了基于spatial CUT&Tag技術采集的小鼠胚胎的數據(圖3a)。這項技術允許研究人員對小鼠胚胎中的DNA與蛋白質相互作用進行深入分析,以測試soScope對于不同空間組學數據的解析能力。soScope成功地消除了小鼠多個器官區域,包括前腦在內的測序噪聲,顯著提升了對小鼠胚胎多個器官結構的辨析度(圖3b)。此外,它還顯著增強了組織內部的連續性,揭示了在原始分辨率下不可見的精細結構,例如小鼠胚胎心臟的雙層結構(圖3c)。這些發現不僅證明了soScope在不同空間組學數據中提高空間分辨率和降低噪聲方面的強大能力,也展示了其在捕獲精細組織結構方面的卓越性能。
此外,soScope的性能還在多個測序平臺(spatia-CITE-seq、spatial ATAC-RNA-seq、slide DNA/RNA-seq等)以及多種生物組織(包括人類皮膚、小鼠肝臟等)上得到了驗證。soScope不僅可用于空間多組學的聯合分析中,還能夠實現不同數據類型間的協同優化,為空間多組學數據的分析提供了工具。
文章通過采用多模態融合的統一生成式框架,成功地在多個空間組學平臺和不同的生物組織樣本上進行了深入分析和驗證。這一框架不僅證明了其在處理和整合多種生物數據類型方面的強大能力,而且為研究者提供了一種新的工具,以更全面和精確的方式探究復雜生物結構的精細功能。
本工作得到了國家自然科學基金杰出青年科學基金,國家自然科學基金重點項目的支持。
您填的信息已提交,老師會在24小時之內與您聯系
如果還有其他疑問請撥打以下電話