|
|
新聞詳情
中科院團隊研發(fā)新型拉曼光譜分析模型 將病原菌識別時間縮至分鐘級中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所宋一之研究團隊近日提出一種新型無監(jiān)督域適應(yīng)深度學(xué)習(xí)方法——拉曼光譜分類差異模型(RSCDM),有效解決了拉曼光譜在病原菌識別中受儀器異質(zhì)性、實驗批次波動及菌株多樣性影響的關(guān)鍵瓶頸問題。相關(guān)研究成果以 “Novel Deep-Learning Unsupervised Domain Adaptation Method for Mitigating Batch, Strain, and Instrument Variations to Enhance Raman Spectroscopy-Based Bacterial Pathogen Identification” 為題,發(fā)表在國際分析化學(xué)領(lǐng)域權(quán)威期刊《Analytical Chemistry》(中國科學(xué)院一區(qū) TOP)上。
上海自動化儀表四廠抗生素耐藥性已成為全球公共衛(wèi)生領(lǐng)域的重大威脅,快速準(zhǔn)確的病原菌鑒定是合理使用抗生素、遏制耐藥性蔓延的關(guān)鍵。拉曼光譜憑借無標(biāo)記、非破壞、分子指紋識別等獨特優(yōu)勢,在生物醫(yī)學(xué)檢測領(lǐng)域展現(xiàn)出廣闊應(yīng)用前景,與深度學(xué)習(xí)結(jié)合后可實現(xiàn)病原菌的快速檢測。
上海自動化儀表四廠然而,在實際臨床和工程應(yīng)用中,不同來源的拉曼光譜數(shù)據(jù)往往存在顯著差異。即使經(jīng)過常規(guī)校準(zhǔn)和預(yù)處理,儀器硬件差異、實驗批次波動以及樣本生物多樣性導(dǎo)致的峰位、強度分布及背景形態(tài)變化,仍會嚴(yán)重削弱分析模型的穩(wěn)定性和泛化能力,成為制約拉曼光譜智能分析技術(shù)走向臨床應(yīng)用的主要障礙。
針對上述共性難題,宋一之研究團隊提出的RSCDM模型基于無監(jiān)督領(lǐng)域自適應(yīng)思想,構(gòu)建了“特征提取器+雙分類器”的協(xié)同工作框架。與傳統(tǒng)依賴固定域假設(shè)的方法不同,該模型通過主動放大并逐步縮小兩個任務(wù)特異性分類器對目標(biāo)域樣本的預(yù)測差異,能夠動態(tài)識別偏離源域特征分布的樣本,并通過對抗式訓(xùn)練引導(dǎo)模型完成面向任務(wù)決策邊界的特征對齊,從而有效緩解跨批次、跨菌株和跨儀器引起的光譜差異問題。與多數(shù)僅在實驗室理想條件下驗證性能的研究不同,這項工作系統(tǒng)考察了拉曼光譜智能分析中常見且對實際應(yīng)用影響大的三類差異來源——批次差異、菌株差異和儀器差異,其驗證結(jié)果更貼近真實使用環(huán)境。在技術(shù)路徑上,RSCDM采用了任務(wù)驅(qū)動的無監(jiān)督域適應(yīng)策略,在不依賴目標(biāo)域標(biāo)簽的條件下,利用雙分類器輸出差異識別域外樣本并完成域?qū)R,為小樣本、弱標(biāo)注甚至無標(biāo)注場景下的拉曼智能分析提供了新的解決方案。
實驗數(shù)據(jù)顯示,該模型顯著提升了病原菌識別的準(zhǔn)確率和泛化能力,在商用拉曼光譜儀平臺上,針對跨批次、跨菌株的7種細菌分類任務(wù),模型準(zhǔn)確率由傳統(tǒng)方法的81.6%提升至95.4%;在自研拉曼平臺R310上,針對未納入訓(xùn)練集的6種臨床分離株,識別準(zhǔn)確率從77.5%提升至91.3%,若結(jié)合跨儀器參考菌株進行微調(diào),臨床分離株的識別準(zhǔn)確率可進一步提升至99.3%,展現(xiàn)出優(yōu)異的跨儀器適應(yīng)能力。同時,該方法還兼顧了高性能與可擴展性,團隊進一步開發(fā)了輕量化版本的RSCDM模型,在參數(shù)量大幅降低的情況下仍保持了較高的識別性能,具備向資源受限的便攜式設(shè)備部署的潛力。
上海自動化儀表三廠實驗結(jié)果顯示,在高菌負(fù)荷條件下,采用該方法的單細胞拉曼光譜病原菌識別系統(tǒng),每條光譜采集時間約為6秒,模型對單條光譜的推理時間僅約0.001秒。這意味著傳統(tǒng)細菌培養(yǎng)鑒定所需的“天級”檢測時間,有望縮短至“分鐘—小時級”,為臨床感染性疾病的快速診斷提供了有力支撐。
上海自動化儀表三廠研究人員表示,該方法的意義于病原菌識別領(lǐng)域。研究表明,制約拉曼光譜與深度學(xué)習(xí)結(jié)合模型可遷移性和實用性的關(guān)鍵因素,往往不是網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度,而是不同來源光譜之間的分布不一致問題。RSCDM從方法學(xué)層面為這一問題提供了有效解決方案,其核心思路未來有望拓展到臨床檢驗、腫瘤診斷、細胞表型識別、藥物響應(yīng)評估及多中心數(shù)據(jù)庫融合等更廣泛的拉曼智能分析場景。
|