English  |  中國科學院
   
首頁  研究生教育 黨建工作
現在位置:首頁 > 新聞動態 > 科研進展
化學所發展基于深度學習的蛋白質單分子分析新方法
2019-05-23 | 編輯:guojie | 【 】【打印】【關閉

  蛋白質是生命活動的物質基礎和主要承擔者,許多重要的蛋白質以復合物或多聚體形式參與信號轉導、離子轉運、免疫響應等眾多生理過程,蛋白質的化學計量組成與其生物功能的調控及多種疾病的發生發展密切相關。因此,在生理條件下定量表征蛋白質的化學計量比(亞基組成數或蛋白聚集狀態),對于研究蛋白質的相互作用、闡明蛋白質結構-功能的調控機制、研發新藥等都具有十分重要的意義。 

  在國家自然科學基金委、科技部和中國科學院的支持下,中科院化學所分子納米結構與納米技術院重點實驗室方曉紅課題組長期致力于發展分析活細胞體系蛋白質動態變化的單分子顯微成像新方法,所建立的利用光漂白計數定量表征膜蛋白化學計量比等單分子研究方法,為化學生物學和生物醫學研究提供了先進的技術(Natl. Sci. Rev, 2017, 4, 739-760)。近年來他們與生命科學家合作,發現了多種信號轉導蛋白激活和轉運新機制(Nat. Microbiology 2019, 4, 97-111Nat. Commun. 2018, 9:11; Cell Res., 2015, 25,738-752)。 

  最近,他們針對單分子光漂白計數分析中檢測信號弱、易被噪音掩蓋和光閃爍干擾、數據量大等挑戰性問題,巧妙地利用人工智能深度學習技術,提出了一個機器學習的深度神經網絡架構——CLDNN,對單分子光漂白事件進行準確、高效計數。他們所設計的CLDNN可憑借其自身強大的學習能力以及特征提取能力,通過卷積層提取光漂白臺階信號,通過長短時記憶(LSTM)循環層排除熒光閃爍等干擾, 實現90%以上準確率的化學計量比分析。相比于已報道的單分子信號分析方法,CLDNN具有諸多優勢:(1)更高的分析準確率,尤其對于低信噪比的數據,優勢更為明顯;(2)更高的計算效率,可以快速處理大批量數據;(3)簡單易用,無需對單分子數據做濾噪等預處理,也無需設置算法參數;(4)具有較好的推廣性和擴展性,可對除訓練水平外的不同信噪比數據以及包含更多光漂白事件的數據進行有效分析。此外,使用者也可以加入自己的實驗數據集重新訓練CLDNN,使其更加滿足個性化分析需要。  

       CLDNN為研究人員提供了一種全新的數據分析策略,使人們可更為高效、準確、客觀地分析蛋白質等生物大分子化學計量比,該架構還可應用于分析化學領域其它具有時間序列特征的數據分析,將促進人工智能技術在化學中的應用。相關研究成果發表在近期J. Am. Chem. Soc.(2019,141,6976-6985 

  1 CLDNN深度學習用于單分子光漂白計數分析及蛋白質化學計量比研究 

    

    

    

                       分子納米結構與納米技術院重點實驗室 

                                     2019523 

中國科學院化學研究所 地址:北京市海淀區中關村北一街2號 郵編:100190
電話:010-62554001 010-62554626 傳真:010-62559373 010-62569564
京ICP備05002796號 京公網安備110402500016號
江苏7位数中奖规则