固話:010-53395839
郵箱:service@qinglianbio.com
網址:www.seosmolinks.com
地址:北京市昌平區北清路生命科學園博雅CC C座1號樓807
肝細胞癌(HCC)是消化系統最常見的惡性腫瘤之一,在中國,肝癌的發病率排名第四,并且由于病程長,起病隱匿,發現時多為中晚期,因此致死率很高。在中國,乙肝病毒(HBV)感染是HCC主要的風險因素,感染HBV的慢性乙肝病人和肝硬化病人具有較高的發展成為HCC的風險。因此,在高危人群中通過HCC標志物的進行篩查對于HCC的早期監測、治療監督極為重要,但是目前臨床常用的HCC血清標志物甲胎蛋白(AFP)敏感度和特異度均不夠理想。
近日,來自國家蛋白質科學中心的孫薇團隊,與北京大學腫瘤醫院等單位合作,于《Journal of Proteomics》雜志上發表了題為“Identification of noninvasive diagnostic biomarkers for hepatocellular carcinoma by urinary proteomics”的研究論文,從尿液蛋白質組學的角度,通過機器學習的方法,對HCC的診斷標志物進行了研究,發現7個尿液蛋白的組合可以對HCC與高危人群進行高靈敏度的診斷。這是首次應用尿蛋白組學策略從高危人群中發現HCC生物標志物,對肝癌的輔助診斷和無創監測有著重要意義。
尿液是良好的生物標志物來源,與血液相比,尿液的采集無創,有利于連續采集進行監控,并且成分相對簡單,高豐度蛋白較血液中少,對于蛋白質組研究更加有利。研究者通過改進濾膜輔助酶切(FASP)方法,建立了高效的尿液蛋白前處理方法,可在15小時內進行進行多達48個尿液樣品的蛋白提取和酶切。通過質譜鑒定,在116個尿液樣品中共鑒定得到2688個蛋白,平均每個尿液樣品得到918個蛋白。質控樣品的鑒定表明,體系也較穩定。因此,此方法可為尿液蛋白質組研究提供高通量的前處理體系參考。
圖1 高通量尿液蛋白質組學處理體系的流程,及HCC及高危人群組尿液樣本鑒定情況
研究者對HCC血清標志物AFP以及尿液GPC3和GP73進行了診斷效果的評價,發現這三個蛋白在進行HCC與高危人群診斷時,分類效果不佳。因此研究者根據產出的尿液蛋白質組數據,利用機器學習的方法進行新的HCC標志物的發現。在由43個高危人群和36個HCC尿液樣品組成的訓練集中,利用特征選擇的算法進行蛋白質的排序。通過計算權重和約登指數,最終選擇AUC和約登指數均較好的七個蛋白(HPX,APOH,APCS,PLG,GOT1,GLRX,NCR3LG1)作為HCC標志物進行分析。
圖2 訓練集中尿液標志物數量的評價和權重排序
研究者利用篩選得到的7個蛋白,進行了不同算法聯合模型的評價,包括隨機森林模型和投票模型。在訓練集中,通過十倍交叉驗證分析,評價兩種模型的AUC,靈敏度和特異度,并在由19個高危人群和18個HCC尿液樣品組成的驗證集中進一步驗證聯合模型的分類效果,最終發現投票模型的診斷效果強于隨機森林模型,并且投票模型的算法結構簡單,在臨床上應用的可行性更高。
圖3 隨機森林模型和投票模型在訓練集和測試集中的分類效果
研究者接下來將聯合應用的七個尿液蛋白通過多重反應監測(MRM)方法,在一組由20個高危人群和20個HCC尿液樣本組成的新驗證集中,進行靶向定量驗證。這七個標志物在高危人群和HCC中的相對含量與非靶向蛋白質組學分析中蛋白的表達趨勢是一致的,并且通過ROC分析發現,這七個蛋白通過投票模型聯合應用時,AUC可達0.95,靈敏度和特異度分別為90%和85%。
圖4 MRM驗證集中投票模型的分類效果
尿液蛋白質組在疾病標志物研究中具有重大潛力,也得到了越來越多的關注。本篇文章中,研究者通過建立了高通量的尿液蛋白質組學方案,對高危人群和HCC病人的尿液樣本進行分析,通過機器學習的方法,篩選得到一組潛在的HCC診斷標志物蛋白,并通過MRM方法進行了驗證,說明尿液蛋白在HCC診斷中具有非常重大的應用潛力。尿液標志物對于HCC高危人群來說,更有利于進行連續和長期的監控,后續可與影像學、血清學結果等進行聯合應用,為肝癌的輔助診斷研究提供了更多空間。
通過機器學習方法篩選潛在診斷標志物,酷不酷?想不想學?快來找我們吧!青蓮百奧可提供一站式蛋白質組學、代謝組學、轉錄組學、多組學聯合分析等科研服務。青蓮百奧在質譜檢測方面項目經驗豐富,擁有國際一流的質譜平臺,海歸坐鎮專業生信分析團隊,助您在科研道路上乘風破浪,沖擊高水平文章。更多技術服務敬請來電咨詢。
![]() | 固話:010-53395839 |
![]() | 郵箱:service@qinglianbio.com |
![]() | 地址:北京市昌平區北清路生命科學園博雅CC C座1號樓807 |