亚洲h色精品,亚洲精品久久久久,欧美激情一二三区,成人影院入口

學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于miRNA相對表達量自動判別月經血和外周血

發布時間:2021-03-15所屬分類:醫學論文瀏覽:1

摘 要: 摘要:目的探索有效區分月經血和外周血的miRNA最優標記組合及最佳分類模型,并構建簡便快速的自動化判別軟件。方法對10種miRNA(miR-451a、miR-205-5p、miR-203a-3p、miR-214-3p、miR-144-3p、miR-144-5p、miR-654-5p、miR-888-5p、miR-891a-5p、miR-124-3p)

  摘要:目的探索有效區分月經血和外周血的miRNA最優標記組合及最佳分類模型,并構建簡便快速的自動化判別軟件。方法對10種miRNA(miR-451a、miR-205-5p、miR-203a-3p、miR-214-3p、miR-144-3p、miR-144-5p、miR-654-5p、miR-888-5p、miR-891a-5p、miR-124-3p)在200余份月經血和外周血樣本中的相對表達量以實時熒光定量PCR檢測,并以7種算法模型(核密度估計、K-最近鄰、邏輯回歸、線性判別分析、支持向量機、神經網絡、隨機森林)進行數據分析,選出鑒別效果最好的標記組合及算法模型,進而構建自動判別軟件。結果月經血和外周血中差別最大的三種miRNA為miR-205-5p、miR-203a-3p和miR-214-3p,使用miR-144-5p與上述miRNA中的一種或兩種組合可達較好區分效果,其中基于miR-144-5p、miR-203a-3p和miR-205-5p所形成的“最優特征項組合一”穩健性最強。7種算法模型中最佳分類模型為核密度估計模型,其次為邏輯回歸模型。結論本研究建立的自動判別軟件界面友好、使用簡單,適合輔助法醫檢驗關于月經血和/或外周血判別分析的計算,便利于法醫物證工作,有較大的推廣應用價值。

基于miRNA相對表達量自動判別月經血和外周血

  關鍵詞:法醫遺傳學;微RNA;外周血;月經血;自動化判別軟件

  犯罪現場遺留的體液樣本類型及來源的判定,對犯罪行為分析、重建犯罪現場至關重要[1]。血液是犯罪現場常見的體液類檢材,其準確定性可為案件偵破提供重要線索,因此尋找簡便快速鑒別血液樣本類型(如外周血還是月經血)的方法對于法醫實踐意義重大[2]。

  微RNA(MicroRNA,miRNA)是具有調控功能的非編碼RNA,其大小約為20~25個核苷酸,能附著在編碼蛋白質的mRNA鏈上而抑制新蛋白的轉錄[3-4]。miRNA具有長度短、表達量高和穩定性好等特點,已被證實可用于各種體液類型的鑒定[5-18]。miRNA在不同體液中的表達特異性主要體現在其表達量上的差異,通過定性鑒定很難對其準確區分判斷,因此越來越多的實驗室開始使用數學算法模型對miRNA的相對表達量進行綜合分析,以期得出更科學可靠的結論[6-7,14,16]。

  本研究建模以外周血和月經血為樣本,經實時熒光定量PCR技術獲取不同miRNA分子在各樣本中的相對表達量而組成分析數據集。選取7種模型算法即核密度估計(kerneldensityestimation,KDE)、K-最近鄰(K-nearestneighbor,KNN)、邏輯回歸(logisticregression,LOG)、線性判別分析(lineardiscriminantanalysis,LDA)、支持向量機(supportivevectormachines,SVM)、神經網絡(neuralnetwork,NN)、隨機森林(randomforest,RF),基于相同的數據集樣本進行分析計算。最終選用核密度估計和邏輯回歸作為后臺算法模型開發軟件,通過miR-144-5p、miR-203a-3p、miR-205-5p三種miRNA的相對表達量數據進行未知樣本的類型判定計算,可實現外周血、月經血的自動判別。

  1材料與方法

  1.1樣本的收集

  來自中國北方25~35周歲健康成年人外周血樣本136份,25~35周歲健康成年女性月經血樣本104份。樣本的收集均符合知情同意原則并已通過公安部物證鑒定中心倫理委員會審查[19]。

  1.2候選miRNA分子標記信息

  根據已報道的多篇研究文章,挑選出10種候選miRNA(miR-451a[6,8-10],miR-205-5p[6,12-13],miR-203a-3p[6-7,12-13],miR-214-3p[6,8,11],miR-144-3p[13],miR-144-5p[14],miR-654-5p[13,15],miR-888-5p[8,11,16],miR-891a-5p[8,11,16],miR-124-3p[7,17])進行此研究工作,使用RNU6b[6,18]作為內參基因對數據進行歸一化,以確保結果的科學合理性[20]。

  1.3miRNA相對表達量的獲取

  采用miRNeasyMiniKit(Qiagen,德國)試劑盒,按說明書提取樣本中的總RNA。用Nanodrop2000c和Qubit4熒光定量儀(ThermoFisherScientific,美國)進行總RNA濃度和純度的測定[12]。對定量后的RNA進行逆轉錄后,使用SYBRGreen法對提取的miRNA及內參RNU6b同時進行qPCR檢測,以獲取相對表達量數據。使用ΔCt值代表miRNA的相對表達量,用于訓練和驗證分類模型數據變量。ΔCt=Ct(miRNA)–Ct(RNU6b)(1)

  1.4候選數據算法模型及模型評估標準

  研究共選取7種模型算法,基于相同的數據集樣本進行分析計算。KDE是一種非參數估計方法,可以根據數據樣本本身研究數據分布規則,并根據給定的樣本集求解隨機變量的分布密度函數。KNN基于每個查詢點的k個最近鄰居執行學習,其中k是用戶指定的整數,本研究選2。LOG是用于分類而不是回歸的線性模型,其描述的可能結果的概率使用logistic函數對單個試驗進行建模。LDA可用于執行有監督的降維,該線性子空間包含使類之間距離最大化的方向,并且還可以使用貝葉斯規則和概率密度函數將降維數據用于分類。SVM屬于監督學習方法,它使用訓練點的子集作為決策邊界(稱為支持向量)。NN方法為多層感知器,是一種有監督的機器學習算法,可學習用于分類或回歸的非線性函數。在多層感知器的輸入和輸出層之間,可以存在一個或多個非線性層,稱為隱藏層。本研究設置一個隱藏層,其由10個神經元組成。RF是一種通過集成學習的思想整合多個決策樹的算法。在RF中,每個決策樹都是一個分類器,然后對于一個輸入樣本集,每個樹都將具有一個分類結果,并最終整合所有分類投票結果,而以指定投票數最多的類別作為最終輸出。

  相關期刊推薦:《刑事技術》ForensicScienceandTechnology(雙月刊)曾用刊名:刑事技術資料,1976年創刊,是綜合性學術期刊,是國內介紹法庭科學技術的權威性雜志。讀者對象主要為基層公、檢、法、司部門的技術警察、干部、偵察員,以及解放軍、武警、鐵路、交通、民航、林業、廠礦企業保衛部門的工作人員,各公安院校和其他大專院校從事法醫學、刑偵、法律工作的師生等。目前涉及的學科有法醫損傷學、法醫物證學、法醫分子遺傳學、毒物學、痕跡檢驗、文學檢驗、指紋識別、微量物證檢驗、刑事照相、司法會計等專業。

  根據體液的類型和來源,用于訓練模型的樣本分為外周血(136份)和月經血(104份)。這些訓練樣本的替代特征包括miR-451a、miR-205-5p、miR-203a-3p、miR-214-3p、miR-144-3p、miR-144-5p、miR-654-5p、miR-888-5p、miR-891a-5p和miR-124-3p的ΔCt值。為避免過擬合的風險,使用五重交叉驗證方法來評估分類器性能。將樣本集隨機分為五個子集,同時確保每個子集中每種體液樣本的比例一致,并使用其中四個對模型進行訓練,然后在其余子集上驗證訓練后的模型。

  2結果

  2.1不同數目miRNA標記構建的模型準確性差異

  為更方便在法醫鑒定中進行應用,并降低分類器的復雜性以使其更穩定,同時確保良好的分類性能,需選擇上述miRNA標記分子的較小子集作為最終使用的標記組合。為了確定適當的標記數量來構建具有低復雜度和高性能的模型,采用依次增加標記數量的方法,并檢查每個標記的所有可能組合。將上述10種miRNA按照一定的數目進行組合,對于每一種組合,分別基于材料與方法中的7種方法進行模型的訓練和測試。分別從每種組合數目的模型中選出測試準確性(采用MCC和AUC進行衡量)最高的一組模型,考察不同數目的miRNA標記所構建模型的準確性差異情況(圖1),可見當標記數目為1時,只有LOG方法構建的模型中存在一個能夠完全鑒別外周血和月經血的模型,該模型所用的分子標記為miR-203a-3p,但是對該模型重復100次的測試結果發現,該模型能夠完全鑒別外周血和月經血的概率只有81%,無法滿足實際應用需要,故排除只用一種miRAN鑒別外周血和月經血的可能性。

  2.2不同方法構建的模型中能夠完全鑒別外周血和月經血的模型數目

  分別統計每種方法構建的組合中能夠完全鑒別出外周血和月經血的模型數目,發現邏輯回歸方法表現最好,其次為核密度估計,結果見圖2。因此最終開發軟件選擇基于這兩種方法。

  2.3鑒別外周血和月經血的最優模型(最優組合以及最優方法)

  選用差異性最大的miR-205-5p、miR-203a-3p以及miR-214-3p進行兩兩組合,驗證使用兩種miRNA進行外周血和月經血區分的能力,結果發現雖然都能夠較好區分外周血和月經血,但由于月經血中存在明顯的離群值,導致單獨使用這三種組合中的某一種區分外周血和月經血都不能達到理想的效果。

  進一步將其他miRNA與這三種miRNA(miR-205-5p、miR-203a-3p、miR-214-3p)中的一種組合卻能達到很好的鑒別效果。所有由兩種標記構建的模型中,一次測試結果能夠完全鑒別外周血和月經血的組合有13組:miR-205-5p/miR-124-3p,miR-144-3p/miR-203a-3p,miR-891a-5p/miR-205-5p,miR-451a/miR-203a-3p,miR-888-5p/miR-203a-3p,miR-888-5p/miR-205-5p,miR-205-5p/miR-144-5p,miR-891a-5p/miR-203a-3p,miR-124-3p/miR-203a-3p,miR-214-3p/miR-144-5p,miR-451a/miR-205-5p,miR-144-3p/miR-205-5p,miR-144-5p/miR-203a-3p。每個組合均會出現miR-205-5p、miR-203a-3p或miR-214-3p中的一個,主要原因是這三種miRNA在外周血和月經血中的表達量存在較大的差異(圖1C),在區分外周血和月經血的過程中起到主要作用,另外一種miRNA起到輔助作用,主要表現在能夠使一種體液中的離群值遠離另一種體液。

  為進一步選出最優模型,對測試數據進行不同程度的數據擾動以進行模型穩健性測試,在每種程度的擾動下分別對上述13個組合重復測試100次,觀察模型的F1值隨著擾動程度的增加而發生的變化,以此來反映模型的穩健性。測試結果顯示包含兩種miRNA的最佳組合為miR-144-5p/miR-203a-3p,其次為miR-144-5p/miR-205-5p。對同一組合不同方法構建的模型進行對比發現,最優方法為核密度估計或邏輯回歸,方法呈現出更好的穩健性。相關結果見圖3。

  測試miR-205-5p、miR-203a-3p、miR-214-3p兩兩組合后,再與miR-144-5p組合,篩選使用3種miRNA分子標記進行區分鑒定的最優模型,最終發現選取miR-205-5p、miR-203a-3p、miR-214-3p中的兩種或一種與miR-144-5p組合能夠得到較好的分類模型,其中3種標記分子的最優組合為miR-205-5p/miR-203a-3p/miR-144-5p,兩種標記分子的最優組合為miR-144-5p/miR-203a-3p或miR-144-5p/miR-205-5p,3種標記分子的最優組合比只用兩種miRNA的最優模型穩健性更強,且最優方法為核密度估計方法,其次為邏輯回歸方法。相關結果見圖4。

  3軟件設計及應用

  3.1設計思路

  根據上述數據模型分析結果,最終分別采用邏輯回歸、核密度估計兩種方法訓練判別模型進行軟件開發。該軟件的模塊包括模型選取、特征項輸入、鑒定結果三個部分。運用數值模擬原理結合判別分析模型,輸入待鑒定體液中測定的miRNA相對表達量數值,即可得出軟件判別模型的預測結果,從而準確快速地檢測出未知血液樣本的類型。

  3.2軟件輸入和輸出

  該軟件內置了三種最優特征項組合(最優特征項組合一:miR-144-5p/miR-203a-3p/miR-205-5p;最優特征項組合二:miR-144-5p/miR-203a-3p;最優特征項組合三:miR-144-5p/miR-205-5p),用戶也可自定義特征項組合。

  當驗證少量樣本時,用戶可在特征輸入面板輸入對應的特征項數值。輸入完成并檢查無誤后,點擊“類型鑒定”按鈕,即可在鑒定結果面板輸入鑒定結果信息。當驗證大量樣本時,用戶需要批量導入訓練數據,導入完成后選取最優特征項組合,點擊模型訓練進行體液類型的鑒定分析。

  3.3軟件運行示例

  本軟件狀態流程圖如圖5A所示。

  使用SYBRGreen熒光定量PCR檢測方法,檢測獲取未知樣本中miR-144-5p,miR-203a-3p,miR-205-5p等3種miRNA的相對表達量數據。從基本功能模塊中的模型選取面板選取“最優特征項組合一”,在特征項輸入面板中輸入未知樣本中以上3種miRNA的相對表達量數據值,點擊“類型鑒定”按鈕后,在鑒定結果面板輸出兩種數據分析方法所分別給出的判別結果,未知樣本兩種判別方法均為外周血,同時給出判定的概率數值:屬于外周血的概率為1,屬于月經血的概率為0。同時在右側的圖形化展示面板中,直觀展示未知樣本的分布情況。圖形化展示面板是通過降維分析展示的兩類體液的樣本數據分布差異,其中外周血為紅色實心圓點集合、月經血為紫色實心圓點集合,未知樣本(黑色實心圓點)落在外周血樣本組成的數據集內,見圖5B。多個實際樣本測試結果顯示,“最優特征項組合一”對外周血和月經血的區分度最好。——論文作者:王國力1,2,劉揚3,何紅霞1,4,季安全1,張偉2,曹洋3,*,孫啟凡1,*

2023最新分區查詢入口

SCISSCIAHCI

主站蜘蛛池模板: 株洲县| 北川| 莱阳市| 呼伦贝尔市| 漳州市| 海安县| 安达市| 太康县| 陕西省| 新安县| 乌兰察布市| 句容市| 高州市| 南投市| 鹤峰县| 西平县| 佛冈县| 平阴县| 琼海市| 黄浦区| 漠河县| 镇原县| 子洲县| 桐柏县| 兰坪| 麻栗坡县| 西平县| 清涧县| 武威市| 彝良县| 昌江| 西城区| 蓬莱市| 郸城县| 屏东市| 房产| 张北县| 洛扎县| 大方县| 安徽省| 双城市|