發布時間:2021-04-01所屬分類:醫學論文瀏覽:1291次
摘 要: 摘要:為系統探索數據挖掘在中醫診斷學領域應用的科研產出、研究主體及研究主題演化路徑和前沿熱點問題,研究以中國知網(CNKI)期刊數據庫為數據源,收集自建庫以來至2019年該領域相關文獻,并利用CiteSpace和VOSviewer科學計量軟件進行可視化知識圖譜繪制。
摘要:為系統探索數據挖掘在中醫診斷學領域應用的科研產出、研究主體及研究主題演化路徑和前沿熱點問題,研究以中國知網(CNKI)期刊數據庫為數據源,收集自建庫以來至2019年該領域相關文獻,并利用CiteSpace和VOSviewer科學計量軟件進行可視化知識圖譜繪制。該研究領域的成長依次經歷了起源階段、探索階段、發展階段、平臺階段及新的發展階段,學者們對該領域研究的關注度總體上呈上升趨勢。目前,該領域高產作者共有35位,發文期刊主要為中醫領域的核心期刊,機構以上海中醫藥大學、北京中醫藥大學、湖南中醫藥大學科研產出最多。研究主題主要形成四大聚類:計算機與中醫辨證論治、數據挖掘與疾病用藥規律、中醫計量診斷、人工智能與中醫四診。主要研究主題從較早的計算機輔助診斷、數學模型、計量診斷、證素辨證等在中醫診斷的應用發展至近年來的數據挖掘、關聯規則、中醫藥、模糊數學、用藥規律、聚類算法、大數據、狀態辨識、名老中醫等。特別是在現今互聯網+及“健康中國”的時代背景下,中醫診斷有了新的內涵,充分發揮數據挖掘優勢,立足中醫思維與名醫經驗,挖掘中醫藥真實世界的健康大數據規律成為新興熱點。
關鍵詞:數據挖掘;中醫診斷;知識圖譜;CiteSpace;VOSviewer;文獻計量;發展趨勢
中醫診斷[1]立足于整體觀念,分別從望、聞、問、切4個不同方面收集疾病相關信息,通過綜合分析以判斷當前疾病的內在機制給出相應的辨證,從而指導臨床用藥,這個過程體現了中醫最大的特點,即辨證論治。然而,傳統辨證診斷方法也存在一定的局限性。首先,繁雜性。同一證候表現常有不同的辨證方法,面對繁多分類,往往給學習者帶來困惑。其次,主觀性。中醫辨證主要憑借人體感官所獲取的病例信息,其主觀性較大。再者,模糊性。中醫中許多概念都是以定性或半定量為主,診斷相關的癥狀如頻率、嚴重程度、證候的輕重、轉歸等都是相對模糊的概念,因此傳統中醫診斷過程中的規范、客觀、量化一直成為近半個世紀以來中醫研究領域中亟待解決的關鍵問題[2]。
自20世紀70年代開始,受計算機新技術的影響,中醫學者開始尋求借助計算機技術以解決中醫復雜、靈活的辨證問題,這也為后面的數據挖掘技術與中醫辨證診斷結合奠定了基礎,并促進了中醫的現代化發展。數據挖掘是指從大量的、不完全的、有噪聲的、模糊的數據中通過挖掘隱藏于其中有用信息的過程,它由計算機科學、統計學、機器學習、專家系統和模式識別等諸多方法多個領域相融合而形成的一個交叉學科[3]。可見,數據挖掘技術可充分考慮到真實世界中中醫數據繁雜、模糊、非線性的特點,從復雜的臨床數據中挖掘繁雜的證、癥關系,尋找大數據下的隱藏中醫知識和規律[4],這無疑成為中醫診斷客觀化進程中有力的催化劑。
雖然有不少文獻對近年來常用數據挖掘方法在中醫診斷領域進行總結梳理,但參考文獻有限,且缺乏基于整體學科發展趨勢的科學計量研究。因此,研究運用科學計量方法,通過繪制可視化知識圖譜,概括國內數據挖掘在中醫診斷學領域應用文章的發表情況、主要研究主題、研究熱點及未來的發展趨勢等,以期對中國中醫診斷與數據挖掘交叉領域研究提供有益參考。
1研究方法
1.1文獻來源文獻資源以國內科技文獻中最全的中國知網(CNKI)數據庫為檢索來源,為保證文獻質量,進一步選擇中國知網學術期刊網絡出版總庫,采用高級檢索功能,依次對“中醫”“診斷”“數據挖掘”及其同義詞進行主題檢索,并選擇在結果中檢索,時間范圍設置為1915—2019年,文獻類型選擇“期刊”,排除會議摘要、雜志通知、廣告、信件等內容后,將所選文獻以“Refworks”文件格式導出以進行可視化分析,同時保存至Endnote軟件以進行文獻整理和查重。
1.2數據處理利用CNKI數據庫文獻分析功能進行描述性分析,利用Endnote對收錄文章進行查重處理,并提取相關題錄信息進行頻數統計分析。利用信息可視化軟件CiteSpace(V5.5.R2)和VOSviewer(V1.6.14)進行本研究領域知識圖譜繪制。前者是由美國德雷塞爾大學陳超美博士所開發,其特點是能夠展示一個學科或知識域在一定時期發展的趨勢與動態,并形成若干研究前沿領域的演進歷程[5];后者是由荷蘭萊頓大學的NeesJanvanEck和LudoWaltman所共同開發[6],其主要特點是可以對學科主題之間的關系進行清晰的呈現。文章結合兩款科學計量軟件的優勢,通過對發文作者與機構合作網絡、關鍵詞共現與時間演變、突現詞等進行分析,以進一步探討數據挖掘技術在中醫診斷學領域應用研究中的主題分布與熱點演進情況。
2研究結果
2.1總體分布特征
2.1.1年度發文量通過對CNKI所有文獻資料檢索初步獲得1797篇文獻,進一步將文獻類型設為“期刊”,獲得期刊文獻共計693篇文獻,并將不符合研究內容的文獻如會議摘要、期刊通知等刪除,并去除重復文獻,最后共得662篇符合研究標準的目標文獻,時間跨度從1979—2019年。期刊文獻為科研思路和成果的重要載體,發文量可以一定程度上反應科研產出情況。數據挖掘在中醫診斷學領域應用的發文量隨時間分布見圖1,從發文量來看,數據挖掘與中醫診斷相關的期刊文獻出現5個較明顯的發展階段。
1)1979—1987年為交叉學科的起源階段,中醫學界開始紛紛探索用科學計算機、統計手段解決中醫診斷存在的問題以尋求實現現代化的方法,發文量開始遞增,該階段每年平均發文量9篇。
相關期刊推薦:《天津中醫藥》(月刊)1984年創刊,是綜合性中醫藥學術刊物,國內外公開發行,經國空和科技部批準,旨在更全面地報道中醫、中藥現代化研究的新成果、新技術。為了促進中醫、中藥在全國省市間及全世界的學術交流本刊收稿范圍包括國際稿件、全國各地稿件、天津稿件。設有:名醫精粹、情志醫學、臨床報道、中西醫結合專欄、針灸經絡、實驗研究、學術探討、爭鳴園地等欄目。
2)1988—2002年為緩慢的科學探索階段,該時期每年發文量波動不大并維持在相對較低水平,主要基于前期的研究工作進行探索與驗證,每年平均發文量6篇。3)2003—2008年期間為發展階段,該時期在數據挖掘與中醫診斷學領域中有較多的新方法和新理論產出,發文量開始呈較快上升速度,2005年論文增長率為92%,2008年發表論文達40篇,該階段平均每年發文量為23篇。4)在2009—2015年為發展平臺期,自2009年相關論文發表量回落后,論文發表保持在相對穩定的水平,曾出現短暫的回落但又快速恢復,平均年度發文量為27篇。5)2016年至今為新的發展階段,論文發表量至2019年達到歷史最高的53篇,平均每年發文量為42篇。可見,目前數據挖掘在中醫診斷學領域應用研究有著很好的發展前景,但如何更好實現中醫診斷現代化還需要更多的學者予以關注。
2.1.2學科和期刊分布在CNKI數據庫中顯示本研究領域發表的文獻所屬學科集中在醫藥衛生科技,約占64.5%;其次,是信息科技,約占28.7%。此外還涉及工程科技、社會科學及基礎科學等領域,有些文獻內容涉及不同學科的交叉,故也會出現同一篇文獻歸于幾個不同學科的現象,這也體現了學科的交叉是科學發展的原始動力之一。1979—2019年間中醫診斷與數據挖掘交叉領域研究的文獻共計在國內243個期刊發表,發文量前20名的期刊情況如圖2所示,發表在《中華中醫藥雜志》《遼寧中醫藥雜志》《中國中醫藥信息雜志》上的數量最多,分別為34篇(6.25%)、25篇(5.77%)、21篇(4.81%),這些期刊主要為中醫領域的核心期刊,說明國內將數據挖掘與中醫診斷學交叉領域已有被學術界認可的學術成果。
2.2研究主體
2.2.1主要作者分布本次納入研究的662篇文獻共包含1749位作者,其中核心作者是活躍在這一研究領域的代表性學者。依據普賴斯定律的計算公式:m=0.749(1)式中nmax為所統計年限中發表論文最多的作者的發文數,而發表論文數在m篇以上的作者即被認為是高產作者。統計發現高產作者發文量最多為13篇,故m=2.7,按照取整原則,高產作者發文量大于或等于3篇。通過數據統計與分析,發文量3篇及以上的作者有35位,其中發文量為前20位作者如表1所示,高產論文學者主要有周小青、李建生、林求誠、胡金亮、朱文峰、晏峻峰、王憶勤、王永炎、袁肇凱、李燦東、王階等。通過VOSviewer對近20年(1999—2019年)作者主要合作網絡進行可視化分析,如圖3所示,不同節點顏色代表不同的年份,顏色越接近藍色,說明該作者發文時間越久,是該研究領域的早期開拓者;節點顏色越接近黃色,說明該作者發文時間越近,是該研究領域的新近活躍者。圖中清楚地展現了近20年全國數據挖掘在中醫診斷學科領域應用研究的主要團隊的合作與發展脈絡,并且發文量較多的作者呈現出明顯的網絡特征,說明中國該領域已形成多個產量較高的作者群。
2.2.2研究機構分布本領域的發文機構主要集中在中醫藥大學及附屬醫院,高產研究機構有上海中醫藥大學(43)、北京中醫藥大學(42)、湖南中醫藥大學(40)等,圖4中列出了排名前18位的機構。進一步利用CiteSpace軟件對近20年本領域的主要研究機構繪制共現圖譜,切片長度(SliceLength)設置為2,篩選原則(SelectionCriteria)為T50,修剪方法選尋徑法(Pathfinder),并將節點閾值(Threshold)設為2次,如圖5所示。圖中共出現64個節點和40個鏈接,密度值為0.0198,從圖中知中國該領域的合作多以省內合作為多,跨省合作對象主要是各中醫藥大學之間,值得注意的是少部分理工類機構也加入其中,主要有廈門大學智能科學與技術系、廣東工業大學自動化學院、河南大學數據與知識工程研究等。從合作發文時間來看,早期以湖南中醫藥大學、北京中醫藥大學發文為主,而后上海中醫藥大學、廣州中醫藥大學發展起來,近幾年福建中醫藥大學、山東中醫藥大學及成都中醫藥大學也成為后起之秀。
2.3研究主題與發展趨勢
2.3.1關鍵詞共現分析研究的主題的分布及演化過程能夠體現不同時序內的熱點領域、分析視角、研究方法等的變化。而關鍵詞作為學術論文研究主題的精煉表達,其在一定程度上可以揭示學科領域中知識的內在聯系。文章對1979—2019年出現的關鍵詞進行同義詞合并,其中出現頻數排前28位的關鍵詞分布見于表2。運用VOSviewer軟件對中醫診斷與數據挖掘交叉領域的文獻中作者所給出的關鍵詞進行共現分析,取閾值3后繪制圖6。關鍵詞字體越大、結點越大說明該關鍵詞在網絡中越重要,不同顏色代表其不同的聚類,從圖中可以看出,本交叉學科研究領域圍繞“數據挖掘”核心技術主要形成4大關鍵詞類簇,形成4個主題:計算機與中醫辨證論治(紅色部分),數據挖掘與疾病用藥規律(綠色部分),中醫計量診斷(藍色部分),人工智能與中醫四診(黃色部分)。從圖中可知這4種聚類之間存在一定的混合部分,如紅色區域中的“辨證論治”與藍色部分“中醫辨證”、綠色部分的“數據挖掘”與黃色部分的“人工智能”等存在著有包含和重疊的部分,說明各研究主題之間存在相互交叉、滲透的關系,這也是學術研究中普遍存在的現象,有助于中醫診斷與數據挖掘交叉領域研究的深入發展。——論文作者:夏淑潔1,2,楊朝陽1,2,林雪娟1,李書楠3,王洋1,李燦東1,2
声明:①文献来自知网、维普、万方等检索数据库,说明本文献已经发表见刊,恭喜作者.②如果您是作者且不想本平台展示文献信息,可联系学术顾问予以删除.
SCISSCIAHCI