發(fā)布時間:2019-04-16所屬分類:文史論文瀏覽:1次
摘 要: 摘要:隨著科學技術(shù)迅速發(fā)展,學術(shù)成果呈爆炸式增長,挖掘論文的核心作者、識別高引論文、分析文獻主題變得日益重要。通過Python抓取中國知網(wǎng)1953-2018年間990篇水族文獻,基于文獻的計量分析方法挖掘出我國水族文獻的高影響力期刊、報紙及機構(gòu),分析水族領(lǐng)
摘要:隨著科學技術(shù)迅速發(fā)展,學術(shù)成果呈爆炸式增長,挖掘論文的核心作者、識別高引論文、分析文獻主題變得日益重要。通過Python抓取中國知網(wǎng)1953-2018年間990篇水族文獻,基于文獻的計量分析方法挖掘出我國水族文獻的高影響力期刊、報紙及機構(gòu),分析水族領(lǐng)域高引論文、發(fā)文熱點時間及核心作者;基于知識圖譜的分析方法構(gòu)建水族文獻核心科研群體及作者間的合作關(guān)系,并揭示出水族文獻的主題演化趨勢。實驗結(jié)果展示我國水族文獻的發(fā)展歷程、核心科研群體和高引論文,識別出水族文化、體育、音樂、醫(yī)學和水書五大主題的關(guān)鍵詞及歷年的主題演化趨勢,為水族文化的研究和進一步發(fā)展提供相關(guān)啟示。
關(guān)鍵詞:水族文獻,計量分析,知識圖譜,高引論文,中國知網(wǎng)
隨著科學技術(shù)迅速發(fā)展,學術(shù)成果呈爆炸式增長,基于文獻的計量分析可以挖掘出一個研究領(lǐng)域的高影響力期刊和機構(gòu),識別出高被引論文的主題、出版社和核心作者;基于知識圖譜的分析可以構(gòu)建文獻作者的合作關(guān)系,挖掘出核心科研群體,并揭示文獻的主題演化趨勢。水族是一個具有悠久歷史和古樸文化的民族,繁衍生息于貴州、云南、廣西等省份,擁有獨特的民族文化、風土人情和語言文字[1],具有重要社會歷史文化價值。
近年來,學術(shù)界和社會媒體掀起了研究水族文化和水書的熱潮,1953年至今,中國知網(wǎng)共收錄水族相關(guān)文獻990余篇,涉及水族文化、水族體育、水族醫(yī)學、水族音樂、水書文字等主題。水族文獻作為水族文化和知識交流的重要載體,是水族相關(guān)的學術(shù)研究團隊或科研工作者貢獻的重大成果。這些學術(shù)成果將有效地推動水族學科和領(lǐng)域的發(fā)展,為進一步追蹤水族源流、研究水族文化變遷、保護和傳承水族文化提供相關(guān)啟示。
傳統(tǒng)的學術(shù)成果研究方法是基于文獻計量學和科學計量學的方法,分析內(nèi)容包括文獻的主題、地域分布、機構(gòu)分布、核心作者、引文特點等。姜春林通過文獻計量歷時法對《科學學研究》做出全面的計量分析[2]。梁永霞等基于CSSCI的中國引文分析進行了可視化研究,展現(xiàn)引文分析領(lǐng)域的知識結(jié)構(gòu)關(guān)系[3]。黃曉斌等統(tǒng)計分析我國情報學高被引論文,展示情報學的發(fā)展歷程和學科主題[4]。蔡文伯等通過計量分析方法研究我國民族教育文獻態(tài)勢[5]。
王宗水等基于1998-2014年中國社會科學引文數(shù)據(jù)分析社會網(wǎng)絡范式的演化、發(fā)展與應用[6]。徐庶睿等利用引文內(nèi)容進行主題級學科交叉類型分析[7]。近年來,國內(nèi)外學者致力于通過數(shù)據(jù)分析與機器學習技術(shù)來研究學術(shù)文獻,基于社交網(wǎng)絡和知識圖譜的引文分析技術(shù)也被用來輔助科研工作者和管理者把握學科發(fā)展脈絡,挖掘主題關(guān)鍵詞和核心作者。羅雙玲等提出了基于半積累引文網(wǎng)絡社區(qū)發(fā)現(xiàn)的學科領(lǐng)域主題演化分析方法,并應用于“合作演化”領(lǐng)域[8]。馬文博等通過文獻計量方法和知識圖譜分析《經(jīng)濟研究》近十年載文[9]。
任曉松等歸納研究中國碳排放熱點演化與知識圖譜分析[10]。當前水族領(lǐng)域的研究更多的是采用傳統(tǒng)的查閱資料、現(xiàn)場考察及問卷調(diào)查等方法分析水族文化、歷史、習俗、水書內(nèi)容,沒有采用計量分析方法和知識圖譜來研究水族文獻,缺乏對水族文化深層次的主題演化和科研群體發(fā)現(xiàn)的研究。
針對這些不足,本文提出了一種基于計量分析和知識圖譜的水族文獻分析方法,一方面統(tǒng)計分析水族文獻的高影響力期刊、報紙及機構(gòu)的基本情況,挖掘水族領(lǐng)域高被引論文、發(fā)文熱點時間及核心作者;另一方面通過知識圖譜構(gòu)建水族領(lǐng)域核心科研群體及作者間的合作關(guān)系,并揭示出水族文獻的主題演化趨勢。本文的研究成果具有重要的理論意義和實用價值,對傳承與弘揚水族傳統(tǒng)文化具有重要意義,為水族文化的研究和進一步發(fā)展提供相關(guān)啟示,為后續(xù)的水族引文分析、水族遷徙研究和水族文化傳承提供有效支撐。
1研究方法和數(shù)據(jù)采集
1.1算法總體流程
當前科研成果的分析研究已經(jīng)引起了社會和學術(shù)界的廣泛關(guān)注和重視,所涉及的領(lǐng)域包括引文分析、論文自動分類、主題挖掘、學術(shù)成果測度、論文知識圖譜構(gòu)建等。本文主要是關(guān)于水族文獻的計量分析和知識圖譜研究。(1)調(diào)用Python、Selenium和XPath技術(shù)自動抓取中國知網(wǎng)水族領(lǐng)域的文獻共990篇。(2)對所抓取的論文信息進行數(shù)據(jù)預處理,包括數(shù)據(jù)清洗、數(shù)值提取、中文分詞、停用詞過濾等處理,這是數(shù)據(jù)分析的重要處理環(huán)節(jié)。(3)將預處理之后的文本數(shù)據(jù)轉(zhuǎn)換為特征詞矩陣,涉及特征提取和權(quán)重計算。(4)通過計量分析和知識圖譜方法研究水族文獻,包括水族高影響力論文、知識圖譜挖掘核心作者及科研群體、水族文獻主題挖掘及演化趨勢等。
1.2數(shù)據(jù)說明及預處理
本文數(shù)據(jù)集采用Python自定義爬蟲抓取中國知網(wǎng)CNKI水族領(lǐng)域相關(guān)的學術(shù)成果信息,包括1953-2018年共收錄的990篇水族領(lǐng)域的學術(shù)文獻,其中學術(shù)期刊論文662篇,會議論文106篇,博士論文7篇,碩士論文91篇,中國專利5篇,科技成果3個,報紙116篇,詳細信息如表1所示。所抓取的水族文獻共包括九個字段,包括文章標題、出版社、文獻類型、出版年份、下載次數(shù)、引用次數(shù)、作者、摘要和關(guān)鍵詞。
在進行數(shù)據(jù)分析之前,通常需要對所爬取的信息進行預處理操作,包括缺失值填充、異常值處理、數(shù)據(jù)清洗、中文分詞、停用詞過濾等步驟,其目標是為了得到高標準、高質(zhì)量的數(shù)據(jù),從而提升分析的結(jié)果。接著從六個方面分析水族文獻,包括水族文獻的高影響力期刊報紙及機構(gòu)計量分析、高被引水族論文計量分析、水族文獻的時間跨度分析、高引論文的核心作者分析、核心作者知識圖譜分析及科研群體發(fā)現(xiàn)、水族文獻主題挖掘及演化趨勢。
2水族文獻分析及研究
2.1高影響力期刊、報紙及機構(gòu)計量分析
本文將分析水族文獻的高影響力期刊、報紙及機構(gòu),所采用的指標是刊載成果數(shù)量、總引用數(shù)量、總下載數(shù)量、篇均引用數(shù)量和篇均下載數(shù)量。
(1)引文期刊分析
對水族學術(shù)期刊論文的計量分析,可以從宏觀層面揭示出刊載期刊及研究群體的力量分布情況,也在一定程度上挖掘出高影響力的期刊,它們對水族文化研究做出了重要的貢獻。其中《黔南民族師范學院學報》刊載論文數(shù)量最多,共刊載45次;《貴州民族研究》總引用次數(shù)最多,42篇論文共被引用203次;《人類學學報》篇均引用數(shù)量最高,刊載10篇論文,平均每篇論文被引用16.40次。
(2)引文機構(gòu)分析
引文機構(gòu)分析主要研究來自全國各大高校、各類研究所和圖書館等機構(gòu)的水族文獻。本文根據(jù)畢業(yè)論文的第一單位進行統(tǒng)計分析。發(fā)表水族領(lǐng)域相關(guān)論文兩篇及以上的機構(gòu)共16個,其中刊載水族論文數(shù)量排名前三位的分別是:貴州民族大學(共刊載16篇)、貴州師范大學(共刊載8篇)、貴州大學(共刊載8篇);論文被引用最多的四個機構(gòu)是:貴州民族大學(共被引用32次)、貴州師范大學(共被引用24次)、云南大學(共被引用19次)、昆明理工大學(共被引用19次);論文被下載最多的三個機構(gòu)是:云南大學(共被下載4193次)、貴州民族大學(共被下載3715次)、中央民族大學(共被下載2793次)。
該結(jié)果表明大學是水族領(lǐng)域研究機構(gòu)的中堅力量,這些大學主要分布于貴州、云南、廣西等省份,這些省份也是水族的聚居區(qū);同時民族類和師范類大學也對水族文化有重要的貢獻,如貴州民族大學、中央民族大學、華東師范大學、廣西民族大學等。
(3)引文報紙分析
報紙作為學術(shù)成果的組成部分,同樣對水族文化和水族傳承具有一定的貢獻,它能讓社會大眾接觸到水族文化內(nèi)涵、水書藝術(shù)和遷徙漂泊的歷史。其中《貴州民族報》報道的水族領(lǐng)域文章數(shù)量、下載次數(shù)和被引用次數(shù)都是最多,分別為發(fā)表45篇、被下載633次和被引用2次;接下來是《黔南日報》報道了20篇,《貴州日報》報道了19篇,《中國民族報》報道了9篇。
2.2高被引水族論文計量分析
論文被引用頻次越高,說明論文的學術(shù)價值越高。本文研究的990篇水族學術(shù)成果共被引用2124次,平均每篇學術(shù)成果被引用2.15次。被引用次數(shù)最多的文獻類型是學術(shù)期刊和碩士/博士論文,其中學術(shù)期刊662篇共被引用了1869次,碩士/博士論文98篇共被引用了242次,二者共占總被引用次數(shù)的99.4%。
全部10篇高引論文的被引頻次都是20次以上,是所有水族文獻篇均被引用次數(shù)(2.15次)的10倍。其中被引頻次最高的論文是李培春等在1994年發(fā)表在《人類學學報》上的“水族的體質(zhì)特征研究”一文,被引頻次為82次;排名第二的是蘇和平所作,2004年發(fā)表在《貴州民族研究》上的“水族審美意識探源”,被引頻次為48次;隨后是孫志國等于2011年發(fā)表在《貴州民族學院學報(哲學社會科學版)》上的“水族非物質(zhì)文化遺產(chǎn)保護的探討”,顧曉艷等于2006年發(fā)表在《中國體育科技》上的“傳統(tǒng)體育文化在水族山寨中的生存狀態(tài)——水族‘端節(jié)’賽馬活動的變遷”,兩者被引頻次均為38次。
其中被引頻次前三位的分別是:陜西師范大學陳永娥的“黔南本土文化語文校本課程資源開發(fā)的研究”,被引用23次;云南大學尤偉瓊的“云南民族識別研究”,被引用18次;上海師范大學韋學純的“水語描寫研究”,被引用14次。
這10篇論文主要分布于民族類、師范類、人文社科專業(yè)較強以及西南水族聚居區(qū)所在的高校,一定程度上反映了這類大學對我國民族文化研究的影響程度。
3研究結(jié)論
本文采用計量分析方法和知識圖譜方法研究中國知網(wǎng)的水族文獻,涉及1953-2018年共990篇水族領(lǐng)域的學術(shù)成果。研究成果如下:
(1)通過對水族文獻的高影響力期刊、報紙及機構(gòu)計量分析發(fā)現(xiàn):①民族類和人文社科類的期刊對水族文化研究做出了重要的貢獻,如《黔南民族師范學院學報》《貴州民族研究》《人類學學報》等。②大學是水族領(lǐng)域研究機構(gòu)的中堅力量,這些大學主要分布于貴州、云南、廣西等省份,這些省份也是水族的聚居區(qū);同時民族類和師范類大學也對水族文化有重要的貢獻,如貴州民族大學、中央民族大學、華東師范大學等。③報紙是學術(shù)成果的重要組成部分,對水族文化和水族傳承具有一定的貢獻,它能讓社會大眾接觸到水族文化內(nèi)涵、水書藝術(shù)和遷徙漂泊的歷史,具有代表性的包括《貴州民族報》《黔南日報》《中國民族報》。
(2)高被引論文期刊和機構(gòu)主要分布于民族類、師范類、人文社科專業(yè)較強以及西南水族聚居區(qū)所在的高校。被引頻次前10位的學術(shù)論文的被引頻次都是20次以上,是所有水族文獻篇均被引用次數(shù)(2.15次)的10倍,這些作者是水族文化研究的核心力量,這一定程度上反映出高校對我國民族文化研究的影響程度。
(3)通過水族文獻時間跨度分析展示了水族文獻研究的進程和不同年份的文獻分布情況。最早一篇論文發(fā)表在1953年,是凌慰民老師發(fā)表在《中國金融》的“少數(shù)民族地區(qū)的農(nóng)貸工作不能違反民族政策”。被引用10次及以上的文獻共45篇,被引用5至9次的文獻共64篇,被引用2至4次的文獻共151篇,僅被引用1次的文獻共137篇。2012年被引用過的水族文獻最高,共45篇;2006年被引用的總頻次最高,為277次,其中10篇文章被引用頻次10次以上,為高被引論文;2004年單篇均被引用頻次最高,平均每篇論文被引用10.69次。
(4)高引論文的核心作者分析采用發(fā)文量、被引頻次、篇均被引頻次三個指標評估核心作者,并挖掘出40位核心作者,其中余躍生發(fā)表了水族相關(guān)的文章23篇,被引頻次為174次,篇均被引頻次為7.57次;顧曉艷發(fā)表了水族文獻16篇,被引頻次為176次,篇均被引頻次11次;趙凌發(fā)表了水族領(lǐng)域的論文14篇,被引頻次為25次,篇均被引頻次1.79次。
(5)通過知識圖譜構(gòu)建了水族文獻作者之間的合作關(guān)系,挖掘出水族文獻的核心科研群體,形成了以余躍生、顧曉艷、趙凌、潘朝霖、何燕、吳昌學、劉世彬、單可人等學者為核心的學術(shù)研究團體。其中以余躍生為首的團隊以水族基因、水族醫(yī)學、遺傳學方向為主;以顧曉艷和王亞瓊為首的團隊主要研究水族體育、水族文化傳承;以何燕為首的團隊研究方向是水族醫(yī)學、水族基因、心血管疾病;以趙凌為首的團隊主要研究水族音樂和水族樂器;以潘朝霖老師為首的團隊主要研究水書、水族圖騰、水族祝詞;以張振江為首的團隊以水族村落、水族祖靈和民族語言為主。這些團隊主要來自于黔南民族醫(yī)學高等專科學校、黔南民族師范學院、貴陽醫(yī)學院、黔南民族師范學院、貴州民族大學、中山大學等機構(gòu)。
(6)通過LDA模型識別出水族文獻的五大主題(水族文化、水族體育、水族音樂、水族醫(yī)學和水書文字)及關(guān)鍵詞,并采用詞云展示了1953年以來水族文獻的主題演化趨勢,包括1953-1995年、1996-2000年、2001-2005年、2006-2010年、2011-2015年、2016-2018年中不同年份的水族文獻所研究的熱點主題關(guān)鍵詞。
總之,本文的研究成果具有重要的理論意義和實用價值。該結(jié)果展示了我國水族文獻的發(fā)展歷程、高引論文、核心科研群體的研究熱點,指出了水族領(lǐng)域高被引論文的主要特征及影響,識別出水族文化、體育、音樂、醫(yī)學和水書五大主題的關(guān)鍵詞及歷年的主題演化趨勢,對傳承與弘揚水族傳統(tǒng)文化具有重要意義,為水族文化的研究和進一步發(fā)展提供相關(guān)啟示,為后續(xù)的水族引文分析、水族遷徙研究和水族文化傳承提供有效支撐。
參考文獻:
[1]饒文誼,梁光華.關(guān)于水族水字水書起源時代的學術(shù)思考[J].原生態(tài)民族文化學刊,2009(4):90-93.
[2]姜春林.基于文獻計量學歷時法引文的案例分析[J].現(xiàn)代情報,2005(10):140-145.
[3]梁永霞,楊中楷,劉則淵.基于CSSCI的中國引文分析的可視化研究[J].情報研究,2008:34-38.
[4]黃曉斌,張歡慶.我國情報學高被引論文分析[J].情報科學,2018,36(1):54-60.
[5]蔡文伯,馬杰.我國民族教育研究文獻態(tài)勢的計量分析[J].民族教育研究,2014,25(2):138-144.
[6]王宗水,趙紅,劉宇,秦續(xù)忠.社會網(wǎng)絡研究范式的演化、發(fā)展與應用——基于1998-2014年中國社會科學引文數(shù)據(jù)分析[J].情報學報,2015,34(12):1235-1245.
相關(guān)刊物推薦:《情報科學》曾用刊名:(國外情報科學),1980年創(chuàng)刊,本著求實創(chuàng)新的理念,始終站在學科研究的前沿,全面反映學科發(fā)展的動態(tài),著力突出刊物與時俱進的時代特征,抓住圖書情報界的研究熱點,刊發(fā)了一大批既有理論水平,又有學術(shù)影響的重要論文,及時反映了情報學、信息管理、圖書館學等諸領(lǐng)域的最新研究進展。《情報科學》主管單位:國家教育部,主辦單位:中國科學技術(shù)情報學會;吉林大學,國內(nèi)統(tǒng)一刊號:22-1264/G2,國際標準刊號:1007-7634.