發(fā)布時間:2020-03-04所屬分類:計算機(jī)職稱論文瀏覽:1次
摘 要: 摘 要:在大數(shù)據(jù)背景下,文章實證地研究了一類合作競爭網(wǎng)絡(luò)的集群系數(shù)對頂點度的依賴關(guān)系,結(jié)果顯示兩者的依賴關(guān)系函數(shù)c(k)形式是多樣的,有指數(shù)形式、泊松形式和冪律形式。通過廣義合作網(wǎng)絡(luò)模型,在項目大小分布分別是指數(shù)分布、泊松分布和冪律分布的三種情
摘 要:在大數(shù)據(jù)背景下,文章實證地研究了一類合作競爭網(wǎng)絡(luò)的集群系數(shù)對頂點度的依賴關(guān)系,結(jié)果顯示兩者的依賴關(guān)系函數(shù)c(k)形式是多樣的,有指數(shù)形式、泊松形式和冪律形式。通過廣義合作網(wǎng)絡(luò)模型,在項目大小分布分別是指數(shù)分布、泊松分布和冪律分布的三種情況下,數(shù)值模擬了集群系數(shù)對頂點度的依賴關(guān)系。得到的結(jié)果與實證統(tǒng)計的結(jié)果相同,即c(k)有指數(shù)形式、泊松形式、冪律形式及SPL等多種形式,并得出隨機(jī)選擇舊節(jié)點連接的概率p越大,所得網(wǎng)絡(luò)的集群系數(shù)對頂點度的依賴關(guān)系越遠(yuǎn)離冪律形式,越接近均勻情況即指數(shù)形式或者泊松形式。
關(guān)鍵詞:集群系數(shù);頂點度;實證統(tǒng)計;數(shù)值模擬;隨機(jī)概率
0 引言
復(fù)雜網(wǎng)絡(luò),一個引起幾乎一切基礎(chǔ)學(xué)科和應(yīng)用學(xué)科注意的熱門研究領(lǐng)域,開始于1998年。它的研究和發(fā)展以圖論作為重要基礎(chǔ),圖論的大量知識在網(wǎng)絡(luò)研究過程中得到了廣泛的應(yīng)用。之后,許多物理學(xué)家把統(tǒng)計物理學(xué)引入到復(fù)雜網(wǎng)絡(luò)的研究中,大家才知道,許多實際網(wǎng)絡(luò)的一些性質(zhì):例如集群系數(shù)(clustering coefficient)、度(degree)分 布 、平 均 距 離(averaged distance)等。
頂點度(degree of a vertex),用k表示,是復(fù)雜網(wǎng)絡(luò)研究中的一個重要的統(tǒng)計性質(zhì)。一般地,假設(shè)網(wǎng)絡(luò)中的一個節(jié)點i有ki條邊將它和其他節(jié)點相連,那么這 ki個節(jié)點就是節(jié)點 i 的鄰點。某一節(jié)點 i 的頂點度 ki,就定義為與該節(jié)點相連接的領(lǐng)點的總數(shù),即節(jié)點的度表示為該節(jié)點的鄰點個數(shù)的總和。直觀上看,度越大的節(jié)點意味著它在某種意義上顯得越“重要”。
集群系數(shù)(clustering coefficient),用 c 表示,是復(fù)雜網(wǎng)絡(luò)研究中的另一重要統(tǒng)計性質(zhì)和概念。它表示網(wǎng)絡(luò)中某一節(jié)點的鄰點之間聯(lián)系的緊密程度。例如,在你的朋友關(guān)系網(wǎng)絡(luò)中,你的兩個朋友彼此間也是朋友的可能性大小。假設(shè)網(wǎng)絡(luò)中的一個節(jié)點i有ki條邊將它和其他節(jié)點相連,顯然,在這ki個節(jié)點之間最多可能有ki(ki-1)/2條邊,實際存在的邊數(shù)記為Ei。
Erzsébet Ravasz 和 Albert-László Barabási 曾研究過復(fù)雜網(wǎng)絡(luò)的層次結(jié)構(gòu)與該網(wǎng)絡(luò)集群系數(shù)對頂點度的依賴關(guān)系密切相關(guān)[1] 。他們提出,如果集群系數(shù)對頂點度的依賴關(guān)系函數(shù)c(k)是冪函數(shù)關(guān)系,即 c(k)~k-1,則表明該網(wǎng)絡(luò)具有層次結(jié)構(gòu)。反之若c(k)不滿足冪函數(shù)關(guān)系,則該網(wǎng)絡(luò)無明顯的層次結(jié)構(gòu)。通過實證調(diào)研,我們也發(fā)現(xiàn)很多實際網(wǎng)絡(luò)的c(k)并不是很好的冪函數(shù)關(guān)系,甚至有些實際網(wǎng)絡(luò)的集群系數(shù)與頂點度是無相關(guān)的[2-5] 。
本文研究目的在于討論復(fù)雜網(wǎng)絡(luò)中集群系數(shù)與頂點度的依賴關(guān)系。接下來將極其簡要地介紹我們所研究的一些實際系統(tǒng),以及這些實際系統(tǒng)的網(wǎng)絡(luò)構(gòu)成,重要的是給出我們所研究的這些實際網(wǎng)絡(luò)的集群系數(shù)對頂點度的依賴關(guān)系。之后將給出我們廣義合作網(wǎng)絡(luò)模型的數(shù)值模擬結(jié)果,并對結(jié)果進(jìn)行了粗淺的分析。最后將給出本文的一些簡單的結(jié)論,期望對復(fù)雜網(wǎng)絡(luò)的研究具有一定的價值。
1 實證統(tǒng)計結(jié)果
統(tǒng)計調(diào)研了10個實際系統(tǒng)。表1為這10個實際網(wǎng)絡(luò)的具體描述。圖1至圖10為10個實際網(wǎng)絡(luò)的集群系數(shù)與頂點度的依賴關(guān)系。
2 模型數(shù)值模擬
2.1 廣義合作網(wǎng)絡(luò)模型
下面是我們在廣義合作網(wǎng)絡(luò)模型[8] 的基礎(chǔ)上,對模型作了一定的修改,然后通過數(shù)值模擬得到了數(shù)值結(jié)果。設(shè)初始t=0時有m0個頂點,已經(jīng)聯(lián)接成若干個完全圖項目,它們的項目度hi0之和為h0。每步時間演化過程增加一個新頂點,然后,以一定的概率 p 隨機(jī)連接、以其余的概率(1-p)優(yōu)選連接,選取T-1個舊頂點,把這T-1個舊頂點和這個新頂點(共T個頂點)中兩兩之間尚未連接的邊都連上,構(gòu)成一個新的完全圖項目。共演化得到 5000 個項目,5000 個節(jié)點。我們對項目大小(T)分別為泊松分布、指數(shù)分布和冪律分布時的三種情況進(jìn)行了數(shù)值模擬,結(jié)果將在后文詳細(xì)報道。
2.2 數(shù)值結(jié)果分析
下面是我們通過數(shù)值模擬得到的數(shù)值結(jié)果,圖11、圖 12、圖 13 分別為項目大小(T)為泊松分布、指數(shù)分布和冪律分布時,當(dāng)網(wǎng)絡(luò)演化過程中新節(jié)點連接舊節(jié)點的選擇概率p取不同值時的情況得到的數(shù)值模擬結(jié)果。
3 結(jié)束語
本文對十個實際系統(tǒng)進(jìn)行了實證統(tǒng)計調(diào)研,主要研究了這十個系統(tǒng)的集群系數(shù)對頂點度的依賴關(guān)系,通過我們的研究發(fā)現(xiàn),這些系統(tǒng)的c(k)關(guān)系函數(shù)形式是多樣的,有指數(shù)函數(shù)、泊松函數(shù)等,甚至還有線性函數(shù)。為了能找出這些實證結(jié)果的合理解釋,我們通過廣義合作網(wǎng)絡(luò)模型進(jìn)行了數(shù)值模擬。通過對模型數(shù)值模擬結(jié)果的分析比較,發(fā)現(xiàn)在網(wǎng)絡(luò)演化過程中,新節(jié)點選擇舊節(jié)點的隨機(jī)概率p越大,按照節(jié)點的項目度優(yōu)選的概率(1-p)越小,演化所得網(wǎng)絡(luò)的c(k)關(guān)系越遠(yuǎn)離冪律分布,越接近相對均勻的分布,即我們此處所述指數(shù)分布或泊松分布,而與網(wǎng)絡(luò)本身的項目大小分布是什么情況無關(guān)。
相關(guān)期刊推薦:《計算機(jī)時代》(月刊)創(chuàng)刊于1983年,由浙江省計算技術(shù)研究所和浙江省計算機(jī)學(xué)會主辦,是《中國期刊網(wǎng)》、《中國學(xué)術(shù)期刊(光盤版)》和《中國核心期刊(遴選)數(shù)據(jù)庫》收錄期刊,全國發(fā)行,豐富的內(nèi)容使您能夠自由的遨游在信息的海洋里,了解新技術(shù),掌握新技術(shù),享受精彩紛呈的數(shù)字生活。目前,設(shè)有:學(xué)術(shù)論壇、技術(shù)廣角、網(wǎng)絡(luò)天地、應(yīng)用實踐、經(jīng)驗技巧、信息安全、考試團(tuán)地、市場縱覽欄目。