Saturday, July 19, 2008

部落格流量(2): friend or foe?

故事要從好萊屋明星Kevin Bacon說起[1]. 我對Kevic Bacon的印象來自電影透明人裡飾反派的Caine一角. 也許在該片中他表現出色, 之後再看阿波羅13才發現他竟然也出現在阿波羅13裡. 儘管不算特別有名, 二線明星的他在1994年被電影雜誌Premiere訪問電影the River Wild時曾誇口他幾乎與任何好萊屋明星或者與這些明星共事的人合作過,例如:

問: Kevin Bacon和Val Kilmer合作過嗎?
答: Val Kilmer在捍衛戰士(Top Gun)裡和Tom Cruise合作, 而Tom Cruise與Kevin Bacon兩人於軍官與魔鬼(A few good men)一片合作.

也就是說, 如果以Kevin Bacon為原點, 那麼, Tom Cruise可以編號為一號, 而Val Kilmer就是二號, 也就是說Kilmer與Bacon有兩度的分隔(two degree). 故事演變的結果是發展出一套稱為 Six Degrees of Kevin Bacon的遊戲. 顧名思義, 娛樂圈內的所有人至多與Kevin Bacon相隔6層關係. 這當然是誇張, 因為實際上大約有12%的演員和Kevin Bacon “沒有關係”[註]. 即便如此, 這遊戲在於傳遞一個 “世界真小”的訊息. (對一堆理論或數字沒興趣者可直接跳到最後小結)

今日的部落格或早期的社群正是一種透過網路串聯起的小世界. 學術界早於1961年由Mikhail Iosifovich Gurevich發展出所謂的網路分析(network analysis).Gurevich當時是MIT的博士班學生, 與他的指導教授根據所謂的”small world”實驗而發表一篇名為聯絡與影響(Contacts and Influences)的手稿而得出以當時美國人口數而言, 兩個個人之間可以藉由兩個中間人(intermediaries)而互相連結. 雖然網路的概念早已有知,應用在電腦網路上的研究一直到了1999年才開始. Barabási 與Albert 發現電腦網路的連結並不均勻,反之, 單獨電腦之間是透過中介者串聯起的, 此類網路被稱為scale free network,而與一般隨機網路(random)有別, 如下圖:
(圖一)

除了電腦網路之外, 現實社會中還有許多此類scale free network的例子. 第一個例子是航空轉運站(hub). 例如西北航空的轉運中樞在雙城市與底特律, 因此絕大部分的飛機都是在此兩地間轉機. 又例如聯合航空的轉運中樞在芝加哥, US Air的在鳳凰城等. 不難想像, 轉運中心的交通量往往比其他城市的航空站來得大.

回到部落格流量的問題, 一個合理的推論是: 如果部落格構成的網路世界也具有scale free網路的特性, 就如同部分旅客到轉運中心的目的在於轉機, 位於樞紐的部落格流量高的部分原因也在於讀者為了聯結到另一個部落格而造訪特定部落格,那麼位於樞鈕的部落格同理可推得其部落格流量相對較高. (當然這部份貢獻的流量是可以估計的, 下回再談—是的,我在打預告啦!).

問題於是乎變成: 部落格構成的虛擬世界真的是scale free network嗎(精確的說: 部落格夠成的網路世界是否具有cale free network的特質)? 回答這個問題前不妨先想想: 假設你喜歡的部落格有7個,從A~G,而其中A網站的10個連結裡有4個(假設是部落格C,D,E,F)是自己常造訪的,另外B網站的10個連結裡只有1個(即部落格G)是自己常造訪的, 那麼你會選擇

a) 在自己部落格裡將這7個部落格全部加入連結, 或是

b)只加入部分連結. 如何選擇這個 “部分”連結?一個簡單的方式是加入A, B與G. (或是A與B而已).


如果你選擇b) ,那麼你等於走進了scale free的網路世界. 為什麼呢? 很簡單, 你的部落格與其他部落格C,D,E,F的連結是透過中介者A! 如此一來, 每當你欲前往部落格C,D,E,F,就得先前往A因而增加A的流量了. (這也是我在第一篇中分析"因為某網誌被加入連結"類似,但不同,於此處的部落格被加入連結所造成部落格流量變化的推論基礎)這個簡單的例子也可看出, A因為與其他連結多, 因此被加入連結, 造成連結多者愈常被連結, 也就是“大者愈大”的現象, 這也是scale free 網路的特色之一: 它的連結不是均勻分布的,而是以power law(感謝網友指教,中文是"冪次律")方式從中樞向外遽減!

部落格構成的網路到底是不是scale free? 我將自己部落格的部份(為了讓自己的部落格成為樞紐而 “選擇性”畫出的…….自娛一下!) 連結畫出來. 視覺上判斷應該比較接近scale free network. (精確的話得用實際數字, 例如計算一個網路內點之間相互連結的可用P(k)^(k−γ) 來描述, 通常γ介2,3之間,未免太學術,我就省略了)
(圖二)




但是, 即使部落格構成的網路世界不是scale free network, 從網路結構還是可以解釋特定部落格的流量比較多的現象。以圖一之一般隨機網路(random network)中的三個部落格X,Y,Z為例, X與Z之間的唯一連結必須透過Y, 即使Y並非居樞紐(not a hub)之地, 但因為它控制了X與Z之間的連結, Y的流量也因此比較大. 這一類的部落格被稱為structure hole, 它解釋了即使某些部落格的對外連結甚多, 流量未必就大的現象[2]. (我把structure hole measures拿掉了,占好多篇幅,大概也沒幾個人管那個啦)

最後來談談此類scale free網路的特色. 假設每個單點受到攻擊的機率一樣, 那麼除非是樞紐受到攻擊, 否則對單點的攻擊不會蔓延到整個網路. 在資源有限的情況下有關當局只須傾全力顧好網路的樞紐即可, 類似猶太諺語“把所有雞蛋放再同一個籃子裡, 然後顧好那個籃子”. 福禍相倚, scale free network的特性是優點但也為它帶來缺點. 舉個公共衛生上的例子, 性病的傳染: 性交易工作者有如位於樞紐,一旦得病, 與其有接觸的人皆中標. 又例如, 網路世界裡一旦伺服器中毒, 其餘相連接的電腦恐怕也難逃一劫等等. 因此, 如果部落格連結建構的網路的確是scale free network, 萬一有朋友反目成仇, 即使兩方截斷了彼此之間的直接聯繫,放的火恐怕很快就會燒到自己身上, 又或是有人白目惹毛位於樞紐的部落客, 那恐怕比自斷手腳還麻煩了! 類似的, 在一般隨機網路(random network)裡,如果與位於structure hole之部落客交惡, 那麼也就無法隨心所欲到任何部落格了; 或是, 萬一當通往你部落格的唯一且必經之路被橫生阻斷, 那麼即使再多努力也無法提升流量了!

小結: 簡單講, 不管部落格夠成的網路世界是scale free或是一般隨機網路, 就如同失業率有結構性與非結構性,部落格流量大小,也有部分原因可能是部落格網路世界結構性因素所致,屬非戰之罪. 對於那些非常在乎自己部落格流量的部落客, 這樣的部落格網路結構到底是友(friend)亦敵(foe)?

[1] 這故事有學術版, 大抵是用傳信的方式, 發現在傳了六個人後信又會回到一開始想傳遞者的手裡. 大意如此.
[2] 我雖然計算了P(K)與structure hole measures 等, 但篇幅起見也考慮大概沒多少人有興趣那種技術性問題,就不一一列出了
[註] 這裡"沒有關係"的意思是說,在6度或以內(degree of 6)能和Bacon找到連結的, 不管是演員本人或是和演員共事過的就叫做有關係, 其他就叫做"沒有關係". 如果用一般日常語言, 說成"關係疏遠"比較貼切,但此處的用法類似統計上的顯著或不顯著,是二分法, 所以只分成有關係(within 6 degree)或是沒關係兩類而已.
-------------
網路版six degree of Kevin Bacon game:http://www.thekevinbacongame.com/

延伸閱讀:
6 degree : The Science of a Connected Age ( by Watts), 或
中文版: 六個人的小世界
此系列部落格

4 comments:

Gracias said...

期待第三篇喔!

GGs Adventure said...

阿 糟糕, 最近老被催稿. 事實是 因為硬碟死掉,資料還有草稿都沒救出來,就一直耽擱下來了


感謝你的興趣....請容我稍後再補寫吧

也希望各位不吝分享看法啦!

Richter said...

好文章。
Power law 可稱為冪次律。

GGs Adventure said...

感謝!

也多謝您提供power law的中文,已更新於文中