Thursday, July 3, 2008

部落格流量(1): fad or fashion?

這篇寫很久了, 不知怎麼今天才發現放上來,但blogger把日期放成當時存草稿之日(6/14),掩埋在舊文裡, 我只好把它重新copy & paste貼出來置頂. 精簡版(少了交通流量的例子)請見msn同名網誌.

------
你看我的部落格嗎? 廢話, 不然你就不會讀到這篇了. 當初開格的主要目的之一在於讓在台灣親朋好友知道我生活的近況(至於出閣的目的當然是找米缸好當米蟲...好冷,我知道), 這從部落格標籤就一目暸然: "水深"寫在大湖區的生活, "火熱"寫在AZ的生活,"實驗廚房"寫胡搞瞎搞的做菜雜記....當然啦, 有時候看到新聞氣火攻心也會發發牢騷,批評月旦一番, 那就歸到"瘋言瘋語"去. 這就得提到此格的第二個目的是在各自表述, 是抒發,也是批判; 是自娛也是自愚, 有些無聊學術笑話屬之.

正因為這是一個私人的空間, 我不曾注意部落格流量. 直到某次. 朋友表示要增加他部落格的流量,在我的部落格"置入性行銷"後, 我才開始注意閱讀部落格的流量,而有一些自認有趣的觀察.

既然要談流量, 第一個問題是: 部落格流量要怎麼衡量? 部落格的流量衡量是問題嗎? 是的! 就如同我們用多少"人次"來衡量博物館,或迪士尼樂園之屬的遊客數或參訪的人數; 用閱讀頁次(page viewed)來衡量部落格流量似乎正當且直覺. 但這是唯一的方式嗎?

先以交通流量為例. 當我們說交通繁忙, 到底我們是用一段期間內經過的車次來衡量呢? 還是該用一段時間內使用的人數來衡量? 而這兩種衡量方式之間又有什麼差異? 舉例來說, 假設我們關心台北市信義路4段與復興南路路口早上8點至9鐘的尖峰時段的交通流量, 經過一個月的觀察後發現, 平均此段時間有30部公車停靠, 100輛計程車行經, 200部機車, 50部轎車經過, 此外另有500行人, 那麼這段時間的交通流量到底是多少? 是單純的30+100+200+50+500=880嗎?

如果沒有大眾運輸工具, 假設每部公車上有40乘客, 每部計程車與轎車各有1乘客含司機2人乘坐, 機車皆僅一人騎乘,也就是說此時段經過該路口的人數共有30X40+150X2+200+500=2200人次!
相反的, 如果共乘機制(car pool)發揮徹底, 每個行人,計程車與機車騎士都得以共乘, 那麼目前這150X2+200+500=1000人僅需1000/4=250輛計程車或轎車即可運載同樣的運輸量,亦即現有的100輛計程車與50部轎車外另需100輛汽車即可取代200部機車與500位徒步的行人,那麼以第一種算法交通量減為30(公車)+250(汽車)=280, 比原先的880大幅減低.

以上簡單的比較對照出交通流量繁忙與否與衡量的單位(unit of analysis)大有關係,即使總量相同。所以, 當你在報章雜誌上閱讀到各種數據,了解其衡量的方法與衡量的單位才能真正了解該數字的意義!



回到部落格流量的問題。部落格的流量或說受歡迎程度要怎麼衡量? 類似於上述的依照某段時間內通過的交通工具(vehicle)數量, 方法之一是根據每天被閱讀的網頁來衡量(pages viewed per day). MSN的部落格工具提供此類統計資料. 這個統計資料會顯示每天閱讀網頁數,本週閱讀頁數與累積閱讀數.

但這是唯一的方法嗎? 當然不是. 就如同機車只能騎載至多2人, 一般轎車或計程車可以運載4人(不含司機),公車卻可以輕鬆的運送4,50人,有些讀者也許只閱讀一篇格文便行離開, 有的則"流連忘返". 因此部落格的流量也有另一種衡量方式. 為此, 我在MSN的首頁也加入地圖來追蹤客從何處來. 下圖對照兩個流量的差別:



舉一反三, 類似上面交通量的例子, 平均每位訪客(以一個位址IP為不同訪客數之衡量)瀏覽部落格網頁數(pages viewed)可以簡單的用 (該日總閱讀數/該日訪客人數)計算出如下圖:


由此可知平均每人閱讀的網頁有極大的起伏,除了第一天與最後一天之外,平均每訪客閱讀網頁數介於10至20之間. 這個發現讓我頗為意外. 為什麼呢?

如同前面提到,我開格的最大目標在於分享生活. 因此我猜測讀者多為認識我的朋友,長期的基本班底之屬. 因此一旦部落格有所更新, 每個訪客讀完更新後便行離去; 特別是同時有使用msn messenger習慣的朋友, 當我的網頁有所更新, msn會在通訊錄上以小花提示. 當然我也不能排除部分朋友久久才上網一次, 一次閱讀自上次以來的所有更新. 因此, 我預料中的每位訪客的平均閱讀頁數應該接近1 (或是說接近於當次更新的網頁數),遠低於追蹤的結果.

那麼, 有哪些可能的原因造成這種情況呢? 我認為有幾個可能性. 首先, 如果 “一旦部落格有所更新,每個訪客讀完更新後便行離去”的想法成立, 那麼更新網頁應該可以預測近期內(如, 一日內. 這是基於我於美國工作時間更新, 數小時後台灣白天始之故)的訪客數. 但是分析的結果顯然 “部落格有更新”做出很差的預測.

我猜測的第二原因是我的部落格或某網誌被其他人加入連結, 因此其他網站的遊客也間接變成本部落格的遊客, 而這些新的訪客也許出於好奇,除了原來的連結外也順便流覽其他網誌. 當然, 因為是透過第三者的網站, 訪客人數也罷, 每訪客平均閱讀部落格數亦然的增加應該與更新的速度有時效上的差異. 例如說, 今日更新,明日被加入連結, 後日起才陸續可見新湧入的訪客數. MSN的統計工具裏提供訪客來源(reference source)提供必要的資訊.

為了印證此想法, 我利用時間序列(time series)的統計方式,以 “被加入新連結”來預測每日瀏覽頁數. 我比較了三個模型, 分別是
1) 完全零時差: 也就是說一更新馬上被加入連結,一被加入連結,閱覽馬上增加,
2) 部分零時差: 亦即更新與被加入連結有一日之時差, 但被加入連結與被瀏覽無時差. 這個模型的前提在於我“假設” 將我加入連結的第三者位於台灣時差區, 因此與我有一日之時差, 但與其他台灣讀者無時差); 與
3) 完全時差: 更新與被加入連結, 被加入連結與被閱讀分別各有一日之時差. 類似於第二個模型, 如果將我加入連結者位於歐洲, 那麼這個模型應可以得到較佳的預測結果.

我預期模型二可以得到最佳的預測值. 因為雖然我的MSN網站選擇的是台灣時間, 但我身在美國因此網誌上的系統日期與我實際更新日期有一日之別. 因此, 除非將我某網誌加入連結者與我情況相同, 否則據其MSN的統計資料顯示該第三者應身處台灣, 應與我有一日之時差.

統計結果印證以上推測, 模型二得到最佳之預測, 其餘兩個模型都不足以正確預測我網站的閱覽數. 下圖深藍色為實際閱覽數, 粉紅色則為模型二的預測閱覽數.


小結1: 因為其他網站將本人的某網誌[1]加入連結, 閱讀數因此增加. 簡單來說是個短暫的流行(fashion)! 該話題流行一過, 我的網站又恢復只服務親朋好友的價值, 回到平日之安靜.


那麼這些新的讀者到底有多少會成為日後常態性的讀者呢? 又, 上述平均每人閱讀頁數遠大於一的問題還沒得到充分解答. 我的猜測是, 如果新的讀者除了被加入連結的網誌外, 還因此閱覽其他網誌並決定訂閱本網誌, 那麼本網站的常態瀏覽人數將增加. 因此新讀者瀏覽其他網誌的這個決定訂閱過程應該可以預測每人平均閱覽頁數的變化(增加).

有了這個想法, 我又跑了另外4個模型來涵蓋不同的新讀者來源分別是:
1) 因搜尋引擎而來: 我推測此類讀者只是因為一時之需求(ad hoc basis), 看完需要的資訊便轉身離去, 對平均閱讀網頁數應該沒有太大影響
2) 因被加入連結而來: 詳細推論如上.
3) 搜尋引擎+被加入連結而來
4) 成為常態性讀者(以RSS來衡量): 這才是我真正預期會影響每人平均閱讀頁數的變數. 也就是說, 我的基本假設是, 因為搜尋引擎而來也好, 因為見到其他連結而來也罷, 新讀者的來源並不重要, 重要的是我的網站上需有其他網誌能夠引起興趣並吸引其成為常態性讀者.

同樣是利用時間序列的統計分析, 唯有模型4能夠頗為正確的預測實際平均閱讀頁數的變化.

最後在呈現實際與預測的統計結果前還有一點補充. 我的推論是: 決定訂閱前新讀者會先行閱讀其他網誌, 這個決策的過程因此增加每人平均閱讀頁數; 也就是說, 每人平均閱讀頁數雖然可能發生在同一天,但實際上會領先RSS這個訂閱動作本身;然而, 一旦成為常態性讀者, 除非有更新, 平均每人閱讀頁數會往下修正至接近一(或接近一日內的更新網頁數).

為了印證這個想法, 我因此將網站更新的時間控制在台灣半夜11點半之後, 也就是說, 我預期新的讀者在讀完特定網頁之後會再花至少半小時的時間閱讀網站上其他文章後才會決定訂閱否, 因此訂閱動作比較有可能是在隔天,也就是半小時後的12點發生. 這麼做的好處是在跑統計模型時我可以比較1)RSS落後平均每人閱讀頁數的變化一天,2)RSS與平均每人閱讀頁數的變化是同一天(零時差). 結果有時差的模型較能正確預測.

同樣的, 深藍色為實際每人平均閱讀數的變化,粉紅色的是以 “RSS落後每人平均閱讀數變化一天”預測的結果.


小結2: 讀者是理性的! 不管因為什麼原因(連結或是搜尋引擎…)來到一個新的網站,讀者在決定訂閱前會花一點時間來判斷. 被訂閱的網站不再是一時之流行,而是至少維持一段期間附庸風雅的行為(fad)!

綜合來講, 談時事等也許可以製造一時的流行,吸引新讀者, 但要有更具體更實質的方式才能保持住新讀者. 我想商務上亦然, 折扣促銷等也許可製造一時話題, 維持忠誠顧客卻需要更多的經營.

[1] 此網誌的分析根據的資料是 “從沙朗史東報應說看台灣嗜血媒體” 被某部落客加入連結的效應 .


----
延伸閱讀
>>流行的曲線
>>TVBS民調不想讓你知道的事

2 comments:

Anonymous said...

This is a nice blog. I like it!

GGs Adventure said...

Thank you, sweepstake lotto. I am glad that you like it and I appreciate your comment.