以下是由 Wisenews 資料庫1 拿下來 29 、 30 兩日的 A1 頭條,經過整理後的數據。
29 日分別有 7 份報章以黃禍事件作為 A1 頭條。 30 日除了明報及 AM 730 改以四叔找 J 數2 的新聞作 A1 頭條之外,另外五份仍跟進黃禍事件。
這五份報章兩天文章出現「移花接木」及「合成」的次數變更,相當有戲劇性。 29 日使用以上字眼的平均次數為 5 次。至 30 日平均次數回落至 2.4 次。就算樣本數如此細,使用對照 t 檢定3 分析,當 Alpha = 0.05 時,兩日出現以上字眼的分野統計上有明顯分別。( t= 5.099, df=4, p=0.007 )平均每篇頭條減少使用次數為 2.6 次, 95% 置信週間為 1.18 次至 4.01 次。另一有趣的發現,是 29 日明報、成報、太陽及 AM730 的標題都有使用到「移花接木」及「合成」字眼,而 30 日沒有報章再用有關字眼作頭條標題。
這個明顯分野,筆者估計反映證明相片真實性的證據愈來愈多,報章再難以跟唱片公司說法指圖片為「移花接木」及「合成」照片,故此在報道時減少使用有關字眼。
===
UPDATE:
Johnson 君建議用總字數作分母。這個建議我贊同。數據我已經放在 Google Doc 。
比較兩個 Mean percentage (t=5.33,df=4,p=0.006)
延伸閱讀:香港仔公國 ﹣ 明眼人能斷定是移花接木
警告:本 Server 在香港,切勿貼上任何違反香港法律的圖片連結。有古惑天皇和師濤事件作前科,你可知道你的 ISP 及各 Webhosting 會如何有效保護你上網的私隱。
- 一個剪報機構,會紀錄香港報紙的內容 [↩]
- 我覺得我像某知名博客 [↩]
- Paired t test [↩]
Today on history:
- 2007: 十面埋伏(2)
- 2007: Nodame Cantabile(1)
- 2005: The power of collaborative editing(0)
- 2003: Beast and the beauty(0)
- 2003: Doom(0)
- 2002: Live a Live!(0)
- 2002: Crash(0)

Comments 5
有些意見:
Posted 30 Jan 2008 at 1:25 pm ¶1. 是否需要以文章總字數做分母? 篇幅愈長, 提到這些字的機會愈高
2. 是否應考慮文字的實際意思, 例如文章提到”並非合成”, 便計作-1個”合成”
3. 無需限制為頭條 (不過可以用來control), 因此可包含更多報章 (我相信所有本港報章都有報導)
4. 樣本這樣細, 是否考慮使用non-parametric test?
Posted 30 Jan 2008 at 1:28 pm ¶1. 可考慮,我試下。
2. 各報頭條新聞 29 及 30 日,出現兩個字眼都是認定而非否定。
3. 呢個也都可考慮,但我開頭只考慮頭條。因為頭條寫法應該份份報都差不多。頭條同內文寫法相當唔同。
4. 我其實覺得,sample size 細不是使用 NP 的原因。(雖然 sample size 愈細 CLT 愈唔對)因為用 NP power 一定細左,Sample size 細 Power 又細。這個 Cycle 搞搞下 Power 愈來愈細。
Posted 30 Jan 2008 at 1:41 pm ¶不過 Anyway 我都做左個 Wilcoxon Sign rank, 用 exact test 而唔用 z approximation, p 係 0.0423. Sign test 更加唔駛講,全部 5 個 pair 都係轉果個方向。
經驗分享:用wisenews搜索新聞標題,好多時對方系統會將大題下的副題也包括在內,但亦有沒有包括副題的情況,所以作為經常用wisenews的本人,都會睇一次hard copy,以免做野時打錯標題...
Posted 30 Jan 2008 at 2:25 pm ¶其實明報29日的9次都好明顯係outlier,係咪應該discard左佢呢
Posted 06 Feb 2008 at 7:16 pm ¶