Turing’s running Chess :在跑場中間設棋局, A 玩家下棋, B 玩家去跑步一圈。(我想跑四百米就太長了吧,或者三百米已經夠) A 玩家要在 B 玩家回來之前下好一步棋,否則即輸。 B 玩家回來下棋, A 玩家又出去跑一圈。一直鄰流。
這個遊戲的刺激是,如果你想對手沒有時間思考怎樣下棋,就要用姬菲芙的速度跑步。如果你跑得太慢,對手就有太多時間思考。
通常一局棋要 40 步,每位玩家要跑約 20 次三百米,即 6000 米。
據說這個遊戲是 Alan Turing 設計的。讀過電腦或數學複雜度(即那個 P = NP 問題)的人都應該知道甚麼是「圖靈機」( Turing Machine )吧。
Patrick Burns ,他是不見經傳的人。但他在 R 的社群很有名。他曾寫了兩份 Documentation1 ,一份叫 S Poetry ,另一份叫 R Inferno ,是介紹 S(及 R )作 Programming Language 時的問題及解決方法。
他最近在 R-Help 郵遞論壇問各位 R 用戶在初學階段最令人不安的情況,寫成了他的新作 Some Hints for the R Beginner 。它說在 R 見到 Error ,其實不是大問題,世界不會因此而崩壞,反而這些錯誤有助用家變得有性格( Hint: the universe doesn’t collapse into a singularity just because of an error in R. Actually, it builds character )。他也指出,故意犯錯( Make mistakes on purpose ),其實是一種實驗。因為:
A slang term that programmers use for themselves is “hacker”. This does not mean that they envision themselves breaking into corporate computers. It means they envision themselves trying a lot of wrong approaches until they find one that works and is suitably elegant.
You can do worse than imitating people who are the best in the world at what they do.
N 年前討論過,做 Survey 前,要知道你的 Target population 是甚麼,你才能用此推演出甚麼。
和之前一樣,我不是針對研究機構,雖則今次是在 Facebook 有十萬人表態反對的 DAB 。趁他們的專貴的陳克勤剛公報這個調查,還未寫進明天報紙之前提出以下重要問題,希望明天報紙別又誤導眾生。
DAB 調查了市民對吸毒後駕駛的意見,看了其研究報告。我暫且相信她們的樣本是有代表性,問卷問題有問題但無謂挑剔。但其中有一條問題(第三題)為此:
這樣的推演方法是錯誤的。假定有以下的 situation :一心、有容和國華是朋友,這三人之中只有國華有車牌,而且他亦曾索k後駕車。好了,民建聯的調查員抽中了一心和有容,他們被問及第三題時,都想起了國華,於是都答「有」。但是他們其實都是指同一個國華,可是以此作推演的話,卻變成了兩個國華。那就 Over-represent 了。極端例子:假定香港有兩萬人,其中有一千人有車牌是駕駛者。如果全港兩萬人都是國華的朋友和親戚,如果民建聯訪問了全部兩萬人,人人都想起同一個國華,第三題都答有。用民建聯同一個推演邏輯,那麼是不是代表全港所有一千個有車牌的人都曾經吸毒後駕駛?
總而言之,這個問題實在沒有甚麼推演作用。
如果要問此類問題,而得出「我們估計約有 81,621 名駕駛人士曾試過吸毒後駕駛」之類的結論,其 Target population 明顯是駕駛人士,而不是駕駛人士的親戚朋友。故此,應該是問駕駛人士自己有沒有試過吸毒後駕駛,才能用1,736,623 名領有正式駕駛執照作為母數推演。不過,這個問題是 Sensitive question ,通常又會 Under reporting ,所以是需要用特別的技巧,而不是簡單一個電話調查那麼便宜的。實情是,此類問題是不可能用電話調查得到可靠的答案。
其中一個解決方法是「抽菲林筒」( Randomized Response )。就是將問題 A 和 B ,分別放入菲林筒之內,再放入布袋之內。
A: 我是女人
B: 我試過吸食毒品後駕駛
受訪者隨機從布袋兩個菲林筒抽出一個,看到問題,只需要根據問題答「是」和「否」便可。訪問的工作人員不知道受訪者抽到甚麼問題,受訪者也無需交代他抽到甚麼問題。受訪者的私穩因此得到保障。
工作人員會就此得出有幾多人答「是」和「否」,但這個答案是包含了 A 和 B 問題的答案。但是我們是知道受訪者有幾多女性。
假設工作人員就這題抽菲林題收集到 16% 人答是,而受訪者有 30% 是女性。受訪者抽到 A 和 B 問題的機會率是二分之一( 50% ),那麼 B 問題答「是」的比率 P 是