民調統計分析釋疑

丘福隆 洛杉磯

做調查時,如果百分之百取樣,取樣結果就是真實數字,譬如選舉開票結果。

做民意調查時,如果取樣連萬分之一都不到,那麼取樣所得數字就必須進一步分析才能看出其代表性。統計學是一項分析工具。近日看到許多名嘴對台灣2024大選「藍白合民調數據」屢做誤解,特此稍做解說。

根據統計學經驗,調查取得約1000個有效樣本後,分析調查結果可得誤差約3%,信心度約95%的數據。

譬如,民意調查1000個人,結果40%贊成,60%反對。那麼,這數據表示:

贊成成者可能高達 40% x (100% +3%) = 41.2%

贊成者也可能低達 40% x (100% – 3%) = 38.8%

換言之,在誤差範圍3%下,調查值的差異為41.2%-38.8% =2.4%

由此可見,柯文哲願意讓侯友宜凈值3%,其實是超過調查值3%。(非常大方!)

除此之外,誤差考慮與處理只可以用在「調查數據」,不可以用在「非調查數據或經過處理的數據」。

再者,誤差3%意即「正3%或者負3%」,顯示「差異範圍為6%」。亦即「調查數據離真實值,頂多加3%或者頂多減3%」,絕非表示「調查數據與真實值的差別會超過3%,甚至達到6%」。

西方學界對統計學有一則笑話。

謊言有三種:謊話、胡扯,還有一種就是統計學。(There are three kinds of lie: Lie, damn lie, and then there is statistics.)

星島廣場