作者 newwu (說不定我一生涓滴廢文)標題 Re: [問卦] 為什麼統計誤差一率是 3 趴?時間 Thu Nov 16 06:40:30 2023
※ 引述《ronny1020 (偷偷魯蛇)》之銘言:
: 統計誤差不是要看樣本數決定嗎?
因為樣本數大家都差不多一千上下,而且大家信心水準都選95%
: 還有信賴區間什麼?
: 而且為什麼會每份統計都一樣?
: 這神秘數字 3 趴是怎麼用科學方式算出來的?
: 有統計學大師能幫忙解惑嗎?
比起這個,我比較好奇所謂的在誤差範圍內是什麼意思
有些一知半解的人會說
因為兩個各3% 所以加起來6%
這太不合統計學
因為假設無相關,誤差應該是平方相加開根號
也就是一組要比另一組好4.2% 才能確保差值的信賴區間不包含0
但是這狀況很明顯不是無相關性的,
因為overlap很大,所以考慮相關性,差值的信賴區間甚至可以比3%小吧
而且假如一份問卷同時問兩個情形,絕對能考量相關性的吧
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 94.140.8.203 (美國)
※ 作者: newwu 2023-11-16 06:40:30
※ 文章代碼(AID): #1bLKZYbn (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700088034.A.971.html
推 Loda29: 好了啦,深綠X粉廢票網軍1F 27.51.82.97 台灣 11/16 06:43
→ banmi: 那個是用常態分佈去算的,95%的信心水準,算出來是1.96個標準差,一般會用兩個標準差算標準差的公式是√p(1-p)/2
打錯了,是√p(1-p)/n2F 122.117.219.42 台灣 11/16 06:43
→ newwu: 我知道 我現在問題又不是這個6F 94.140.8.203 美國 11/16 06:46
→ banmi: google"常態分佈 95% 信心水準"很容易找到sorry,那就誤會你的問題了.... :)7F 122.117.219.42 台灣 11/16 06:46
→ newwu: 原原po問題很簡單 √(0.5^2/1000)*2 ~0.03這我知道,我只是好奇他們要比較結果是不是在誤差範圍內要怎麼算9F 94.140.8.203 美國 11/16 06:47
→ banmi: 我倒是比較好奇,為什麼p都用0.5下去算. = =12F 122.117.219.42 台灣 11/16 06:49
→ newwu: 通常這是說AB兩組有沒有統計顯著差異
但是這就是有我上面那個相關性的問題13F 94.140.8.203 美國 11/16 06:49
推 StylishTrade: 操弄問題造成的誤差更大好嗎
這個3%只是統計誤差 不包含系統誤差你把統計誤差弄成零也沒用15F 111.249.157.27 台灣 11/16 06:52
推 garry5566: 沒差,相關性再大不會超過118F 49.216.184.62 台灣 11/16 06:54
→ StylishTrade: 單單機構效應 就不知道幾%了19F 111.249.157.27 台灣 11/16 06:54
→ newwu: 這又沒辦法避免,單以統計誤差來說,他們的規則訂得蠻不明確的吧20F 94.140.8.203 美國 11/16 06:55
→ garry5566: 在未知母體下,p=1/2 算出來的n最大,22F 49.216.184.62 台灣 11/16 06:56
推 StylishTrade: 因為猴子不敢賭 你不讓3% 他不會上23F 111.249.157.27 台灣 11/16 06:56
→ garry5566: 以確保能達到95%信賴區間24F 49.216.184.62 台灣 11/16 06:56
→ wolver: 以前數學老師沒教嗎?公式背起來就對了,不要問為什麼.26F 1.165.155.149 台灣 11/16 06:57
→ StylishTrade: 釣猴子釣到大白鯊 QQ28F 111.249.157.27 台灣 11/16 06:57
→ newwu: 所以他們的規則是直接讓3%不考慮統計細節嗎29F 94.140.8.203 美國 11/16 06:57
→ garry5566: 你套公式就可以用相關係數=1算你需要的最大的誤差值
有“民調專家“,應該不會簡單用3%去判斷30F 49.216.184.62 台灣 11/16 06:58
→ newwu: 重點是假如民調專家考慮相關性,其實對柯很有利,因為是差值 所以差值誤差範圍是
3%*sqrt(2*(1-rho^2)),因為兩組overlap高34F 94.140.8.203 美國 11/16 07:00
推 garry5566: 算了一下,相關係數去取最大值1, 標準差是6%37F 49.216.184.62 台灣 11/16 07:03
→ newwu: 差值的信賴區間可以比正負3%還要小39F 94.140.8.203 美國 11/16 07:04
→ garry5566: V(p1-p2)=V1+V2+2r*S1*S2)=< 4*V140F 49.216.184.62 台灣 11/16 07:08
→ newwu: 因為是相減 所以相關性前面要是負號,所以重點不是<4V1 而是有機會<V141F 67.168.192.176 美國 11/16 07:14
推 garry5566: 你是不是套錯公式?相關型越大,需要的誤差值越大,對柯p約不利
沒有喔,不管相加還是想減,共變異數前面都是加號
var 是平方和,所以不會出現減號43F 49.216.184.62 台灣 11/16 07:15
推 patiger: 因為p不可能為0這樣統計個屁48F 223.139.102.41 台灣 11/16 07:19
→ newwu: 你誤解相關性了吧 這裡的相關性是指,以抽樣1000唯一次民調來說,假如有一組(1000個民眾)的侯柯比例越高,那組的柯侯比例也會越高,這是一定的
並不會出現負號啊 最小的狀況就是049F 67.168.192.176 美國 11/16 07:19
推 garry5566: 你要做 p1-p2=0的假設檢定, 用的標準差就是v(1-2)54F 49.216.184.62 台灣 11/16 07:22
→ patiger: 常態分布的模型分布是負無窮到正無窮,不取一定範圍根本無法估算,95%信心區間大概是2倍標準誤差範圍內,再擴大上去效益很低56F 223.139.102.41 台灣 11/16 07:24
→ newwu: 你才搞錯 想想a=b的狀況,Var(a-b)是0,var(a+b)=4 Var(a)
換個方向想你設p2’=-p2 r’=-r 所以加減
當然會變號60F 67.168.192.176 美國 11/16 07:24
→ newwu: 問題是X和Y在這裡就是正相關啊
你打叉那項就是一個負的contribution 也就67F 67.168.192.176 美國 11/16 07:41
推 garry5566: 所以不會有減號啊69F 49.216.184.62 台灣 11/16 07:43
→ newwu: 是說Var(X-Y)在這裡小於Var(X)+Var(Y)
Var(X-Y)當然不是負的,重點是它可能比Var(X)小70F 67.168.192.176 美國 11/16 07:43
推 zephyr105: 谷歌 區間估計…73F 1.164.156.138 台灣 11/16 07:45
→ newwu: 懂嗎 所以考量相關性,差值的信賴區間可能小於3%74F 67.168.192.176 美國 11/16 07:46
→ k44754 …
噓 k44754: 統計學可以做手腳的76F 49.215.51.136 台灣 11/16 07:48
推 garry5566: 我晚點再來查查是不是我記錯77F 49.216.184.62 台灣 11/16 07:48
→ AddListener …
→ AddListener: https://reurl.cc/jvj1kZ78F 223.137.35.215 台灣 11/16 07:56
噓 chenu: 問統計數字是我們DPP強項 柯批這次G了79F 27.51.56.103 台灣 11/16 08:18
--