Re: [問卦] 為什麼統計誤差一率是 3 趴？ - Gossiping板

作者 newwu (說不定我一生涓滴廢文)
標題 Re: [問卦] 為什麼統計誤差一率是 3 趴？
時間 Thu Nov 16 06:40:30 2023

※ 引述《ronny1020 (偷偷魯蛇)》之銘言：
: 統計誤差不是要看樣本數決定嗎？
因為樣本數大家都差不多一千上下，而且大家信心水準都選95%
: 還有信賴區間什麼？
: 而且為什麼會每份統計都一樣？
: 這神秘數字 3 趴是怎麼用科學方式算出來的？
: 有統計學大師能幫忙解惑嗎？

比起這個，我比較好奇所謂的在誤差範圍內是什麼意思
有些一知半解的人會說
因為兩個各3% 所以加起來6%
這太不合統計學

因為假設無相關，誤差應該是平方相加開根號
也就是一組要比另一組好4.2% 才能確保差值的信賴區間不包含0

但是這狀況很明顯不是無相關性的，
因為overlap很大，所以考慮相關性，差值的信賴區間甚至可以比3%小吧
而且假如一份問卷同時問兩個情形，絕對能考量相關性的吧

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 94.140.8.203 (美國)
※ 作者: newwu 2023-11-16 06:40:30
※ 文章代碼(AID): #1bLKZYbn (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700088034.A.971.html

推 Loda29: 好了啦，深綠X粉廢票網軍1F 27.51.82.97 台灣 11/16 06:43

→ banmi: 那個是用常態分佈去算的,95%的信心水準,算出來是1.96個標準差,一般會用兩個標準差算標準差的公式是√p(1-p)/2
打錯了,是√p(1-p)/n2F 122.117.219.42 台灣 11/16 06:43

→ newwu: 我知道我現在問題又不是這個6F 94.140.8.203 美國 11/16 06:46

→ banmi: google"常態分佈 95% 信心水準"很容易找到sorry,那就誤會你的問題了.... :)7F 122.117.219.42 台灣 11/16 06:46

→ newwu: 原原po問題很簡單 √(0.5^2/1000)*2 ~0.03這我知道，我只是好奇他們要比較結果是不是在誤差範圍內要怎麼算9F 94.140.8.203 美國 11/16 06:47

→ banmi: 我倒是比較好奇,為什麼p都用0.5下去算. = =12F 122.117.219.42 台灣 11/16 06:49

→ newwu: 通常這是說AB兩組有沒有統計顯著差異
但是這就是有我上面那個相關性的問題13F 94.140.8.203 美國 11/16 06:49

推 StylishTrade: 操弄問題造成的誤差更大好嗎
這個3%只是統計誤差不包含系統誤差你把統計誤差弄成零也沒用15F 111.249.157.27 台灣 11/16 06:52

推 garry5566: 沒差，相關性再大不會超過118F 49.216.184.62 台灣 11/16 06:54

→ StylishTrade: 單單機構效應就不知道幾%了19F 111.249.157.27 台灣 11/16 06:54

→ newwu: 這又沒辦法避免，單以統計誤差來說，他們的規則訂得蠻不明確的吧20F 94.140.8.203 美國 11/16 06:55

→ garry5566: 在未知母體下，p=1/2 算出來的n最大，22F 49.216.184.62 台灣 11/16 06:56

推 StylishTrade: 因為猴子不敢賭你不讓3% 他不會上23F 111.249.157.27 台灣 11/16 06:56

→ garry5566: 以確保能達到95%信賴區間24F 49.216.184.62 台灣 11/16 06:56

→ StylishTrade: 鉤25F 111.249.157.27 台灣 11/16 06:56

→ wolver: 以前數學老師沒教嗎?公式背起來就對了,不要問為什麼.26F 1.165.155.149 台灣 11/16 06:57

→ StylishTrade: 釣猴子釣到大白鯊 QQ28F 111.249.157.27 台灣 11/16 06:57

→ newwu: 所以他們的規則是直接讓3%不考慮統計細節嗎29F 94.140.8.203 美國 11/16 06:57

→ garry5566: 你套公式就可以用相關係數=1算你需要的最大的誤差值
有“民調專家“，應該不會簡單用3%去判斷30F 49.216.184.62 台灣 11/16 06:58

→ newwu: 重點是假如民調專家考慮相關性，其實對柯很有利，因為是差值所以差值誤差範圍是
3%*sqrt(2*(1-rho^2))，因為兩組overlap高34F 94.140.8.203 美國 11/16 07:00

推 garry5566: 算了一下，相關係數去取最大值1, 標準差是6%37F 49.216.184.62 台灣 11/16 07:03

→ newwu: 差值的信賴區間可以比正負3%還要小39F 94.140.8.203 美國 11/16 07:04

→ garry5566: V(p1-p2)=V1+V2+2r*S1*S2)=< 4*V140F 49.216.184.62 台灣 11/16 07:08

→ newwu: 因為是相減所以相關性前面要是負號，所以重點不是<4V1 而是有機會<V141F 67.168.192.176 美國 11/16 07:14

推 garry5566: 你是不是套錯公式？相關型越大，需要的誤差值越大，對柯p約不利
沒有喔，不管相加還是想減，共變異數前面都是加號
var 是平方和，所以不會出現減號43F 49.216.184.62 台灣 11/16 07:15

推 patiger: 因為p不可能為0這樣統計個屁48F 223.139.102.41 台灣 11/16 07:19

→ newwu: 你誤解相關性了吧這裡的相關性是指，以抽樣1000唯一次民調來說，假如有一組（1000個民眾）的侯柯比例越高，那組的柯侯比例也會越高，這是一定的
並不會出現負號啊最小的狀況就是049F 67.168.192.176 美國 11/16 07:19

推 garry5566: 你要做 p1-p2=0的假設檢定, 用的標準差就是v(1-2)54F 49.216.184.62 台灣 11/16 07:22

→ patiger: 常態分布的模型分布是負無窮到正無窮，不取一定範圍根本無法估算，95%信心區間大概是2倍標準誤差範圍內，再擴大上去效益很低56F 223.139.102.41 台灣 11/16 07:24

→ newwu: 你才搞錯想想a=b的狀況，Var(a-b)是0，var(a+b）=4 Var(a)
換個方向想你設p2’=-p2 r’=-r 所以加減
當然會變號60F 67.168.192.176 美國 11/16 07:24

推 garry5566: https://i.imgur.com/aDBGjBB.jpg
除非rho=-1, 你才會看到減號
剩下的你去翻書吧, 我要工作了64F 49.216.184.62 台灣 11/16 07:38

→ newwu: 問題是X和Y在這裡就是正相關啊
你打叉那項就是一個負的contribution 也就67F 67.168.192.176 美國 11/16 07:41

推 garry5566: 所以不會有減號啊69F 49.216.184.62 台灣 11/16 07:43

→ newwu: 是說Var(X-Y)在這裡小於Var(X)+Var(Y)
Var(X-Y)當然不是負的，重點是它可能比Var(X)小70F 67.168.192.176 美國 11/16 07:43

推 zephyr105: 谷歌區間估計…73F 1.164.156.138 台灣 11/16 07:45

→ newwu: 懂嗎所以考量相關性，差值的信賴區間可能小於3%74F 67.168.192.176 美國 11/16 07:46

→ k44754 …

推 garry5566: 我晚點再來查查是不是我記錯77F 49.216.184.62 台灣 11/16 07:48

→ AddListener …

噓 chenu: 問統計數字是我們DPP強項柯批這次G了79F 27.51.56.103 台灣 11/16 08:18

作者 newwu 的最新發文:

+9 Re: [新聞] 木可匯400萬進「柯文哲私人戶頭」？民眾 - Gossiping 板

作者: newwu 185.213.82.137 (台灣) 2024-08-29 08:34:06

42F 10推 1噓
+18 Re: [問卦] IBA醫師證實林郁婷XY染色體檢測呈陽性 - Gossiping 板

作者: newwu 73.11.54.208 (美國) 2024-08-06 05:36:39

78F 22推 4噓
+5 Re: [問卦] 台大持續被攻擊XD - Gossiping 板

作者: newwu 67.168.192.176 (美國) 2024-02-03 04:29:02

17F 5推
+6 Re: [問卦] 為啥憲哥上夜夜秀感覺像主持人== - Gossiping 板

作者: newwu 67.168.192.176 (美國) 2024-01-30 12:53:23

12F 7推 1噓
+24 Re: [新聞] 民眾黨內參民調失準？柯文哲：不可能造假 - Gossiping 板

作者: newwu 172.56.104.119 (美國) 2024-01-17 04:54:44

不要跟我說民眾黨是年齡分佈加權加錯，誤差才那麼大我用這份他們年齡分組民調的結果去看看年輕人投票率要多差才會讓柯選到26% 結果我假設投票率落差超大 20-30 0.5 30-40 0.5 40- …

106F 27推 3噓

點此顯示更多發文記錄