作者 newwu (說不定我一生涓滴廢文)
標題 Re: [問卦] 為什麼統計誤差一率是 3 趴?
時間 Thu Nov 16 06:40:30 2023


※ 引述《ronny1020 (偷偷魯蛇)》之銘言:
: 統計誤差不是要看樣本數決定嗎?
因為樣本數大家都差不多一千上下,而且大家信心水準都選95%
: 還有信賴區間什麼?
: 而且為什麼會每份統計都一樣?
: 這神秘數字 3 趴是怎麼用科學方式算出來的?
: 有統計學大師能幫忙解惑嗎?

比起這個,我比較好奇所謂的在誤差範圍內是什麼意思
有些一知半解的人會說
因為兩個各3% 所以加起來6%
這太不合統計學

因為假設無相關,誤差應該是平方相加開根號
也就是一組要比另一組好4.2% 才能確保差值的信賴區間不包含0

但是這狀況很明顯不是無相關性的,
因為overlap很大,所以考慮相關性,差值的信賴區間甚至可以比3%小吧
而且假如一份問卷同時問兩個情形,絕對能考量相關性的吧

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 94.140.8.203 (美國)
※ 作者: newwu 2023-11-16 06:40:30
※ 文章代碼(AID): #1bLKZYbn (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700088034.A.971.html
Loda29: 好了啦,深綠X粉廢票網軍1F 27.51.82.97 台灣 11/16 06:43
banmi: 那個是用常態分佈去算的,95%的信心水準,算出來是1.96個標準差,一般會用兩個標準差算標準差的公式是√p(1-p)/2
打錯了,是√p(1-p)/n2F 122.117.219.42 台灣 11/16 06:43
newwu: 我知道 我現在問題又不是這個6F 94.140.8.203 美國 11/16 06:46
banmi: google"常態分佈 95% 信心水準"很容易找到sorry,那就誤會你的問題了....  :)7F 122.117.219.42 台灣 11/16 06:46
newwu: 原原po問題很簡單 √(0.5^2/1000)*2 ~0.03這我知道,我只是好奇他們要比較結果是不是在誤差範圍內要怎麼算9F 94.140.8.203 美國 11/16 06:47
banmi: 我倒是比較好奇,為什麼p都用0.5下去算. = =12F 122.117.219.42 台灣 11/16 06:49
newwu: 通常這是說AB兩組有沒有統計顯著差異
但是這就是有我上面那個相關性的問題13F 94.140.8.203 美國 11/16 06:49
StylishTrade: 操弄問題造成的誤差更大好嗎
這個3%只是統計誤差 不包含系統誤差你把統計誤差弄成零也沒用15F 111.249.157.27 台灣 11/16 06:52
garry5566: 沒差,相關性再大不會超過118F 49.216.184.62 台灣 11/16 06:54
StylishTrade: 單單機構效應 就不知道幾%了19F 111.249.157.27 台灣 11/16 06:54
newwu: 這又沒辦法避免,單以統計誤差來說,他們的規則訂得蠻不明確的吧20F 94.140.8.203 美國 11/16 06:55
garry5566: 在未知母體下,p=1/2 算出來的n最大,22F 49.216.184.62 台灣 11/16 06:56
StylishTrade: 因為猴子不敢賭 你不讓3% 他不會上23F 111.249.157.27 台灣 11/16 06:56
garry5566: 以確保能達到95%信賴區間24F 49.216.184.62 台灣 11/16 06:56
StylishTrade: 鉤25F 111.249.157.27 台灣 11/16 06:56
wolver: 以前數學老師沒教嗎?公式背起來就對了,不要問為什麼.26F 1.165.155.149 台灣 11/16 06:57
StylishTrade: 釣猴子釣到大白鯊 QQ28F 111.249.157.27 台灣 11/16 06:57
newwu: 所以他們的規則是直接讓3%不考慮統計細節嗎29F 94.140.8.203 美國 11/16 06:57
garry5566: 你套公式就可以用相關係數=1算你需要的最大的誤差值
有“民調專家“,應該不會簡單用3%去判斷30F 49.216.184.62 台灣 11/16 06:58
newwu: 重點是假如民調專家考慮相關性,其實對柯很有利,因為是差值 所以差值誤差範圍是
3%*sqrt(2*(1-rho^2)),因為兩組overlap高34F 94.140.8.203 美國 11/16 07:00
garry5566: 算了一下,相關係數去取最大值1, 標準差是6%37F 49.216.184.62 台灣 11/16 07:03
newwu: 差值的信賴區間可以比正負3%還要小39F 94.140.8.203 美國 11/16 07:04
garry5566: V(p1-p2)=V1+V2+2r*S1*S2)=< 4*V140F 49.216.184.62 台灣 11/16 07:08
newwu: 因為是相減 所以相關性前面要是負號,所以重點不是<4V1 而是有機會<V141F 67.168.192.176 美國 11/16 07:14
garry5566: 你是不是套錯公式?相關型越大,需要的誤差值越大,對柯p約不利
沒有喔,不管相加還是想減,共變異數前面都是加號
var 是平方和,所以不會出現減號43F 49.216.184.62 台灣 11/16 07:15
patiger: 因為p不可能為0這樣統計個屁48F 223.139.102.41 台灣 11/16 07:19
newwu: 你誤解相關性了吧 這裡的相關性是指,以抽樣1000唯一次民調來說,假如有一組(1000個民眾)的侯柯比例越高,那組的柯侯比例也會越高,這是一定的
並不會出現負號啊 最小的狀況就是049F 67.168.192.176 美國 11/16 07:19
garry5566: 你要做 p1-p2=0的假設檢定, 用的標準差就是v(1-2)54F 49.216.184.62 台灣 11/16 07:22
patiger: 常態分布的模型分布是負無窮到正無窮,不取一定範圍根本無法估算,95%信心區間大概是2倍標準誤差範圍內,再擴大上去效益很低56F 223.139.102.41 台灣 11/16 07:24
newwu: 你才搞錯 想想a=b的狀況,Var(a-b)是0,var(a+b)=4 Var(a)
換個方向想你設p2’=-p2 r’=-r 所以加減
當然會變號60F 67.168.192.176 美國 11/16 07:24
garry5566: https://i.imgur.com/aDBGjBB.jpg
除非rho=-1, 你才會看到減號
剩下的你去翻書吧, 我要工作了64F 49.216.184.62 台灣 11/16 07:38
[圖]
newwu: 問題是X和Y在這裡就是正相關啊
你打叉那項就是一個負的contribution 也就67F 67.168.192.176 美國 11/16 07:41
garry5566: 所以不會有減號啊69F 49.216.184.62 台灣 11/16 07:43
newwu: 是說Var(X-Y)在這裡小於Var(X)+Var(Y)
Var(X-Y)當然不是負的,重點是它可能比Var(X)小70F 67.168.192.176 美國 11/16 07:43
zephyr105: 谷歌 區間估計…73F 1.164.156.138 台灣 11/16 07:45
newwu: 懂嗎 所以考量相關性,差值的信賴區間可能小於3%74F 67.168.192.176 美國 11/16 07:46
k44754 
k44754: 統計學可以做手腳的76F 49.215.51.136 台灣 11/16 07:48
garry5566: 我晚點再來查查是不是我記錯77F 49.216.184.62 台灣 11/16 07:48
AddListener 
AddListener: https://reurl.cc/jvj1kZ78F 223.137.35.215 台灣 11/16 07:56
chenu: 問統計數字是我們DPP強項 柯批這次G了79F 27.51.56.103 台灣 11/16 08:18

--
作者 newwu 的最新發文:
點此顯示更多發文記錄