假設(shè)檢驗(yàn)(Hypothesis Test),顧名思義,就是假設(shè)和檢驗(yàn),即尋找證據(jù)”檢驗(yàn)”我們的”假設(shè)”是對(duì)是錯(cuò)
簡(jiǎn)述假設(shè)檢驗(yàn)的步驟和基本思想

假設(shè)是相對(duì)于問題來說的,我們對(duì)于一個(gè)問題的答案有自己的預(yù)先判斷(即假設(shè))。而為了證明我們的判斷是否正確,我們需要收集證據(jù)并根據(jù)一定的判斷標(biāo)準(zhǔn)來證明它。所以,根據(jù)邏輯可以簡(jiǎn)單的把假設(shè)檢驗(yàn)的過程分為4個(gè)步驟:
Step1,明確問題和假設(shè)
Step2,收集證據(jù)(p)
Step3,確定判斷標(biāo)準(zhǔn)(α)
Step4,得出結(jié)論(根據(jù)p和α的對(duì)比)
現(xiàn)在我們舉一個(gè)具體的例子來說明下每個(gè)步驟的邏輯推理是怎樣的
Step1,明確問題和假設(shè)
比如說,我們現(xiàn)在想研究一個(gè)問題:使用頭條APP的用戶中男性多還是女性多?我們根據(jù)自己的經(jīng)驗(yàn)預(yù)先判斷這個(gè)問題的答案是:使用頭條APP的用戶中男性更多(即男性>女性)。而我們的判斷的對(duì)立面是:使用頭條APP的用戶中男性不比女性用戶多(即男性<=女性)
這樣我們就得到了一個(gè)問題的2種答案,也就是2種假設(shè)(Hypothesis):
H0:男性<=女性
H1:男性>女性
我們把自己預(yù)先判斷的答案叫做H1,而我們預(yù)先判斷的對(duì)立面的答案叫做H0。可以看到H0和H1在邏輯上是完全互補(bǔ)的,也就是說如果我們能證明H0是錯(cuò)誤的,那么我們的判斷H1則是正確的!(為什么不直接證明H1是正確的,這是另一個(gè)話題,可以后續(xù)再講…)
好了,我們的問題和假設(shè)都明確了,下一步要做的事情就是去收集證據(jù)去挑戰(zhàn)H0,如果證據(jù)表明H0是錯(cuò)誤的,那么就可以證明我們的判斷(H1)是正確的了!
Step2,收集證據(jù)(p)
收集證據(jù)最直白的就是把所有使用頭條的用戶挨個(gè)詢問一遍他們的性別,就可以得出問題的答案,但是很顯然這個(gè)工作量是無法完成的,我們可以選擇從所有使用頭條的用戶中抽取一部分用戶來收集他們的性別,統(tǒng)計(jì)學(xué)上認(rèn)為合理的足夠多的樣本可以代表總體情況
頭條APP有100個(gè)用戶(僅舉例),我們從中隨機(jī)抽取10個(gè)用戶,詢問他們的性別,按照H0假設(shè)這個(gè)結(jié)果應(yīng)該大概率是5個(gè)男性5個(gè)女性。而我們的調(diào)查結(jié)果發(fā)現(xiàn)有7個(gè)男性,3個(gè)女性,出現(xiàn)這種情況的概率是0.113。也就是說在H0(5男5女)的情況下,出現(xiàn)了7男3女的概率是0.113。我們把這個(gè)概率叫做p值,而p=0.113
我們也可能會(huì)抽取出其他比例的結(jié)果,比如如果我們隨機(jī)抽取的10個(gè)用戶中有9個(gè)男性,1個(gè)女性,出現(xiàn)這種情況的概率是0.007,也就是說在H0(5男5女)的情況下,出現(xiàn)了9男1女的概率是0.007,即p=0.007
0.007是一個(gè)很小的概率值,可以說是小概率事件,小概率事件我們一般認(rèn)為是不可能發(fā)生的,也就是說H0是不可能發(fā)生的,這個(gè)時(shí)候我們就可以得出結(jié)論:H0錯(cuò)誤,從而我們的假設(shè)H1是正確的!
那么到底是出現(xiàn)0.113我們就可以認(rèn)為是小概率事件,還是說出現(xiàn)了0.007才可以認(rèn)為是小概率事件呢?
Step3,判斷的標(biāo)準(zhǔn)(α)
承接上一步,當(dāng)抽樣的結(jié)果等于多少的時(shí)候我們可以認(rèn)定是小概率事件呢?也就是說是在我們抽的10個(gè)用戶中有7個(gè)男性的時(shí)候就可以判斷H0是錯(cuò)誤的,還是說當(dāng)我們抽的10個(gè)用戶中有9個(gè)男性的時(shí)候,我們才可以判斷H0是錯(cuò)誤的呢?這個(gè)值就是我們的判斷標(biāo)準(zhǔn),我們把這個(gè)標(biāo)準(zhǔn)叫做α!
一般來說統(tǒng)計(jì)學(xué)上把α定為0.05或0.01。如果我們?nèi)ˇ?0.05(即我們做決策的標(biāo)準(zhǔn)),那么如果在假設(shè)H0的情況下我們的抽樣結(jié)果的出現(xiàn)概率p<0.05(即α)時(shí),我們就可以認(rèn)為是出現(xiàn)了小概率事件,即H0是錯(cuò)誤的!
Step4,得出結(jié)論(根據(jù)p和α的對(duì)比)
好的,現(xiàn)在我們的證據(jù)也收集了,判斷標(biāo)準(zhǔn)也定了,把我們的收集的證據(jù)p和α做對(duì)比,就可以做出結(jié)論了!我們可以根據(jù)結(jié)論明確頭條APP的用戶是怎樣的,可以針對(duì)性的做一些符合他們需求的產(chǎn)品決策…



















