統計學中p值的計算,統計學中P值的計算

時間 2021-05-03 21:10:33

1樓:

統計學意義(p值)zt

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有乙個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推導出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於乙個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分布並不呈正態。

2樓:匿名使用者

礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:一是用替代的非引數檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。

另一種方法是:當確定樣本量足夠大的情況下,通常還是

統計學中的「p」值是什麼意思?怎麼計算?

3樓:忘洛心

p值即概率,反映某一事件發生的可能性大小。

不同的p數值所表達的含義也是不一樣的。

統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為有統計學差異, p<0.01 為有顯著統計學差異,p<0.001為有極其顯著的統計學差異。

其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 、0.01、0.

001。實際上,p值不能賦予資料任何重要性,只能說明某事件發生的機率。統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。

拓展資料:

計算p值的相關注意事項:

1、p的意義不表示兩組差別的大小,p反映兩組差別有無統計學意義,並不表示差別大小。因此,與對照組相比,c藥取得p<0.05,d藥取得p <0.01並不表示d的藥效比c強。

2、p>0.05時,差異無顯著意義,根據統計學原理可知,不能否認無效假設,但並不認為無效假設肯定成立。在藥效統計分析中,更不表示兩藥等效。

哪種將「兩組差別無顯著意義」與「兩組基本等效」相同的做法是缺乏統計學依據的。

3、統計學主要用上述三種p值表示,也可以計算出確切的p值,有人用p <0.001,無此必要。

4、顯著性檢驗只是統計結論。判斷差別還要根據專業知識。抽樣所得的樣本,其統計量會與總體引數有所不同,這可能是由於兩種原因。

p值的其他含義:

1、 一種概率,一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。

2、拒絕原假設的最小顯著性水平。

3、觀察到的(例項的)顯著性水平。

4、表示對原假設的支援程度,是用於確定是否應該拒絕原假設的另一種方法。

4樓:瑾

與「機率」不同,乙個事件的機率(odds)是指該事件發生的概率與該事件不發生的概率的比值。

拓展資料:

關於統計定義

在一定條件下,重複做n次試驗,na為n次試驗中事件a發生的次數,如果隨著n逐漸增大,頻率na/n逐漸穩定在某一數值p附近,則數值p稱為事件a在該條件下發生的概率,記做p(a)=p。這個定義成為概率的統計定義。

在歷史上,第乙個對「當試驗次數n逐漸增大,頻率na穩定在其概率p上」這一論斷給以嚴格的意義和數學證明的是雅各布·伯努利(jacob bernoulli)。

從概率的統計定義可以看到,數值p就是在該條件下刻畫事件a發生可能性大小的乙個數量指標。

5樓:墨竹親親

統計學意義(p值)zt:

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有乙個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

2.均值的計算:

在處理實驗資料或取樣資料時,經常會遇到對相同取樣或相同實驗條件下同一隨機變數的多個不同取值進行統計處理的問題。此時,多數作者會不假思索地直接給出算術平均值和標準差。顯然,這種做法是不嚴謹的。

在數理統計學中,作為描述隨機變數總體大小特徵的統計量有算術平均值、幾何平均值和中位數等。

拓展資料:

何時用算術平均值?何時用幾何平均值?以及何時用中位數?

1.  這不能由研究者根據主觀意願隨意確定,而要根據隨機變數的分布特徵確定。反映隨機變數總體大小特徵的統計量是數學期望,而在隨機變數的分布服從正態分佈時,其總體的數學期望就是其算術平均值。

此時,可用樣本的算術平均值描述隨機變數的大小特徵。

2.  如果所研究的隨機變數不服從正態分佈,則算術平均值不能準確反映該變數的大小特徵。在這種情況下,可通過假設檢驗來判斷隨機變數是否服從對數正態分佈。

3.   如果服從對數正態分佈,則可用幾何平均值描述該隨機變數總體的大小。此時,就可以計算變數的幾何平均值。

4.   如果隨機變數既不服從正態分佈也不服從對數正態分佈,則按現有的數理統計學知識,尚無合適的統計量描述該變數的大小特徵。退而求其次,此時可用中位數來描述變數的大小特徵。

6樓:fu我若為王

統計學中p一般指概率。

以古典概率模型為例,概率的計算方法為:

古典定義

如果乙個試驗滿足兩條:

(1)試驗只有有限個基本結果;

(2)試驗的每個基本結果出現的可能性是一樣的。

這樣的試驗便是古典試驗。

其中n表示該試驗中所有可能出現的基本結果的總數目。m表示事件a包含的試驗基本結果數。

這裡,僅僅舉例了簡單的古典概率,其還有很多種模型。你可以找統計學的相關書籍進行學習。

拓展內容:概率亦稱「或然率」。它反映隨機事件出現的可能性大小的量度。

隨機事件是指在相同條件下,可能出現也可能不出現的事件。例如,從一批有**和次品的商品中,隨意抽取一件,「抽得的是**」就是乙個隨機事件。設對某一隨機現象進行了n次試驗與觀察,其中a事件出現了m次,即其出現的頻率為m/n。

經過大量反覆試驗,常有m/n越來越接近於某個確定的常數。該常數即為事件a出現的概率,常用p (a) 表示,與「機率」不同,乙個事件的機率(odds)是指該事件發生的概率與該事件不發生的概率的比值。

7樓:前行熊貓

p值即概率,反映某一事件發生的可能性大小。

統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為有統計學差異, p<0.01 為有顯著統計學差異,p<0.

001為有極其顯著的統計學差異。其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 、0.

01、0.001。實際上,p值不能賦予資料任何重要性,只能說明某事件發生的機率。

統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。

假設檢驗是推斷統計中的一項重要內容。用sas、spss等專業統計軟體進行假設檢驗,在假設檢驗中常見到p值( p-value,probability,pr),p值是進行檢驗決策的另乙個依據。

擴充套件資料

p值由來

從某總體中抽

⑴、這一樣本是由該總體抽出,其差別是由抽樣誤差所致;

⑵、這一樣本不是從該總體抽出,所以有所不同。

如何判斷是那種原因呢?統計學中用顯著性檢驗來判斷。其步驟是:

⑴、建立檢驗假設(又稱無效假設,符號為h0):如要比較a藥和b藥的療效是否相等,則假設兩組樣本來自同一總體,即a藥的總體療效和b藥相等,差別僅由抽樣誤差引起的碰巧出現的。

⑵、選擇適當的統計方法計算h0成立的可能性即概率有多大,概率用p值表示。

⑶、根據選定的顯著性水平(0.05或0.01),決定接受還是拒絕h0。

如果p>0.05,不能否定「差別由抽樣誤差引起」,則接受h0;如果p<0.05或p <0.

01,可以認為差別不由抽樣誤差引起,可以拒絕h0,則可以接受另一種可能性的假設(又稱備選假設,符號為h1),即兩樣本來自不同的總體,所以兩藥療效有差別。

p值的計算

一般地,用x 表示檢驗的統計量,當h0為真時,可由樣本資料計算出該統計量的值c,根據檢驗統計量x的具體分布,可求出p值。具體地說:

左側檢驗的p值為檢驗統計量x 小於樣本統計值c 的概率,即:p = p

右側檢驗的p值為檢驗統計量x 大於樣本統計值c 的概率:p = p

雙側檢驗的p值為檢驗統計量x 落在樣本統計值c 為端點的尾部區域內的概率的2 倍:p = 2p (當c位於分布曲線的右端時) 或p = 2p (當c 位於分布曲線的左端時) 。若x 服從正態分佈和t分布,其分布曲線是關於縱軸對稱的,故其p 值可表示為p = p 。

計算出p值後,將給定的顯著性水平α與p 值比較,就可作出檢驗的結論:

如果α > p值,則在顯著性水平α下拒絕原假設。

如果α ≤ p值,則在顯著性水平α下接受原假設。

在實踐中,當α = p值時,也即統計量的值c剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

統計學中的Inter quartile range(四分間距

清溪看世界 四分位距是一個結果變異性的量度,是統計學中分位數的一種,即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值。四分位距的計算公式為iqr q3 q1 即對一組按順序排列的資料,上四分位值q3與下四分位值q1之間的差稱為四分位距 iqr 四分位距通常用於 與總範圍不同,四分位數範...

幫忙計算一下醫學統計學中的P值和X的平方

表一.出血與胎次 胎次 剖宮產人數 出血人數 出血率 初產婦 141 7 4.96 經產婦 182 22 12.09 x2p值 蘭馨清韻 先問一下,你的分析目的是什麼?如果是比較實施前後是否有差異用配對的非引數檢驗,若是比較實施前後滿意和不滿意的頻數分布有無差別用卡方或fisher 精確檢驗 你這是...

統計學的Excel中如何求解迴歸趨勢(T)

和才漢魂 表示不太確定您說的迴歸指什麼 如果只是曲線擬合 那麼1l正解 如果是基於最小二乘估計的曲線擬合 獲得曲線趨勢 貌似excel還沒有提供,只提供了多項式和對數擬合等,如果指的是迴歸分析,那麼請參考 http zhidao.baidu.com question 337825555.html 不...