九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
F檢驗(yàn)

前言

做統(tǒng)計(jì)分析R語(yǔ)言是最好的,R語(yǔ)言對(duì)于統(tǒng)計(jì)檢驗(yàn)有非常好的支持。我會(huì)分7篇文章,分別介紹用R語(yǔ)言進(jìn)行統(tǒng)計(jì)量和統(tǒng)計(jì)檢驗(yàn)的計(jì)算過(guò)程,包括T檢驗(yàn),F檢驗(yàn),卡方檢驗(yàn),P值,KS檢驗(yàn),AIC,BIC等常用的統(tǒng)計(jì)檢驗(yàn)方法和統(tǒng)計(jì)量。

本文是第二篇F檢驗(yàn),T檢驗(yàn)關(guān)注點(diǎn)在均值,而F檢驗(yàn)關(guān)注點(diǎn)在方差。

目錄

  1. F檢驗(yàn)介紹

  2. 數(shù)據(jù)集

  3. F檢驗(yàn)實(shí)現(xiàn)

1. F檢驗(yàn)介紹

F檢驗(yàn)法(F-test),初期叫方差比率檢驗(yàn)(Variance Ratio),又叫聯(lián)合假設(shè)檢驗(yàn)(Joint Hypotheses Test),是英國(guó)統(tǒng)計(jì)學(xué)家Fisher提出的,主要通過(guò)比較兩組數(shù)據(jù)的方差,以確定他們的密度是否有顯著性差異。至于兩組數(shù)據(jù)之間是否存在系統(tǒng)誤差,則在進(jìn)行F檢驗(yàn)并確定它們的密度沒有顯著性差異之后,再進(jìn)行T檢驗(yàn)。

F檢驗(yàn),是一種在零假設(shè)(H0)之下,統(tǒng)計(jì)值服從F-分布的檢驗(yàn)。

樣本標(biāo)準(zhǔn)偏差的平方公式:

F統(tǒng)計(jì)量計(jì)算公式:


公式解釋

  • F:統(tǒng)計(jì)量,根據(jù)自由度查表,當(dāng)F值小于查表值時(shí)沒有顯著差異,當(dāng)F值大于等于查表值時(shí)有顯著差異

  • S1:樣本1的標(biāo)準(zhǔn)差

  • S2:樣本2的標(biāo)準(zhǔn)差

  • 分子自由度: df=分子的數(shù)量-1

  • 分母自由度: df=分母的數(shù)量-1

T檢驗(yàn)和F檢驗(yàn)對(duì)比
T檢驗(yàn)用來(lái)檢測(cè)數(shù)據(jù)的準(zhǔn)確度(系統(tǒng)誤差),F(xiàn)檢驗(yàn)用來(lái)檢測(cè)數(shù)據(jù)的精密度(偶然誤差)。在定量分析過(guò)程中,常遇到兩種情況:一種是樣本測(cè)量的平均值與真值不一致;另一種是兩組測(cè)量的平均值不一致。

上述不一致是由于定量分析中的系統(tǒng)誤差和偶然誤差引起的,因此必須對(duì)兩組分析結(jié)果的準(zhǔn)確度或精密度是否存在顯著性差異做出判斷,兩組數(shù)據(jù)的顯著性檢驗(yàn)順序是先F檢驗(yàn)后T檢驗(yàn)。

T檢驗(yàn)是檢查兩組均值的差異,而F檢驗(yàn)是檢查多組均值之間的差異。

對(duì)于多元線性回歸模型,t檢驗(yàn)是對(duì)于單個(gè)變量進(jìn)行顯著性,檢驗(yàn)該變量獨(dú)自對(duì)被解釋變量的影響。f檢驗(yàn)是檢驗(yàn)回歸模型的顯著意義,即所有解釋變量聯(lián)合起來(lái)對(duì)被解釋變量的影響,關(guān)于線性回歸請(qǐng)參考文章,R語(yǔ)言解讀一元線性回歸模型R語(yǔ)言解讀多元線性回歸模型。

2. 數(shù)據(jù)集

F檢驗(yàn),對(duì)于數(shù)據(jù)有比較嚴(yán)格的要求,所以我們需要先找到一個(gè)合適的數(shù)據(jù)集,作為測(cè)試數(shù)據(jù)集。我發(fā)現(xiàn)了R語(yǔ)言自帶的一個(gè)數(shù)據(jù)集ToothGrowth,是很好的測(cè)試數(shù)據(jù)集,本文接下來(lái)的內(nèi)容,將以這個(gè)數(shù)據(jù)集進(jìn)行測(cè)試,來(lái)介紹F檢驗(yàn)。

開發(fā)環(huán)境所使用的系統(tǒng)環(huán)境

  • Win10 64bit

  • R: 3.4.2 x86_64-w64-mingw32/x64 b4bit

數(shù)據(jù)集ToothGrowth,記錄了60只豚鼠的牙齒生長(zhǎng)速度,使用2種不同的方法(OJ和VC),每天按3種不同的注射劑量進(jìn)行注射,對(duì)牙齒的生長(zhǎng)速度的對(duì)比數(shù)據(jù),共3列,60條記錄。

  • len列,為牙齒長(zhǎng)度

  • supp列,為注射方法

  • dose列,為注射劑量

查看數(shù)據(jù)集,打印前10行

> head(ToothGrowth,10)    len supp dose1   4.2   VC  0.52  11.5   VC  0.53   7.3   VC  0.54   5.8   VC  0.55   6.4   VC  0.56  10.0   VC  0.57  11.2   VC  0.58  11.2   VC  0.59   5.2   VC  0.510  7.0   VC  0.5

F檢驗(yàn)對(duì)于數(shù)據(jù)的正態(tài)性非常敏感,我們需要先對(duì)選定數(shù)據(jù)集進(jìn)行進(jìn)行正態(tài)分布檢驗(yàn)。使用Shapiro-Will作為正態(tài)分布檢驗(yàn)的方法,原假設(shè)H0:樣本符合正態(tài)分布。

# 按不同的處理方法,進(jìn)行分組> len_VC<-ToothGrowth$len[which(ToothGrowth$supp=='VC')]> len_OJ<-ToothGrowth$len[which(ToothGrowth$supp=='OJ')]# 正態(tài)分布檢驗(yàn)> shapiro.test(len_VC)	Shapiro-Wilk normality testdata:  len_VCW = 0.96567, p-value = 0.4284# 正態(tài)分布檢驗(yàn)> shapiro.test(len_OJ)	Shapiro-Wilk normality testdata:  len_OJW = 0.91784, p-value = 0.02359

兩個(gè)樣本的W統(tǒng)計(jì)量都接近1,且p-value都大于0.05,不能拒絕原假設(shè),兩組樣本數(shù)據(jù)為正態(tài)分布。

查看數(shù)據(jù)的相關(guān)性。

> coplot(len ~ dose | supp, data = ToothGrowth, panel = panel.smooth,       xlab = "ToothGrowth data: length vs dose, given type of supplement")

3. F檢驗(yàn)實(shí)現(xiàn)

3.1 隨機(jī)數(shù)進(jìn)行F檢驗(yàn)
我們先用一種隨機(jī)數(shù),來(lái)做一下F檢驗(yàn)。以正態(tài)分布生成2組數(shù)據(jù),數(shù)量,均值,方差都不同,進(jìn)行F檢驗(yàn)。

# 生成隨機(jī)數(shù)> set.seed(1)> x <- rnorm(50, mean = 0, sd = 2)> y <- rnorm(30, mean = 1, sd = 1)# 進(jìn)行F檢驗(yàn)> var.test(x, y)	F test to compare two variancesdata:  x and yF = 2.6522, num df = 49, denom df = 29, p-value= 0.006232alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval: 1.332510 4.989832sample estimates:ratio of variances           2.652168 

指標(biāo)解釋:

  • H0:原假設(shè)2組樣本的方差,無(wú)顯著差異

  • F統(tǒng)計(jì)量:2.6522

  • num df,分子自由度,50-1=49

  • denom df,分每自由度,30-1=29

  • p-value值:0.006232

  • 95 percent confidence interval:95%的置信區(qū)間

  • ratio of variances:方差比率2.652168

結(jié)果解讀,以0.05為顯著性水平,F(xiàn) = 2.6522大于臨界值1.81(查表),F(xiàn)值顯著,拒絕原假設(shè)。以0.05為顯著性水平,p-value=0.006232小于0.05,拒絕原假設(shè),兩樣本方差有顯著性差異。這個(gè)結(jié)果與我們構(gòu)造的數(shù)據(jù)是一致的,樣本的方差就是不同的。

3.2 ToothGrowth進(jìn)行F檢驗(yàn)
使用ToothGrowth數(shù)據(jù)集進(jìn)行F檢驗(yàn),原假設(shè)HO,用VC和OJ兩種方法按3種劑量進(jìn)行注射,對(duì)于60只豚鼠的牙齒生長(zhǎng)速度的方差,沒有顯著性差異。

> var.test(len_VC,len_OJ)	F test to compare two variancesdata:  len_VC and len_OJF = 1.5659, num df = 29, denom df = 29, p-value= 0.2331alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval: 0.745331 3.290028sample estimates:ratio of variances           1.565937 

結(jié)果解讀,以0.05為顯著性水平,F(xiàn)=1.5659小于臨界值1.90(查表),F(xiàn)值不顯著,不能拒絕原假設(shè)。以0.05為顯著性水平,p-value=0.2331大于0.05,不能拒絕原假設(shè),所以兩種方法的3種劑量實(shí)驗(yàn)的方差,沒有顯著性的差異。

我們可以用F值進(jìn)行顯著性差異判斷,也可以用p值進(jìn)行顯著性差異判斷,他們的作用是一樣的。F值判斷時(shí),需要用計(jì)算所得的F值,與顯著性水平查表對(duì)比。p值相當(dāng)于是把F值,進(jìn)行一種標(biāo)準(zhǔn)化的變型,只和已經(jīng)定義好的顯著性水平比就行了,比如0.05, 0.01, 0.001等幾個(gè)固定值。

手動(dòng)計(jì)算F值和P值,關(guān)于P值的詳細(xì)解釋,請(qǐng)查看文章R語(yǔ)言實(shí)現(xiàn)統(tǒng)計(jì)檢驗(yàn)-P值

# 手動(dòng)計(jì)算T值> Xn<-length(len_VC)> Yn<-length(len_OJ)> Xm<-mean(len_VC)> Ym<-mean(len_OJ)# 計(jì)算兩組樣本的偏方差> fx<-sum((len_VC-Xm)^2)/(Xn-1)> fy<-sum((len_OJ-Ym)^2)/(Yn-1)# 計(jì)算F值> fx/fy[1] 1.565937# 手動(dòng)計(jì)算P值,雙邊檢驗(yàn)> p_value<-pf(f_stat,Yn-1,Xn-1)> p_value<-2*min(p_value, 1 - p_value);p_value[1] 0.2331433

用F檢驗(yàn)測(cè)試樣本數(shù)據(jù)的偶然誤差,對(duì)數(shù)據(jù)集進(jìn)行方差齊性檢驗(yàn),從而判斷數(shù)據(jù)是否有顯著性差異,為方差分析提供了基本的判別方法,對(duì)于研究數(shù)據(jù)的波動(dòng)性是非常有用的。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
r語(yǔ)言ggplot2誤差棒圖快速指南
ggplot2|從0開始繪制折線圖
【R分享|實(shí)戰(zhàn)】參數(shù)分析~T檢驗(yàn)與方差分析
數(shù)據(jù)挖掘?qū)n} | 使用ggpubr繪制箱式圖(基礎(chǔ)篇)
一元(多元)線性回歸分析之R語(yǔ)言實(shí)現(xiàn)
淺談蛋白組的差異蛋白分析
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服