資源描述:
《《正態(tài)分布統(tǒng)計(jì)學(xué)》word版》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、第九章數(shù)值變量資料的統(tǒng)計(jì)分析《衛(wèi)生學(xué)(7)》醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系駱福添第一節(jié)數(shù)值變量資料的統(tǒng)計(jì)描述一、數(shù)值變量資料的頻數(shù)分布二、平均水平指標(biāo)三、離散程度指標(biāo)■平均指標(biāo)描述樣本數(shù)據(jù)的集中趨勢(一般水平)■變異指標(biāo)描述樣本數(shù)據(jù)的離散程度(差別大?。ㄒ唬┤啵╮ange)¨全距用R表示,是最大值與最小值之差(又稱極差)·優(yōu)點(diǎn)—簡便;缺點(diǎn)—不穩(wěn)健(重復(fù)抽樣時(shí)結(jié)果變化很大),因只利用了2個(gè)數(shù)據(jù)的信息;應(yīng)用—潛伏期、罕見?。ㄆ珣B(tài)小樣本)(二)四分位數(shù)間距(quartileinterval)¨四分位數(shù)間距用Q表示,是上四分位數(shù)QU(P7
2、5)和下四分位數(shù)QL(P25)之差(中間半數(shù)個(gè)體的全距)·優(yōu)點(diǎn)—比全距稍穩(wěn)??;缺點(diǎn)—仍不夠穩(wěn)健,因多數(shù)數(shù)據(jù)的信息仍未利用;應(yīng)用—偏態(tài)分布數(shù)據(jù)例如:用表9-5的數(shù)據(jù)計(jì)算四分位數(shù)間距得:P25=0.75+(0.25/42)×(340×25%-81)=0.77(mmol/L)P75=1.50+(0.25/36)×(340×75%-219)=1.75(mmol/L)P95=2.50+(0.25/6)×(340×95%-322)=2.54(mmol/L)(三)方差與標(biāo)準(zhǔn)差■方差(variance):離均差平方的均值(9-8)(9-9)
3、·s2為總體方差,S2為樣本方差·方差利用了所有數(shù)據(jù)的信息,反映平均差別(但量綱是平方單位)·式(9-9)中“n-1”為自由度,數(shù)理統(tǒng)計(jì)認(rèn)為用自由度作分母較好(無偏估計(jì))■標(biāo)準(zhǔn)差(standarddeviation):方差的平方根便是標(biāo)準(zhǔn)差,其實(shí)質(zhì)是離均差的均值,反映平均差別大小·方差開平方后,使平方單位變?yōu)槠胀ǖ亩攘繂挝唬?-10)(9-11)·s為總體標(biāo)準(zhǔn)差,S為樣本標(biāo)準(zhǔn)差▲方差和標(biāo)準(zhǔn)差的意義:都反映資料的變異程度大?。ú顒e的平均大?。ひ?yàn)椋?-12)·推導(dǎo)出計(jì)算公式為(9-13)(9-14)例9-8例9-2中,某班級
4、中10名女孩身高(cm)分別為132.40151.30126.80138.10146.60139.50154.20147.50148.10137.60求其求標(biāo)準(zhǔn)差。本例n=10,SX=1422.1,SX2=202904.37,代入式(9-13)得:10名女孩身高標(biāo)準(zhǔn)差為0.117kg。例9-9利用表9-3中數(shù)據(jù)計(jì)算140名正常成年男子的血清BUN濃度標(biāo)準(zhǔn)差。已算得Sf=140,Sfx=616.80,再用第(3)、(4)欄相乘后相加,得Sfx2=2875.36。代入式(9-14),得:140名正常成年男子的血清BUN濃度標(biāo)準(zhǔn)差
5、為1.07mmol∕L·標(biāo)準(zhǔn)差的用途:①反映一組觀察值的離散程度②用于計(jì)算變異系數(shù)③計(jì)算標(biāo)準(zhǔn)誤(第三節(jié))④估計(jì)參考值的范圍(第二節(jié))(四)變異系數(shù)(coefficientofvariation)記為CV(9-15)例9-10某地40名7歲男童,平均身高121.48cm,標(biāo)準(zhǔn)差為4.65cm;體重均數(shù)為22.18kg,標(biāo)準(zhǔn)差2.35kg。試比較其身高和體重的變異程度。身高CV=(4.65/1221.48)×100%=3.83%體重CV=(2.35/22.18)×100%=10.60%比較計(jì)算所得的兩個(gè)變異系數(shù),可見該地40名7
6、歲男童,體重的變異度比身高的變異大。第二節(jié)正態(tài)分布及其應(yīng)用一、正態(tài)分布■正態(tài)分布(normaldistribution)是一種重要的連續(xù)型分布(理論分布、高斯分布,圖9-2c)·正態(tài)分布來源于實(shí)際的頻數(shù)分布(巴斯荻監(jiān)獄犯人的身高分布),如圖9-2通過數(shù)學(xué)上的修勻便可獲得正態(tài)曲線·許多自然現(xiàn)象和醫(yī)學(xué)現(xiàn)象本身就服從正態(tài)分布(可直接應(yīng)用)圖9-3頻數(shù)分布逐漸向正態(tài)分布接近·許多非正態(tài)分布的數(shù)據(jù),只要樣本足夠大,其樣本均數(shù)將逼近正態(tài)分布■標(biāo)準(zhǔn)正態(tài)分布·標(biāo)準(zhǔn)化變換:稱為標(biāo)準(zhǔn)化變換·標(biāo)準(zhǔn)正態(tài)分布:若x服從正態(tài)分布,標(biāo)準(zhǔn)化值u的分布便稱為
7、標(biāo)準(zhǔn)正態(tài)分布(圖10-3b)0m正態(tài)分布(x)標(biāo)準(zhǔn)正態(tài)分布(u)圖9-4正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的面積和縱高·標(biāo)準(zhǔn)正態(tài)分布的均數(shù)和標(biāo)準(zhǔn)差分別為0和1N(0,-1)N(0,0)N(0,1)N(0,0.5)N(0,1)N(0,2)圖9-5不同m,s下正態(tài)分布概率密度函數(shù)的圖形二、正態(tài)分布的特征和曲線下面積分布規(guī)律(一)正態(tài)分布的特征①曲線外觀如吊鍾型;以均數(shù)為中心,左右對稱②分布有兩個(gè)參數(shù),即均數(shù)與標(biāo)準(zhǔn)差,均數(shù)又稱位置參數(shù),決定曲線的中心位置;標(biāo)準(zhǔn)差又稱形狀參數(shù),決定曲線的形狀·標(biāo)準(zhǔn)差變大則曲線中段壓低,曲線兩頭拉寬變高③正態(tài)分布
8、的面積分布有一定的規(guī)律性(二)正態(tài)分布面積分布規(guī)律·任意范圍內(nèi)的面積都可用積分或查表方法求得·重要的面積分布規(guī)律如表9-6表9-6正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律正態(tài)分布(x)標(biāo)準(zhǔn)正態(tài)分布(u)面積(或概率)m-1s~m+1s-1~+168.27%m-1.96s~m+1.96s-1