資源描述:
《管理數(shù)量方法與分析習(xí)題》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、管理數(shù)量方法與分析習(xí)題第1章數(shù)據(jù)分析的基礎(chǔ)思考與練習(xí)1.什么是數(shù)據(jù)分組?它有哪些種類,各在什么情況下應(yīng)用?所謂數(shù)據(jù)分組,就是對(duì)某一變量的不同取值,按照其自身變動(dòng)特點(diǎn)和研究需要?jiǎng)澐殖刹煌慕M別,以便更好地研究該變量的分布特征及變動(dòng)規(guī)律。根據(jù)變量的類型可分為:⑴單項(xiàng)分組,若變量是離散型變量,且取值不多時(shí)采用;⑵組距分組,若變量是連續(xù)型變量、或者是取值較多的離散型變量時(shí)采用。2.什么是變量數(shù)列?如何編制變量數(shù)列?在對(duì)變量取值進(jìn)行分組的基礎(chǔ)上,將各組不同的變量值與其變量值出現(xiàn)的次數(shù)排列成的數(shù)列,稱為變量數(shù)列。組距數(shù)列的編制過(guò)程:⑴確定組數(shù)。
2、若變量的取值變動(dòng)不均勻,如急劇增大、變小,變動(dòng)幅度很大時(shí),應(yīng)采用異距分組;若變量的取值變動(dòng)均勻,應(yīng)采用等距分組。等距分組便于比較和分析處理,實(shí)踐中應(yīng)盡量采用等距分組。究竟分為多少組比較合適,可采用斯特吉斯公式計(jì)算:M=1+3.322*LgN,N為變量值的個(gè)數(shù),m為組數(shù)。⑵確定組距。確定了分組的組數(shù)之后,接下來(lái)就需要確定出分組的組距。等距分組的組距可根據(jù)變量值的取值范圍和已確定的組數(shù)確定,下式可計(jì)算組距的最小值:d=(max(Xi)–min(Xi))/m,d為組距,Xi為觀測(cè)變量中的第i個(gè)變量值,m為組數(shù)。⑶確定組限。在確定了分組的組
3、數(shù)和組距之后,就需要確定各組的組限。各組的組限應(yīng)盡量用整數(shù),特別是5和10的倍數(shù)來(lái)表示。用小于或等于變量最小值的整數(shù)作為最低一組的下限,然后依次每增加一個(gè)組距就是一個(gè)組限,直到組限值增加到比變量的最大值還大時(shí)即為最高組上限。組限的表示方法隨著變量的不同也有所不同。若變量是離散變量,則相鄰兩組中數(shù)值較小一組的上限和數(shù)值較大一組的下限可分別用相鄰的兩個(gè)整數(shù)值表示;若變量是連續(xù)變量或是即可取整數(shù)又可取非整數(shù)的離散變量,則相鄰兩組中較小一組的上限和數(shù)值較大一組的下限只能用同一數(shù)值表示。為了不違反分組的互斥性原則,在后一種情況下,一般規(guī)定上限
4、不包含在本組之內(nèi),稱為上限不在內(nèi)原則。⑷計(jì)算各組的次數(shù)(頻數(shù))。在確定了各組的組限以后,接著就需要計(jì)算出所有變量值中落入各組之內(nèi)的變量值的個(gè)數(shù),每組所分配的變量值的個(gè)數(shù)也就是該組的次數(shù),又稱頻數(shù)。⑸編制變量數(shù)列。當(dāng)各組變量值的變動(dòng)范圍和各組的次數(shù)確定之后,接下來(lái)就可以將各組變量值按照從小到大的順序排列,并列出相對(duì)應(yīng)的次數(shù),就形成變量數(shù)列。3.測(cè)度變量分布中心有何意義?測(cè)度指標(biāo)有哪些,各有什么特點(diǎn)?均值、中位數(shù)和眾數(shù)之間有什么關(guān)系?揭示變量的分布中心有著十分重要的意義:⑴變量的分布中心是變量取值的一個(gè)代表,可以用來(lái)反映其取值的一般水平
5、。一個(gè)變量往往有許多個(gè)不同的取值,假若要用一個(gè)數(shù)值作為它們的代表,反映其一般水平,分布中心值無(wú)疑是一個(gè)最合適的數(shù)值。⑵變量的分布中心可以揭示其取值的次數(shù)分布在直角坐標(biāo)系上的集中位置,可以用來(lái)反映變量分布密度曲線的中心位置,即對(duì)稱中心或尖峰位置。測(cè)度指標(biāo)有:⑴算術(shù)平均數(shù),又稱均值,它是一組變量值的總和與其變量值的個(gè)數(shù)的比值,是測(cè)度變量分布中心最常用的指標(biāo)。算術(shù)平均數(shù)的計(jì)算方法有:簡(jiǎn)單算術(shù)平均數(shù)、加權(quán)算術(shù)平均數(shù)。算術(shù)平均數(shù)容易受到極端變量值的影響。⑵中位數(shù),是指將某一變量的變量值按照從小到大的順序排成一列,位于這列數(shù)中心位置上的那個(gè)變量
6、值。中位數(shù)表明在順序排列的變量值中,小于中位數(shù)的變量值的個(gè)數(shù)與大于中位數(shù)的變量值的個(gè)數(shù)是相等的。因此,用中位數(shù)來(lái)代表所排列變量值的一般水平能夠避免受到這些變量值中出現(xiàn)的極端變量值的影響,在某些特定條件下它更具有代表性。⑶眾數(shù),是指某一變量的全部取值中出現(xiàn)次數(shù)最多的那個(gè)變量值。在特殊的應(yīng)用條件下,使用眾數(shù)作為變量的一般代表值既簡(jiǎn)便又具有代表性。在許多場(chǎng)合只有眾數(shù)才適合作為某一變量取值的代表值。三者之間的關(guān)系:算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者之間在數(shù)量上的關(guān)系取決于變量值在數(shù)列中的分布狀況。⑴在正態(tài)分布的情況下,變量值的分布是以算術(shù)平均數(shù)為
7、中心,兩邊呈對(duì)稱型,這時(shí)算術(shù)平均數(shù)、中位數(shù)和眾數(shù)在數(shù)量上完全相等。在偏態(tài)分布的情況下,由于變量值中出現(xiàn)特別大或特別小的極端數(shù)值使其分布曲線在圖形上呈現(xiàn)出不對(duì)稱的情形。⑵當(dāng)有極大變量值出現(xiàn)時(shí),是正偏分布(又稱右偏分布),此時(shí)眾數(shù)<中位數(shù)<算術(shù)平均數(shù);⑶當(dāng)有極小變量值出現(xiàn)時(shí),是負(fù)偏分布(又稱左偏分布),眾數(shù)>中位數(shù)>算術(shù)平均數(shù)。4.測(cè)度變量取值的離散程度有何意義?測(cè)度指標(biāo)有哪些,各有什么特點(diǎn)?有了極差、平均差和標(biāo)準(zhǔn)差,為什么還要計(jì)算離散系數(shù)?意義:⑴通過(guò)對(duì)變量取值之間離散程度的測(cè)定,可以反映出各個(gè)變量值之間的差異大小,從而也就可以反映分
8、布中心指標(biāo)對(duì)各個(gè)變量值代表性的高低。⑵通過(guò)對(duì)變量取值之間離散程度的測(cè)定,可以大致反映變量次數(shù)分布密度曲線的形狀。測(cè)度指標(biāo):⑴極差,又稱全距,是指一組變量值中最大值與最小值之差,用來(lái)表示變量的變動(dòng)范圍。它計(jì)算簡(jiǎn)單,意義明了。由于極差的確