資源描述:
《第11講-序貫決策分析001》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、國(guó)防科學(xué)技術(shù)大學(xué)信息系統(tǒng)與管理學(xué)院管理科學(xué)與工程系第11講序貫決策分析§8.1多階段決策8.1.1多階段決策問(wèn)題8.1.2多階段決策方法及其應(yīng)用實(shí)例§8.2馬爾可夫決策8.2.1馬爾可夫決策問(wèn)題8.2.2馬爾可夫鏈與轉(zhuǎn)移概率矩陣8.2.3穩(wěn)態(tài)概率8.2.4馬爾可夫應(yīng)用實(shí)例主要內(nèi)容8.1.1多階段決策問(wèn)題決策過(guò)程比較復(fù)雜;需要將過(guò)程分為若干個(gè)相互聯(lián)系的階段,分別對(duì)每階段都做出決策;各階段的決策結(jié)果前后相互銜接,彼此相互關(guān)聯(lián),前階段決策結(jié)果影響后階段決策目標(biāo),后階段決策狀態(tài)又依賴(lài)于前階段狀態(tài)設(shè)置;各個(gè)階段決策形成一個(gè)完整的決策過(guò)程(序列);8.1
2、多階段決策8.1.1多階段決策問(wèn)題決策者關(guān)心的是整個(gè)決策過(guò)程的總體效應(yīng),而不單是各階段的決策結(jié)果??傊?,若一個(gè)決策問(wèn)題需要經(jīng)過(guò)相互銜接、相互關(guān)聯(lián)的若干階段決策才能完成,則自然稱(chēng)之為多階段決策。8.1多階段決策8.1.2多階段決策方法及其應(yīng)用實(shí)例多階段決策分析的步驟適當(dāng)?shù)貏澐蛛A段;確定各階段的狀態(tài)變量,尋找各階段之間的聯(lián)系;從后到前用逆序歸納法進(jìn)行決策分析,每一階段決策可采用各種單階段決策方法。主要方法是決策樹(shù)方法和動(dòng)態(tài)規(guī)劃方法。8.1多階段決策例8.1某企業(yè)考慮是否花費(fèi)1萬(wàn)元購(gòu)買(mǎi)某新產(chǎn)品專(zhuān)利。若購(gòu)買(mǎi)了專(zhuān)利,可進(jìn)行大批生產(chǎn)(a1)、中批生產(chǎn)(a
3、2)或小批生產(chǎn)(a3),可能出現(xiàn)的市場(chǎng)銷(xiāo)售情況也分為暢銷(xiāo)(θ1)、一般(θ2)和滯銷(xiāo)(θ3)三種。其收益(利潤(rùn),萬(wàn)元)矩陣如下表:狀態(tài)θP(θ)θ1θ2θ3a10.642-3a20.333-2a30.11118.1多階段決策為了更正確地掌握市場(chǎng)情況,正式投產(chǎn)公司打算先生產(chǎn)少量產(chǎn)品試銷(xiāo),試銷(xiāo)費(fèi)需要5000元。試銷(xiāo)結(jié)果分為產(chǎn)品受歡迎(H1),一般(H2)和不受歡迎(H3)三種。由于試銷(xiāo)面不寬,試銷(xiāo)結(jié)果的準(zhǔn)確性有限。其準(zhǔn)確度(似然分布矩陣)見(jiàn)下表:θP(θ)P(H1︱θ)P(H2︱θ)P(H3︱θ)θ10.60.60.30.1θ20.30.20.6
4、0.2θ30.10.20.30.5例8.1如不買(mǎi)此項(xiàng)專(zhuān)利,把這筆費(fèi)用用在其他方面,在同樣的時(shí)期可獲利1.1萬(wàn)元。那么,該公司應(yīng)該如何決策?(1)是否買(mǎi)專(zhuān)利?(2)如果買(mǎi)專(zhuān)利,是否采取試銷(xiāo)辦法?(3)如果不試銷(xiāo),應(yīng)大批生產(chǎn),中批生產(chǎn)還是小批生產(chǎn)?如果試銷(xiāo),又應(yīng)該如何根據(jù)試銷(xiāo)結(jié)果決定其行動(dòng)?例8.1第一階段127買(mǎi)專(zhuān)利不買(mǎi)專(zhuān)利試銷(xiāo)不試銷(xiāo)3456H1H2H38910a1a2a3θ1θ2θ3(略)第二階段第三階段例8.1解:這是一個(gè)三階段決策問(wèn)題,采用逆序歸納法進(jìn)行決策分析,先要計(jì)算在一定的試銷(xiāo)結(jié)果下的各后驗(yàn)概率。由全概率公式:計(jì)算得:例8.1再由貝
5、葉斯公式:計(jì)算得:例8.1當(dāng)試銷(xiāo)結(jié)果為H1時(shí):故當(dāng)試銷(xiāo)結(jié)果為H1時(shí),應(yīng)選擇大批生產(chǎn)a1,截去方案a2、a3,結(jié)點(diǎn)4的值為3.406萬(wàn)元。----結(jié)點(diǎn)8----結(jié)點(diǎn)9----結(jié)點(diǎn)10例8.1當(dāng)試銷(xiāo)結(jié)果為H2時(shí):故當(dāng)試銷(xiāo)結(jié)果為H2時(shí),應(yīng)選擇中批生產(chǎn)a2,截去方案a1、a3,結(jié)點(diǎn)5的值為2.62萬(wàn)元。例8.1當(dāng)試銷(xiāo)結(jié)果為H3時(shí):故當(dāng)試銷(xiāo)結(jié)果為H3時(shí),也應(yīng)選擇中批生產(chǎn)a2,截去方案a1、a3,結(jié)點(diǎn)6的值為1.53萬(wàn)元。例8.1試銷(xiāo)收益期望值:故當(dāng)不試銷(xiāo)時(shí),應(yīng)選擇大批生產(chǎn)a1,截去方案a2、a3,結(jié)點(diǎn)7的值為2.7萬(wàn)元。不試銷(xiāo)的收益期望值:----結(jié)點(diǎn)
6、3例8.1決策:(1)購(gòu)買(mǎi)專(zhuān)利;(2)不試銷(xiāo);(3)大批生產(chǎn)a2。購(gòu)買(mǎi)專(zhuān)利總期望收益=2.7-1=1.7萬(wàn)元,大于不買(mǎi)技術(shù)的收益1.1萬(wàn)元,截去不買(mǎi)專(zhuān)利方案,結(jié)點(diǎn)1的值為1.7萬(wàn)元。試銷(xiāo)收益期望值扣除試銷(xiāo)費(fèi)用5000元后小于不試銷(xiāo)的收益值,截去試銷(xiāo)方案,結(jié)點(diǎn)2的值為2.7萬(wàn)元。例8.1第一階段127買(mǎi)專(zhuān)利不買(mǎi)專(zhuān)利試銷(xiāo)不試銷(xiāo)3456H10.44H20.39H30.178910a1a2a30.8180.1360.046(略)第二階段第三階段4萬(wàn)元2萬(wàn)元-3萬(wàn)元1.1萬(wàn)元3.406萬(wàn)2.77萬(wàn)1萬(wàn)3.406萬(wàn)2.62萬(wàn)1.53萬(wàn)2.78054萬(wàn)-0
7、.5萬(wàn)2.7萬(wàn)2.7萬(wàn)-1萬(wàn)1.7萬(wàn)例8.1有一類(lèi)多階段決策問(wèn)題,在進(jìn)行決策后又產(chǎn)生一些新情況,需要進(jìn)行新的決策,接著又有一些新的情況,又需要進(jìn)行新的決策。這樣決策、情況、決策…,就構(gòu)成一個(gè)序列,這就是序列決策。特點(diǎn):決策次數(shù)事前并不明確,決策階段劃分次數(shù)依賴(lài)于決策過(guò)程中出現(xiàn)的特殊狀況。仍可用決策樹(shù)法解這類(lèi)問(wèn)題,關(guān)鍵是:確定一個(gè)決策序列終止的原則。8.1多階段決策某廠家的產(chǎn)品裝箱出廠,每箱有產(chǎn)品1000件,產(chǎn)品的次品率有0.01,0.40,0.90三種可能,相應(yīng)概率分別為0.2,0.6,0.2。有兩種產(chǎn)品檢驗(yàn)方案:整箱檢驗(yàn)(a1),檢驗(yàn)費(fèi)10
8、0元;不作整箱檢驗(yàn)(a2),在銷(xiāo)售中若顧客發(fā)現(xiàn)次品,允許調(diào)換并賠償,每件損失0.25元。例8.2為了更好地選擇檢驗(yàn)方案,可先從任意一箱中隨機(jī)地抽取一件產(chǎn)品作為樣品。