資源描述:
《個人信用評價影響因素決策分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、為增強(qiáng)黨員保持先進(jìn)性教育活動學(xué)習(xí)教育的針對性,使廣大黨員身臨其境、潛移默化受到革命傳統(tǒng)教育,增進(jìn)同人民群眾的血肉聯(lián)系個人信用評價影響因素決策分析 作者:何曉群胡小寧 征信XX年03期 個人消費信貸在我國迅速發(fā)展,對拉動經(jīng)濟(jì)增長起到了一定的促進(jìn)作用,。但其中也隱藏著很大的潛在風(fēng)險,即信貸資產(chǎn)不能及時有效地收回。因此,亟須建立完善的個人信用體系,使得商業(yè)銀行在放貸前就能夠?qū)J款申請人的信用做出有效的評估,從而降低信貸風(fēng)險。通過建立數(shù)學(xué)模型,對申請人的信用進(jìn)行預(yù)測,是常用的一種信用評價方法。目前廣泛應(yīng)用的方法主要有兩大類:統(tǒng)計分析方法和機(jī)器學(xué)習(xí)方法[1]。當(dāng)然,也有學(xué)者將多種方法加
2、權(quán)組合進(jìn)行預(yù)測[2]。機(jī)器學(xué)習(xí)方法雖然預(yù)測精度較高,但穩(wěn)健性差,且建模過程基本上是一個“黑箱”,模型的解釋性不強(qiáng);統(tǒng)計分析方法則在穩(wěn)健性和模型可解釋性上有其自身的優(yōu)勢。統(tǒng)計分析方法中,學(xué)者最關(guān)注的是logistic模型,其計算簡單、預(yù)測精度高、模型解釋能力強(qiáng)[3]。國內(nèi)外許多學(xué)者對個人信用評價方法進(jìn)行了許多有益的探討,但對信用評價影響因素的討論并不多見。本文將通過logistic模型,對影響個人信用評價的因素進(jìn)行探討。 二、數(shù)據(jù)及預(yù)處理 ?。ㄒ唬?shù)據(jù)來源采用紅歌會這種大眾喜聞樂見的比賽形式來加強(qiáng)紅色主題文化在校園的傳播,不僅可以向同學(xué)們傳播紅色精神、營造校園的紅色氛圍為增強(qiáng)黨員保
3、持先進(jìn)性教育活動學(xué)習(xí)教育的針對性,使廣大黨員身臨其境、潛移默化受到革命傳統(tǒng)教育,增進(jìn)同人民群眾的血肉聯(lián)系 本文數(shù)據(jù)選用的是德國某銀行的個人信貸數(shù)據(jù)集合[4-5]。該數(shù)據(jù)集中有1000條記錄,21個字段。其中前20個字段為信貸申請人的個人特征描述(表1),最后1個字段是銀行對客戶信用級別的定義:0為“差客戶”,1為“好客戶”。數(shù)據(jù)集中信用差客戶與好客戶的數(shù)量比為3:7。在信用“差客戶”和“好客戶”中分別隨機(jī)抽取80%用以建立模型,剩余20%用來驗證?! 。ǘ┕簿€性檢測 擬合logistic模型時,與多元線性回歸一樣,對自變量中存在多元共線性很敏感[6-7]。在建立模型前,首先對
4、數(shù)據(jù)做共線性診斷,結(jié)果(表2)可見,最大的VIF值為,表明共線性不明顯?! 。ㄈ?shù)據(jù)不平衡處理 當(dāng)數(shù)據(jù)存在不平衡問題時,稀有類的識別率遠(yuǎn)遠(yuǎn)低于大類,使得分析結(jié)果具有很大的偏向性[8]。個人信用評價將信貸申請人評判為“差客戶”和“好客戶”,而真實數(shù)據(jù)中“差客戶”數(shù)量比“好客戶”要少得多。信用評價模型將真正的“差客戶”誤判為“好客戶”的錯誤稱為A類錯誤,將真正的“好客戶”誤判為“差客戶”的錯誤稱為B錯誤。建模過程中,在保證整體判別準(zhǔn)確率的前提下,應(yīng)盡量減少A類錯誤,因為犯A類錯誤比B類錯誤的代價更大,這樣做可以降低信貸違約率[5]。采用紅歌會這種大眾喜聞樂見的比賽形式來加強(qiáng)紅色主題
5、文化在校園的傳播,不僅可以向同學(xué)們傳播紅色精神、營造校園的紅色氛圍為增強(qiáng)黨員保持先進(jìn)性教育活動學(xué)習(xí)教育的針對性,使廣大黨員身臨其境、潛移默化受到革命傳統(tǒng)教育,增進(jìn)同人民群眾的血肉聯(lián)系 本文所用數(shù)據(jù)集中信用“差客戶”與“好客戶”的數(shù)量比為3:7,數(shù)據(jù)不平衡比較明顯,如果不對原始數(shù)據(jù)進(jìn)行處理,將更傾向于犯A類錯誤。為了降低數(shù)據(jù)不平衡對分析結(jié)果造成的影響。采用RandomOversampling方法[8]在信用“差客戶”中生成200條記錄參與建立模型,自我評價《》。 三、信用評價影響因素分析 (一)logistic模型的建立 通過SPSS21軟件建立logistic模型,變量選擇
6、采用FSTEP(WALD),得: Logistic模型對數(shù)據(jù)集的預(yù)測結(jié)果(表3)表明:模型對訓(xùn)練集總體預(yù)測準(zhǔn)確率達(dá)到73%,相對于未經(jīng)過不平衡處理的訓(xùn)練集而言,總體預(yù)測準(zhǔn)確率相差不大,但犯A類錯誤的機(jī)會由60%有效地降低為%,盡管犯B類錯誤的機(jī)會有所提高,但符合“保證整體判別準(zhǔn)確率的前提下盡量減少A類錯誤”的要求[5]。對測試集的總體預(yù)測準(zhǔn)確率也高達(dá)76%。說明建立的logistic模型是合適的。 ?。ǘ?biāo)準(zhǔn)化回歸系數(shù) 由于自變量的度量尺度不同,在比較因變量與不同自變量之間關(guān)系的強(qiáng)度時,通常采用標(biāo)準(zhǔn)化回歸系數(shù)[6,9]。在logistic回歸中,標(biāo)準(zhǔn)化回歸系數(shù)的計算較為復(fù)雜,
7、可以根據(jù)估計的logit和模型的類來間接計算其標(biāo)準(zhǔn)化回歸系數(shù)[6]:采用紅歌會這種大眾喜聞樂見的比賽形式來加強(qiáng)紅色主題文化在校園的傳播,不僅可以向同學(xué)們傳播紅色精神、營造校園的紅色氛圍為增強(qiáng)黨員保持先進(jìn)性教育活動學(xué)習(xí)教育的針對性,使廣大黨員身臨其境、潛移默化受到革命傳統(tǒng)教育,增進(jìn)同人民群眾的血肉聯(lián)系 ?。ㄈQ策分析 本文結(jié)合德國銀行的信貸數(shù)據(jù),首先利用RandomOversampling方法克服了數(shù)據(jù)不平衡性帶來的問題,通過共線性檢測后,建立了標(biāo)準(zhǔn)化的logist