資源描述:
《數(shù)據(jù)脫敏方案v1.1》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、大數(shù)據(jù)脫敏方案2017-1-15第20頁更改履歷版本號(hào)修改編號(hào)更改時(shí)間更改的圖表和章節(jié)號(hào)更改簡要描述更改人批準(zhǔn)人第20頁目錄1.概述41.1.編寫目的41.2.數(shù)據(jù)脫敏的定義41.3.電網(wǎng)數(shù)據(jù)脫敏需求42.脫敏方案52.1.脫敏算法52.1.1.K-Anonymity(K-匿名)52.1.2.L-Diversity52.1.3.T-Closeness52.2.脫敏規(guī)則53.電網(wǎng)應(yīng)用場(chǎng)景63.1.云平臺(tái)功能設(shè)計(jì)73.2.大數(shù)據(jù)平臺(tái)功能設(shè)計(jì)7第20頁1.概述1.1.編寫目的本文檔描述了數(shù)據(jù)脫敏的研究成果和方法論。旨在為具有數(shù)據(jù)脫敏需求的開發(fā)人員和項(xiàng)
2、目提供參考和借鑒。1.2.數(shù)據(jù)脫敏的定義敏感數(shù)據(jù)一般指不當(dāng)使用或未經(jīng)授權(quán)被人接觸或修改會(huì)不利于國家利益或不利于個(gè)人依法享有的個(gè)人隱私權(quán)的所有信息。工業(yè)和信息化部編制的《信息安全技術(shù)公共及商用服務(wù)信息系統(tǒng)個(gè)人信息保護(hù)指南》明確要求,處理個(gè)人信息應(yīng)當(dāng)具有特定、明確和合理的目的,應(yīng)當(dāng)在個(gè)人信息主體知情的情況下獲得個(gè)人信息主體的同意,應(yīng)當(dāng)在達(dá)成個(gè)人信息使用目的之后刪除個(gè)人信息。這項(xiàng)標(biāo)準(zhǔn)最顯著的特點(diǎn)是將個(gè)人信息分為個(gè)人一般信息和個(gè)人敏感信息,并提出了默許同意和明示同意的概念。對(duì)于個(gè)人一般信息的處理可以建立在默許同意的基礎(chǔ)上,只要個(gè)人信息主體沒有明確表示反
3、對(duì),便可收集和利用。但對(duì)于個(gè)人敏感信息,則需要建立在明示同意的基礎(chǔ)上,在收集和利用之前,必須首先獲得個(gè)人信息主體明確的授權(quán)。這項(xiàng)標(biāo)準(zhǔn)還正式提出了處理個(gè)人信息時(shí)應(yīng)當(dāng)遵循的八項(xiàng)基本原則,即目的明確、最少夠用、公開告知、個(gè)人同意、質(zhì)量保證、安全保障、誠信履行和責(zé)任明確,劃分了收集、加工、轉(zhuǎn)移、刪除四個(gè)環(huán)節(jié),并針對(duì)每一個(gè)環(huán)節(jié)提出了落實(shí)八項(xiàng)基本原則的具體要求。數(shù)據(jù)脫敏(DataMasking),又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形。百度百科對(duì)數(shù)據(jù)脫敏的定義為:指對(duì)某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。這樣,就可以在開發(fā)、測(cè)試
4、和其它非生產(chǎn)環(huán)境以及外包環(huán)境中安全地使用脫敏后的真實(shí)數(shù)據(jù)集。敏感數(shù)據(jù),又稱隱私數(shù)據(jù),常見的敏感數(shù)據(jù)有:姓名、身份證號(hào)碼、地址、電話號(hào)碼、銀行賬號(hào)、郵箱地址、所屬城市、郵編、密碼類(如賬戶查詢密碼、取款密碼、登錄密碼等)、組織機(jī)構(gòu)名稱、營業(yè)執(zhí)照號(hào)碼、銀行帳號(hào)、交易日期、交易金額等。隨著大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)商業(yè)價(jià)值的挖掘,用戶的精準(zhǔn)定位,大數(shù)據(jù)中蘊(yùn)藏的巨大商業(yè)價(jià)值被逐步挖掘出來,但是同時(shí)也帶來了巨大的挑戰(zhàn)–個(gè)人隱私信息的保護(hù)。第20頁個(gè)人信息與個(gè)人行為(比如位置信息、消費(fèi)行為、網(wǎng)絡(luò)訪問行為)等,這些都是人的隱私,也是我們所關(guān)注的一類敏感信息,在
5、大數(shù)據(jù)價(jià)值挖掘的基礎(chǔ)上如何保護(hù)人的隱私信息,也將是數(shù)據(jù)脫敏必須解決的難題。1.1.數(shù)據(jù)脫敏需求隨著國家電網(wǎng)數(shù)據(jù)應(yīng)用的不斷深入,有許多應(yīng)用需要和外部系統(tǒng)對(duì)接,數(shù)據(jù)需要對(duì)外提供服務(wù)才能體現(xiàn)出它的價(jià)值,大數(shù)據(jù)時(shí)代是數(shù)據(jù)融合的時(shí)代,如何在數(shù)據(jù)融合的過程中,保證數(shù)據(jù)在開發(fā)、測(cè)試、生產(chǎn)、應(yīng)用等各個(gè)環(huán)節(jié)的安全,成為信息安全部門的重要任務(wù)。國家電網(wǎng)數(shù)據(jù)脫敏需求包括:通過數(shù)據(jù)抽取、數(shù)據(jù)漂白、數(shù)據(jù)混淆等處理過程,用來滿足測(cè)試、開發(fā)、培訓(xùn)、數(shù)據(jù)共享和數(shù)據(jù)融合場(chǎng)景下的敏感數(shù)據(jù)保護(hù)需求,并使得數(shù)據(jù)處理過程滿足國家電網(wǎng)的敏感數(shù)據(jù)防護(hù)的政策規(guī)定。具體脫敏需求包括:?防止生產(chǎn)
6、庫中的敏感數(shù)據(jù)泄漏通過對(duì)生產(chǎn)庫中的身份、地址、用戶卡號(hào)、手機(jī)號(hào)等敏感信息進(jìn)行混淆、打亂后再提供給第三方使用,防止生產(chǎn)庫中的敏感數(shù)據(jù)泄漏。?保證測(cè)試、開發(fā)、應(yīng)用階段的數(shù)據(jù)關(guān)聯(lián)性通過脫敏策略和算法,保證脫敏數(shù)據(jù)有效性(保持原有數(shù)據(jù)類型和業(yè)務(wù)格式不變)、完整性(保證長度不變、數(shù)據(jù)含義不丟失)、關(guān)系性(保持表間、表內(nèi)數(shù)據(jù)關(guān)聯(lián)關(guān)系)。以提升測(cè)試、開發(fā)、應(yīng)用環(huán)節(jié)的數(shù)據(jù)真實(shí)性和可用性。?保證數(shù)據(jù)維護(hù)和數(shù)據(jù)共享的安全對(duì)數(shù)據(jù)庫訪問者的用戶名、IP、工具類型、時(shí)間等進(jìn)行監(jiān)控,控制數(shù)據(jù)訪問結(jié)果的差異化,數(shù)據(jù)結(jié)果可以劃分為真實(shí)數(shù)據(jù)、掩碼數(shù)據(jù)、數(shù)據(jù)阻斷、行限定數(shù)據(jù)等,通
7、過訪問者的不同訪問策略,滿足細(xì)粒度的數(shù)據(jù)訪問需求。例如DBA可維護(hù)但無法查看敏感數(shù)據(jù)、業(yè)務(wù)系統(tǒng)可以訪問真實(shí)數(shù)據(jù)、分析系統(tǒng)可以訪問脫敏后的數(shù)據(jù)。?保證隱私數(shù)據(jù)管理的政策合規(guī)性數(shù)據(jù)的脫敏和數(shù)據(jù)處理必須在國家電網(wǎng)的相關(guān)政策規(guī)定允許的情況下進(jìn)行,脫敏規(guī)則符合國家電網(wǎng)的數(shù)據(jù)管理要求。第20頁1.脫敏方案1.1.脫敏流程數(shù)據(jù)脫敏的流程一般分為:敏感數(shù)據(jù)發(fā)現(xiàn)、敏感數(shù)據(jù)梳理、脫敏方案制定、脫敏任務(wù)執(zhí)行四大步驟,結(jié)合數(shù)據(jù)脫敏算法、數(shù)據(jù)脫敏規(guī)則以及脫敏的環(huán)境來達(dá)到最佳的數(shù)據(jù)脫敏效果。1.1.1.敏感數(shù)據(jù)發(fā)現(xiàn)敏感數(shù)據(jù)的發(fā)現(xiàn)分為人工發(fā)現(xiàn)和自動(dòng)發(fā)現(xiàn)兩種。對(duì)于國家電網(wǎng)相對(duì)
8、固定的業(yè)務(wù)數(shù)據(jù),可以采用人工甄別,明確指定那些列、那些庫的數(shù)據(jù)是需要脫敏,這些數(shù)據(jù)一般數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)長度不會(huì)有變化,大部分為數(shù)值型和固定長度的字符。比