美創科技打造縣域醫療災備新標桿|神木市醫院 HIS 系統數據庫分鐘級切換演練實錄
2025-07-02
百萬罰單警示!DCAS助力金融機構筑牢數據安全防線,實現監管合規
2025-06-20
2025中國互聯網產業年會丨《中國互聯網產業綠色算力發展倡議》正式發布
2025-02-07
美創用戶專訪 | 精細化管理:醫療行業數據分類分級的策略與實踐
2025-01-10
容災演練雙月報|美創助力某特大型通信基礎設施央企順利完成多個核心系統異地容災演練
2025-01-10
存儲域
數據庫加密 諾亞防勒索訪問域
數據庫防水壩 數據庫防火墻 數據庫安全審計 動態脫敏流動域
靜態脫敏 數據水印 API審計 API防控 醫療防統方運維服務
數據庫運維服務 中間件運維服務 國產信創改造服務 駐場運維服務 供數服務安全咨詢服務
數據出境安全治理服務 數據安全能力評估認證服務 數據安全風險評估服務 數據安全治理咨詢服務 數據分類分級咨詢服務 個人信息風險評估服務 數據安全檢查服務
什么是數據分類分級
數據分類分級方法
實踐案例
01
—
什么是數據分類分級
數據分類分級是數據安全治理中的一項基礎而關鍵的活動,它涵蓋了數據分類和數據分級兩個核心部分,旨在系統化地管理和保護企業的數據資產。
數據分類是將數據根據其屬性或特征進行歸集,形成不同的類別,以便于查詢、識別、管理、保護和使用。這一過程通常從業務角度或數據管理的角度出發,涉及行業維度、業務領域維度、數據來源維度等多個維度。通過數據分類,企業能夠更有效地對數據資產進行編目、標準化、確權和管理,同時也為數據資產服務提供支持。
數據分級則是根據數據的敏感程度及其在遭受篡改、破壞、泄露或非法利用后可能對個人、組織或國家安全造成的影響,對數據進行敏感度的分級。這一過程更多地從安全合規性要求和數據保護要求的角度出發,確保對不同敏感度的數據采取相應的保護措施。
數據分類和分級是相互依賴的:沒有準確的分類,就無法進行有效的分級,反之亦然。因此,在數據安全治理和數據資產管理中,這兩者通常被結合在一起進行,以確保數據的安全和合規使用。
數據分類和分級是數據管理的基石,它們對于企業的數據治理和保護至關重要。如果企業不進行數據的分類和分級,就無法有效地進行數據治理和保護,甚至連企業自身擁有哪些數據、哪些數據是敏感的、以及這些數據存儲在何處都難以掌握。此外,數據分類和分級的重要性還體現在以下幾個方面:
1、數據的查詢、管理和保護
數據分類和分級提供了一套原則和流程,幫助企業識別、標記和定位數據,并對數據的敏感度進行評估。這有助于企業回答關鍵問題,例如企業擁有哪些類型的數據、哪些數據是敏感的以及它們存儲的位置、數據對企業的價值和潛在風險、誰有權訪問和修改這些數據、以及在數據泄露、損壞或被不當修改時可能對企業業務造成的影響。
2、提升數據安全性,滿足合規要求
通過數據分類和分級,企業能夠更有效地實施數據保護措施,降低數據泄露的風險,并加強對數據隱私的保護。這包括控制對敏感數據的訪問,確保數據安全;了解不同數據類型的重要性,以便采取相應的保護措施,如數據加密、身份認證、訪問控制和數據丟失防護(DLP);根據不同的監管或法規要求,妥善處理敏感數據,如醫療信息、個人身份信息和支付信息;提高通過監管和合規性審計的可能性;以及構建多套分類分級體系,以滿足不同的合規性要求。
3、提高業務運營效率,降低業務風險
從數據的創建到銷毀,數據分類和分級有助于企業確保數據資產的有效管理、保護、存儲和使用,從而提高業務運營的效率并降低風險。這包括更好地管理企業的數據資產,最大化數據的共享和利用;在整個企業中有效地訪問和使用受保護的數據;評估數據的價值以及數據丟失、被盜、誤用或泄露可能對企業造成的影響;幫助企業滿足監管所需的合規性要求;以及優化數據管理成本,確保關鍵數據得到適當的關注和資源投入。
其中企業的數據安全合規性認證是DSMM:數據安全能力成熟度等級證書
DSMM(數據安全能力成熟度模型)從多個維度對組織的數據安全能力進行評估,主要依據以下四個能力維度:
1、組織建設:涉及數據安全組織的設立、職責分配和溝通協作等方面。評估時會考慮數據安全組織架構對組織業務的適用性、數據安全組織承擔的工作職責的明確性,以及數據安全組織運作、溝通協調的有效性。
2、制度流程:包括組織數據安全領域的制度和流程執行。評估將檢查數據生命周期關鍵控制節點授權審批流程的明確性、相關流程制度的制定、發布、修訂的規范性,以及制度流程實施的一致性和有效性。
3、技術工具:關注組織用于開展數據安全工作的安全技術、應用系統和工具。評估時會考察數據安全技術在數據全生命周期過程中的利用情況,以及利用技術工具對數據安全工作的自動化支持能力。
4、人員能力:著眼于執行數據安全工作的人員的安全意識及相關專業能力。評估將基于數據安全人員所具備的數據安全技能是否能夠滿足實現安全目標的能力要求,以及數據安全人員的數據安全意識和關鍵數據安全崗位員工數據安全能力的培養。
DSMM將數據安全成熟度分為五個等級,從1級(非正式執行級)到5級(持續優化級),每個等級代表了組織在數據安全能力上的成熟度和完善程度。通過這樣的評估,組織可以了解自身在數據安全方面的現狀,識別短板,并據此制定改進措施,以提升整體的數據安全能力。
02
—
數據分類分級方法
1、數據分類分級的原則
數據分類分級的原則采用MECE原則。MECE(Mutually Exclusiv Collectively Exhaustive)核心是“相互獨立,完全窮盡”,我理解MECE原則有三層含義:“第一,所有的數據都得涵蓋全了,不能遺留;第二,分類之間不允許重復和交叉;第三,同一級次分類的維度要統一,顆粒度要一致”。
MECE原則,即“Mutually Exclusive, Collectively Exhaustive”,中文意思是“相互獨立,完全窮盡”。在數據分類中采用MECE原則,意味著在進行數據分類時,應確保:
1、相互獨立(Mutually Exclusive):每個數據項只能屬于一個分類,不同分類之間沒有重疊。這確保了每個數據項都有一個明確的歸屬,避免了數據歸屬的模糊不清。
2、完全窮盡(Collectively Exhaustive):所有數據項必須被分類,沒有遺漏。這意味著所有的數據都被考慮到了,并且被包含在某個分類中。
所以,當你提到“一張表只能屬于一個分類”,這是符合MECE原則中“相互獨立”的要求。在實際應用中,這意味著:
每個數據項(例如,數據庫中的一張表)都應該被清晰地歸入一個預先定義好的類別中。
不同類別之間應該有明顯的區分標準,以確保數據項不會同時屬于多個類別。
所有數據項都應該被覆蓋到,沒有數據項是未分類的。
采用MECE原則進行數據分類有助于提高數據管理的清晰度和效率,確保數據治理和安全措施能夠被正確地實施。這種分類方式也有助于在進行數據分析和決策時,能夠快速準確地定位和使用所需的數據。
2、數據分類的方法
數據分類的常用維度包括但不限于以下幾個方面,這些維度可以幫助組織更有效地管理和保護其數據資產:
1、業務應用場景維度:根據數據所支持的業務領域或業務流程進行分類,例如財務數據、人力資源數據、客戶關系管理數據等。
2、數據來源維度:依據數據的來源進行分類,如內部生成數據、外部采購數據、用戶生成數據等。
3、數據格式維度:按照數據的格式或類型進行分類,如文本、圖像、視頻、音頻、數據庫記錄等。
4、數據共享維度:依據數據是否需要在組織內部或外部共享進行分類,如公開數據、內部數據、保密數據等。
5、數據價值維度:根據數據對組織的價值進行分類,如高價值數據、中等價值數據、低價值數據等。
6、數據所有權維度:按照數據的所有權進行分類,如組織所有數據、第三方數據、用戶所有數據等。
通過這些維度,組織可以更精確地對數據進行分類,從而制定相應的數據治理策略、安全措施和合規性要求。數據分類是數據安全治理和數據資產管理的重要組成部分,有助于提高數據的可用性、安全性和合規性。
3、數據分級的方法
如果企業決定按照數據的敏感性將數據分為四個等級,這樣的分級體系通常旨在平衡管理的復雜性和數據保護的需求。以下是按敏感性分級的四個類型的例子,以及每個等級可能包含的數據類型:
這類數據對公眾開放,不包含任何敏感信息。
例子:公開發布的新聞稿、公司年報、公開的研究論文等。
這些數據在組織內部共享,但不包含敏感的個人或財務信息。
例子:員工通訊錄、內部培訓資料、非敏感的業務報告等。
包含個人可識別信息(PII)或其他敏感信息,需要額外的保護措施。
例子:員工個人信息、客戶數據、財務記錄、醫療記錄等。
這類數據對組織至關重要,泄露可能導致嚴重后果,需要最高級別的保護。
例子:知識產權、商業秘密、關鍵基礎設施設計、高級管理層決策信息等。
級別 | 敏感程度 | 判斷標準 |
1級 | 公開數據 | 可以免費獲得和訪問的信息,沒有任何限制或者不利后果。例如營銷材料、聯系信息、客戶服務合同等 |
2級 | 內部數據 | 安全要求低,但是不打算公開的內部數據:客戶數據、銷售手冊、組織架構 |
3級 | 秘密數據 | 敏感數據,如果泄漏可能對公司產生負面影響。包括:供應商信息、客戶信息、員工信息、薪水信息。 |
4級 | 機密數據 | 高度敏感的公司數據,如果泄漏,可能會面臨財務、法務、監管和聲譽的風險,例如客戶身份信息、個人身份、信用卡信息 |
其中個人敏感信息,根據《個保法》列出的敏感個人信息類型有7項,包括生物識別、宗教信仰、特定身份、醫療健康、金融賬戶、行蹤軌跡等信息,以及不滿十四周歲未成年人的個人信息?!?/span>信息安全技術 個人信息安全規范》(GB/T 35273—2020)對敏感個人信息作出更加詳細的列舉:
企業敏感信息除了包括企業內部的個人敏感信息以外,還包括企業的敏感信息,通常包括以下幾個方面:
1、個人身份信息:包括個人隱私數據,如姓名、身份證號碼、住址、電話號碼、銀行賬號、電子郵件、密碼、醫療信息、教育背景等。
2、受保護的健康信息:涉及個人的健康狀況、醫療歷史、保健治療、醫療支付信息等。
3、用戶數據:涉及用戶在企業平臺的行為數據、交易記錄、個人設置等。
4、員工信息:包括員工的個人資料、工資信息、人事記錄、績效考核結果等 。
5、客戶信息:涉及客戶聯系信息、交易歷史、支持服務記錄等。
6、專有數據:包括任何幫助組織保持競爭優勢的數據,如軟件代碼、技術計劃、內部流程、知識產權或商業秘密。
7、商業秘密:涉及公司的合同條款、商業策略、未公開的財務數據、定價策略等敏感商業信息。
8、內部策略和決策信息:包括公司的重大決策、主要會議紀要、項目應用程序及文檔等。
9、網絡和系統安全信息:如服務器的用戶名和密碼、網絡架構、IP地址列表等。
10、法律和合規信息:涉及法律訴訟、合規審計結果、監管調查等敏感信息。
11、研發信息:包括在開發過程中的產品設計、技術規格、測試結果等。
12、供應鏈信息:涉及供應商合同、物流數據、庫存信息等。
企業在處理這些敏感信息時需要格外小心,確保采取適當的安全措施來保護數據不被未授權訪問、泄露或濫用。這包括實施數據加密、訪問控制、數據脫敏、安全審計和員工培訓等措施 。同時,企業還需要遵守相關的法律法規,如《中華人民共和國數據安全法》、《個人信息保護法》等,確保數據的合法合規處理。
03
—
實踐案例
在實踐中,數據分類分級的方法可以根據不同的業務需求和組織特性進行調整和應用。以下是一個實踐案例,結合了搜索結果中的信息:
1. 準備工作:在開始分類分級之前,首先需要梳理和參考相關的法規和標準。在這個案例中,大數據局參考了《公共數據分類分級指南》、《人口綜合庫數據規范》、《信息安全技術 個人信息安全規范》等規范,形成了適用于本單位的數據分類分級參考規范。
2. 數據資產盤點與分類分級咨詢:通過使用數據平臺的元數據采集完成資產盤點工資以及數據安全的分類分級功能,結合自動掃庫掃表、模型匹配、數據統計、機器學習等技術,進行數據發現、數據含義識別、業務類型確認、數據分類分級、多維結果輸出。這個過程提升了數據發現和分類分級的準確性和規范性,縮短了項目周期。
3. 實施落地:在業務類型識別的基礎上,完成了對人口庫數據的分類分級。通過工具進行標簽管理,并生成可視化的分類分級報告。資產發現和分類分級的結果通過標準接口的方式,提供給安全產品和大數據局其他數據資源管理平臺,完成對數據資產的安全訪問和高效管理。
4. 結果:
1、形成了11個二級分類、50個三級分類,5個敏感等級(極敏感、敏感、較敏感、低敏感、不敏感)。
2、梳理了人口綜合庫30多個schema,近1000張數據表,約25000個字段。
3、發現超過40%的數據表中都有敏感字段,可以根據不同分級對敏感數據和敏感表格進行安全管控。
通過這個案例,我們可以看到數據分類分級在實際應用中的重要性和有效性。它不僅幫助組織更好地管理和保護數據資產,還提高了數據的可用性、安全性和合規性。此外,自動化工具的使用大大提升了分類分級的效率和準確性,為長期持續運營提供了支持。
總結一下,數據的分類分級需要在理解數據安全相關法律法規的基礎上,并理解數據的情況下,采用數據安全的分類分級功能,通過規則的方式進行數據分類和分級,但是目前存在的問題是,如果新手在處理新的平臺的數據的時候,由于缺乏對法律知識的理解以及數據的業務知識的理解,同時還需要制定大量的識別規則,不管是業務理解門檻高還是人工制定規則的時間成本高,都提高了數據治理的成本,未來通過人工智能的方式,學習已有項目的治理成果,可以快速遷移到相似的項目中,降低數據安全治理的成本。
這張圖片描述了一個使用人工智能技術進行數據安全治理的框架,包括數據的分類、威脅檢測、以及威脅評級等環節。我們可以分析出基于AI的數據安全治理系統的原理和優勢。以下是對這個框架的分析:
1、數據分級:
敏感類型:首先,AI系統需要識別數據的敏感類型,這可能包括個人身份信息、財務數據、知識產權等。AI系統識別敏感數據通過關鍵字庫、身份模型、金融模型、位置模型、文件模型、密碼模型等
敏感信息占比:系統評估敏感信息在數據集中的比例,以確定數據的敏感級別。
規則庫:系統使用規則庫來檢測潛在的數據泄露或威脅。規則庫可能包含一系列的關鍵字和模式,用于識別敏感數據。
關鍵字挖掘:通過機器學習方法,系統可以挖掘出新的關鍵字,這些關鍵字可能與已知的敏感數據相關聯。
權重學習:AI模型通過學習不同特征的權重,以提高威脅檢測的準確性。
復合模型:系統使用多個模型共同決策,例如金融模型、身份模型等,以確定威脅的嚴重程度。
位置模型、文件模型、密碼模型:這些模型可能用于評估數據泄露的潛在影響,如數據所在的位置、數據的文件類型、以及數據是否包含密碼等。
加權得分:系統根據多個參數特征計算出一個加權得分,以輸出威脅等級。
AI可以自動學習和適應新的威脅模式,減少了人工干預的需求。
通過機器學習和復合模型,系統可以更準確地識別和分類敏感數據,減少誤報和漏報。
AI模型可以快速適應新的數據類型和威脅場景,提供更靈活的安全策略。
自動化的關鍵字挖掘和權重學習減少了人工分析和配置規則的工作量。
AI系統可以通過持續學習不斷優化其檢測和評級算法,以應對日益復雜的安全威脅。
簡單的來說,基于AI的數據安全治理系統通過自動化、智能化的方式,提高了數據安全治理的效率和效果,降低了數據安全治理的學習成本和遷移難度不在依賴專業的數據安全治理工程師和大量的梳理工作,同時也提供了更高的靈活性和適應性,以應對不斷變化的安全威脅。