2025中國互聯網產業年會丨《中國互聯網產業綠色算力發展倡議》正式發布
2025-02-07
美創用戶專訪 | 精細化管理:醫療行業數據分類分級的策略與實踐
2025-01-10
容災演練雙月報|美創助力某特大型通信基礎設施央企順利完成多個核心系統異地容災演練
2025-01-10
國家級|美創、徐醫附院共建項目入選工信部《2024年網絡安全技術應用典型案例擬支持項目名單》
2024-12-20
全球數據跨境流動合作倡議
2024-11-22
存儲域
數據庫加密 諾亞防勒索訪問域
數據庫防水壩 數據庫防火墻 數據庫安全審計 動態脫敏流動域
靜態脫敏 數據水印 API審計 API防控 醫療防統方運維服務
數據庫運維服務 中間件運維服務 國產信創改造服務 駐場運維服務 供數服務安全咨詢服務
數據出境安全治理服務 數據安全能力評估認證服務 數據安全風險評估服務 數據安全治理咨詢服務 數據分類分級咨詢服務 個人信息風險評估服務 數據安全檢查服務
隨著《數據安全法》《個人信息保護法》《網絡數據安全管理條例》等一系列法律法規相繼實施,在政策法規層面極大地促進了數據安全分類分級市場的發展。
與此同時人工智能技術、行業大模型在數據分類分級領域的應用,推動了數據分類分級產品技術和應用的快速迭代。
數據安全分類分級產品已成為政企單位數據安全治理的重要工具,是開展數據安全保護建設的基礎。
本文將從用戶視角出發,結合行業實際及美創科技數據安全分類分級平臺優勢,深度分析數據安全分類分級產品選型時需重點關注的五個層面。
選型指標一
合規性滿足與行業適配性
合規性驅動是政企單位開展數據安全建設的主要因素之一,數據安全分類分級工作也是如此,滿足國家、行業監管要求是用戶關注的重點之一。
GB/T 43697-2024《數據安全技術 數據分類分級規則》根據相關法律法規規定,給出了分類分級通用規則,用于指導各行業、各地區、各部門和數據處理者開展數據分類分級工作。
在實際落地數據分類分級工作中,常面臨用戶所屬的地區、行業沒有分類分級的標準和規范的情況,如此一來需要從制定數據安全分類分級標準規范做起。美創科技會充分評估用戶業務數據情況,通過“咨詢服務+數據安全分類分級平臺”的方式解決。
如用戶所在行業具備數據分類分級標準,美創科技會將其轉換成統一的分類分級大綱格式,并導入數據安全分類分級平臺,形成可落地的分類分級方案。
整體而言,不同行業的差異性主要體現在分類的層級不同、對安全級別的命名差異。美創數據安全分類分級平臺通過不限制分類層次、自定義安全級別名稱、動態分級等功能對不同行業分類分級差異性進行兼容,最大程度滿足各行業的分類分級訴求。
選型指標二
數據識別和處理能力
數據安全分類分級產品中,敏感數據識別準確率是關鍵。常規產品實現中,常采用正則、關鍵字、數據字典等基于字段名、字段備注、字段內容等滿足基本語義識別。除此之外,美創科技還將自然語言處理(NLP)、大語言模型(LLM)、詞嵌入(WordEmbeddings)等多種機器學習算法模型內置為平臺智能引擎,構建語義知識庫,為LLM提供豐富的上下文信息,確保語義識別和分類分級推薦的精準性,在保證算力要求下,?準確率可達85%-95%。
在數據顆粒度和標注能力方面,美創數據分類分級平臺對結構化數據可標注到每個字段,對長文本中的內容進行敏感數據識別,按詞分割打標,標注到數據所在的具體位置。最后根據字段的標注,按照規則對表、文件等數據集進行數據集的分類分級標注。
在分類分級結果確認之后,美創利用特征工程技術,對結果進行深入建模和學習,建立一個動態更新的分類分級模型,從而實現對新增業務字段的自動智能化分類分級,日積月累,不斷迭代。
選型指標三
智能化與自動化
智能化和自動化水平直接關乎數據安全分類分級產品的交付效率和成本,也因此成為用戶選型的又一重要指標。回顧數據安全分類分級產品剛推出的前幾年,曾因為海量數據、較高的人工成本(人工咨詢、人工標注、人工校正分類分級結果)導致整體分類分級項目成本居高不下,產品也很難標準化和產業化。
美創科技產品專家認為,分類分級的自動化主要體現在敏感數據的自動發現、增量數據的自動發現、自動化的分類分級。其中增量數據的自動發現可以通過元數據變更檢測,自動提示用戶,分類分級作業也支持單獨對新增字段進行分類分級,推薦新增字段的分類和分級。分類分級智能化的第一步,是對數據字段的含義進行準確識別,詳細實現見上面闡述。
其次在數據分類分級產品的流程上,通過高效的配置,可提升產品的效率,比如可先對表進行分類分級,表內字段可批量設置為同表的分類分級結果;人工已確認的分類分級結果,重新跑作業時,分類分級結果不會被覆蓋;人工稽核分類分級結果時可批量同時調整多個字段等等。
在某大數據局實現分類分級與資產編目系統對接中,分類分級系統根據表名、表注釋、列名、列注釋利用AI語義識別能力對字段進行分類分級,并通過接口返回分類分級結果。人工確認或調整確認后可反哺到系統進行建模分析,實現數據資產在注冊時同步分類分級的效果。大大減少后期二次資產盤點、與業務部門確認溝通的成本。
選型指標四
性能和穩定性
在數據安全分類分級產品選型過程中,性能意味著處理速度,穩定性更是基礎。
美創數據分類分級平臺對于整體性能的提升采用合理的數據庫設計、索引優化、緩存數據、使用異步處理等方法,以提升后臺處理速度,保證平臺快速響應用戶需求。
穩定性保障方面,配置監控系統,實時監測各項指標,如服務器負載、內存使用、網絡流量等;使用負載均衡技術來平衡服務器負載,保證系統穩定運行,同時可以根據需求進行水平擴展,以應對高并發情況;系統設計上考慮容錯機制,升級與修復時會對數據進行備份,并建立完善的數據恢復機制,以防止數據丟失或損壞。
選型指標五
分類分級結果應用與系統兼容性
數據安全治理需要基于分類分級結果實施精細化安全防護,這要求數據安全分類分級產品具備開放接口,以實現安全設備聯動。美創數據安全分類分級平臺通過數據分類分級輸出敏感、核心、重要數據,再聯動安全產品可實現敏感數據在生產運維、測試、取數等場景下分類管理、分級保護、權限適當,非敏感數據實現最大程度開放共享。
此外,美創數據安全分類分級產品提供強大的數據集管理能力,提供重要數據資產目錄,滿足各種場景下的取數、用數和數據上報需求。
對于系統兼容和擴展,需要充分考慮操作系統、數據庫、中間件國產化的適配和改造,同時對國產數據庫、大數據平臺、各類關系型數據庫、各類文件資產的分類分級快速兼容和支持。