存儲域
數據庫加密 諾亞防勒索訪問域
數據庫防水壩 數據庫防火墻 數據庫安全審計 動態脫敏流動域
靜態脫敏 數據水印 API審計 API防控 醫療防統方運維服務
數據庫運維服務 中間件運維服務 國產信創改造服務 駐場運維服務 供數服務安全咨詢服務
數據出境安全治理服務 數據安全能力評估認證服務 數據安全風險評估服務 數據安全治理咨詢服務 數據分類分級咨詢服務 個人信息風險評估服務 數據安全檢查服務中國石油天然氣股份有限公司吉林油田分公司(簡稱中國石油吉林油田公司)是中國石油天然氣股份有限公司下屬地區公司,主營業務為石油和天然氣勘探、開發及銷售,總部位于吉林省松原市。吉林石油集團有限責任公司是中國石油天然氣集團公司(CNPC)的全資子公司,也是中國石油四大上產油田之一。
自2006年,吉林油田陸續開展了勘探開發主庫建設、歷史數據建設及新數據正常化三項重點工作:集中開展了科研成果文檔、分析化驗、錄井圖、測井圖、開發地質、物探、油氣生產、試井等11類17期科研生產急需的歷史數據資源建設工作,目前勘探開發歷史數據入庫率近70%。
勘探開發主庫的數據來源于數據同步、專業庫集成和歷史數據建設批量加載,這一過程存在錯誤數據或數據不一致等問題,需要按照一定的規則針對問題數據開展數據清洗工作。
具體如下:
1、需借助ETL工具等技術手段對勘探開發主庫及鉆錄測試等專業庫進行數據綜合分析。
2、對關鍵值缺失、異常值和重復數據及其它關鍵問題數據進行處理,提升主庫和專業庫內數據規范性、可用性和數據質量。
針對吉林油田上述實際需求,美創科技通過自主研發的數據支撐平臺實現數據清洗、轉換、同步和加載工作。該平臺通過對業務系統數據進行標準化,向數據倉庫或大數據平臺提供高質量數據,支持異構數據遷移、基于數據庫日志的數據實時復制、ETL開發、分布式處理等功能。具體如下:
數據清洗人物配置管理模塊
清洗模塊是整個清洗工具的控制中心,實現清洗數據源的連接信息、清洗表的設置,并且記錄清洗信息。
清洗規則管理模塊
包含各類清洗算法的運行參數、數據質量指標等,如重復記錄清洗算法的閾值、異常值檢測的標準、基于業務規則的清洗算法的業務邏輯等。
清洗算法管理模塊
對重復數據檢測算法、不完整數據檢測算法和字段匹配算法、異常值檢測算法等進行靈活定義和配置。
擴展模塊管理
通過擴展模塊允許向數據清洗工具中加入完全定制化的清洗方法和流程,負責將編譯好的擴展清洗方法及描述信息保存到擴展模塊配置中,清洗任務可以靈活的選擇相應的擴展清洗方法。
清洗日志管理
實現清洗動作的可追溯性,清洗任務會自動保存到清洗日志表中,不能自動清洗的為異常。通過清洗日志管理模塊可以對清洗任務進行查詢,并對異常數據進行手工處理。
算法和規則配置管理
通過選擇不同的清洗方法和規則實現數據清洗的需求。算法庫管理:通過配置管理界面,將已實現算法編譯后的類加載到算法庫,并在算法庫中維護算法的描述信息便于以后的配置管理;規則庫管理:工具中的清洗規則都維護在系統規則表中,將規則代碼和規則相對應管理。
擴展清洗模塊
增強數據清洗工具和數據類型的靈活性,在滿足擴展模塊接口的前提下,定制數據清洗流程進行數據清洗工作。
安全測評
系統上線前開展代碼安全測評,并出具第三方測評機構出具評測報告。
1、實現數據標準化、數據模型管理規范化、數據采集上傳規范化、數據采集流程、數據整理流程規范化、數據質量控制、完整性控制的流程與規范化。
2、進一步整合了吉林油田不同系統業務數據,挖掘信息所能帶來的價值以及對業務提供更好的決策支持。
3、支持多種數據交換應用場景,平臺支持數據復制、數據同步、數據備份/恢復、數據遷移、應用系統數據卸載、ETL、數據匯聚整合、數據分發、數據服務等應用場景,并滿足各種不同應用場景的統一使用和監控管理需求。
請聯系我們,我們將推薦適合您需求的產品,或為您定制解決方案
400-811-3777轉1