数据标注分类(数据安全防护体系建设)
为了应对各种类型的数据安全威胁挑战,企业往往已经部署了众多的数据安全防护产品,而这些安全防护措施基本都处在单点工作状态,策略配置基础不一数据标注分类,很难最大化发挥产品本身的效能。与此同时,我国数据安全法规和标准不断完善,要求企业采取更加主动和全面的安全措施来保护其数据资产,对数据持有者和数据处理者都提出了更高的合规要求。因此,企业安全负责人越来越希望能够系统化建设数据安全防护体系,有根源、有依据、高效的解决数据安全问题,屏蔽数据安全风险,因此数据发现与分类分级作为数据安全治理的基础环节,受到广泛关注。通过对数据进行有效识别、分类和分级,可以明确数据的重要性和敏感性,为后续数据安全建设提供依据。以数据为中心的数据安全策略有助于实现对不同级别数据的差异化管理,从而提升数据安全防护的效率和效果。
IDC定义下的数据发现与分类系统/工具可以帮助组织主动进行信息与数据的生命周期管理。该系统/工具通过扫描公司资源来识别数据资产并确定其资产数据的敏感度,将数据进行分类分级,从而实施数据治理策略。该解决方案需要识别和标记包含法定个人信息的结构化和非结构化数据。
在此背景下,国际数据公司(IDC)于近日正式发布《IDC Technology Assessment:中国数据发现与分类分级厂商技术评估,2024》报告(Doc#CHC52855925,2024年12月),本次技术评估从数据发现与分类分级产品涉及的多模态数据支持、数据标注能力、行业覆盖、AI与自动化处置能力、隐私保护能力、易用性与可视化能力、产品开放性7个维度进行评估数据标注分类,具体包括15项细粒度的评估标准。
数据分类分级-数据安全治理的基石起点
政策和业务需求的双重推动使数据发现与分类分级产品持续保持稳定增长态势。为了更好地适应和匹配最终用户的安全需求,数据发现与分类分级产品将向常态化能力、高能力扩展、自动化智能化建设、标准合规化等方面不断发展迭代,具体的产品发展方向如下:
• 数据治理、数据安全治理的核心:随着数字化转型推动,企业数据量将会呈现爆炸式增长的趋势,数据发现与分类分级将会成为企业数据治理、数据安全治理的核心环节。企业需要建立常态化的数据发现与分类分级机制,以确保数据安全、合规、高效的利用。常态化能力将帮助企业更好地管理数据资产,提升数据质量,为数据价值挖掘和数据安全决策提供可靠的基础。
• 技术与业务融合:未来,数据发现与分类分级技术将更加深入融入到企业业务流程中。通过技术手段实现数据自动发现、分类和分级,减少人工干预需求,提高数据处理的准确性,也更加促进企业业务流程的优化和升级。
• 扩展能力提升:扩展能力发展将提高数据发现与分类分级产品可用性,企业根据自身需求选择合适的外接进行组合,比如将数据分类分级结果对接到数据安全防护产品可以及时监控并发现潜在的数据安全威胁并制定针对性的安全防护策略;对接到数据分析平台可以提升数据分析效率,提高数据价值挖掘能力;对接到大模型训练预料治理功能可以提升大模型训练质量、避免敏感数据泄露等等。
• 智能化建设:随着大模型的发展,将大模型能力接入到数据发现与分类分级产品中能更进一步增强产品的智能化程度,通过大模型行、小模型相结合的方式,不断提升数据发现与分类分级产品自主训练、自主调优、自主预测的能力。
• 自动化建设:未来,数据发现与分类分级产品的自动化程度将不断提高,企业可以高效对数据进行处理和分析,减少人工失误干预引起的错误,有助于企业更快响应市场变化,提升业务竞争力。
国内数据分类分级产品全景解析:技术驱动与场景落地
1. 天融信:AI 赋能的行业标杆
技术亮点:首款通过中国信通院 “AI 赋能数据安全” 测评的产品,支持 Oracle、达梦等多种数据库及文档、图片等非结构化数据,采用 “行业模板 + 自定义规则” 动态调整策略。
合规能力:深度参与《数据安全治理实践指南 4.0》等标准制定,完成麒麟、统信等信创生态适配。
2. 原点安全:一体化平台的架构革新
技术亮点:主被动结合监测,主动扫描自定义任务,被动模式自动更新敏感数据资产目录,无需数据库账号口令。AI 语义与 NLP 技术加持,敏感数据识别准确率 98.7%,自动标注分类分级,支持自定义标签与手工标注。覆盖多源异构数据,提供统一视图。内置丰富行业模板,可灵活定制,适配不同法规与业务需求。融入大语言模型辅助分类,提升准确性与效率,降低人工成本。支持业务人员协同打标,让分类分级更贴合实际业务,强化数据安全与业务融合。
合规认证:通过网安专用产品认证,入选 Gartner 中国数据安全平台代表厂商。
3. 腾讯云 WeData:金融行业的智能引擎
技术亮点:内置金融行业分类分级模板(如 JR/T 0197—2020),支持结构化与非结构化数据识别,自动化打标准确率 95%,人工复核后达 100%。
场景落地:为某银行完成 86 个库的敏感数据治理,实现数据资产全生命周期管控,满足银保监合规要求。
4. 美创科技:双 AI 协同的效率革命
技术亮点:首创 “单模型自检 + 双模型互检” 机制,自动校验分类分级结果,人工介入范围缩小 80%,分类效率提升至行业新高。
行业适配:支持医疗、金融、政务等领域重要数据识别,在某省农信社项目中帮助客户通过密评合规率 100%。
5. 北信源:终端数据防护专家
技术亮点:以终端数据防护为核心,结合文档加密与敏感规则库,实现电子文档的起草阶段定级、分级保护,支持与 300 + 业务系统集成。
典型案例:某商业银行部署后,完成境内外分支机构推广,处理十亿级加密文档,保障商业秘密信息安全。
6. 中新赛克:AI 知识库的协同创新
技术亮点:安全大模型与知识图谱融合,构建覆盖数据全生命周期的智能监测系统,敏感数据识别准确率 90%,审计监督成本降低 60%。
行业实践:在南钢等标杆项目中构建审计风控 AI 知识库,实现安全事件分析效率提升 300%。
7. 数安行:零信任数据安全先锋
技术亮点:自主研发零信任数据安全防护系统,支持动态信任评估与细粒度权限控制,误报率低于 0.3%,完成飞腾、龙芯等国产芯片适配。
行业标准:参与编制《网络数据分类分级指引》标准,提供数据安全沙箱与隐私计算服务。
文章评论(0)