0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

康谋分享 | 突破传统匿名化:先进技术解锁数据价值新维度

康谋自动驾驶 ? 2025-02-19 09:24 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

海量数据的收集使得新旧企业能够利用机器学习技术开发新产品并革新旧产品。近年来,数据质量因直接影响了人工智能系统的性能和鲁棒性而备受关注。然而,这对通常通过破坏像素信息(如模糊化、马赛克等)来实现匿名化的方法提出了挑战,这些方法导致合规性与数据质量之间难以兼得。

我们探索了一种不是简单移除像素信息,而是对其进行自然替换的深度自然匿名化(Deep Natural Anonymization,DNAT)方法,致力于提高匿名化数据价值,助力企业开发创新。

一、匿名化数据的传统矛盾

DNAT能够检测人脸、车牌等可识别信息,并为每个对象生成人工替换。每个替换都尽可能匹配源对象的属性,但这种匹配是有选择性的,我们可以灵活控制保留哪些属性。

例如,对于人脸,保留性别和年龄等属性可能对后续分析至关重要。对于可识别信息以外的内容,不包含敏感个人数据的信息则保留不做修改。通过这种方式,DNAT成功打破了数据消除与匿名化之间的传统矛盾。

wKgZO2e1MhKAMci7AAQVaZi4spI058.png图1: 匿名化工具的比较,从左至右依次为:Facepixelizer,YouTube,Fast Redaction,DNAT,原图

为了衡量匿名化方法对数据质量的影响,我们从Labeled Face in the Wild(LFW)数据集中采样了图像。所有图像均取自测试集。我们比较了代表匿名化技术的四种不同的匿名化工具,图1显示了这些示例的一部分。

二、匿名化的结构一致性

首先,我们分析了图像在匿名化处理后的整体结构变化。为此,我们仔细研究了图像分割结果。图像分割是将图像的像素划分为多个片段的过程,每个片段代表一个对象类别。在我们的示例中,最重要的对象是个人资料图片中的人物和背景

图2和图3展示了LFW数据集中两位名人的分割图。这些分割图是由语义分割模型DeepLabv3+生成的,采用了官方TensorFlow存储库中的实现和模型权重。

wKgZO2e1MiSAVSZSAALCvOWb5YA092.png图2: AI Pacino DeepLabv3+ 分割结果对比

wKgZPGe1Mi-AcwIGAAJiAzAgOCc073.png图3: Reese witherspoon DeepLabv3+ 分割结果对比

从图2和图3中可以看出,传统匿名化方法的分割图明显退化,其中一些甚至完全错误。然而,深度自然匿名化(DNAT)保留了语义分割。分割图与原始图像几乎完全相同。从图3中可以看出,经过传统匿名化方法处理的人脸图像不仅产生了较差的分割边界,还使分割模型推断出原始图像中从未出现的新对象类别,如猫、狗或瓶子。

为了量化每种匿名化技术的影响,我们计算了整个测试集的平均交并比(mIOU)。计算是在不同方法生成的图像分割图与原始图像分割图之间进行的。结果如表1所示。

wKgZPGe1Mj-AXW_9AABLWey_FFs574.png表1:用mIOU测量的语义分割一致性(越高越好)

三、匿名化的内容一致性

为了评估匿名化图像与原始图像之间的整体内容一致性,我们使用了Clarifai的独立图像标注模型。“通用图像标注模型能够识别超过11,000种不同的概念,包括对象、主题、情绪等。”这些标签描述了模型从输入图像中推断出的内容。

此外,模型还为每个标签提供了置信度。图4展示了Clarifai公共图像标注模型对原始图像及其DNAT版本预测的前5个概念。

wKgZPGe1MlCAFwi8AAJSxT1uHIg291.png图4:来自clarifai的Reese Witherspoon前5个概念。(左原始图像,右DNAT)

理想情况下,通用图像标注模型应该为原始图像和匿名化图像预测完全相同的概念。为了衡量一致性,我们使用Clarifai为每种匿名化技术的所有测试样本预测概念。然后,我们计算了匿名化图像与原始图像之间前N个预测概念的平均精度(mAP)(其中N代表不同概念的数量)。

通过mAP,我们评估了两点:预测概念的一致性及其相关分数。例如,考虑一个匿名化图像及其原始图像对,经过图像标注模型处理后,如果某个概念在匿名化图像中的置信度值低于其在原始图像中的置信度值,则对最终mAP分数的影响较小;而如果某个概念仅出现在匿名化图像中,而未出现在其原始图像中,则影响较大。

前5和前50个概念的结果如表2所示。

wKgZPGe1Ml-AE1fuAAB6YSyVKHE911.png表2:用mAP测量图像概念一致性(越高越好)

四、总结

本文探讨了如何通过深度自然匿名化(DNAT)技术提升匿名化数据的价值,打破了传统匿名化方法在合规性与数据质量之间的固有权衡。DNAT通过生成自然替换而非破坏像素信息,不仅有效保护了个人隐私,还最大限度地保留了数据的分析价值。

实验表明,DNAT在图像分割内容一致性方面显著优于传统匿名化方法,能够更好地支持后续的AI分析和应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 汽车电子
    +关注

    关注

    3037

    文章

    8369

    浏览量

    170327
  • 图像处理
    +关注

    关注

    27

    文章

    1328

    浏览量

    58149
  • 图像识别
    +关注

    关注

    9

    文章

    527

    浏览量

    39182
  • 人工智能
    +关注

    关注

    1808

    文章

    49104

    浏览量

    250392
  • 数据处理
    +关注

    关注

    0

    文章

    628

    浏览量

    29311
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    加入ASAM组织,自动驾驶仿真平台aiSim引领安全新标杆

    科技正式加入全球汽车标准组织 ASAM(Association for Standardization of Automation and Measuring Systems),成为其正式会员单位!
    的头像 发表于 07-09 16:53 ?233次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>加入ASAM组织,自动驾驶仿真平台aiSim引领安全新标杆

    FLIR先进技术如何助力安全生产

    夏日炎炎,安全更不能忘!在工业生产中每一个细节都关乎到人员的生命安全和设备的稳定运行,今天就让我们一起了解如何通过FLIR的先进技术为夏季生产保驾护航!
    的头像 发表于 07-07 16:58 ?465次阅读

    云翎智能全国产执法记录仪核心技术突破:自主可控新标杆

    核心技术维度解析其创新价值:云翎智能纯国产执法记录仪一、纯北斗高精度定位:突破传统盲区,实现厘
    的头像 发表于 05-07 10:05 ?279次阅读
    云翎智能全国产<b class='flag-5'>化</b>执法记录仪核心<b class='flag-5'>技术</b><b class='flag-5'>突破</b>:自主可控新标杆

    CodeForge编码熔炉:重塑数据DNA,解锁信息宇宙新维度

    编码熔炉——一款以颠覆性技术重构数据底层逻辑的智能编码器,正以“数据炼金术”的姿态,为各行业开辟信息处理的新纪元。 【技术内核:突破压缩极限
    的头像 发表于 04-29 09:12 ?260次阅读

    分享 | 3DGS:革新自动驾驶仿真场景重建的关键技术

    3DGS技术为自动驾驶仿真场景重建带来突破,通过3D高斯点精确表达复杂场景的几何和光照特性,显著提升渲染速度与图像质量。aiSim平台结合3DGS,提供高保真虚拟环境与动态交通流模
    的头像 发表于 03-05 09:45 ?3543次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>分享 | 3DGS:革新自动驾驶仿真场景重建的关键<b class='flag-5'>技术</b>

    方案 | 基于AI自适应迭代的边缘场景探索方案

    测试 ADAS/AD 系统时,传统 DoE 方法难以覆盖驾驶边缘场景,影响自动驾驶性能提升。 aiSim集成的aiFab方案,以贝叶斯优化为核心,依据碰撞时间等关键指标,快速定位高风险场景,高效、低耗地查找与分析极端边缘案例
    的头像 发表于 02-26 09:45 ?2990次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>方案 | 基于AI自适应迭代的边缘场景探索方案

    与C2A Security达成战略合作

    日前,虹科姐妹公司与C2A Security达成战略合作,正式成为C2A Security在亚太地区的销售与售后服务合作伙伴。此次合作将充分发挥双方在技术研发与市场拓展方面的优势资源,重点聚焦汽车自动驾驶领域,携手推进
    的头像 发表于 02-08 09:12 ?933次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>与C2A Security达成战略合作

    方案 | 本地匿名化解决方案:隐私保护、自主掌控和高效运行!

    本地匿名化解决方案,以隐私和安全为核心设计原则,利用Terraform部署技术实现灵活自动扩展,确保高吞吐量与高效管理。该方案确保隐私保护、具备高灵活性与控制力,并支持离线操作,已广泛应用于欧洲多个行业领导者,为企业数据管理、安
    的头像 发表于 01-22 11:15 ?3549次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>方案 | 本地<b class='flag-5'>匿名</b>化解决方案:隐私保护、自主掌控和高效运行!

    解锁Chiplet潜力:封装技术是关键

    的关键钥匙。 Chiplet: 超大规模芯片突破的关键策略 面对全球范围内计算需求的爆炸性增长,高性能芯片市场正以前所未有的速度持续扩张。在这一背景下,Chiplet技术以其独到的设计理念与先进的封装工艺,成为了
    的头像 发表于 01-05 10:18 ?1020次阅读
    <b class='flag-5'>解锁</b>Chiplet潜力:封装<b class='flag-5'>技术</b>是关键

    与Anyverse建立合作伙伴关系

    日前,虹科姐妹公司与Anyverse正式建立合作伙伴关系,负责该品牌及产品在亚太地区的销售和售后服务,此次合作旨在通过整合双方的技术专长和市场资源,共同推动汽车自动驾驶领域的技术
    的头像 发表于 12-16 15:04 ?653次阅读

    直流变频焊接控制器:先进技术在焊接领域的革新应用探索

    在当今的工业生产领域中,新技术的发展与应用始终是推动产业升级、提升效率的关键驱动力。其中,直流变频焊接控制器作为一种前沿技术,在焊接工艺中的革新性应用引起了广泛关注。本文将深入探讨这一先进技术
    的头像 发表于 12-06 09:07 ?402次阅读

    分享 | 数据隐私和匿名:PIPL与GDPR下,如何确保数据合规?(二)

    自动驾驶技术飞速发展,但数据隐私安全成拦路虎?别担心,本文带您深入剖析PIPL与GDPR在数据处理行为及基础合法性方面的异同之处,帮助您准确把握法规要求,从而利用匿名化处理工具有效应对
    的头像 发表于 10-30 09:30 ?1769次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>分享 | <b class='flag-5'>数据</b>隐私和<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:PIPL与GDPR下,如何确保<b class='flag-5'>数据</b>合规?(二)

    技术 | 毫米波雷达技术解析

    自动驾驶技术飞速发展,毫米波雷达已成为自动驾驶传感器套件的关键。为此,为您深度解析毫米波雷达技术,从概述到工作原理,再到前沿的4D技术
    的头像 发表于 10-15 10:07 ?4363次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b><b class='flag-5'>技术</b> | 毫米波雷达<b class='flag-5'>技术</b>解析

    分享 | 数据隐私和匿名:PIPL与GDPR下,如何确保数据合规?(一)

    自动驾驶技术的快速发展伴随着数据隐私保护的严峻挑战。PIPL和GDPR为自动驾驶数据合规设立了高标准。本篇文章将带大家深入探讨PIPL与GDPR的异同点,期望能够帮助车企更好地理解并应对数据
    的头像 发表于 09-29 10:28 ?1851次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>分享 | <b class='flag-5'>数据</b>隐私和<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:PIPL与GDPR下,如何确保<b class='flag-5'>数据</b>合规?(一)

    分享 | 汽车仿真与AI的结合应用

    实现高质量的虚拟传感器输出是自动驾驶领域的一项关键挑战,然而传统方案对广角镜头的渲染和处理等方面仍存在一定的局限性。为此,为您介绍aiSim通用高斯泼溅渲染器如何打破限制,在自动驾驶仿真中的具体应用。
    的头像 发表于 09-11 09:24 ?1858次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>分享 | 汽车仿真与AI的结合应用