人工智能借助合成和匿名数据强调隐私保护

2025-04-15

新闻要点

Apple采用新方法训练AI模型，借助合成数据和差分隐私，不收集用户内容，在iOS 18.5等测试版中推出，旨在平衡隐私与性能。

- Apple用合成数据和差分隐私训练AI模型

- 新技术用于改进邮件摘要等AI功能

- 相关系统在iOS 18.5等测试版推出

主要内容

苹果正在采取一种新方法来训练其 AI 模型，避免从 iPhone 或 Mac 收集或复制用户内容。据最近的一篇博客文章称，该公司计划继续依靠合成数据（用于模拟用户行为的构造数据）和差分隐私来改进诸如电子邮件摘要等功能，而无需访问个人电子邮件或消息。

对于选择加入苹果设备分析计划的用户，其 AI 模型将在本地设备上存储的少量真实用户内容样本中比较合成的类似电子邮件的消息。设备然后识别出最接近其用户样本的合成消息，并将关于所选匹配的信息发送回苹果。没有实际用户数据离开设备，苹果表示它仅接收聚合信息。

该技术将使苹果能够在不收集真实用户内容的情况下改进其用于长文本生成任务的模型。这是该公司长期使用差分隐私的延伸，差分隐私将随机数据引入更广泛的数据集以帮助保护个人身份。苹果自 2016 年以来就一直在使用这种方法来了解使用模式，符合公司的保障政策。

改进 Genmoji 和其他苹果智能功能：该公司已使用差分隐私来改进诸如 Genmoji 等功能，在这些功能中，它收集关于哪些提示最受欢迎的一般趋势，而不会将任何提示与特定用户或设备相关联。在即将发布的版本中，苹果计划将类似方法应用于其他苹果智能功能，包括图像游乐场、图像魔杖、记忆创建和写作工具。

对于 Genmoji，该公司匿名调查参与设备以确定是否已看到特定提示片段。每个设备以嘈杂信号响应——一些响应反映实际使用，而其他则是随机的。该公司表示，这种方法确保只有广泛使用的术语对苹果可见，并且任何单个响应都无法追溯到用户或设备。

为更好的电子邮件摘要策划合成数据：虽然上述方法在短提示方面效果良好，但苹果需要一种新方法来处理诸如电子邮件摘要等更复杂的任务。为此，苹果生成数千个样本消息，这些合成消息基于语言、语气和主题转换为数值表示或“嵌入”。参与的用户设备然后将嵌入与本地存储的样本进行比较。同样，仅共享所选匹配，而不是内容本身。苹果从参与设备收集最常选择的合成嵌入，并使用它们来优化其训练数据。随着时间的推移，此过程使系统能够生成更相关和逼真的合成电子邮件，帮助苹果在不明显损害用户隐私的情况下改进其用于摘要和文本生成的 AI 输出。

该系统正在 iOS 18.5、iPadOS 18.5 和 macOS 15.5 的测试版中推出。据彭博社的马克·古尔曼称，苹果正试图通过这种方式解决其 AI 开发中的挑战，这些挑战包括功能推出延迟和 Siri 团队领导变化的后果。其方法在实践中是否会产生更有用的 AI 输出还有待观察，但这表明了在平衡用户隐私和模型性能方面的明确公开努力。

人工智能借助合成和匿名数据强调隐私保护

新闻要点

主要内容

关于我们