微软人工智能工程师声称在 OpenAI 的《DALL-E 3》中发现了安全护栏问题-电脑志

上周，歌手泰勒-斯威夫特（Taylor Swift）的露骨图片充斥着 X（前 Twitter）社交网络。因此，X 暂时阻止了在其平台上对斯威夫特的搜索。有报道称，微软的 Designer AI 图像创建器（使用 OpenAI 的 DALL-E 3 模型）被用来制作斯威夫特的深度假图像。微软官方表示没有发现支持这一说法的证据，但随后更新了 Designer 的安全防护措施。

现在，一位名叫谢恩-琼斯（Shane Jones）的现任微软人工智能工程师致信华盛顿州总检察长鲍勃-弗格森（Bob Ferguson）以及美国参议员和众议员，声称他在 DALL-E 3 中发现了一个绕过其安全系统的漏洞。他还声称微软试图淡化这一漏洞。

在 GeekWire 发布的信中，琼斯声称他在 12 月初发现了 DALL-E 3 中的护栏漏洞。他没有详细说明具体问题。他声称，这些缺陷非常严重，DALL-3 "构成了公共安全风险"，应该在OpenAI尝试修复这些缺陷时关闭。

琼斯声称，他在 12 月初向微软提出了自己的担忧，但随后又被要求将他发现的问题发送给 OpenAI。他说自己没有收到回复，随后在 LinkedIn 上向 OpenAI 董事会发布了一封公开信，要求他们关闭《DALL-E 3》。从那以后，琼斯声称他再也没有收到微软或 OpenAI 关于此事的任何消息。

Mistral AI 为 Le Chat 带来重大更新挑战 ChatGPT

微软就琼斯的说法向 GeekWire 发送了一份声明。该公司表示，"确认他分享的技术没有绕过我们任何人工智能图像生成解决方案中的安全过滤器"。该公司补充说，它正在 "与这位同事联系，以解决他可能还有的任何顾虑"。

OpenAI 发言人在自己的声明中说，"他分享的技术没有绕过我们的安全系统"。该发言人补充道：