微软人工智能工程师声称在 OpenAI 的《DALL-E 3》中发现了安全护栏问题

微信扫一扫,分享到朋友圈

微软人工智能工程师声称在 OpenAI 的《DALL-E 3》中发现了安全护栏问题

上周,歌手泰勒-斯威夫特(Taylor Swift)的露骨图片充斥着 X(前 Twitter)社交网络。因此,X 暂时阻止了在其平台上对斯威夫特的搜索。有报道称,微软的 Designer AI 图像创建器(使用 OpenAI 的 DALL-E 3 模型)被用来制作斯威夫特的深度假图像。微软官方表示没有发现支持这一说法的证据,但随后更新了 Designer 的安全防护措施。

现在,一位名叫谢恩-琼斯(Shane Jones)的现任微软人工智能工程师致信华盛顿州总检察长鲍勃-弗格森(Bob Ferguson)以及美国参议员和众议员,声称他在 DALL-E 3 中发现了一个绕过其安全系统的漏洞。他还声称微软试图淡化这一漏洞。

GeekWire 发布的信中,琼斯声称他在 12 月初发现了 DALL-E 3 中的护栏漏洞。他没有详细说明具体问题。他声称,这些缺陷非常严重,DALL-3 "构成了公共安全风险",应该在OpenAI尝试修复这些缺陷时关闭。

琼斯声称,他在 12 月初向微软提出了自己的担忧,但随后又被要求将他发现的问题发送给 OpenAI。他说自己没有收到回复,随后在 LinkedIn 上向 OpenAI 董事会发布了一封公开信,要求他们关闭《DALL-E 3》。从那以后,琼斯声称他再也没有收到微软或 OpenAI 关于此事的任何消息。

微软就琼斯的说法向 GeekWire 发送了一份声明。该公司表示,"确认他分享的技术没有绕过我们任何人工智能图像生成解决方案中的安全过滤器"。该公司补充说,它正在 "与这位同事联系,以解决他可能还有的任何顾虑"。

OpenAI 发言人在自己的声明中说,"他分享的技术没有绕过我们的安全系统"。该发言人补充道:

我们还为我们的产品、ChatGPT 和 DALL-E API 实施了额外的保护措施,包括拒绝那些点名询问公众人物的请求。我们会识别并拒绝违反我们政策的信息,并在向用户展示之前过滤所有生成的图片。我们使用外部专家红队来测试滥用情况,并加强我们的保障措施。

琼斯在信中说,他希望美国政府建立一种新的方式,让人们报告和跟踪任何与人工智能相关的问题。他说,应该建立这样一个系统,这样开发人工智能产品的公司就可以使用这个报告系统,而不用担心这些企业的问题。

上一篇

Edge Dev v122.0.2365.3 发布 - 含多项改进

下一篇

苹果最后一款带光驱的 MacBook 已过时

你也可能喜欢

评论已经被关闭。

插入图片

公众号

公众号
关注我们

排行榜

返回顶部