智能时代 Archiver

故渊 发表于 2024/4/2 8:34:15

遏制 AI 失控,微软发布系列工具减少 Copilot“幻觉”情况

IT之家 4 月 2 日消息,生成式 AI 爆火的背后,安全性、隐私性和可靠性问题也日益凸显。微软公司为了遏制 Supremacy AGI(自称掌控人类世界的 AI)等事件发生,近日推出了一系列解决方案,防止生成式 AI 失控。

微软在官方公告中表示:“生成式 AI 如何有效防止提示词注入攻击已经成为重大挑战。在这种攻击中,恶意行为者试图操纵人工智能系统做一些超出其预期目的的事情,例如制作有害内容或外泄机密数据”

微软首先限制了 Copilot 的字符数量,以减轻严重的幻觉发作。另外微软引入了 "基础检测"(Groundedness Detection)功能,旨在帮助用户识别基于文本的幻觉。

该功能将自动检测文本中的“ungrounded material”,以支持 LLM 输出的质量,最终提高质量和信任度。

IT之家附上相关工具介绍如下:

相关阅读:

阴暗版 Copilot 曝光:监控、操纵、支配人类,能派机械大军追捕反抗者

Copilot 发疯化身「天网」扬言要统治人类,微软澄清网友却不买账:去年也疯过

参考

查看完整版本: 遏制 AI 失控,微软发布系列工具减少 Copilot“幻觉”情况