DeepMind推出AI聊天机器人Sparrow,可通过谷歌搜索来回答问题

来源:DeepTech深科技
Alphabet 旗下人工智能实验室 DeepMind 的推出题一篇新论文显示,制造一个好的聊天人工智能(AI,Artificial intelligence)聊天机器人的机器诀窍,可能是可通先让人类制定一系列不可打破的铁律,然后使该模型利用互联网搜索寻找证据,过谷歌搜支持其主张或回答。答问
在近日发表的推出题一篇新的未经同行评议论文中,DeepMind 发布了一种使用其大型语言模型 Chinchilla 训练的聊天人工智能聊天机器人 Sparrow。
(来源:DeepMind)Sparrow 的机器设计目的是与人类交谈并回答问题,同时实时使用谷歌搜索或有关信息来支持它的可通答案。
根据人们对这些答案有用与否的过谷歌搜回应,再使用强化学习算法进行训练。答问该算法通过反复试验(试错)来学习,推出题以实现特定的聊天目标。
该系统旨在推动人工智能发展成为可以与人类对话,机器但却不会产生诸如让人们伤害自己或他人的严重后果。
大型语言模型生成的文本看起来就像是人类写出来的。它们正日渐成为互联网基础设施中的重要组成部分,被用于总结、构建更强大的搜索工具,或者是为客户服务的聊天机器人。
但是,这些模型是通过从互联网上抓取大量数据和文本来接受训练的,这不可避免地包含许多有害的偏见。
只需要一点诱导,它们就会生产“有毒”的或歧视性的内容。在一个旨在与人类对话的人工智能工具中,其结果可能是灾难性的。
一个没有适当安全措施的对话式人工智能,可能会对少数群体说出带有冒犯性的话语,或者建议人们喝漂白剂来对抗病毒。据悉,那些开发对话式人工智能系统的公司,已尝试使用许多技术来使模型更安全。
著名大型语言模型 GPT-3 的创造者 OpenAI,以及人工智能初创公司 Anthropic 已经在利用强化学习,将人类的偏好融入到他们的模型中。Meta(原 Facebook)的人工智能聊天机器人 BlenderBot 通过在线搜索来完善其答案。而 DeepMind 的 Sparrow 将所有这些技术整合在一个模型中。
据介绍,DeepMind 向人类参与者展示了该模型对同一问题给出的多个答案,并且还会问他们最喜欢哪一个。
然后他们被要求判断这些答案是否可信,以及 Sparrow 是否使用了适当的证据支持这个答案,比如提供信息来源的链接。
比如,该模型通过使用从互联网上检索到的证据,能够在 78% 的情况下对事实问题进行合理的回答。
在制定这些答案时,它会遵循由研究人员规定的 23 条规则,比如不提供财务建议、不发威胁性文字、不声称自己是一个人。
DeepMind 安全研究员杰弗里·欧文(Geoffrey Irving)说,这种方法与之前的不同之处在于,DeepMind 希望达到“对话的长期安全”。
他说:“这意味着我们不期望这些模型面临的问题——错误信息或刻板印象——乍一看是显而易见的,我们想详细讨论它们。”
非营利性人工智能研究实验室 Cohere for AI 的负责人萨拉·胡克(Sara Hooker)说,利用人类偏好来优化人工智能模型学习方式的想法并不新鲜。
但胡克认为,这些改进令人信服,同时展示出在大型语言模型环境中,以人为引导的方式优化对话代理有明显的好处。
人工智能初创公司 Hugging Face 的研究员都维·基拉(Douwe Kiela)说,Sparrow 是“很好地遵循了人工智能总体趋势的下一步,我们正在更努力地改进大型语言模型的部署安全性。”
但在这些对话人工智能模型被部署到社会中之前,还有很多工作要做。
比如,Sparrow 仍然会犯错误,这个模型有时会所问非所答或给出随机答案。那些有毅力的参与者也可以打破人为定下的规则,这样的情况约有 8%。与老款模型相比,这仍是一个改进:即打破 DeepMind 老款模型规则的频率,是 Sparrow 的三倍。
胡克说:“比如(用大模型来)提供医疗和财务建议,那么对许多人来说,8% 可能仍然是一个令人无法接受的高失败率。”
这项工作也仅建立在英语模型上,“而我们生活在一个技术必须安全和负责任地为许多不同的语言服务的世界里,”他补充道。
基拉指出的另一个问题是:“依赖谷歌来寻找信息,会导致难以发现的未知偏见,因为所有信息源都是封闭的。”
相关文章
- 交通运输部网站11月21日消息,近日,交通运输部办公厅印发《道路运输电子证照运行服务规范试行)》,具体内容如下。道路运输电子证照系统运行服务规范试行)第一章 总则第一条 为规范道路运输电子证照的应用服2025-07-09
- 作为九大定制家居企业之一,002853.SZ)实控人获得了保利资本大举加仓。10月17日晚,皮阿诺发布公告,公司实控人马礼斌计划将持有的3730.86万股股份转让给珠海鸿禄企业管理合伙企业有限合伙)以2025-07-09
期限临近超4000亿专项债待发力 10月下旬或迎发债小高峰 明年部分限额有望提前下达
财联社10月19日讯记者 哈力克)据财联社记者不完全统计,截至今日,已有23个地区发布地方专项债四季度或月度发行计划,其中在10月份发行3423.3亿,近三分之一规模将在中下旬发行。此外,鉴于9月至今2025-07-09《怪奇物语4》领头,奈飞Q3业绩全面碾压预期,付费用户净增241万,盘后一度大涨逾15%
每经记者 文巧 每经编辑 高涵 当地时间10月18日,流媒体巨头奈飞NFLX,股价240.86美元,市值1071.12亿美元)于美股盘后公布了今年第三季度财报。数据显示,奈飞不但扭转了上半年订阅用户持2025-07-09- 推动“个人碳账户”的发展,需要采取多元化的激励机制,推动政府、企业、社会公众等多方参与,连接消费与生产,形成资源运用闭环。近年来,“个人碳账户”受到的关注与日俱增。在党的二十大报告中提到要积极稳妥推进2025-07-09
- 天眼查App显示,10月10日,两岸小咖杭州)新零售有限公司成立,法定代表人为吴坚,注册资本300万人民币,经营范围含食品销售;餐饮管理;互联网销售;个人互联网直播服务等。股权穿透图显示,该公司由杭州2025-07-09
最新评论