谷歌大模型团队并入DeepMind，为了对抗ChatGPT？-今日热议

本文来自微信公众号：量子位（ID：QbitAI），作者：明敏，题图来自：《环太平洋》

【资料图】

为应对ChatGPT，谷歌在大模型方面的动作还在继续。

最新消息，其旗下专注语言大模型领域的“蓝移团队”（Blueshift Team）宣布，正式加入DeepMind，旨在共同提升LLM能力。

图/Twitter

DeepMind科学家们在推特下面“列队欢迎”，好不热闹。

图/Twitter

蓝移团队隶属于谷歌研究和谷歌大脑实验室同等级。

图/Google Research

之前谷歌耗时2年发布的大模型新基准BIG-Bench，就有该团队的重要贡献。

还有谷歌5400亿大模型PaLM，背后也有蓝移团队成员提供建议。

综合此前消息，DeepMind表示要在今年发布聊天机器人麻雀（Sparrow）内测版本。如今又有擅长大模型研究的团队加入，强强联手，或许会加快谷歌应对ChatGPT的脚步？

这下有好戏看了。

蓝移团队是谁？

据官网介绍，蓝移团队主要关注的研究点是如何理解和改进大语言模型的能力。

他们专注于了解Transformer的局限性，并挑战将其能力扩展到解决数学、科学、编程、算法和规划等领域。

具体可分为如下几方面分支：

图/Google Research

团队的代表性工作成果有数学做题模型Minerva。它曾参加数学竞赛考试MATH，得分超过计算机博士水平。

综合了数理化生、电子工程和计算机科学的综合考试MMLU-STEM，它的分数比以往AI高了20分左右。

图/Google Research

并且它的做题方法也是理科式的，基于谷歌5400亿参数大模型PaLM，Minerva狂读论文和LaTeX公式后，可以按照理解自然语言的方式理解数学符号。

作者透露，让该模型参加波兰的数学高考，成绩都超过了全国平均分数。

图/Twitter

还有蓝移团队曾和MIT的科学家一起，通过训练大模型学会程序员debug时“打断点”的方式，能让模型读代码的能力大幅提升。

图/Google Research

还有谷歌耗时2年发布的大模型新基准BIG-Bench，蓝移团队全部成员均参与了这项工作。

BIG-bench由204个任务组成，内容涵盖语言学、儿童发展、数学、常识推理、生物学、物理学、社会偏见、软件开发等方面的问题。

图/Google Research

以及如上提到的谷歌大模型PaLM，蓝移团队成员Ethan S Dyer也贡献了建议。

官网显示，蓝移团队目前有4位主要成员。

Behnam Neyshabur现在是DeepMind的高级研究员。他在丰田工业大学（芝加哥）攻读了计算机博士学位，后来在纽约大学进行博士后工作，同时是普林斯顿大学高等研究理论机器学习项目组的成员。研究领域是大语言模型的推理和算法能力、深度学习和泛化等。

Vinay Ramasesh在加州大学伯克利分校获得物理学博士学位，曾致力于研究基于超导量子比特的量子处理器，硕士毕业于麻省理工学院。

最近他主要在研究语言模型，职位是研究科学家。

Ethan Dyer博士毕业于麻省理工学院，2018年加入谷歌工作至今。

Anders Johan Andreassen同样是物理专业出身，博士毕业于哈佛大学。在哈佛大学、加州大学伯克利分校都做过博士后，2019年起加入谷歌。

谷歌还有多少后手？

这次蓝移团队的调动，也不免让外界猜测是否是谷歌为应对ChatGPT的最新举措。

ChatGPT引爆大模型趋势后，谷歌几乎是最先打响“阻击战”的大厂。

尽管加急发布的Bard效果确实有失水准，但这并不意味着谷歌会就此丧失竞争力。

诚如OpenAI之于微软，谷歌也有DeepMind。

DeepMind还是上一轮AI浪潮的引爆者。

消息显示，DeepMind手里也有聊天机器人。

去年9月，他们介绍了一个对话AI麻雀（Sparrow），它的原理同样是基于人类反馈的强化学习，能够依据人类偏好训练模型。

图/Sparrow

DeepMind创始人兼CEO哈萨比斯在今年早些时候说，麻雀的内测版本将在2023年发布。

他表示，他们将会“谨慎地”发布模型，以实现模型可以开发强化学习功能，比如引用资料等，这是ChatGPT不具备的功能。

图/Google Research

但具体的发布时间还没有透露。

蓝移团队的加入公告中提到，他们是为了加速提升DeepMind乃至谷歌的LLM能力，不知这一动向是否会加速该对话模型的发布。

与此同时，谷歌也没有把目光完全局限在自家开发能力上。

本月初，劈柴哥重磅宣布，斥资3亿美元，紧急投资ChatGPT竞品公司Anthropic——由GPT-3核心成员出走创办。

1月底，该公司内测聊天机器人Claude。

图/Claude

这是一个超过520亿参数的大模型，自称基于前沿NLP和AI安全技术打造。

它同ChatGPT一样，靠强化学习（RL）来训练偏好模型，并进行后续微调。

但又与ChatGPT采用的人类反馈强化学习（RLHF）不同，Claude训练时，采用了基于偏好模型而非人工反馈的原发人工智能方法（Constitutional AI），这种方法又被称为AI反馈强化学习（RLAIF）。

如今，Claude尚未作为商业产品正式发布，但已有人（如全网第一个提示工程师Riley Goodside）拿到了内测资格。有人说效果比ChatGPT要好。

图/Twitter

目前，这家公司的最新估值已经达到50亿美元。

总而言之，谷歌虽然在Bard上栽了跟头，但也没把鸡蛋放在同一个篮子里。接下来它在大模型上还有哪些新动作？这件事还很有看头。

参考链接：

[1]https://twitter.com/bneyshabur/status/1629150056715816962

[2]https://research.google/teams/blueshift/

[3]https://www.deepmind.com/blog/building-safer-dialogue-agents

本文来自微信公众号：量子位（ID：QbitAI），作者：明敏

推荐内容

谷歌大模型团队并入DeepMind，为了对抗ChatGPT？-今日热议

投资公司注册需要什么条件？投资公司起名字大全

上市公司一定要出业绩报告吗？上市公司业绩报告什么时候发布？

hkd是什么货币？hkd换算人民币是多少？

医药ETF：连续5日融资净买入累计313.51万元（02-24）-今日热文

雪狼谷的剧情是什么？雪狼谷中姬陪香的结局是什么？

神兵小将是什么时候出的？神兵小将的大结局是什么？

卷尺的工作原理是什么？卷尺十大品牌

光圈范围是什么意思？怎么看光圈范围？

魔兽世界光芒护甲圣物在哪里刷？魔兽世界光芒护甲圣物怎么制作？

漫威蜘蛛侠黑猫任务怎么做？漫威蜘蛛侠黑猫任务攻略

为“退休”家电寻个好归宿-全球最新

新能源汽车“出海”势头旺

PICO攻下VR市场15%份额 券商建议紧密跟踪Pico和苹果产业链-天天精选

永恒之塔怎么屏蔽其他玩家？永恒之塔电脑推荐配置

魔兽世界电狼在哪抓？魔兽世界电狼刷新时间

造梦西游2五毒兽怎么获取？造梦西游2五毒兽最佳属性是什么？

口袋妖怪黑2和白2有什么区别？口袋妖怪黑2金手指代码整合

赛尔号怀旧服几点到几点可以玩？赛尔号怀旧服怎么孵化精元？

王者荣耀扭蛋活动是真的吗？王者荣耀扭蛋活动在哪里？

ChatGPT写出的文章，版权归我还是归它？-环球看点

魔兽世界s3武器在哪买？魔兽世界s3武器需要多少等级？

叶黄素什么时候吃最合适？叶黄素怎样服用效果最佳？

指尖陀螺的运动形式是什么？指尖陀螺怎么玩儿？

炒外汇如何开户外汇开户流程_外汇如何开户交易

英特尔确认第二代Arc显卡！带来新架构和更多新技术！

第13代酷睿HX处理器有多强？i7-13700HX性能体验-全球简讯

大力促销，价格降到冰点！OMEN暗影精灵8 Pro速来抢-最新消息

不完整的幸福-天天消息

怎样提高孩子背诵能力 如何提高孩子背诵能力-天天讯息

德里赫特：我一条大腿和穆勒两条大腿一样粗，坏处是皮裤很难穿-独家焦点

Solana链上活动持续冻结，验证者准备第二次尝试重启-速递

加密交易所CoinEx将停止为美国用户提供服务，提款截至4月24日-全球今日报

Voyager疑似正通过Coinbase出售资产，现仍持有6.31亿美元的加密资产-环球要闻

Solana网络在第二次重启后重新上线-当前速读

Cardano联创：已与Coindesk签署收购保密协议，但交易难度较大

潮田渚-世界今亮点

社科院国家金融与发展实验室副主任杨涛：银行数字化转型目标应服务于生存和发展

公司法定代表人的产生方式有哪些

ChatGPT之父传奇：技术天才、投资狂魔、下一个马斯克

警惕！全国多地警方发布预警！特别是苹果手机用户…-环球关注

飞行汽车是驾驶工具的未来吗？｜思维百科

AIGC三创赛即将在沪开幕，专家：国内已显现独特元宇宙路径，以虚实交互促进实体经济

假如我是我们班学习委员作文(汇总23篇)-世界热推荐

新增节能车指标 家电以旧换新 广东春季促消费激发市场活力-关注

家电业拥抱智能家居：“文心一言”只是起点-焦点日报

王亦凡

郏县教体局：明确“禁酒”规定 狠抓作风建设

《原子之心》里的这段苏联动画，被批种族歧视…-世界微头条

消息称索尼将举办 PS 发布会，安排好 PS5 第二阶段-速读

人人都能梦的解析高铭-全球微速讯

中国人民银行丽江市中心支行-世界快资讯

步入艺术之境 三星The Frame画壁电视评测-环球视讯

全面的电竞小钢炮！HKC神盾系列MG24Q显示器评测-全球即时

vivo手机怎样查看手机号码_vivo怎么查看手机号码

中国教师教学思想录：二-环球热头条

卢卡申科驳斥“俄计划战略吸收白俄罗斯”假消息：不要听信这些谎言

罗永浩进场之后，苹果入局之前：XR又寒冬了吗？-世界观天下

“每次都是整箱整袋地搬”，优衣库高管 4 年偷走 800 余件服装-环球热消息

剑咬之虎-报道

Meta版ChatGPT来了？-天天资讯

iPhone 15标准版真机谍照曝光：终于如愿尝鲜灵动岛-天天资讯

魅族20系列电池稳了：1600天连续充放覆盖36月超长质保-当前焦点

土耳其强震已造成该国44218人遇难 余震超9000次-环球关注

zkMint：基于零知识证明的Tendermint共识验证方案（英文原版）-微资讯

数据：比特币挖矿难度上调 9.95% 至 43.05T，再创历史新高-当前热门

Arbitrum的时机：迟迟不发币的Arbitrum究竟错过了什么？-全球新消息

《易经》：天人合一，大道修行的终极密码

恋着多喜欢-天天亮点

国产架构的龙芯CPU可以跑QQ了！底层重写、与x86/Arm肩并肩-快资讯

京东内部邮件曝光：证实“百亿补贴”将上线 2月23日已启动内测-每日速看

长脸适合什么刘海_长脸适合刘海吗-世界今热点

加密货币交易所TRT出现流动性问题正在暂停业务

对冲基金巨头Tapiero筹集新资金增加加密IPO

FTX Japan 用户在恢复提款后已提现约 5000 万美元的法币和加密货币

各大企业巨亏裁员，元宇宙“凉了”会是又一个泡沫吗？

Nansen：三箭资本NFT销售预估价值约为1030万美元-天天亮点

SharkTeam：加密货币钓鱼团伙Monkey Drainer链上行为分析-每日看点

王艳老公

PICO攻下VR市场15%份额券商建议紧密跟踪Pico和苹果产业链-天天精选

怎样提高孩子背诵能力如何提高孩子背诵能力-天天讯息

新增节能车指标家电以旧换新广东春季促消费激发市场活力-关注

郏县教体局：明确“禁酒”规定狠抓作风建设

步入艺术之境三星The Frame画壁电视评测-环球视讯

土耳其强震已造成该国44218人遇难余震超9000次-环球关注

02月25日宜昌今日疫情最新动态消息宜昌出行进出返乡最新疫情防疫管控出入政策通知-环球时讯

盒马同店销售双位数增长带动直营业务同比增长10%-焦点精选

魅族20安兔兔跑分曝光综合成绩突破125万分大关-环球新消息

努比亚Z50 Ultra正式官宣正面将配备无孔全面屏