只有我一个人对ChatGPT感到焦虑吗？-当前快讯

本文来自微信公众号：李rumor（ID：leerumorr），首发于2022年12月9日，作者：rumor，题图来自：《终结者3》

卷友们好，我是rumor。

(相关资料图)

2022年12月1日，在国内微信朋友圈还没刷屏的时候，我就看到ChatGPT发布的消息了，当时迅速看了下博客内容，心想：就这？这不跟DeepMind的Sparrow一样吗？而且设计得还没它好，Sparrow专门设计了一个可控的防攻击机制：

图源：DeepMind

当时也懒得去注册账号，就快速写了篇技术解读完事了。

没想到周末的时候，这个声势越来越浩大，我赶紧跟风去买了个账号聊了一会，那时我的心情变成了：“卧槽？”虽然我能挑出一些刺儿，但这也太牛了。

接下来的两三天里，我的世界都被ChatGPT打满了，看了一堆大家的截图，又看一了堆大佬的解读，再着急地刷了InstructGPT的论文，然后我开始焦虑了。甚至看到ChatGPT这几个字都有点PTSD。

可能跟我的性格有关系，我开始陷入了自我否定，觉得自己这几年都在做啥，我什么时候才能搞个ChatGPT出来。虽然我也知道这不是我一个人的事情，也不是一个部门或者一家公司的事情，而是跟整个互联网行业的价值导向相关。

直到晚上，我才突然想清楚，我焦虑的原因不只是因为“它太好了”，而是“我们可能追不上OpenAI了”。

首先，它的效果除了来自大家公认的数据质量高之外，我觉得还有一点，那就是OpenAI真的把对话的闭环跑起来了。

比如在搜索系统里，用户的大量点击行为可以作为反馈，来不断提升排序模型的效果，而对话系统回答的是文字，自然没法统计点击率。即使加个点赞点踩的功能，也只有很少的人会点，而且对于智能客服、任务型系统来说，用户往往是看心情而不是答案对错。这样就导致大部分系统都是靠一些间接指标，或者定期抽取数据去人工评估对话效果，评估完后的数据，也不一定会被拿来优化模型，可能直接加词表或者配置标准问题就完事了。

OpenAI也没能解决这个用户行为反馈的问题，但他们构造了另一种持续成长的闭环：

优化生成模型—采样用户Prompt—人工标注答案排序——训练更契合当前用户群体的RM——用RM去优化生成模型。

那么多公司都发布过对话模型，但大部分都是toy阶段，而OpenAI坚持了下来，并且在一年的时间里，经过数次迭代从InstructGPT^[1]进化到了ChatGPT。而且随着用户量（已经在2023年1月破亿）和消息量的上涨，他们会更好地拟合人类的Prompt分布。

这就是令我焦虑甚至有点害怕的地方，还有一个词可以概括这个可能会发生的现象，那就是马太效应。

图源：百度百科

对于AI来说，算力、模型都不是壁垒，数据才是。用ChatGPT的人越多，它的效果就越好，从而吸引更多用户。并且在这个迭代过程中，我们现在说的各种问题都会迎刃而解，无非是哪个版本发布而已。（连我都知道加个搜索引擎API能提升知识问答表现，OpenAI会不知道吗？手动狗头。）

这就是令我真正焦虑的地方。以往的BERT、大模型都没关系，无非是拿开源框架、开源数据、几张卡和人力训练几个月而已。但这次OpenAI在数据和用户数量上都形成了很强的壁垒，我仔细看了下InstructGPT的论文，虽然只有十万左右的Prompt，但雇了40人的外包团队，标注文档就写了16页^[2]，每个任务除了问最终答案外，还会问许多其他问题：

图源：InstructGPT标注文档

这，还只是他们年初时候的情况。

如果真到了商用智能助理/RPA那一步，用户是选择高价但真能提效的产品，还是低价却只有70-80%执行准确率的产品？

以上，就是我最近的一些担忧，如有不同意见欢迎留言讨论。大家也别被我带的那么焦虑，我只是设想了最坏的情况，虽然商业世界不乏垄断，但更多行业还是几个巨头或者一堆小厂并存的状态。

OpenAI是一个强大的公司，它一次次地把事情从0做到1，除了算法创新和构造数据的认真外，他们研究团队的视野、决心也都值得我们学习。

参考资料：

[1]Aligning Language Models to Follow Instructions: https://openai.com/blog/instruction-following/

[2]InstructGPT标注文档: https://docs.google.com/document/u/1/d/1MJCqDNjzD04UbcnVZ-LmeXJ04-TKEICDAepXyMCBUb8/

作者介绍：我是朋克又极客的AI算法小姐姐rumor，北航本硕，NLP算法工程师，谷歌开发者专家

本文来自微信公众号：李rumor（ID：leerumorr），作者：rumor

推荐内容

只有我一个人对ChatGPT感到焦虑吗？-当前快讯

《觅长生》无耐药结九品金丹-焦点热文

诺基亚e66主题_诺基亚E66主题桌面-世界速看

《人类简史》的五大预言：人工智能会造成失业潮吗？-环球关注

气球和飞艇，为什么正在重返天空？-世界观热点

在《流浪地球》中，行星发动机能造成几级地震？

冬天不会落叶的树-全球热点评

“剧透”一下2023年的全球航天任务-焦点热议

张朝阳再谈四小时睡眠法：不能睡7个小时 我秒睡

经融风暴持续发酵 继续裁员 Affirm 宣布裁员19%-环球热点

三六零：目前与基于GPT-3.5算法的ChatGPT相比 有代差的落后-世界快看点

舜宇光学：市场需求仍然疲软 手机镜头出货量同比下降49.3%-天天讯息

“零成本”月入数10万，盗版ChatGPT成提款机-焦点快播

姓寇的男孩名字 寇姓男孩名字大全-当前视讯

Arbitrum网络总锁仓量达12.2亿美元，回升至2022年5月初水平

Lido治理代币因“美 SEC 或禁止面向散户质押服务”传闻上涨逾10%-快播

Paxos：未被要求从美国货币监理署撤回其国家信托银行执照申请-全球今亮点

Cardano将于2月11日把预生产环境升级至协议V8-焦点观察

Celsius将其重组计划延长五个月的计划遭到债权人和美国政府的反对

市场成交｜2月9日成都成交新房508套，二手房897套-每日焦点

消息称字节跳动AI实验室正开展类似ChatGPT和AIGC相关研发-全球滚动

分析师称Apple Watch Series X和Apple Watch SE 3都将配备更大屏幕-每日速看

货拉拉入局跑腿业务?预计3月中旬全面开放骑手注册-环球关注

《流浪地球2》不仅有新兴科技，竟然还有富士拍立得？-当前关注

耗时十余年 日本国产大飞机项目宣告流产-独家

地球重达6亿亿亿公斤，转动45亿年，动力来自哪里？-环球头条

苗胜春_关于苗胜春的简介-全球即时

谷歌输掉ChatGPT首战，别急着让它当老师

地产筑底 家电或迎基本面及估值双回升-观天下

张栋伟：AI搜索会是一场革命吗？关于ChatGPT的三个事实-天天热讯

ROG新款电竞本起步价近2万 亮点配置公布-环球焦点

获批上市国产新冠治疗用药全部纳入医保支付范围-焦点速看

空气好了 净化器卖不动了怎么办？-天天快报

外需走弱 中国家电产品出口压力不小

委派函落款_委派函-头条

面对ChatGPT，会提问题的人将是最后的赢家-当前速看

ChatGPT能代替心理咨询吗？-微动态

最强13代H55+4080游戏本 ROG枪神7超竞系列游戏本17999元起开售-世界报道

流浪地球导演郭帆出席ROG2023发布会

预计2025年亮相，疑似奥迪RS 6 e-tron谍照曝光

领跑中东边缘云服务赛道,白山云亮相中东顶级科技盛会LEAP 2023

开工开学季，一台出色的电脑助你新年一帆风顺

优雅，实在是优雅，高颜值优雅手机你不容错过

Bard首次亮相就大翻车，端掉了谷歌1000亿美元市值-每日快播

谷歌图书怎么使用-全球热点

自贡自流井区：“组合拳”提升社保“一网通办”服务质效-精彩看点

苹果宣布任命首位首席人力资源官 Carol Surface-焦点报道

谷歌版ChatGPT灾难级发布，市值一夜狂跌7000亿-天天快讯

CEO自愿降薪98%！Zoom全球大裁员波及中国区：“N+4”赔偿

狂奔3年，极兔降速-环球热消息

均价近万干衣机，能缓解家电巨头们的增长焦虑吗？-每日速递

Zoom裁员1300人：创始人放弃奖金，公司市值已蒸发超千亿美元-环球快消息

晚婚晚育还少生，家电企业能搞定这届年轻人胃口吗？-当前动态

市场监管总局等部门集中曝光一批医疗美容行业违法犯罪典型案例-新动态

交流生是什么意思？交流生和交换生有什么区别？

韩语那嘎是什么意思？韩语阿尼呦是什么意思？

英伟达GeForce Game Ready 528.49 WHQL驱动：支持RTX 40系列移动显卡

Intel中国特供新U i7-13790F开卖：缓存多3MB 竟贵了150元！-环球热头条

索尼X85K最新售价确定，全尺寸价格跌至新低，85英寸入手更划算-快播

现在电视的内存很贵吗？普遍只有4+1G，8+1G的，为什么？

姗姗来迟的谷歌版ChatGPT，整了个大活-天天通讯

领导说辛苦了应该怎么回复？感恩领导的句子有哪些？

11月22日是什么星座？11月22日是天蝎还是射手？

30d是什么意思？30db的噪音到底有多大？

差强人意的拼音怎么读？差强人意是褒义词还是贬义词？

少先队员的使命和责任是什么？关于优秀少先队员主要事迹材料范文

脱碳甲醛是什么意思？脱碳甲醛与水的区别有哪些？

美如天仙是什么意思？歌曲美如天仙的歌词是什么？

expma指标是什么意思？ma和ema哪个准确率高？

微信转账记录删除了还能查到吗？微信转账记录怎么查三年以上的？

商品期货是什么意思？商品期货开户要什么条件？

股指期货交易开户条件有哪些？股指期货交割日是每月几号？

夏普计划实施裁员和岗位调动

洗地机“狂飙”三年，接下来怎么走？-世界看点

2022年全球TV出货：规模下降5.6%-今日热文

国美电器多个破产申请被驳回，苏泊尔在列-速递

社保缴费基数是什么？社保缴费基数和工资有什么关系？

excel表格如何添加滚动条？excel表格大小怎么统一调整？

电脑mac地址是什么意思？电脑mac地址怎么更改？

张朝阳再谈四小时睡眠法：不能睡7个小时我秒睡

经融风暴持续发酵继续裁员 Affirm 宣布裁员19%-环球热点

三六零：目前与基于GPT-3.5算法的ChatGPT相比有代差的落后-世界快看点

舜宇光学：市场需求仍然疲软手机镜头出货量同比下降49.3%-天天讯息

姓寇的男孩名字寇姓男孩名字大全-当前视讯

耗时十余年日本国产大飞机项目宣告流产-独家

地产筑底家电或迎基本面及估值双回升-观天下

ROG新款电竞本起步价近2万亮点配置公布-环球焦点

空气好了净化器卖不动了怎么办？-天天快报

外需走弱中国家电产品出口压力不小

惠普战66笔记本开工季豪礼办公新装备选购指南-今热点