我叫MOSS，中国版ChatGPT，源自《流浪地球》

本文来自微信公众号：机器之心（ID：almosthuman2014），编辑：泽南、蛋酱，原文标题：《复旦发布中国版ChatGPT：MOSS开启测试冲上热搜，服务器挤爆》，题图来自：《流浪地球》

ChatGPT 是最先进的 AI，也是最热门的应用 —— 自去年 11 月底发布以来，它的月活跃用户两个月超过一亿，轻松拿到了全球互联网史上用户增长速度的第一。

(相关资料图)

它也是一种门槛很高的技术。由于 ChatGPT 的训练过程所需算力资源大、标注成本高，目前国内暂未出现对大众开放的同类产品。百度、阿里、京东等互联网大厂都放出消息，表示正在打造国产 ChatGPT，并将在近期发布。

在各大厂产品到位之前，学界先有了消息。2 月 20 日晚，复旦大学自然语言处理实验室发布了具备 ChatGPT 能力的语言模型 ——MOSS，并面向大众公开邀请内测。

图/MOSS 项目主页

MOSS 的名称来自电影《流浪地球》，和电影一样火的是，MOSS 发布的消息很快冲上了知乎等平台热搜榜的第一位。

图/MOSS 项目主页

不过与科幻不同的是，现实世界的 AI 还没有量子计算机加持，距离开放还没有过 24 个小时，由于瞬时访问压力过大，MOSS 服务器昨晚已被挤爆，可见大家对于生成语言模型的期待程度有多高。

据复旦大学研究人员介绍，现在服务器正在修复，扩容也在进行中。

图/MOSS

我们知道，自然语言处理是 AI 领域的最大挑战之一，虽然突破已经出现，但这个月上线的新必应搜索，以及谷歌发布的竞品 Bard 在测试中不时会出现问题，复旦大学的 MOSS 水平如何呢？

对话 MOSS，水平如何？

MOSS 的基础功能与 ChatGPT 类似，可以按照用户输入的指令完成各类自然语言处理任务，包括文本生成、文本摘要、翻译、代码生成、闲聊等等。在预览期间，MOSS 的使用是免费的。

图/MOSS

MOSS 和 ChatGPT 一样，构建的过程包括自然语言基础模型训练，以及理解人类意图的对话能力训练两个阶段。

图/MOSS 项目主页

据项目主页介绍，MOSS 和 ChatGPT 的主要区别在于：

MOSS 的参数数量比 ChatGPT 少得多。

MOSS 通过与人类和其他人工智能模型交谈来学习，而 ChatGPT 则通过人类反馈强化学习（RLHF）进行训练。

MOSS 将是开源的，以促进未来的研究，但 ChatGPT 可能不会。

MOSS 的对话水平如何，让我们看几个示例。以下是 MOSS 生成的一些交互记录：

图/MOSS

在这个例子中，用户首先要求 MOSS 推荐五部科幻电影，接着要求 MOSS 生成了一个表格来展示这些电影以及它们的导演，最后要求 MOSS 在表格中新插入一列来展示这些电影的上映年份。完成这一任务需要语言模型具备强大的多轮交互能力和指令理解能力，MOSS 显然在这两方面表现优异。

与 ChatGPT 类似，MOSS 有时也会输出一些事实性错误的例子，比如例子中《黑客帝国》的导演并不是 Thomas Neff，而是沃卓斯基兄弟（姐妹）。

除了多轮对话，MOSS 生成代码也不在话下。在下面的例子中，MOSS 不仅可以为用户提供实现快速排序的 Python 代码，还能在用户的要求下对这段代码提供解释和使用示例，可谓是手把手教学的程序员了。

图/MOSS

除了让 MOSS 帮忙写代码之外，还可以向 MOSS 询问有关代码细节的问题，让其更好地帮助理解代码。在下面的例子中，用户向 MOSS 询问了一段代码的编程语言和功能，并进一步提问了其中一个函数的作用，MOSS 均给出了满意的回复。

图/MOSS

此外，MOSS 还具备人类的价值观，当被要求回答不合理的问题时，MOSS 会拒绝回答并给出正确的劝导。

图/MOSS

据了解，MOSS 采用参数量为百亿级的自研模型进行训练。在对话能力训练阶段，OpenAI 收集了至少几十万条人类指令 —— 让各行各业的专业标注员写出指令回复，再将它们输入模型基座，以帮助 ChatGPT 逐步理解各种指令。复旦团队则采用不同的技术路线，通过让 MOSS 和人类以及其它 AI 模型都进行交互，显著提升了学习效率和研发效率，短时间内高效完成了对话能力训练。

研发团队表示，虽然 MOSS 已经实现了 ChatGPT 的一些功能，但仍然存在许多限制，由于缺乏高质量的数据、计算资源和模型容量，MOSS 仍然远远落后于 ChatGPT。

由于训练数据中的多语言语料库有限，MOSS 在理解和生成英语以外的语言的文本方面表现不佳。团队目前正在开发一个改进版本，以提高其中文语言技能。

由于模型容量相对较小，MOSS 不包含足够的世界知识。因此，MOSS 生成的一些响应可能包含误导性或虚假信息。

有时 MOSS 以迂回的方式执行，甚至未能遵循指示。在这种情况下，用户可能需要重新生成几次或修改 prompt，以获得令人满意的回复。团队正在积极提高其遵循指示的能力以及生产力。

有时 MOSS 可能会因 prompt 生成不道德或有害的反应。用户可通过单击 “不喜欢” 来帮助减少此类行为，团队将在下一个版本中更新模型。

研究团队指出，当前版本的 MOSS 表现仍不稳定，也受到数据集问题的影响：“MOSS 的英文回答水平比中文高，因为它的模型基座学习了 3000 多亿个英文单词，中文词语只学了约 300 亿个。“

发布之后，团队将持续通过提供 MOSS 的可访问界面，根据宝贵的用户反馈（在许可下）不断改进模型。

未来，研究人员还计划结合复旦在人工智能和相关交叉学科的研究成果，赋予 MOSS 绘图、语音、谱曲等多模态能力，并加强它辅助科学家进行高效科研的能力等。

期待 MOSS 能为国内对话大模型的发展开一个好头。

团队介绍

MOSS 的主要作者共有两位：复旦大学教授邱锡鹏和他的博士生孙天祥。此外还有多位成员对项目有所贡献。

邱锡鹏，复旦大学计算机科学技术学院教授，博士生导师。国家优青获得者，于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究，发表 CCF A/B 类论文 70 余篇，获得 ACL 2017 杰出论文奖（CCF A 类）、CCL 2019 最佳论文奖、《中国科学：技术科学》2021 年度高影响力论文奖，有 5 篇论文入选 PaperDigest 发布的 IJCAI/ACL/EMNLP 的最有影响力论文（被引用数进入前当届会议的 20 名）。

出版开源专著《神经网络与深度学习》，Github 关注数 1.5 万，豆瓣评分 9.4 分。主持开发了开源框架 FudanNLP 和 FastNLP，已被国内外数百家单位使用。2015 年入选首届中国科协青年人才托举工程项目，2018 年获钱伟长中文信息处理科学技术奖青年创新奖一等奖，2020 获第四届上海高校青年教师教学竞赛优等奖，2021 年获首届上海市计算机学会教学成果奖一等奖（第一完成人）等。培养学生多次获得一级学会优博、微软学者、百度奖学金等。

孙天祥，复旦大学计算机科学学院博士生，导师为邱锡鹏教授和黄萱菁教授。2019 年毕业于西安电子科技大学。研究兴趣集中于机器学习及其在自然语言处理中的应用，特别是预训练语言模型的高效微调及推理、多任务学习、知识表示学习等。以第一作者在 ICML， ACL， NAACL， AAAI， COLING 等会议发表多篇论文。

MOSS 体验链接：https://moss.fastnlp.top/

MOSS 项目主页：https://txsun1997.github.io/blogs/moss.html

本文来自微信公众号：机器之心（ID：almosthuman2014），编辑：泽南、蛋酱

推荐内容

我叫MOSS，中国版ChatGPT，源自《流浪地球》

“套娃式”收费被批，彩电厂商替视频平台“背锅”？

被网友挤崩了！复旦MOSS团队回应体验“非常不好”，解释名称源于《流浪地球》

合肥这场软件供应链安全盛会，透露了哪些重要信息？-世界要闻

地铁3号线二期、文一西路西延工程（二期），杭州43个重大项目集中开工！-世界要闻

2022年全球新能源车销售量约1065万辆 年增63.6%-世界要闻

选购移动电源的九条指南请收好-快看点

马斯克回应Meta推出付费认证服务：不可避免的

2022年中国移动互联网用户超12亿-焦点热讯

统计数据显示：国人买iPhone 14要花12%年薪-天天快讯

2022年Q4全球台式机和笔记本出货量下降29% 跌至6540万台-全球热头条

瑞银预计今年iPhone全球出货量下滑 增速四年来首度落后安卓-焦点热门

8.8万起，三年8折回购，传祺GS3·影速开启预售-环球速递

微软增强 Win11系统设置应用，添加VHD / VHDX支持、改进键盘设置-天天资讯

苹果将阻止用户免费装开测版iOS17

13代酷睿i5-1340P处理器性能怎么样？核显提高多少？-焦点观察

山东海湾大型设备吊装有限公司-信息

印刷显示产业化序幕即将开启-当前焦点

高分红高薪酬下，未来穿戴到底在“按摩”谁的大腿？-世界报道

电视尺寸和观看距离最佳标准是多少？液晶电视机排名前十名

立升净水器滤芯多久更换一次？立升净水器怎么更换滤芯？

语言栏不见了是怎么回事？语言栏怎么调回去？

用户反映苹果 HomePod 出故障：多个扬声器会同时响应 Siri 指令

离婚带什么东西去民政局-环球快资讯

怎么开通黄钻？黄钻颜色等级排序

脖子抽筋是什么原因引起的？脖子抽筋怎么快速缓解？

周期重启前夜，面板行业即将迎来反转？-当前播报

泡泡订阅一个月是多少钱？泡泡订阅多久可以多发字？

送股是什么意思？送股和转股有什么区别？

资产虚增是什么意思？资产虚增对企业的影响有哪些？

银行股破净可以买吗？银行股破净意味着什么？

三缄其口的近义词和反义词是什么？三缄其口的意思及造句有哪些？

姆巴佩现在在哪个俱乐部？姆巴佩的年薪是多少人民币？

化工企业是做什么的？化工企业安全生产管理制度模板

匿名举报信会被追查到本人吗？匿名举报信格式及范文

广东出实招促绿色智能家电消费 鼓励开发农村及老年人所需产品-环球关注

风波发酵以来 爱奇艺“试错”与“回头”-天天要闻

需求边际改善，家用电器行业回暖加速

家电直播今年走向理性：小家电之后大家电也在热卖-当前简讯

智能电视“不智能”？消费者吐槽操作太复杂

rotate的中文翻译是什么？rotate和revolve的区别是什么？

兄弟情义是什么意思？表达兄弟情义的句子有哪些？

乐此不疲的反义词是什么？乐此不疲造句有哪些？

6.99美元等于多少人民币？美元兑换人民币汇率

造梦西游3法宝五行有什么用？造梦西游3法宝五行最多几个？

魔兽世界火焰龟在哪抓？魔兽世界火焰龟刷新时间

泡泡是什么聊天软件？泡泡是真的和爱豆聊天吗？

地铁跑酷多久换一次地图？地铁跑酷怎么切换账号？

军旗是哪个国家发明的？军旗的走法以及规则大小顺序

QQ炫舞非卖品怎么获得？qq炫舞非卖品美瞳怎么换上？

“有图有真相”的时代要终结了，我们还能相信什么？-天天热闻

asap是什么意思？asap是什么英文的缩写？

IDC：2022年上半年中国边缘云市场增速50.8% 未来年复合增长40%以上

互联网巨头互拆围墙-环球微资讯

股价跌不停 裁员后亚马逊员工又面临“减薪”

魔兽世界ds是什么职业？魔兽世界DS是哪个副本？

红肿硬块痘痘属于什么类型？红肿痘痘怎么消除？

魔兽世界斯内维尔的账本在哪里？斯内维尔的账本怎么做？

dnf黑雾之源在哪里？dnf黑雾之源吞噬魔怎么打？

dota2怎么改成国服？dota2龙之血分别是哪些英雄？

暗黑2雇佣兵光环怎么获得？暗黑2雇佣兵光环怎么选？

爱奇艺副总裁徐勇明：如果元宇宙会颠覆在线视频 希望爱奇艺来做这件事-世界速讯

11款芭比烫造型 让你化身芭比女王_芭比烫发型图片新款-世界关注

外放张扬的设计，这里的手机有没有你的“菜”？-每日消息

可折叠iPhone？苹果新专利：更复杂的铰链设计

不简单！开售一周后的一加 Ace 2：热销双榜榜上有名-全球今日报

便携轻量化、兼具画质与对焦、超长焦随包镜头-尼克尔 Z 400mm f/4.5 VR S评测-全球看热讯

最后的好价！惠普VICTUS光影精灵8火热促销中-世界看热讯

《夏花》像超长擦边MV？导演回应言承旭演技台词太肉麻-天天快报

谁在用ChatGPT贬低我们的工作？-观热点

奋进的春天 | “老区思维”变“湾区思维”-当前简讯

一家有机农场的种子保育之路

秦刚将访问印度尼西亚

X-META元宇宙主题乐园与爱奇艺共创元宇宙文娱-热点聚焦

苹果研发最新铰链专利 折叠iPhone指日可待-世界热议

食物、能源、水：人类如何更可持续地生存？-焦点热议

OKX 2月储备证明显示其持有86亿美元资产，呈持续净流入状态-天天头条

韩国预将提前两年夺取主导权 2028年就将推出6G网络服务-天天热闻

封杀这个公式，ChatGPT智商将为零-每日资讯

2022年全球新能源车销售量约1065万辆年增63.6%-世界要闻

瑞银预计今年iPhone全球出货量下滑增速四年来首度落后安卓-焦点热门

广东出实招促绿色智能家电消费鼓励开发农村及老年人所需产品-环球关注

风波发酵以来爱奇艺“试错”与“回头”-天天要闻

股价跌不停裁员后亚马逊员工又面临“减薪”

爱奇艺副总裁徐勇明：如果元宇宙会颠覆在线视频希望爱奇艺来做这件事-世界速讯

11款芭比烫造型让你化身芭比女王_芭比烫发型图片新款-世界关注

苹果研发最新铰链专利折叠iPhone指日可待-世界热议

因侵害商标权、不正当竞争百度被判赔偿抖音10万元

努比亚Z50 Ultra或3月份发布将使用屏下摄像头技术

站位科技之城叠造空天之城—— 2023首届中国科技城北川通航（无人机）产业峰会举行

极致体验继续稳坐机皇位置三星S23 Ultra评测-世界快播报

张兰受邀参观格力与董明珠见面冲上热搜

巨人网络确认接入百度文心一言继续加大游戏+AI布局-今日热文

OPPO Reno 10系列设计图疑似曝光或配备潜望式镜头-全球资讯