本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,题图来自:《终结者2:审判日》
(资料图片仅供参考)
ChatGPT出世,“谷歌要完蛋”了?
这是不久前前,ChatGPT刚刚推出测试时,未尽研究发布一篇文章的标题。
我们向谷歌提出了一个问题:“人们一旦可以使用ChatGPT与自己互动,不仅答疑解惑,还能产出内容,更能听从指令完成任务,谁还需要挂满广告的搜索引擎呢?”
现在,微软开始下手了。
微软的搜索引擎必应(Bing),可能最快到3月份就会采纳 ChatGPT 的功能,只要搜索查询,就会进行无缝的问答互动、生成内容,而不仅仅是显示链接列表。微软希望用 ChatGPT 来颠覆其强大的搜索竞争对手谷歌。截至 2022 年 12 月,谷歌占据了92.21% 的市场份额,而必应只有 3.42% 左右。
凑巧的是,万众期待的语言训练大模型GPT-4,也将于春季发布,届时可能出现GPT-4+ChatGPT+Bing 的组合。2023年聊天机器人大战,比人们预计的提早到来。
ChatGPT 测试版仅仅推出来一个多月,已经火遍网络世界,成为新年前后社交媒体上最热闹的话题之一。因为其对话水平已经相当接近人类,被普遍看好为下一代的搜索引擎,或者干脆是谷歌的颠覆者。
OpenAI 是 ChatGPT 的开发者,而 OpenAI 的早期投资者是伊隆·马斯克和山姆·奥特曼(Sam Altman)等,后来马斯克退出,2019 年微软加入,投资 OpenAI 达 10 亿美元,并且有意再加码下注。
微软意在支持 OpenAI 构建通用人工智能。两者随后合作构建新的 Azure AI 超级计算技术。2022 年,微软将 OpenAI 的图像生成软件 DALL∙E 2 结合到 Azure AI 中,使用户能够通过文本输入生成图像。
谷歌已经拉响红色警报,可能将于5月份的I/O开发者大会上发布一款产品原型来应对。
但是,无论是谷歌还是必应,都不会轻易用聊天机器人替代搜索。
必应仍将依靠自己的技术来产生大部分搜索结果,因为 ChatGPT 并不像搜索引擎那样持续抓取网络数据并提供实时信息。同时,必应需要确保结果的准确性。在 ChatGPT 的测试演示中,回答谬误、事实差错、臆想答案的比例仍然相当高。也许 ChatGPT 为搜索提供了一种附加功能,但微软仍在权衡聊天机器人的准确性以及将其纳入搜索引擎的节奏。最初的版本可能是对一小部分用户的有限测试。
OpenAI 首席执行官奥特曼希望用户像对待一位会犯错误的人一样对待 ChatGPT, “在任何重要的事情上都依赖它是错误的。”
对于谷歌来说,模型的“胡编乱造”也是一大挑战。谷歌在加紧迭代其语言模型构建的聊天系统LaMDA,就是去年 6 月甚至闹出了笑话的那个计算系统,有位员工公开声称这个爱学习的机器人,已经具备人类的意识与灵魂。谷歌也担心 AIGC(AI生成内容)产生的失误会带来声誉风险。
AIGC 的江湖正在形成,基本格局是 DeeMind 帮 vs. OpenAI 帮。
这一轮AIGC的竞争,背后主要是巨头微软和谷歌,而在大模型算法上不断取得突破的,正是DeepMind 和OpenAI 。当年AlphaGo 的成功,开创了深度学习的大模型时代,其自然语言处理模型 BERT 推出时引发轰动,并于 2019 年用于谷歌搜索。而 OpenAI 则在自然语言处理领域持续深耕,推出的 GPT-3 将大模型带入千亿参数时代,并且从语言进入图画领域,推出模型 Dall-E 和 Dall-E2。
OpenAI 专注于大模型产生的知识和内容,据报道 OpenAI 的估值已经达到 200 亿美元,2023 年和 2024 年的收入会分别达到 2 亿美元和 10 亿美元。
而谷歌的模型可以用于其搜索业务;一个最重要的应用是帮助编程,AlphaCode 已经能够在竞争性编码挑战中击败 54% 的人类,使其与许多初级开发人员不相上下。DeepMind 更关注用大模型去求解科学难题,如用自然语言模型去分析蛋白质内 DNA 和 RNA 的“语法”结构。DeepMind 甚至去研究核聚变。
目前在AIGC、AGI(通用人工智能)等领域的主要创业者,许多来自 DeepMind、谷歌或者 OpenAI,而拥有强大计算能力的科技巨头,也与 AIGC 中的基础设施公司建立合作关系。
谷歌首席执行官皮查伊(Sundar Pichai)已经重组谷歌研究、信任和安全以及其他部门的团队,以帮助开发 AI 原型和产品,包括文字生成艺术品的产品。
大概在 5 月份的 I/O 开发者大会上 ,谷歌可能会发布新产品原型,但会把用户限制在 50 万人,新业务中也可能会包括将现有的 LaMDA 聊天技术作为云产品提供给第三方。
目前谷歌手中有三张牌,一个是 2021 年发布的 LaMDA,目前已经推出的 LaMDA2。第二个是 MUM,能帮助用户进行多模态查询,如提供文字、图片、地图等的多维回答。第三个是 PaLM( Pathways Language Model),它可以用来答疑解惑。这些AI对话功能主要用于增强 Google Assistant、Search和 Workspace 这几大产品。
人与信息的关系,似乎正在迅速进入一个后 ChatGPT 的世界,谷歌基于广告的商业模式面临着的威胁,用户如果直接得到答案就不再需要点击链接。但实际情况却并不那么简单,如前所述,直接提供答案并不能完全满足用户的要求,也不能令用户对结果的真实性和正确性完全放心,链接到提供相关来源,由用户获取第一手的信息,仍然是基本需求。
谷歌的使命是“整合全球信息,使人人皆可访问并从中受益”,最终实现这一使命,就需要搜索像人类一样回答问题。谷歌拥有实现这一目标的技术,但其真正的挑战是将研发转移到实际产品中。
本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究