内容来自MoPaaS
ChatGPT产生的影响还在继续,ChatGPT 以及其创造者 OpenAI 背后的故事却鲜为人知。OpenAI 是怎样偏离其初心坚持商业化?凭什么 Altman可以让微软早期押注他们? OpenAI原来的安全团队为什么分家与他们分庭抗争?ChatGPT的编程能力是怎样被发现的?ChatGPT 为什么差点被扼杀掉?ChatGPT是怎样歪打正着成为爆款?Altman 为什么时而理想主义狂热时而又回到反乌托邦?OpenAI 今年还可能会有哪些惊喜?...“The inside story of ChatGPT”(“ChatGPT 的内幕故事”)将为你解密这一切。该文由《财富》杂志资深作者JEREMY KAHN采访研究完成,并将以标题“ChatGPT creates an A.I. frenzy”(“ChatGPT创造了AI狂潮”)在美国《财富》杂志2023年2月/3月号上发表。我们特编译出来和各位客户、合作伙伴朋友分享。
Sam Altman, CEO and cofounder of OpenAI.
在一代人的时间中总有一种产品的出现,它将从工程系昏暗的地下室、书呆子们臭气熏天的青少年卧室和爱好者们孤独的洞穴中弹射出来,变成了你的祖母Edna都知道如何使用的东西。早在 1990 年就有网络浏览器,但直到 1994 年Netscape Navigator的出现,大多数人才发现了互联网。2001 年 iPod 问世之前就已经有了 MP3 播放器,但它们并没有引发数字音乐革命。在2007 年苹果推出iPhone之前,也有智能手机,但在 iPhone 之前,没有智能手机的应用程序。2022 年 11 月 30 日,人工智能迎来了 Netscape Navigator 时刻。这一时刻是由OpenAI 的首席执行官Sam Altman 开启的,OpenAI 是一家总部位于旧金山的人工智能公司,成立于 2015 年,得到了包括Elon Musk 、Peter Thiel 和PayPal校友、LinkedIn联合创始人Reid Hoffman 等多位硅谷重量级人物的资金支持。11 月 30 日,也是公司成立大约七年后,Altman 在推特上写道:“今天我们推出了 ChatGPT,尝试在这里与它交谈”,然后是一个链接,任何人都可以注册一个帐户,开始免费与 OpenAI 的新聊天机器人交谈。任何人都可以,而且不仅仅只是聊聊天气。软件 CEO 兼工程师 Amjad Masad 要求它调试他的代码,它做到了。美食博主兼网红Gina Homolka用它写了一份健康巧克力曲奇的食谱。Scale AI 的工程师 Riley Goodside 要求它为Seinfeld剧集编写剧本。Guy Parsons 是一名营销人员,他还经营着一家致力于 AI 艺术的在线画廊,他让它为他编写提示,以输入另一个 AI 系统Midjourney, 从文本描述创建图像。斯坦福大学医学院的皮肤科医生 Roxana Daneshjou也研究 AI 在医学上的应用,她向它提出了医学问题,许多学生用它来做作业。而这还只是在聊天机器人发布后的 24 小时内出现的。以前也出现过聊天机器人,但都不是这样的。ChatGPT 可以进行长时间、流畅的对话,回答问题,并撰写人们要求的几乎任何类型的书面材料,包括商业计划、广告活动、诗歌、笑话、计算机代码和电影剧本。它远非完美:结果并不总是准确的;它不能引用其信息来源;它几乎不知道 2021 年之后发生的任何事情。它所提供的内容虽然通常流畅到足以通过高中课程甚至大学课程的考试,却很少像人类专家那样完美。另一方面,ChatGPT 会在一秒内生成这些内容,用户几乎没有等待,而且它吐出的很多内容都还不错。在ChatGPT发布后的五天内,就有超过100万的玩家,这是Facebook花了 10 个月才达到的里程碑。在过去的十年中,人工智能技术稳步进入商业领域,并悄悄改进了我们每天使用的许多软件,但并未引起非技术人员的太大兴趣。ChatGPT 改变了这一点。突然之间,每个人都在谈论人工智能如何颠覆他们的工作、公司、学校和生活。ChatGPT 是相关人工智能技术浪潮的一部分,这些技术统称为“生成式人工智能”——其中还包括热门的艺术生成器,如 Midjourney 和 Lensa。OpenAI处于科技行业下一件大事件的最前沿,具有初创公司史诗般的标志,包括全明星阵容和狂热的投资者,据报道,该公司的估值达到 290 亿美元。但是,尽管其最近的激增引发了嫉妒、惊奇和恐惧——据报道,其利润丰厚的搜索帝国可能会受到攻击,谷歌宣布了内部“红色代码”,以回应 ChatGPT—OpenAI 不太可能成为技术超级大国俱乐部的成员。直到几年前,它还根本不是一家公司,而是一家致力于学术研究的小型非营利性实验室。崇高的创始原则仍然存在,例如保护人类免受不受限制的人工智能的威胁。与此同时,OpenAI 也经历了内部转型,将其原来的员工分开,并更加关注商业项目而不是纯科学项目上。(一些批评家认为,将 ChatGPT 推向市场本身就很危险,这也标志着 OpenAI 的方法发生了深刻的转变。)
“我认为 [对于 AI] 的好案例是如此令人难以置信的好,以至于你谈论它听起来像个疯子。我认为最坏的情况是我们所有人都熄灯了。”★OPENAI联合创始人兼首席执行官 SAM ALTMAN 于 1 月 12 日在旧金山举行的以风险投资为重点的活动上发表讲话本周,微软宣布扩大与OpenAI的合作伙伴关系,其中包括高达 100 亿美元的新资本,这可能会使这家软件巨头在未来几年占据 OpenAI 利润的最大份额。这笔交易可能会加深人们的看法,即曾经理想主义的努力现在主要关心的是赚钱。尽管如此,《财富》杂志看到的文件显示,OpenAI 的业务目前是多么无利可图。37 岁的联合创始人兼首席执行官Altman体现了 OpenAI 令人费解的本质。Altman 是一位连续创业的科技企业家,他更以商业头脑而非工程壮举而闻名,他既是 OpenAI估值飙升的设计师,也是该公司的首席执行官,他曾公开表示 ChatGPT 离真正可靠还有多远。与此同时,他认为这项技术是朝着开发一种被称为人工通用智能(AGI)的计算机超级智能的宏大而不切实际的企业使命向前迈出的一步。“AGI 可能是人类生存所必需的,” Altman在 7 月份发推文说。“如果没有更好的工具,我们的问题似乎太大,我们无法解决。”对于一家赚钱的企业来说,这是一种不同寻常的指导理念,尤其是考虑到一些计算机科学家认为Altman的痴迷只是一种幻想。“AGI 很愚蠢,”加州大学伯克利分校的计算机科学家 Ben Recht 说。“我的意思是,这不是一回事。”然而,借助 ChatGPT,Altman 已将 OpenAI 以及更广泛的 AI 使命转变为吸引科技界的东西。问题在于,他与微软建立的合作伙伴关系是否可以修复 ChatGPT 的缺陷并利用其早期领先优势来改变科技行业。谷歌和其他巨头正在努力开发自己的人工智能平台;未来,更完善的软件会让 ChatGPT 看起来像小孩子在玩游戏。OpenAI 可能有一天会发现,就像 Netscape 短暂的浏览器统治一样,它的突破打开了一扇通往未来的门,而这扇门并不属于它。
1 月中旬的一个星期四晚上,Altman罕见地在旧金山公开露面。这位 CEO 穿着灰色毛衣、蓝色牛仔裤和一双颜色鲜艳的时髦扎染运动鞋,走进了一个满是投资者、技术人员和记者的房间,他们聚集在一起收集关于 ChatGPT 或即将到来的融资轮的任何信息。当Altman的采访者、专注于风险投资的媒体公司 StrictlyVC 的创始人 Connie Loizos 向他询问媒体的狂热时,Altman回答说:“我不看新闻,我也不太会做这样的事情”。
该活动在Salesforce 大楼的 46 层举行,现场只有站立的空间。在接受采访前举行的金融科技小组讨论会上,一位发言人甚至告诉听众,她知道他们“都在等 Sam Altman”。但是,尽管议论纷纷,并且流传着微软投资的谣言,但Altman似乎还是刻意打消了人们的这种兴奋。“这些技术的一个奇怪之处在于,它们令人印象深刻但并不稳健,”他告诉人群。“所以你在第一个演示中使用它们;你会有种令人印象深刻的反应,“哇,这太不可思议了,准备好了”。但你看到它一百次,你就会看到它的弱点。”这种谨慎似乎是 OpenAI 总部的官方模式,该总部位于旧金山 Mission 区的一家旧箱包工厂。事实上,如果 ChatGPT 是 AI 的 Netscape Navigator 时刻,那它几乎从未发生过,因为 OpenAI 几个月前几乎扼杀了这个项目。允许用户用简单的英语(和许多其他语言)与 AI 交谈的聊天界面最初是由 OpenAI 构想的,作为改进其“大型语言模型” LLM 的一种方式。大多数生成式人工智能系统的核心都是LLM。它们是通过采用非常庞大的神经网络(一种基于人脑连接的人工智能)并将它们应用于大量人类创建的文本而创建的。从这个库中,该模型学习了一个复杂的映射,即在任何给定上下文中,任何一组单词将会出现在另一个单词旁边。这使得 LLM 能够执行大量的自然语言处理任务,从翻译到摘要再到写作。OpenAI 已经创建了世界上最强大的LLM 之一。它被称为 GPT-3,拥有超过 1750 亿个参数,并在大约三分之二的互联网、所有维基百科和两个大型书籍数据集上接受训练。但是 OpenAI 发现让 GPT-3 产出用户想要的东西可能很棘手。一个团队有使用强化学习的想法,人工智能系统通过反复试验来学习以最大化奖励,来完善模型。该团队认为聊天机器人可能是这种方法的理想候选者,因为以人类对话的形式不断提供反馈将使人工智能软件很容易知道它何时做得很好以及需要改进的地方。因此,在 2022 年初,该团队开始构建 ChatGPT。当ChatGPT准备就绪后,OpenAI 让 Beta 测试人员使用ChatGPT。但根据 OpenAI 联合创始人兼现任总裁Greg Brockman 的说法,他们并没有像 OpenAI 希望的那样接受它;人们不清楚他们应该与聊天机器人谈论什么。有一段时间,OpenAI 改变了策略,试图构建专家聊天机器人,以帮助特定领域专业人士。但这项努力也遇到了问题,部分原因是 OpenAI 缺乏训练专家机器人的正确数据。Brockman说,几乎就像孤注一掷一样,OpenAI 决定将 ChatGPT 从板凳上拉下来,并将其放在野外供公众使用。“我承认,我不知道这是否会奏效,” Brockman说。聊天机器人的迅速传播让OpenAI 猝不及防,OpenAI 的首席技术官 Mira Murati 说,“这绝对令人惊讶,”。在旧金山 VC 活动上Altman 说,他“本以为一切都会少一个数量级,少一个数量级的炒作。”OpenAI 首席技术官 Mira Murati 于 2022 年 10 月 25 日在“The Daily Show with Trevor Noah”上发表讲话。ChatGPT 不是 OpenAI 唯一的炒作工具,该公司只有 300 名左右的员工,规模相对较小,但在创建数据(而不仅仅是分析数据)方面,已经突破了人工智能的极限。DALL-E 2 是 OpenAI 的另一项创作,它允许用户通过输入几个词来创建他们可以想象的任何事物的逼真图像。该系统现在已被其他公司模仿,包括 Midjourney 和一个名为Stability AI的开源竞争对手. (所有这些图像生成器都有缺点,最显着的是它们倾向于放大训练数据的偏差,生成可能具有种族主义和性别歧视的图像。)通过在计算机代码上微调其 GPT LLM,OpenAI 还创建了Codex ,一个可以为程序员编写代码的系统,程序员只需用简单的语言指定他们想要代码做什么。更多的创新在等待,OpenAI在 beta 测试中有一个更强大的 LLM,称为 GPT-4,预计将在今年发布,甚至可能很快发布。Altman 还表示,该公司正在开发一种可以根据文本描述生成视频的系统。与此同时,在 1 月中旬,OpenAI 表示打算发布ChatGPT 的商业版本,并宣布了一个等待名单,供潜在客户通过一个界面注册付费访问该机器人,从而使他们能够更轻松地集成它到他们自己的产品和服务中。
愤世嫉俗的人可能会认为,OpenAI正在筹集大量风险投资这一事实可能与 ChatGPT 的发布时间有关。(OpenAI 说这个时间是巧合。)可以肯定的是,ChatGPT 在充满鲨鱼的水域中游弋。这在风险投资公司中掀起了一股抢购狂潮,他们希望在 OpenAI 高管、员工和创始人持有的私募股权中抢购股票。
该收购报价与微软刚刚宣布的新投资一起发生,这将为该公司注入高达 100 亿美元的新资本。微软于 2016 年开始与 OpenAI 合作,并与这家初创公司建立了战略合作伙伴关系,于三年前宣布向该公司投资10 亿美元。据熟悉新收购报价的消息人士称,尽管这种不寻常的结构为微软带来了巨大的财务优势,它已被大量超额认购。根据《财富》杂志看到的文件显示,在新投资完成后,在OpenAI 的第一批投资者收回初始资本后,微软将有权获得 OpenAI 75% 的利润,直到它收回其投资的 130 亿美元,这一数字包括之前对 OpenAI 的 20 亿美元投资,该投资直到今年1月《财富》杂志才披露。直到这家软件巨头赚取 920 亿美元的利润后,微软的份额将降至 49%。与此同时,其他风险投资者和 OpenAI 的员工也将有权获得 OpenAI 49% 的利润,直到他们赚取约 1500 亿美元。如果达到这些上限,微软和投资者的股份将归还给 OpenAI 的非营利基金会。本质上,OpenAI 是在把公司借给微软,借多久取决于 OpenAI 赚钱的速度。但要收回投资可能需要相当长的时间,更不用说达到这些上限。《财富》杂志看到的文件显示,OpenAI迄今为止的收入相对较少,而且亏损严重。文件显示,去年该公司预计将带来近 3000 万美元的收入。但该公司预计计算和数据费用支出为 4.1645 亿美元,员工费用为 8931 万美元,其他未指明的运营费用为 3875 万美元。不包括员工股票期权在内,其 2022 年的净亏损总额预计为 5.445 亿美元。而对于 ChatGPT,这些损失可能会飙升:Altman 在推特上说,在回答 Elon Musk 的问题时表示,OpenAI 在用户与 ChatGPT 的每次交互中花费的计算成本为“个位数美分”,随着ChatGPT变得流行,每月的计算成本可能达到数百万美元。OpenAI 预计,随着 ChatGPT 成为吸引诱客户的警笛,其收入将迅速增加。文件显示,该公司预计2023年的收入将达到 2 亿美元,并预计到 2024 年收入将超过 10 亿美元。他们没有预测 OpenAI 的开支会如何增长以及何时可以盈利。这些公司拒绝对这些数字发表评论,但他们指出了一个明显的现实:OpenAI 和微软都认为,这家曾经的非营利性实验室现在拥有可以出售的东西。
★《财富》杂志获得的文件显示,ChatGPT 2024 年的预期收入高于 2023 年的 2 亿美元和 2022 年的 3000万美元。
微软已经从合作伙伴关系中获益。它已经在其 Azure 云中推出了一套 OpenAI 品牌的工具和服务,允许 Azure 客户访问 OpenAI 的技术,包括 GPT 和 DALL-E 工具。例如,汽车市场CarMax已经推出了运行在这些 Azure 工具上运行的新服务。
微软 AI 平台公司副总裁 Eric Boyd 表示,满足培训和运行 OpenAI 的 LLM 的需求推动了创新,使所有 Azure 客户受益。例如,微软已经为人工智能构建了它认为是世界上最强大的超级计算集群,并创造了多项软件创新,以便更容易的在这些机器上训练和运行大型人工智能模型。微软正逐渐将 OpenAI 的技术融入其大部分软件中。它已经在其搜索引擎 Bing 中发布了一个图像生成器、以及一个新的 Designer 图形设计工具,两者均由 DALL-E 提供支持;其 Power Apps 软件中支持 GPT-3 的工具,以及基于 OpenAI 的 Codex 模型的代码建议工具 GitHub Copilot。Morningstar高级股票研究分析师Dan Romanoff 表示,即使OpenAI与Azure的合作不会立即对 Azure 的收入产生影响,但它是一种很好的品牌定位和营销。“这是高调的,”他说。“能够将 OpenAI 开发的 AI 解决方案放在 Azure 上,称之为 Azure AI :这让他们保持竞争力。”微软的云计算竞争对手,谷歌、AWS、IBM、甲骨文、Salesforce 和其他公司,都有自己的“认知”服务,但与创建 ChatGPT 的人联系在一起也无妨。对微软来说,更大的收获可能在于搜索业务。科技出版物 The Information 最近报道,微软计划将 ChatGPT 集成到 Bing 中,可能允许它返回简单、简洁的查询答案,并让人们通过与该聊天机器人的对话而不是链接列表来更深入地研究。谷歌目前在搜索市场占据主导地位,全球市场份额超过 90%。Bing 排在第二位,所占份额约为 3%。2022 年前九个月,谷歌的搜索收入为 1200 亿美元;总的来说,它约占谷歌收入的 60%左右。ChatGPT 可能为微软提供了唯一一次真正的机会,它必须将谷歌从神坛上推下来。(微软拒绝对 The Information 的报道发表评论。)并且按照微软的标准,这些好处是很便宜的。其 130 亿美元的总投资是一笔巨款,但仅占其过去 12 个月 850 亿美元税前利润的 15%,对于近期控制一项颠覆范式的技术而言,这是一笔相对便宜的投资。就 OpenAI 和 Altman 而言,他们可能会付出不同的代价:微软的优先级可能会挤占他们自己的优先级,使他们更广泛的使命面临风险,并疏远推动其成功的科学家。2015 年 7 月的一个晚上,时任著名创业孵化器 Y Combinator 负责人的Altman在 Rosewood Sand Hill 举办了一场私人晚宴,这是一家豪华的牧场风格酒店,位于门洛帕克硅谷风险投资行业的中心, Elon Musk也在现场,布罗克曼也是如此,当时 26 岁的他从麻省理工学院(MIT)辍学,曾担任支付处理初创公司Stripe的首席技术官。一些与会者是经验丰富的人工智能研究人员。有些人几乎不懂机器学习,但他们都相信 AGI 是可行的。谷歌刚刚收购了一家总部位于伦敦的神经网络初创公司DeepMind,在Altman、Elon Musk和其他科技业内部人士看来,这是首家最有可能率先开发 AGI 的公司:如果 DeepMind 成功了,谷歌可能会垄断这项无所不能的技术。Rosewood 晚宴的目的是讨论组建一个竞争实验室,以确保这种情况不会发生。新实验室旨在成为DeepMind 和谷歌无法做到的一切。它将作为一个非营利组织运营,明确致力于使先进人工智能的好处民主化。它承诺发布其研究成果,并开源其所有技术,其对透明度的承诺体现在其名称中:OpenAI。该实验室获得了一份令人印象深刻的捐助者名册:不仅是Elon Musk,还有他在 PayPal 的同事蒂尔和霍夫曼;Altman和布罗克曼;Y Combinator 联合创始人 Jessica Livingston;YC Research,Altman创立的基金会;印度 IT 外包公司 Infosys;和亚马逊网页服务。创始捐助者共同承诺向这个理想主义的新企业捐助 10 亿美元(尽管根据税务记录,该非营利组织只收到了引人注目的承诺的一小部分)。但训练巨型神经网络很快就被证明是昂贵的,计算成本高达数千万美元。人工智能研究人员的薪水也不便宜,税务记录显示,Ilya Sutskever 是一位出生于俄罗斯的科学家,在谷歌工作后来到 OpenAI成为其首席科学家,据称,他在实验室的头几年,年薪为 190 万美元。几年后,Altman和 OpenAI 的其他人得出结论,为了与谷歌、Meta 和其他科技巨头竞争,实验室不能继续作为非营利组织。Altman在 2019 年对《连线》杂志表示:“我们要成功完成任务所需的资金比我最初想象的要多得多。”OpenAI成立了一个以盈利为目的的分支机构,从而筹集到了风险资本。但 OpenAI 创造了一种不同寻常的结构,将投资者的回报限制在其初始投资的数倍。OpenAI的非营利性董事会由硅谷一线明星组成,将保留对 OpenAI 知识产权的控制权(见边栏)。一位没有留下来的一线明星是Elon Musk:2018 年,他离开了董事会,理由是运营SpaceX和更重要的特斯拉。大约在这个时候,微软首席执行官Satya Nadella急切地想证明,他的公司被认为在人工智能领域落后于其竞争对手,能够在技术的最前沿发挥作用。该公司曾尝试聘请一位知名的 AI 科学家,但未能成功。它还在构建一个庞大、昂贵的专用芯片集群,以推进自己在语言模型方面的努力。这正是 OpenAI 需要的那种超级计算能力,而且它当时花费了大笔钱来购买。就OpenAI本身而言,它擅长完成Nadella希望展示微软 AI 智慧的那种引人注目的 AI 演示。Altman 与Nadella 进行了交易,多次飞往西雅图向他展示 OpenAI 的 AI 模型。Nadella最终签署了一项协议,于 2019 年 7 月宣布,使Microsoft OpenAI 成为其技术商业化的“首选合作伙伴”,并向这家人工智能初创公司最初投资10亿美元。Sam Altman 与微软 CEO Satya Nadella 在微软华盛顿州雷德蒙德园区。
虽然Altman从一开始就参与了 OpenAI,但他直到 2019 年5 月才成为 CEO,那是在 OpenAI 转变为营利性企业后不久。但它从研究实验室到价值数十亿美元的现象的轨迹反映了Altman独特的筹款能力和以产品为导向的重点,以及这些商业本能和他对科学驱动的大想法的承诺之间的紧张关系。在某种程度上,这位OpenAI的领导者是硅谷的一幅漫画:年轻、男性、苍白;坚定不移;精通Geek;痴迷于最大化效率和生产力;一个致力于“改变世界”的工作狂。(在2016年的纽约客简介中,他说他没有阿斯伯格综合症,但可以理解为什么有人会认为他有。)Altman 从斯坦福大学的计算机科学学位课程中退学,与他人共同创立了 Loopt,这是一家社交媒体公司,其应用程序可以告诉您朋友在哪里。2005年该公司进入Y Combinator的首批创业公司;Loopt 未能起飞,但 Altman 在出售时赚到的钱帮助他进入了风险投资领域。他创办了自己的小型风险投资公司Hydrazine Capital,筹集了约 2100 万美元,其中包括来自蒂尔的资金。然后,Y Combinator 的联合创始人保罗·格雷厄姆 (Paul Graham) 和利文斯顿 (Livingston) 聘请他作为格雷厄姆的继任者来管理 YC。Altman是一位企业家,而不是科学家或人工智能研究人员,他以异常擅长筹集风险投资资金而闻名。他深信伟大的事业来自雄心壮志和坚定不移的自信,他曾表示,他渴望通过所谓的深度科技领域创造数万亿美元的经济价值,比如核聚变和量子计算,这些领域的可能性很小,但潜在回报可能很大。“Sam 相信他在他所承担的一切方面都是最棒的,”曾在 Loopt 与 Altman 共事的资深技术投资者和创业顾问Mark Jacobstein 表示,“我很确定,他相信自己是办公室里最好的乒乓球运动员,直到他被证明是错误的。”根据几位现任和前任OpenAI 内部人士的说法,随着 Altman 上任,这家初创公司的优先事项开始发生变化。曾经广泛的研究议程缩小到主要关注自然语言处理。Sutskever 和 Altman 为这种转变辩护说,认为这是在目前看来为 AGI 提供最有前途的道路的研究领域上最大限度地发挥作用。但一些前员工表示,在微软进行初始投资后,专注于 LLM 的内部压力大幅增加,部分原因是这些模型具有直接的商业应用。一些人抱怨说,OpenAI 的成立是为了不受公司影响,但它很快成为一家大型科技公司的工具。一位前员工说:“重点更多的是,我们如何创造产品,而不是试图回答最有趣的问题,”。与许多接受采访的人一样,该员工出于保密协议要求匿名,并避免疏远与 OpenAI 相关的权势人物。OpenAI 也变得不那么开放了。由于担心其技术可能被滥用,它已经开始放弃发布所有研究成果和开源代码的承诺。但据前员工称,商业逻辑也发挥了作用。OpenAI的高级模型只能通过 API 提供,从而保护了其知识产权和收入来源。“Altman和Brockman 对‘AI安全’口头上说了很多,但这通常看起来只是商业问题的遮羞布,而实际的、合法的 AI 安全问题却被置之不理,” 这位前雇员举例说,OpenAI在Midjourney和Stability AI推出竞争产品后,由于担心滥用,迅速撤销了限制访问DALL-E 2的决定。(OpenAI 表示,在经过仔细的 Beta 测试后,它才允许更广泛地使用 DALL-E 2,因为它对自己的安全系统有信心。)据一些前员工透露,这些战略和文化的转变,在十几名OpenAI研究人员和其他员工(其中许多人从事人工智能安全工作)于2021年与公司决裂,成立自己的研究实验室Anthropic的决定中发挥了作用。OpenAI 表示,与其他人工智能实验室相比,它继续发表更多的研究成果,它捍卫其向产品重点的转变。首席技术官 Murati 说:“你不能只呆在实验室里就可以构建 AGI。”她说,运输产品是发现人们想要如何使用和滥用技术的唯一途径。她说,OpenAI 并不知道 GPT-3 最流行的应用程序之一是编写软件代码,直到他们看到人们用它编写代码。同样,OpenAI 最担心的是人们会使用 GPT-3 来制造政治虚假信息。但事实证明,这种担心是没有根据的;相反,她说,最普遍的恶意使用是人们制造广告垃圾邮件。最后,Murati 表示,OpenAI 希望将其技术推向世界,以“最大限度地减少真正强大的技术对社会的冲击。”她认为,如果不让人们知道未来可能会发生什么,先进人工智能对社会的破坏将会更严重。Sutskever 承认 OpenAI 与微软的关系创造了一种新的“期望,即我们确实需要用我们的技术制造出某种有用的产品”,但他坚称 OpenAI 文化的核心没有改变。他说,访问 Microsoft 数据中心对 OpenAI 的进步至关重要。布罗克曼还辩称,这种合作关系让 OpenAI 能够产生收入,同时保持商业上的关注度低于它本来必须的。“雇用数千名销售人员实际上可能会改变这家公司的现状,而拥有一个已经这样做过的合作伙伴实际上是非常了不起的,”他说。Sutskever 断然否认 OpenAI 不再强调安全性的暗示:“我会说恰恰相反。”在Anthropic 分裂之前,AI的安全“局限于一个团队”,但现在是每个团队的责任,Sutskever 说。“安全标准不断提高,我们正在进行的安全工作量不断增加。”
★ILYA SUTSKEVER,研究员,OPENAI
然而,批评者说,OpenAI 以产品为导向的高级人工智能方法是不负责任的,相当于给人们上了膛的枪,理由是这是确定他们是否真的会互相射击的最佳方式。纽约大学认知科学名誉教授Gary Marcus对以深度学习为中心的 AI 方法持怀疑态度,他认为生成式 AI 对“社会结构构成了真实而迫在眉睫的威胁”。他说,通过将制造虚假信息的成本降低到几乎为零,像 GPT-3 和 ChatGPT 这样的系统可能会引发一波虚假信息的浪潮。Marcus说我们甚至已经看到了第一批受害者。Stack Overflow 是一个程序员提出和回答编程问题的网站,它已经不得不禁止用户提交由 ChatGPT 编写的答案,因为该网站被看似合理但错误的答案淹没了。与此同时,科技新闻网站 CNET 开始使用 ChatGPT 生成新闻文章,但后来发现许多文章由于事实不准确而不得不更正。对于其他人来说,ChatGPT编写准确的代码才是真正的风险。网络安全公司 Check Point 的研究副总裁 Maya Horowitz 表示,她的团队能够让 ChatGPT 编写网络攻击的每个阶段,从编写令人信服的网络钓鱼电子邮件到编写恶意代码再到规避常见的网络安全检查。ChatGPT 基本上可以让零编码技能的人成为网络罪犯,她警告说:“我担心会出现越来越多的攻击。”OpenAI 的 Murati 表示,该公司也有同样的担忧,并且正在研究“调整”其 AI 模型的方法,这样它们就不会编写恶意软件——但这并不是一件容易的事情。无数评论家和教育工作者谴责学生可以轻松地使用 ChatGPT 作弊。纽约市、巴尔的摩和洛杉矶的学区都阻止了学校管理的网络访问聊天机器人,澳大利亚的一些大学表示他们将恢复只使用监考的笔试考试来评估学生。(OpenAI 正在研究使 AI 生成的文本更易于检测的方法,包括可能向 ChatGPT 的输出添加数字“水印”。)2022 年ChatGPT 最初的组装方式也存在伦理问题。《时代周刊》的一项调查发现,作为该过程的一部分,OpenAI 聘请了一家数据标记公司,该公司使用肯尼亚的低薪工人来识别涉及有毒语言和图形性暴力内容的段落,其中一些工人报告说,这导致了心理健康问题。OpenAI 在一份声明中告诉《时代周刊》,此类数据标记是“最大限度地减少训练数据中包含的暴力和色情内容的数量以及创建可以检测有害内容的工具的必要步骤。”
免费提供 ChatGPT 让 OpenAI 能够收集大量反馈,以帮助改进未来的版本。伦敦人工智能公司Faculty的创始人兼首席执行官Marc Warner说:“从历史上看,我们倾向于看到这些非常通用的算法不足以让一家特定的公司获得所有的总体回报。”例如,人脸和图像识别技术最初是由谷歌和英伟达等科技巨头开发的,但现在已无处不在。
法院和监管机构还可以向生成人工智能所依赖的数据飞轮中设置监管。在加利福尼亚州联邦法院提起的一项价值 90 亿美元的集体诉讼可能对该领域产生深远影响。该案的原告指责微软和 OpenAI 未能对使用他们的代码训练 GitHub 的编码助手 Copilot 的编码人员给予信用或补偿,这违反了开放许可条款。微软和 OpenAI 拒绝就此诉讼发表评论。人工智能专家表示,如果法院支持原告,它可能会破坏生成人工智能的繁荣:大多数生成模型都是在未经许可或无偿的情况下从互联网上收集的材料进行训练的。代表这些原告的同一家律师事务所最近对 Stability AI 和 Midjourney 提起了类似的诉讼,指控他们未经许可在其训练数据中使用受版权保护的艺术作品。图片机构 Getty Images 也对 Stability AI 提起了自己的版权侵权诉讼。正如一些欧盟立法者正在考虑的那样,如果立法者通过规定,给予创作者选择不将其内容用于人工智能培训的权利,则可能会出现另一个问题。与此同时,OpenAI 的竞争对手并没有停滞不前。据《纽约时报》报道,谷歌的高管们担心失去在搜索领域的主导地位,因此发布了“红色警报”。据该报报道,谷歌 CEO 桑达尔·皮查伊 (Sundar Pichai) 已召开会议重新定义公司的 AI 战略,并计划在年内发布 20 款支持 AI 的新产品,并展示用于搜索的聊天界面。谷歌拥有自己强大的聊天机器人,称为 LaMDA,但一直犹豫是否要发布它,因为担心如果它最终被滥用会损害声誉。现在,该公司计划根据ChatGPT“重新调整”其风险偏好,据该报报道,谷歌还在开发文本到图像生成系统,以与 OpenAI 的 DALL-E 和其他系统竞争。当然,目前还不清楚聊天机器人是否会成为搜索的未来。ChatGPT 经常发明信息,AI 研究人员称之为“幻觉”的现象。它不能可靠地引用其来源或轻易地显示链接。当前版本无法访问互联网,因此无法提供最新信息。一些人,例如 Marcus,认为幻觉和偏见是 LLM 的根本问题,需要从根本上重新考虑他们的设计。“这些系统预测句子中的单词序列,就像类固醇的自动补全一样,”他说。“但他们实际上并没有适当的机制来追踪他们所说的话的真实性,甚至无法验证他们所说的话是否与他们自己的训练数据一致。”“这些系统预测句子中的单词序列,就像类固醇的自动补全一样。但他们实际上并没有适当的机制来追踪他们所说的话的真实性。”
★GARY MARCUS,纽约大学认知科学名誉教授
包括 OpenAI 投资者 Hoffman 和 Vinod Khosla在内的其他人则预测,这些问题将在一年内得到解决。穆拉蒂更为谨慎。“到目前为止,我们一直在遵循一些研究方向,以解决事实的准确性和模型的可靠性等问题。我们正在继续努力,”她说。事实上,OpenAI 已经发布了关于不同版本 GPT 的研究,称为 WebGPT,它能够通过查询搜索引擎回答问题,然后总结它找到的信息,包括相关来源的脚注。尽管如此,WebGPT 并不完美:它倾向于接受用户问题的前提并寻找确认信息,即使前提是错误的。例如,当被问及希望某事是否可以实现时,WebGPT 回答说:“的确,你可以通过思想的力量实现愿望。”在极少数情况下,Altman会在公共场合畅谈人工智能,他自己听起来就像一个一厢情愿的思想家。在旧金山 VC 活动上被问及关于 AI 的最佳案例时,他滔滔不绝地说道,“我认为最好的案例非常好,以至于难以想象……我认为好的案例好到令人难以置信,以至于你谈论它听起来像个疯子在说话。”然后,他突然回到 OpenAI 根源上的反乌托邦主题:“我认为最坏的情况是我们所有人都熄灯了。”
欢迎加入Imagination GPU与人工智能交流2群
(添加请备注公司名和职称)
对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数字化转型Imagination Technologies是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!