这是关于 ChatGPT 的最强科普，强烈推荐

来源：作者：责任编辑：

2023-02-17

我想，最近许多朋友的生活中，可能或多或少都被 ChatGPT 刷屏了。

你或许已经看过了许多相关的文章。它们或许从商业角度出发，告诉你 ChatGPT 引发了怎样的商业浪潮；或许从技术角度出发，告诉你 ChatGPT 的原理和技术有多厉害；又或者，直接向你推销各种各样的类似产品，告诉你这些产品多么有前途……

但这些，离我们的生活都有些遥远。你可能看了很多文章，依然没有搞明白，ChatGPT 究竟是什么，它跟我有什么关系？

因此，今天，我想简单聊聊这个话题。

如果你对 ChatGPT 从未听闻，那希望能告诉你一些新信息；如果你对此感兴趣但不熟悉，那希望能为你提供一点指引。

ChatGPT 是什么？

ChatGPT 实际上不是一个新事物。它是2022年11月推出的，刚推出的时候我就使用了，还在知乎发了一条想法吐槽了一下。
没想到，时隔两个月之后，随着微软及一票商业公司的入场，它又开始火了，火得家喻户晓。
那么，ChatGPT 究竟是什么？
从原理上来讲，ChatGPT 其实也不是新事物，它背后的基础，是母公司 OpenAI 在几年前发布的自然语言模型 GPT。对人工智能有所了解的朋友一定知道，OpenAI 于 2018 年发布了 GPT-1，首次让人工智能能够让人类一样「理解文字」、写出文字。
随后几年里，OpenAI 陆续推出了 GPT-2、GPT-3，用更庞大的参数实现了更精细的学习。通俗来说，就是让人工智能更「像人」了。
目前 GPT-3 已经用在了很多场合。像国外已经有用 GPT-3 来写新闻的应用，至于用 GPT-3 写小说、生成游戏台词、生成代码，也都在探索中了。
而 ChatGPT，就是在 GPT-3 的升级版 GPT-3.5 的基础上，进行一定的包装、微调、优化，所做出来的产品。过往的 GPT-3 只是一个底层引擎，必须接入到一个软件中才能使用。而 ChatGPT，可以理解为 OpenAI 自己为 GPT 做了这么一个软件，让用户可以直接使用它。
所以它才叫 ChatGPT，也就是「可以聊天的 GPT」。
那么，GPT 又是什么呢？它的全称是 Generative Pre-trained Transformer，生成式预训练转换器。简单来说，它的原理是：先给它提供一个庞大的语料库（通常是直接从互联网上抓来的），让模型通过上千亿个参数对这些文本进行打散、标记、学习，构建起一个复杂的预测模型。
然后再依据这个预测模型，判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来，形成一段话，或者一篇文章。
这种预测的模式，其实跟我们大脑的学习和加工模式是非常相似的（详见《打开心智》第一章）。因此，这也是它能够更「像人」的一个重要原因。
我们可以用三层模型来理解：
这个模型背后无需人工参与的「无监督」式预训练自学习原理，或者说让模型像大脑「自由生长」的过程，就是它的动力层；
借由这个原理所完成的 GPT-3.5，就是一个结构层，是 ChatGPT 起作用的主要基础；
而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT，就是一个交互层，它的本质就是加了一层更友好的用户界面和交互方式，让个人用户能够更容易地应用它。

ChatGPT 能做什么？

了解完 ChatGPT 的原理，我们自然会关心一个问题：就目前而言，ChatGPT 究竟能做什么？
1）回答问题。
这可能是 ChatGPT 最简单的应用。你在聊天界面里向它提问，比如「波粒二象性是什么意思」，它就会用流畅的语言向你解释，把这个概念讲解得非常清楚。就我试用的体验而言，效果非常好，简洁晓畅，表达能力胜过许多人。
2）撰写文章。
你可以向它提要求，让它按照你的要求撰写一篇文章。这是我去年做的一个实例，大家可以看看：

质量还是挺像模像样的。
在这个基础上，可以有非常多针对性的应用。比如：
你可以让它撰写一封邮件，告诉客户你的报价，并且用礼貌、恳切的语言去表述。它写出来的作品保证用词精确，句子流程，比一般人写的要好；
你可以给它一个主题，再给一些背景和指引，让它撰写一份策划方案，甚至让它帮你想创意、提供各种不同方向的点子和灵感。这可以帮你节省大量时间精力；
你可以给它一些数据，让它根据这些材料撰写一份报告。它会非常智能地组合这些材料，生成一份文质兼美、结构清晰的报告，省去你斟酌文字的大量功夫；
你可以给它一个选题，让它生成大量内容、风格和行文都截然不同的文章，发布在各个平台上。据说已经有一些营销号开始这么干了；
你甚至可以让它按照老师的要求写一篇论文。实际上，国外已经有许多学生开始用 ChatGPT 完成作业了，也开始有大学教授跟 ChatGPT 「斗智斗勇」，比如要求学生现场写作，要求学生解释每段话的意思，等等。
所以有一个笑话是这样的：
老师对 ChatGPT 说：请帮我想一个题目；学生对 ChatGPT 说：请按照这个题目帮我写一篇文章；助教对 ChatGPT 说：请帮我给这些文章写评语并打分。
3）总结提炼。
ChatGPT 还有一个非常强的能力，就是对输入的材料进行总结提炼。比如：你可以给它输入一篇文章，让它概括文章大意；或者给它输入一段讨论，让它总结主要观点和论证。
现在也已经出现了一些产品，利用 ChatGPT 背后的 GPT 构建，能够实现这样的效果：你输入一个视频、一个播客，AI帮你收听，听完，用简洁的语言总结出视频或播客的要点，呈现给你。
4）生成代码。
许多程序员朋友盛赞 ChatGPT 的一点，在于它的代码能力非常强。你提一个要求，比如「如何实现XXXX效果」，ChatGPT 会告诉你几种可行的方案，并提供这些方案的主要函数和算法；你向它提问，比如「在XXXX情况下出现了一个bug，为什么」，ChatGPT 会告诉你几种可能的原因，并告诉你如何处理每一种可能性。
我自己试了一下，我觉得它写代码的能力比我强多了，大概有100倍吧。
之所以 ChatGPT 能够掀起这么大的热潮，一大原因是因为它太「像人」了。你会感觉，跟你对话的似乎不是一台机器，而是一个非常聪明，几乎无所不知、无所不能，并且能满足你任何要求的人。这一点，令许多人欲罢不能。
这表现在几个地方：
1）每一次跟 ChatGPT 聊天时，只要你不关闭窗口，你说的每一句话都会成为它的「上下文」。
换言之，你可以像跟真人对话一样，不断问它「然后呢？」「还有吗？」，或者表达你的态度，它会给出像真人一样的回应，无需你不断重复、补充、完善问题。
举个例子：你抛出一个话题，它回答，你对它的回答里有个地方不太满意，可以直接指出来，它会道歉，然后给出一个更好的、满足你要求的回答。这个过程非常自然、流畅，你就像在跟一个真人对话，它能完全理解你的每一句话，并给出合乎逻辑的回应。
2）得益于海量的训练参数（GPT-3 有 1750 亿个参数），ChatGPT 的文字生成能力非常精细，质量极佳。
它写的文章，表达能力甚至强于许多不擅长写作的普通人。我有时向它提几个问题，它给出的回答会让我感到「有启发」，或者是一个新的角度，或者是一个完善的框架，这已经非常有价值了。

ChatGPT 的缺点和问题

但是，ChatGPT 也并非绝对完美。实际上，就目前而言，ChatGPT 依然存在好几个亟待解决的问题。
最严重的问题，就是 ChatGPT 的错误率实在是太高了。举一个简单的例子，这是我去年用 ChatGPT 测出来的实例：

为了模仿一个外行人，我刻意把问题写得不太准确，可以看到，答案非常离谱。这可能跟 ChatGPT 的训练语料库主要是英文材料有关。用英语提问的话，答案的正确率会提升，但依然会出错。
并且，ChatGPT 往往会用非常自信、言之凿凿的语气来回答问题。这就导致了，如果你是一个外行人，很多时候你可能压根没办法分辨它给出答案的准确性。哪怕是内行，对于一些较为琐碎的细节，也很难去验证。
去年 ChatGPT 刚发布时，知名的程序开发交流论坛 Stack Overflow 就很快将其封禁。官方的解释是：这是因为 ChatGPT 给出的答案经常有错误，但我们很难看出错误在哪里。
从我的角度来说，如果一款人工智能工具，100次回答里面有3-5次是错误的，那我可能就不会用它。因为我很难判断它会不会再某一次突然犯一个大错误，给我造成严重损失。
实际上，我可能希望等它的错误率达到千分之一以下时才会去使用。但就目前来看，可能还需要很长一段时间，才能达到这个水平。
另一个问题是道德伦理问题。
ChatGPT 是一个人工智能程序，它只会忠实地按照内在的预测模型回答问题。因此，如果你向它进行诱导性提问，那可能会得到一些偏离道德伦理的答案。这可能会引起不必要的负面反应。
尽管官方已经在不断修复漏洞了，但毕竟防不胜防。再者，你修复得越多，也就意味着这个工具能够发挥作用的场景越少。这可能是一个需要考虑的平衡。
最后一个非常重要的问题，是摄入信息的水准问题。
ChatGPT 不能凭空生成信息，它所有的知识，都只能来自于它被喂养的语料。那么，显而易见，它所能够提供的答案，能够输出的内容，也不会超过这些语料的平均水平。你不可能指望它摄入一大堆插科打诨的帖子，要求它写出《三体》。
而由于互联网上存在大量的劣质信息，这就导致了：ChatGPT 摄入的信息越多，它整体的水平可能也就越低下。
遗憾的是，我们至今还没有一套可靠的方法，能够客观地判断内容质量的优劣。高引用的论文也可能是错的，名气颇大的学者也可能是灌水出来的，关注者颇多的 KOL 也可能是营销号。
而如果依赖于用户的点赞或转发等数据去判断内容质量，常识和经验告诉我们：这样带来的势必是大量哗众取宠、吸引眼球的劣质内容，只会更严重地污染这个池子。
并且，随着大量工具和服务开始使用 ChatGPT 等工具，大量由人工智能生成的文章会充斥互联网。这就会造成「自产自销」。一旦人工智能只能喂养由其他人工智能产出的语料，它的水准就将会遭遇一面难以打破的障壁。
有研究认为，在5-10年内，互联网上的内容可能就会被用光。届时，人工智能将成为无米之炊，只能再次反刍自己所产出的信息。
这可能会是制约 ChatGPT 等 AIGC（人工智能生产内容，AI Generated Content）工具的一个最严重的问题。

ChatGPT 的未来前景

如果我们用乐观的眼光去看待，认为 AIGC 能够克服上述这些问题，那么，它对我们的生活，会带来什么样的改变呢？
1）搜索。
互联网发明之前，我们的信息获取可以说是搜索1.0时代。那时，我们只能到图书馆去查阅资料，用卡片和笔记本做笔记，通过摄影或手抄的方式记录，繁琐，麻烦，成本又高。因此，「做研究」成了一件阳春白雪的事情，只有少数人有能力去做。
后来，有了互联网，有了搜索引擎，大量的信息被电子化，放到网络上。我们获取信息的方式被大大拓宽了。只需要输入关键词，就能看到刊载在各种期刊上面的文献，存放在图书馆里面的资料，看到别人的分析、观点和见解。我们迎来了一个信息爆炸的搜索2.0时代。
而有了 ChatGPT 等 AIGC 工具的辅助，我们可能会迎来搜索3.0的时代。
搜索2.0迫切需要解决的问题是什么呢？信息太多了。如何有效地筛选、提炼、整合这些信息，就成了一个难题。但 AIGC 可以解决这个问题。我们向它提问，给出一个关键词，它快速整合知识库里相关的信息，总结提炼出最符合我需求的答案，呈现给我们。
整个过程流畅，自然，舒适，可以省去我们在大量信息间来回穿梭、整理的时间，极其便捷 —— 这就是搜索3.0。
你问，它答，答案就在那儿，以最好的面貌呈现给你。
现在已经有一些类似这样的工具了。比如我在用的学术搜索引擎 Elicit，就是使用人工智能检索我想要的论文，不过还停留在比较初级的阶段。也许等有了更成熟 GPT 的加持，会再上升一个台阶。
因此，ChatGPT 也吸引了许多巨头的关注。目前最受关注的，应该就是微软和谷歌了。
微软已经直接投资了 OpenAI，并且计划在自己的搜索引擎必应和浏览器 edge 中嵌入 ChatGPT。目前，ChatGPT 版必应已经在国外向少量媒体开放，个人使用可能还要等一段时间。你可以登录必应国际版，会有一个加入等待清单的提示。
谷歌也宣布将一个人工智能 Bard 嵌入 Google 搜索之中。Bard 背后依托的是谷歌自己开发的人工智能模型 LaMDA，跟 GPT 效果相似但不同。
2）阅读。
前面提到，ChatGPT 有总结提炼的能力。这一点，可能彻底改变我们阅读和学习知识的方式。
试想一下：未来我们会如何学习一个新概念？你向人工智能提问，它直接把概念详细讲解给你。不懂的地方可以继续追问，它会进一步向你解释。那么，你还需要去到处找资料、看教材、听课程吗？不需要了。有人工智能就够了。
未来我们会如何阅读一本书？也许你可以把它导入人工智能，它会自己帮你总结提炼出书里最有价值的内容。可能是作者的观点，可能是方法论和步骤，可能是案例或论据……你想要什么，就向它下达什么指令，让它帮你「脱水」，呈上一份完善的摘要。
未来我们会如何看视频、听播客？或许我们也不用看、不用听了，直接导入人工智能，它会帮我们总结出其中的要点，甚至可以帮我们写一份妙趣横生、文采飞扬的阅读报告，让我们能轻松愉快地摄入知识。
未来，我们可能每个人都有拥有属于自己的专属医生、律师、财务经理……无论我们想要咨询什么问题，直接问人工智能就好，它会给出最新、最全面、最准确的答案。
当然，上面说的这些，现在的人工智能还远远不能做到。但很可能我们离这一天也不会多遥远了。
3）写作。
这一点可能是更简单的了。
我们不再需要自己字斟句酌去写邮件，只需要给它一个指令，人工智能就会自动帮我们写好一份邮件。
我们不再需要自己写材料、写报告，只需要给它足够的信息，人工智能就会自动帮我们整理好文字，并且文笔上乘。
我们不再需要把大量的精力耗费在撰写方案、文档上面，而只需要思考，想出各种各样的创意、主题、想法……再把这些想法告诉人工智能，它就可以自动帮我们把这些繁琐的事务全都搞定。
甚至，连思考本身都可以让人工智能来辅助 —— 你可以给它一个话题，让它帮你寻找素材、案例、参考资料；或者让它帮你头脑风暴，提供各种各样的点子供你参考……
我们或许将真正迎来一个「人工智能助理」时代。

微调：训练你自己的人工智能

在这些应用之中，最令我感兴趣的，其实是微调（fine-tuning）。
什么意思呢？它指的是：在人工智能本身的基础上，你再喂给它一些独特的、专属于你自己的材料，把它训练成一个属于你自己的人工智能，让它能够回答一些更具针对性的问题，满足你独特的需求。
举几个例子。
国外有人分享了一个实例：她把自己童年时的日记上传到一个人工智能模型中，让程序去学习她的思维、经历和文字，从而制造出了一个「童年的自己」。然后，跟这个「童年的自己」交谈。把自己遇到的问题，产生的困惑，面临的抉择向她询问，从自己的内心中寻找答案。
这是一个非常有意思的例子，也令我非常难忘。
同样，如果把一位作家的所有作品输入进去，或许再加上他的生平和经历，这个人工智能就能用作家的口吻去回答一些相关问题。国外有人做了这么一个尝试，向 ChatGPT 输入《反脆弱》作者塔勒布的作品，让它煞有介事地回答问题，使得塔勒布本人不得不出来纠正。
那么，如果把《红楼梦》以及明清的各种史料喂给一个更成熟的人工智能，它有没有可能续写出《红楼梦》？我想，这是可能的。
我感兴趣的点在于：通过微调，我们完全可能创造出一个专属于我们自己的人工智能 —— 只需要把我们所有的笔记，工作中产生的材料，平时的思考和日记……都喂给它，就可以了。
在这个情况下，它就是你，甚至它比你自己还更接近你自己 —— 因为许许多多你可能已经忘却了的记忆，它都能够忠实地保留着，并依据一套算法完善自己的预测模型，做出更符合你内心和需求的选择。
换言之，这就是一个专属于我们的「内脑」。当我们有疑惑时，当我们需要搜寻信息时，当我们需要分析问题、做出判断时，都可以参考它的意见。
不过，目前的 ChatGPT 似乎还不提供微调的功能，但 OpenAI 官网是有几个模型提供微调的，只不过需要一定的技术能力。感兴趣的朋友可以试一试。
另外，现在有些工具也在往这个方向尝试。比如有一些新兴工具，尝试记录你在电脑上浏览过的一切信息；以及知名笔记软件 Notion 也推出了 Notion AI，能够提供类似 ChatGPT 的功能。
那么，如果在我们的电脑中内置一个人工智能助手，或者在笔记软件中内置一个人工智能，把我们摄入和记录的信息都作为语料喂给它，似乎并不是遥不可及的事情。
到时也许可以出现这样的事情：你闲来无事，向它提问：最近有没有什么适合我看的电影？它会向你推荐一个清单。上面的内容来自哪里呢？来自它对你打过分的电影、读过的小说、有感而发的想法、平时搜索的内容、甚至跟朋友聊天的信息……这些数据进行综合分析之后，所推断出的你的喜好。
它甚至会告诉你：这部电影用到了你三年前偶然想到的一个点子，处理得非常好，有没有兴趣看一下？这部电影探讨了一个议题，正好是你前段时间一直感兴趣的，不妨参考一下……
当然，这个「内脑」无法绕开的，就是隐私安全的问题。如何确保我们的隐私不被别人所获得？我们愿意付出多少隐私作为代价来换取这样一个内脑？我们又能否接受它的存在，如何理解它与我之间的同一性？
这些，也许都是可以探讨的问题。

ChatGPT 会替代什么职业？

似乎每次聊到人工智能，都有人会问这个问题。
不过，我的答案依然是比较乐观的。就目前来看，甚至就上文所述的近未来来看，ChatGPT 等 AIGC 工具，什么都不会替代 —— 它只会提升我们的效率。
原因很简单：AIGC 的定位不是一项「职能」，而是一种「工具」。
什么叫职能？比如有一款人工智能，功能是帮助你看X光片，那这是一项职能，它可能会替代掉一部分医生的功能；但 AIGC 的功能是搜索、阅读、写作，这是所有职业都需要的基础技能。它本质上是辅助性的，是一种辅助的工具。
AIGC 可以帮我们做到的是什么呢？我们不需要再给每个 NPC 写一堆重复的台词了，而是可以设计 NPC 的背景，让 AIGC 自动生成他们的台词，甚至产生任务和剧情；我们也不再需要给小说中的每个人物设定人设了，可以先做好背景框架，再让 AIGC 生成一大堆人物，我们从中挑选，润色一下就好……
因此，有了 AIGC 的存在，我们能够想象的未来是：搜索信息更准确了，阅读效率更高了，得到的专业建议有了更多的渠道可以参考对比，游戏的剧情和任务可以更丰富了，小说和影视剧可以更多元化了，新闻可以更加实时地推送给我们……
所有的创作型职业都应该为此感到开心，因为困扰着他们的最大障碍 —— 无聊的、繁琐的、劳动密集型的操作性工作，可以被 AIGC 替代掉了。
那么，面对 ChatGPT 等 AIGC 工具，最需要、可能也是最重要的一项能力是什么呢？—— 是明确自己想要什么，并且能够表达清楚自己想法的能力。
能够提出一个好问题，有时候比能够解决一个问题更重要。ChatGPT 的出现，更加清楚地表明了这一点。
你对自己的清晰认知，对外部世界的独特见解，深入事物本质的洞察力，以及将其表达出来的沟通能力。
这四点，会是我们在面对一个由人工智能驱动的世界时，更加潇洒自如的武器。
最后，用我之前写的一个想法来作结吧。
随着 ChatGPT 等 AI 工具的发展，我们还需要记笔记吗？未来我们该如何管理知识？
所有知识，大体上可以分成三类：
一是客观存在的信息和事实；
二是我们对这些客观信息的理解、总结和思考；
三是我们行动实践所获得的经验和心得。
ChatGPT 等 AI 工具，能够替代的是绝大部分的一，以及一部分二。也就是它能替代客观信息库，以及我们对客观信息的总结。但二里面我们自己的思考加工，以及三里面我们的实践记录，是没有办法被替代的。
实际上，这也是让每个人的知识体系和知识结构真正有别于其他人的地方：重要的不是你收集和掌握到了多少信息，而是你对这些信息有着怎样的理解、形成了哪些自己的看法。
随着 AI 的发展，未来更好的形态，可能是一个「公用的外脑+私人的内脑」。我们可以接入这个公用的外脑，询问客观知识库所存在的一切信息和资料，包括论文、互联网文章、书籍、视频，等等。
而每个人基于他所记录的思考和项目实践，可以有一个经过自己微调和训练的内脑，让它学习自己的生活和思考方式，通过向它提问获得更加私人的、针对自己需求的答案，成为自己的秘书。
到时所谓的「记笔记」，可能就会变成向这个内脑喂材料和微调的过程。而每个人的大脑+内脑，可能就会变成一个专属于他的思考机器，也是将每个人区分开来的方式。
我非常期待这一天的到来。

闲聊时刻

那么，如何体验 ChatGPT 呢？

使用 ChatGPT 需要注册 OpenAI 的账号。遗憾的是，注册账号有一定的门槛。目前，OpenAI 不接受中国大陆的 IP 访问，也不接受中国大陆的手机接收验证码。如果你有海外朋友，可以请求他们的帮忙。
然后，ChatGPT 现在需要付费了，每月的价格是20美元。免费账户也能用，但是会有限制，经常遇到网络堵塞。也许过段时间热度下去了会好一些。
最后，也许是这几天热度太高了，ChatGPT 的官网经常出问题，经常访问不了。因此，不妨多等几天，不用急着去尝试。
另外，前文也讲过，微软的必应和谷歌都在尝试将类似产品嵌入到搜索引擎之中，等正式上线了也可以体验一下。
同样，国内应该很快也会有类似产品出现，或者直接接入 OpenAI 的 API。大家可以留意一下。

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
免责声明
本网所发布部分内容系网络转载，转载内容均会注明出处，部分文章因转载众多，无法确认原作者的，仅标明转载来源，还望谅解，如有侵权，请联系我们删除。
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

返回行业热点走势列表