未来X年GPT的动态

什么是 ChatGPT ?
智如其名,ChatGPT,一个预训练的对话式文本生成 AI。其中,Chat包括输入端你发出的有效提问(Prompt)和输出端的智能参考答案。

有一个广泛的误解是“GPT 通过搜索来拼凑答案”,也有人调侃“大量东南亚的廉价外包在GPT背后疯狂打字”,这其实是上一个搜索时代的惯性认知幻觉。GPT 的运行方式,我认为更像一个共享超级大脑:我们提交问题,云端的 GPT 大脑基于预训练好的能力“计算”出结果。

怎么计算呢?驾驭语言,以最大概率预测输出。

ChatGPT 是一种逻辑语言推理大模型 (LLM)。本质上,这个模型是一种神经网络,TA 能够读取并理解大量的自然语言文本,像人类一样“驾驭”语言,支持直接使用中文。神奇的是ChatGPT靠语料库里只占 5% 的中文就自己学会了如何驾驭这门语言。

不知道你有没有想过,自然语言“编程”会通过ChatGPT这种能力来实现?除了表面的技术突破,更深层的影响是,只要你会“说话”,就能解决问题。

图片

在生成新文本的时候,GPT 能够根据上文进行最大概率预测来保持文本的连贯。采用打字机的输出方式,其实就是一种隐喻。

图片

然而,假如每次续写都按最高概率,宇宙的尽头不就是同一个答案?破解单调的秘诀,就是温度参数 temperature 。在它的作用下,GPT 可以按一定概率输出概率低的续写词,保障了生成结果的可用性和创造性。不过这种随机也意味着ChatGPT也可能给你一本正经地胡说八道。所以记得擦亮双眼,谨防忽悠。

说到这里,ChatGPT给我们的学习方式带来了一个巨大的变化。

以 temperature 这个概念为例,以前咱们深入去了解它的方式几乎绕不开搜索吧?现在,通过一个提问,ChatGPT老师就能通过“布朗运动”来关联记忆,立即给你答疑解惑,是不是就秒懂了?

图片

ChatGPT有什么样的底层能力?
刚才提到的“计算”的能力,正是使得人工智能燎原的星火。而ChatGPT 之所以是有效的人工智能,离不开背后的2个底层能力。

底层能力1:涌现(Emergence),会表达
随着模型迭代的参数量变,ChatGPT 对世界的认知产生了质变。TA 不再是单纯记住预训练的信息。现在的信息会通过理解,再被提炼为知识,然后由GPT为你表达。而到了 GPT-4,也可以说 TA 拥有超越了认知的创造力。

这个过程挺像人脑的进化,神经元发展到一定数量之后,智人就拥有了主宰地球的能力。不过注意,涌现的能力目前在业界是有争议的,但不妨碍我们用这个概念来理解“TA能够表达”这件事情。

图片

底层能力2:思维链(CoT),能推理
GPT3 之后的模型泛化出了思维链(CoT,Chain-of-Thought)的能力,这个能力是模型涌现新能力的关键机制,你可以把它理解为 GPT 的推理能力(Resoning)。比如我希望GPT结合Golden Circle(一种思维模式),说一说iPhone的销售方式,这就是无法通过搜索来拼凑的答案,但GPT就能给你说出来。

图片

在后续的课程中,我们还将利用这个机制,使用各种思维链提示方法,让 GPT 变得更聪明、更有效。

进阶课程中,我还会分享已经被验证更有效的推理网络(ToT,Tree-of-Thought),帮你设计能灵活应对现实中复杂需求的提示。

这里提到的“计算”可不是冷冰冰的数学运算啊,ChatGPT的数学运算能力其实很差。你会发现,在解决问题的层面,真正起作用的是GPT的推理能力,你的有效输入和ChatGPT的推理,决定了最终输出。

快速揭开 ChatGPT 的神秘面纱之后,我们一起来追踪ChatGPT的变化,后面的内容我也会为你动态更新,欢迎你随时回来看看,或者加入课程交流群,和我一起了解最新消息。

动态:GPT“现在”长什么样了?
✦ GPT-4 开胃“小”菜——ChatGPT 跨越了人类科技奇点,随之而来的 GPT-4,又是一跃成为通用人工智能(AGI)的起点。更多参数和更长的文本支持,输出全面提升,更稳定、更专业。

✦ 大超预期——GPT 由大语言模型升级为多模态模型,各种多媒体处理任务轻松拿下。

✦ 炸裂生态——推出插件能力,让 ChatGPT 飞得更高,看得更远,被业界誉为 OpenAI 的 AppStore 时刻。

图片

✦ 华丽插曲——斯坦福人机交互小组利用 GPT-4 模拟了一个小游戏,已有《西部世界》的雏形,细思极恐。

图片

✦ 图文并茂——基于GPT-4的newBing,接入 Dall-E 的能力,能够智能绘图。

✦ 时效保证——Browse With Bing、WebPilot插件等,实现联网搜索。

✦ 一站式自动化——Code Interpreter 模型直接给出可视化分析、自动批处理、输出视频和文档等。

✦ 随时随地——iOS 版发布,自带Whisper语音输入,Mobile 模型响应速度惊人。(5月中)

✦ 新的生活方式——会话分享已经灰度测试(5月底),必将改变社交、协作和材料交付的方式。

图片

✦ Prompt即工具——GitHub已有高质量的开源prompt,提供了解决问题的新启蒙、新方式。(4月)

✦ 未来可期——GPT-5 或将于年内推出,一个人活成一支军队不再是痴人说梦。

我们知道,技术必然往更低成本、更便捷、更高效的方向发展,当然,AI访问权造成的割裂、数据安全和伦理等实际问题也会带来新的挑战。面对AI的狂飙,我的方法是掌握核心,融会贯通。不是追着AI跑,也不是被动等着TA进化。在课程中掌握的核心方法,你也可以快速应用到其他 AI 的实战中,比如Claude、Bard、HeyPi、Notion、Midjourney、MusicLM……

最后,分享一个体会:关于AI的所有知识,只有亲身实践的,才是你的。

关键词: