当前位置:首页 > 人工智能 > ChatGPT理论分析

ChatGPT理论分析

7个月前 (05-25)67

  团队模型、论文、博文、直播合集,点击此处浏览

一、背景

        这里我就直接贴上跟ChatGPT的对话作为背景输入,说真的,它的回答比我写的还要专业,具体见如下截图:

ChatGPT理论分析 _ Java侠

ChatGPT理论分析 _ Java侠

二、原理

        从官网介绍可以看到,ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从字面上来看,顾名思义,它就是指令式的GPT,“which is trained to follow an instruction in a prompt and provide a detailed response”。接下来我们来看下InstructGPT论文[1]中的主要原理:

ChatGPT理论分析 _ Java侠

从该图可以看出,InstructGPT是基于GPT-3模型训练出来的,具体步骤如下:

步骤1.)从GPT-3的输入语句数据集中采样部分输入,基于这些输入,采用人工标注完成希望得到输出结果与行为,然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。

步骤2.)在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。

步骤3.)采样新的输入语句,policy策略网络生成输出结果,然后通过reward反馈模型计算反馈,该反馈回过头来作用于policy策略网络。以此反复,这里就是标准的reinforcement learning强化学习的训练框架了。

        所以总结起来ChatGPT(对话GPT)其实就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型,最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果(其中PPO-ptx曲线就是InstructGPT模型),可以看到在回答友好型上InstructGPT是远超原始GPT的:

ChatGPT理论分析 _ Java侠

        ChatGPT它非常擅长对话、情感分析、文本生成、摘要提取等,有了这些直接打开了更广阔的应用面。可想而知,如若在垂直领域做定向训练,它将会发挥出更极致的性能,即可作咨询用途,同时也可以辅助创作(这将颠覆很多行业的工作方式)等等。

        效果是非常惊艳的,使用完之后的体感是这应该能辅助到各行各业中,应用空间无限大,这类技术可能会成为未来AI系统的基石应用之一。

三、其他

        Discord,文生图体验,文章《人工智能内容生成元年—AI绘画原理解析》中已介绍到Midjourney的用户通过该文生图的能力,在美国科罗拉多州举办的艺术博览会,《太空歌剧院》的画作获得数字艺术类别冠军。相应参与界面如下:

ChatGPT理论分析 _ Java侠

四、文献

[1]InstructGPT:https://arxiv.org/abs/2203.02155

作者:AI记忆
来源链接:https://blog.csdn.net/sunbaigui/article/details/128245044

标签: ChatGPT

“ChatGPT理论分析” 的相关文章

我们问了ChatGPT 100个问题,它说了不少废话

近日,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT引爆中文互联网。它可以与人类轻松地对话,无论是回答各种奇怪的问题,还是写代码...

全网唯一,不忽悠的ChatGPT

全网唯一,不忽悠的ChatGPT

 Datawhale干货  作者:Ben,中山大学,Datawhale成员 最近ChatGPT火出圈了,它和前阵子的Stable...

【ChatGPT使用笔记】 ChatGPT回答不完整,如何获取后续的内容

【ChatGPT使用笔记】 ChatGPT回答不完整,如何获取后续的内容

____tz_zs 对于 ChatGPT 回答不完整的情况(篇幅限制,没有说完),可以输入“继续”指令,让其继续回答下去,获得完整内容。...

ChatGPT可以帮我们做哪些事?

ChatGPT可以帮我们做哪些事?

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发......

机器学习算法介绍-拔草ChatGPT

机器学习算法介绍-拔草ChatGPT

  最近ChatGPT(https://chat.openai.com)特别火,笔者也借此机会尝鲜了一波。ChatGPT是一个一个大型语言模型,它的...

想用ChatGPT写作?或许没你想的那么神奇...

想用ChatGPT写作?或许没你想的那么神奇...

ChatGPT让AI进化到了新高度,它不但懂你还能够回答问题。这与传统中的网络检索、语义识别不太一样。核心是基于自然语言处理(NLP)的聊天机器人技术。 说...

如何用乐高积木式操作让 ChatGPT 变得更强大?

如何用乐高积木式操作让 ChatGPT 变得更强大?

需求 这些日子,很多小伙伴儿玩儿 ChatGPT 不亦乐乎,甚至陷入了沉迷。 他们尝试了各种 ChatGPT 的功能。不少功能强悍到不可思...

ChatGPT 之后,再玩玩 Stable-Diffusion

ChatGPT 之后,再玩玩 Stable-Diffusion

前些天体验的 ChatGPT 主要用来进行文本方面的处理,那么图片生成有没有这样的 AI 工具 呢?答案是肯定的。 例如:和菜头公众号的题图和文章...

chatgpt会开源码

ChatGPT 会开源吗? 削微寒 于 2022-12-08 08:15:06 发布 16316 收藏 229 文章标签: cha...

ChatGPT 大智近妖,从宇宙人生到手搓光刻机,从哄女朋友到写年终总结我们聊得非常开心,反而让人越来越忧心...

ChatGPT 大智近妖,从宇宙人生到手搓光刻机,从哄女朋友到写年终总结我们聊得非常开心,反而让人越来越忧心...

都说 ChatGPT 要干掉程序员,清理搜索引擎,取代Stack Overflow,还能消灭人类,这些有些言过其实了。ChatGPT 的定位是一个人工智能助理,它说...