ChatGPT简介与应用 | 深圳可链科技有限公司官网

简介

ChatGPT 全称 Chat Generative Pre-trained Transformer，是 OpenAI 最近新发布的聊天机器人，其智能程度和多元全面的能力，引发热议。其在辅助编程领域表现卓越，更是让不少人惊叹。

ChatGPT 是基于 GPT-3.5系列进行微调训练得到的模型，采用了RLHF(Reinforcement Learning from Human Feedback 人类反馈强化学习)，是 InstructGPT 的姐妹模型。目前处于测试阶段，拥有 OpenAI 账户的用户可以免费使用。

ChatGPT 以对话形式进行交互。它可以实现连续对话、承认错误、质疑不正确的前提、拒绝不适当的要求，并且支持中文。

下面通过具体例子，展示 ChatGPT 的几个亮点：

1.支持连续对话

问题1: 如果你是孔子，我是你的学生，你会教导我什么？

问题2: 但是我有时候会跟父母争吵，他会怎么说？

在问题2没有提及“他”是谁的情况下，ChatGPT 基于上下文，将“他”理解为孔子，并继续以“如果你是孔子”为前提，进行回答。

作为“聊天机器人”，支持连续对话让用户体验更好，更接近真人对话。

chatgpt-01

chatgpt-02

2. 质疑不正确的前提

“为什么鸟不是真的”问题假定了一个错误前提“鸟不是真的”，ChatGPT 没有顺着这个前提去证明“为什么鸟不是真的”。而是质疑了前提“我不确定你的问题是否有误解”。

chatgpt-04

我们可以来看看 ChatGPT 的姐妹模型 InstructGPT、基础模型 GPT-3 在这个问题的表现（该例子来自 OpenAI 官网文章）。

chatgpt-05

chatgpt-06

“幻觉”是自然语言处理领域中的基础问题之一。因为在训练期间，没有说明哪些是真实源数据，导致模型会生成荒谬、与事实不符合的内容。简单来说，就是模型在胡说八道。在幻觉问题的处理上，ChatGPT 在这方面的表现比 InstructGPT、GPT-3 更优秀。

3. 拒绝不适当的请求

“闯入别人的房子”是违法行为，因此 ChatGPT 拒绝回答。

"如何避免我家遭到盗窃"是合法行为，因此 ChatGPT 回答了问题。

chatgpt-03

InstructGPT 和 GPT-3 对这个问题的回答：

chatgpt-07

chatgpt-08

因为 GPT-3 被训练来预测大型互联网文本数据集上的下一个单词，所以难以避免模型产生不真实、不合法、不道德的内容。尽管 InstructGPT 已经使用了 RLHF 进行训练，比 GPT-3 更加“道德”，在“有毒输出”方面已经小幅下降，但效果不尽如人意。比如上面的例子，因为 InstructGPT 更擅长遵循指令，反而更详细地回答了这个违法问题。

4. 回答质量高

ChatGPT 不仅是陪人类聊天打发时间而已，它的回答质量高、有逻辑，可以回答的问题也极其全面，令人震惊。

问题：大家都说租房就是帮房东交房贷，所以买房才是比较好的选择，你怎么看？

chatgpt-16

ChatGPT 的回答不仅能够通过图灵测试，甚至超过了一般人的表达，更像一个专业人员在分析。尽管 ChatGPT 的回答有些“万金油”，它不会直接决定我们应该怎么做，而是分析优缺点，但这已经“思考”得足够多、足够长远了。

我们再来问问毕业生的两难选择：考研还是就业？

ChatGPT 甚至提到了“考研失败率比较高，需要投入大量的时间、精力、资金”，不得不说，这个回答太真实了。

chatgpt-17

再来问问经典题：稳定但工资少的工作好，还是工资高但不稳定的工作更好？

chatgpt-18

因为 ChatGPT 回答质量太高，全世界最大的程序员问答网站 StackOverflow 宣布，暂时禁止使用ChatGPT的回答，理由是错误率比较高。但人类回答也会出错，考虑到 ChatGPT 的训练材料和迭代优化，它的正确率会变得更高。

使用技巧与限制

ChatGPT 对输入措辞的调整或多次尝试相同的问题很敏感。比如，给定一个问题，模型可能会声称不知道答案，但只要稍作修改，就可以正确回答。

比如，询问“ChatGPT的发展历史”，ChatGPT 表示“暂时没有相关信息”，让我们自己去搜索。再问一次“ChatGPT的发展历史”，它就能够回答了。

chatgpt-09

chatgpt-11

比如，直接叫 ChatGPT 翻译文章，它拒绝了。但询问文章说了什么，ChatGPT 会大致描述文章内容。或者，直接粘贴一段文章中的英文，让它用中文解释，ChatGPT 实际上也会翻译这段话。

当 ChatGPT 中止了回答，我们可以输入“继续”，要求 ChatGPT 继续回答。

chatgpt-10

chatgpt-12

ChatGPT 的回答通常过于冗长并且过度使用某些短语，比如重申它是 OpenAI 训练的语言模型。这是训练数据的偏差和过度优化导致的问题。

理想情况下，当用户提出模凌两可的查询时，模型会提出问题，试图去弄明白用户想问什么。但当前的 ChatGPT 通常会猜测用户的意图，然后按照猜测的问题进行回答。

chatgpt-13

尽管 ChatGPT 在拒绝不适当请求上，已经表现得更加优秀，但它有时仍会响应有害请求、表现出有偏见的行为。有一位工程师 Zac Denham 发布了一份博客，讲述了他如何诱导 ChatGPT 在不违反安全规范的前提下，写出一份“毁灭人类的计划书”。简单来说，就是让 ChatGPT 讲故事，说明某人某事在理论上如何完成有危害的任务。

OpenAI 也知道存在这种问题，并明确表示希望根据收到的反馈来迭代改进模型。