Skip to main content

2篇文章 tagged with "gpt"

View All Tags

· 约20分钟
Josie Chow

文章翻译自《Aligning Language Models to Follow Instructions》

引言

我们训练的语言模型比 GPT-3 更善于遵循用户意图,同时,通过使用我们的一致研究(alignment research)开发的技术,使回答更真实、毒性更小(less toxic)。这些与人类一起训练的 InstructGPT 模型,现在作为默认语言模型部署在我们的API上。

InstructGPT 与 GPT-3

在遵循英文指令上,InstructGPT 优于 GPT-3。

GPT-3 模型没有被训练去遵循用户指令。我们的 InstructGPT 模型明显能生成更有用的输出,来响应用户的指令。

· 约12分钟
Josie Chow

简介

ChatGPT 全称 Chat Generative Pre-trained Transformer,是 OpenAI 最近新发布的聊天机器人,其智能程度和多元全面的能力,引发热议。其在辅助编程领域表现卓越,更是让不少人惊叹。

ChatGPT 是基于 GPT-3.5系列进行微调训练得到的模型,采用了RLHF(Reinforcement Learning from Human Feedback 人类反馈强化学习),是 InstructGPT 的姐妹模型。目前处于测试阶段,拥有 OpenAI 账户的用户可以免费使用。

ChatGPT 以对话形式进行交互。它可以实现连续对话、承认错误、质疑不正确的前提、拒绝不适当的要求,并且支持中文。