ChatGPT是人工智能中的一个大型语言模型,类似聊天机器人,不过它可以和用户进行多轮对话,这也是之前的聊天机器人所办不到的chatgpt。和所有大数据模型一样,ChatGPT同样也是经过“预训练+微调”的过程,但是OpenAI这次在数据收集上设置上有了细微的差别。
首先,OpenAI用有监督学习训练出了一个初始模型。人类AI培训员分别作为用户和AI,模拟人类和AI之间的对话。此外,OpenAI还创建了一个奖励模型,将机器生成的回复由人类培训员筛选,按照质量排序,挑出质量最优的那一个。
尽管如此,ChatGPT本质上和传统的聊天机器人并没有分别——它并不理解自己所说的话,并且总是试图合理化自己的回答。OpenAI也表示,ChatGPT 有时会写出貌似合理但不正确或荒谬的答案,或者过度使用一些词句和特定表达。
© 版权声明
文章版权归作者所有,未经允许请勿转载。