今天,OpenAI 发布了有关 ChatGPT 最新研究成果的消息,展示了该模型如何通过人类反馈学习(RLHF)技术的应用,显著减少了有害和不真实的输出。此外,GPT-4 作为 OpenAI 最先进的系统,采用了更多的数据和计算资源,致力于生成更安全、更有用的回应。GPT-4 在内部评估中显示,相较于 GPT-3.5,在拒绝处理禁止内容的请求方面提高了82%,在产生事实性回应的准确性上提高了40%。
OpenAI 强调了持续从实际使用中学习并改进模型的重要性。例如,ChatGPT 和 GPT-4 都将定期更新以解决安全性和对齐性问题。公司还与多个专家和组织合作,利用 GPT-4 加快安全研究工作,并通过迭代训练和评估来改进这些模型。
此外,OpenAI 的新任临时 CEO Shear 表示,公司可能会放慢产品的推出速度,以确保其开发的人工智能产品更加安全。
通过今天的更新,OpenAI 希望通过提供更安全、更实用的 AI 系统,以及通过与用户的互动来获得宝贵的反馈,进一步推动其模型的优化和进步。