据报道,AI初创公司OpenAI启动了为期12天的直播活动。活动首日,推出了完整版(满血版)o1推理模型,并新增了月费为200美元的ChatGPT Pro订阅。

直播第二天, OpenAI推出了强化微调研究项目。该项目旨在使开发人员和机器学习工程师能够创建经过微调的专家模型。

新的模型自定义技术使开发人员能够使用数十到数千个高质量任务定制模型,并根据提供的参考答案对模型的响应进行分级。此技术强化了模型对类似问题解决方案的推导,以及在特定任务上的准确性。

在OpenAI的演示中,微调后的o1-mini模型得分提高80%,直接反超o1正式版。据OpenAI介绍,用户可以综合运用o1、微调和数据创建定制的小型 o1模型 o1 mini。用户要做的就是提供数据,然后在强化微调方面,设置一个数据集和一个“评分器”,根据训练和验证数据集评估模型的性能,其他工作交给OpenAI。


责编:聚观365

此内容归聚观365整编发布,未经聚观365书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。


点赞(57)

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部