01 为什么新模型起名叫“o1”
OpenAI在发布文档中写道,新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1——这表示大模型能力实现了等级的提升,"o"代表旧的终结,"1"代表新的开始。
02 OpenAI o1提升到了什么水平?
直接看图:
可以看到,在2024年美国数学邀请赛的竞赛题和Codeforces算法竞赛题上,o1预览版解决数学和编程问题的能力,比起GPT-4o,提升了5-6倍。而可怕的是,深橙色的柱形,代表真正的o1,相比于GPT-4o,提升了8-9倍!
最后一个图中,OpenAI还列出了人类专家在解决博士级别科学题目的时的成功率,大约在69.7%,而o1预览版和o1,都已经超过了人类专家的水平。
OpenAI的技术博客提到了更具体的数字,目前o1模型的成绩,在美国数学邀请赛上,可以排名进入美国前500名。而物理、生物和化学问题上的准确度,超过了人类博士的水平。
在官方博客中,OpenAI简单解释了这一进步背后的原理。
类似于人类在回答难题之前可能会思考很长时间,o1在尝试解决问题时会使用一系列思维。通过强化学习,o1学会了磨炼其思维链并完善其使用的策略。它学会了认识并纠正错误,将棘手的步骤分解为更简单的步骤。当当前方法不起作用时,它会尝试另一种方法。这个过程极大地提高了模型的推理能力。
简言之,大模型开始会“思考”了。做“思维链”的人,是不是觉得很沮丧?辛辛苦苦搞半天,大模型直接支持了。
OpenAI提到,在未来,医疗保健研究人员可以使用o1来注释细胞测序数据,物理学家可以使用o1生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用o1来构建和执行多步骤工作流程。
OpenAI还提及了自己训练中发现的一个现象:随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1的性能能持续提高。扩展这种方法的限制与LLM预训练的限制有很大不同。
Jim Fan在X上的一句话或许说中要害:“之前,没人能将AlphaGo的成功复制到大模型上,使用更多的计算让模型走向超人的能力。目前,我们已经翻过这一页了。”
03 是喜是优?
AI近来的发展有点太快。随着科学的发展,人类想站到科技的前沿已经越来越吃力。数学、物理、化学、生物等,人类需要学20多年才能走到最前沿。如果人类被AI轻松超越,是不是会感到很绝望?自己奋斗几十年,不如AI一瞬间。
当AI被一个超级大国单独掌握,会形成科技霸权,其他国家再难与其竞争。超级霸权国家,何尝对其他国家真的仁慈。
随着AI发展,人类越来越多的工作被替代。像黑灯工厂不需要太多的工人。大家失业了,就没有收入,没有收入,就不能消费,不能消费,商品就卖不出去,商品卖不出去,就要裁员缩产。熟悉吗?经济危机是这么发生的。
可以想见,AI将会极大影响人类社会的发展。AI发展如此迅速,到底是喜是忧?让时间给出答案吧!
本文链接:https://yuchubao.com/chatgptxiazai/46.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介
网友评论