对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
11月18日消息,对标代推第日前,布新国内人工智能公司月之暗面推出的理模Kimi国产大模型正式发布k0-math。
k0-math是型中Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,考高考考通过模拟人脑的研全思考和反思过程,大幅提升解决数学难题的对标代推第能力。
据了解,布新在多项数学基准能力测试中,理模k0-math的型中表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
根据官方公布的考高考考结果,在中考、研全高考、对标代推第考研以及包含入门竞赛题的布新MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,理模拿下第一。
在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。
官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。
据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。
另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。
月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。
相关文章
[流言板]拿下!特伦特快攻三分空心命中,剩5分钟雄鹿领先到20分
[流言板]拿下!特伦特快攻三分空心命中,剩5分钟雄鹿领先到20分由篮球资讯发表在篮球资讯 50212月22日讯 今天NBA常规赛雄鹿主场迎战奇才的比赛正在进行中。比赛进行到第4节,特伦特快攻三分空心命2024-12-25- [流言板]狼队发文:我永远相信我们重庆狼队,北京见!由游戏电竞资讯发表在王者荣耀 kog11月10日讯 狼队发文:我永远相信我们重庆狼队,北京见!来源: 微博11月10日讯 狼队发文:我永远相信我们重2024-12-25
- 发行商SOEDESCO和开发商Among Giants宣布,自然沉浸模拟游戏《Albatroz》将于11月1日发售,登陆PS5、XSX和Steam平台,数字版售价29.99美元,实体版售价39.99美2024-12-25
- 主打魅力背枪玩点话题的人气枪战美少女游戏《胜利女神》陷入角色红莲:黑色暗影)抄袭事件,9月24日今天,官方承认错误正式致歉,并即时下架问题角色。·出问题的角色是在2023年12月28日实装上线版本“N2024-12-25
[流言板]NBA官推祝贺詹姆斯超越科沃尔,升至历史三分榜第7位
[流言板]NBA官推祝贺詹姆斯超越科沃尔,升至历史三分榜第7位由篮球资讯发表在篮球资讯 50212月05日讯 今日,湖人客场挑战热火。本场比赛,湖人前锋勒布朗-詹姆斯命中一记三分,这样他的生涯三分命中2024-12-25[流言板]恭喜狼队小胖(李达亨)达成KPL赛场【2500助攻】里程碑!
[流言板]恭喜狼队小胖李达亨)达成KPL赛场【2500助攻】里程碑!由游戏电竞资讯发表在王者荣耀 kog11月10日讯 恭喜狼队小胖李达亨)达成KPL赛场【2500助攻】里程碑!原文如下:【里程碑达成2024-12-25
最新评论