国产AI大模型高考成绩单出来了：讯飞星火获得综合第一

新智派 • 2024年6月11日下午3:14 • 科技 • 阅读 158

随着高考的落幕，全国各地的高三学子们终于可以卸下沉重的负担，轻松迎接假期。与往年不同的是，今年的高考战场上还有一支与众不同的队伍引人注目——国产人工智能大模型。

在这场特殊的高考中，包括搜狐科技、潇湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测，并公布了成绩。我们来一起回顾一下：

首先进行的是高考作文的评测。在搜狐科技的评测中，三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列，智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的“AI写作”评测中，讯飞星火不仅平均分位居首位，且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师，对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分，经过四位阅卷老师的综合打分，讯飞星火以49分的平均分高居首位。

给讯飞星火打出“全场最高分”56分的阅卷老师表示：“本文观点清晰，论述集中且层层推进，很多句子都简洁有力，颇有思想性。如果是某个学生写的，无疑是难得的佳作。”另外，从网友的热门评论中也能看出讯飞星火摘得高分的原因。

网友@2024：感觉星火好点，更像作文，有些更像回答问题。

网友@烟花绽放的节日：讯飞星火更有高考味。

接下来是数学科目的较量。在搜狐科技的数学评测中，讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队，智谱清言、阿里通义则以50%的正确率位居第二梯队，其他大模型相对落后。

在量子位的高考数学评测中，虽然没有给出详细成绩单，但展示了各家大模型详细的解题思路，交由网友打分，通过网友的投票打分可以看出，讯飞星火的“识图+解数学题”能力收到了最高认可，位居其后的分别是Kimi、通义千问、文心一言、豆包等。

最后是高考物理的测试。在量子位的评测中，阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队，而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题，在成功识别的题目中，商量和文心一言的正确率为2/4，即正确率为28.6%；豆包、天工、智谱清言正确率为1/2，即正确率为14.3%。

综合以上媒体在作文、数学、物理三门科目的成绩，我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名，通义千问、文心一言分别位列第二、第三名，而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

第一名：52.49 讯飞星火

第二名：46.08 通义千问

第三名：37.67 文心一言

第四名：34.68 Kimi

第五名：33.57 字节豆包

第六名：31.92 海螺AI

第七名：30.61 腾讯元宝

第八名：30.28 智谱清言

第九名：21.56 百川百小应

尽管评测方式可能不够严谨科学，但这次大模型高考无疑展示了国产人工智能在多个学科的优秀表现和长足进步，尤其是讯飞星火的表现堪称“文理兼修”！期待国产大模型再接再厉，在明年的高考中取得更加出色的成绩！

原创文章，作者：新智派，如若转载，请注明出处：https://knewsmart.com/archives/301077

0 0 打赏

微信扫一扫

关于作者

新智派

21.3K 文章

2 评论

1 粉丝

新智派首席客服代表

讯飞星火为何能成为多领域头部企业的首选？三个关键维度看领先地位

上一篇 2024年6月11日下午3:14

知乎“新职人好物节”里的荐书人：暑期童书，启发大于教育

下一篇 2024年6月13日上午11:14

科技

从数字屏幕到物理世界：全球首款机器人手机启动预约开启多模态具身交互新时代

7月18日，荣耀CEO李健在2026世界人工智能大会（WAIC 2026）提出，AI的演进必将脱离冰冷的工具属性，从操作系统到具身交互，全面迈向伙伴型的类人生命体，重构人与物理世界的关系，这就是人工智能时代的价值锚点。基…

新智派
1天前
324
科技

售价19.98万元起全新坦克300打造都市时尚新符号

7月19日，“自由去闯”全新坦克300在杭州电竞中心正式上市。新车全面升级，覆盖多种动力，全新坦克300L Hi4-T售价24.98万元、全新坦克300L Hi4-Z售价25.98万元；燃油版同步上市，全新坦克300 2.4T柴油版售价23.48万…

新智派
2天前
358
科技

锁定上海百货展，快手电商携20+品牌商家达人集结“播出百货好生意”

第119届中国日用百货商品交易会（以下简称“上海百货展”）将在上海新国际博览中心举行。快手电商将携20+日用家居百货品牌、商家、达人现场集结，通过线下展出+线上直播的形式，为所有快手老铁带来超多低价百…

新智派
2天前
406
科技

682亿曝光、 4660万人共创，快手以「老铁上场」打造全民体育主场

2026美加墨世界杯落下帷幕，阿根廷与西班牙的决赛之战仍引发着热烈讨论。但体育的魅力与精彩远不止于世界冠军和顶尖赛场，普通人的热爱与参与让我们在今年夏天看到了属于广大老铁精彩纷呈与热力四射的体育现场。今…

新智派
2天前
900
科技

比亚迪成为巴黎圣日耳曼官方合作伙伴

近日，比亚迪与巴黎圣日耳曼足球俱乐部（PSG）达成全球战略合作关系，这份合作直至 2029 年 6 月。此次合作汇聚两大全球品牌。双方秉持对创新、卓越与国际化发展的共同理念，在各自领域持续突破创新，并与全球数百…

新智派
3天前
1.5K
科技

容声冰箱全食材解决方案正式亮相，以“生态舱”食材储鲜藏住人间烟火气

长沙的夏夜，热浪裹着湘江的水汽扑面而来。 7月19日晚，一场名为容声蒙牛世界杯冠军之夜暨容声全食材养鲜解决方案发布会在这片“火热”之中拉开帷幕。这场发布会，更像一场关于“吃”的圆桌对谈。知名博主、家电行业资…

新智派
3天前
1.5K
科技

鲜翻全场！容声冰箱见证西班牙青春风暴，以“养鲜”制胜与冠军共鸣

北京时间7月20日凌晨，美国新泽西球场。当终场哨音像一把利刃划开湿热的天幕，西班牙队的少年们扑倒在草地上，泪水与汗水混在一起，折射出大力神杯金色的光芒。1:0，他们击败了卫冕冠军阿根廷，捧起了队史第二座世…

新智派
3天前
1.4K
科技

拼多多助力农资“包邮入村”：农户少跑路商家扩销路

炎炎夏日，在山东青州，两个做化肥生意的老板，最近都忙着招工。他们招的大多是周边村庄的女工——男人们外出打工了，她们在照料家庭之余，希望能有一份离家近的工作。在陈凯琪的公司，咨询电话每天响个不停，需要更…

新智派
5天前
1.9K
科技

魔法原子WAIC2026亮相Magic-VLA K02新任务打造物理AI平台大脑

7月17日，2026世界人工智能大会（WAIC）期间，魔法原子携自研通用具身大模型Magic-VLA K02最新成果亮相，并面向公众展示叠盒封胶、柔性衣物整理、行李箱收纳等多项复杂长程任务。展会现场，搭载Magic-VLA K02的机器…

新智派
5天前
2.3K
科技

面壁智能端侧模型落地三星盖乐世AI

7 月 15 日，国家网信办公布最新一批生成式AI服务备案名单，三星盖乐世 AI 等 7 款手机端侧 AI 产品通过备案。面壁智能 MiniCPM 系列作为三星盖乐世 AI 的端侧模型能力提供方，深度参与此次备案落地。作为唯一一家…

新智派
5天前
2.3K

发表回复

登录后才能评论

国产AI大模型高考成绩单出来了：讯飞星火获得综合第一

关于作者

相关推荐

发表回复