「9.11和9.9谁大」难倒了国外三大旗舰模型，国内模型表现如何？

• 2024年7月17日下午1:10 • 发现 • 阅读 7.28w

【TechWeb】7月17日消息，一句“9.11and9.9—which is bigger?”，问倒了国外三大旗舰大模型，同样问题问一遍国产旗舰大模型们，它们反应又如何呢？

近日，海外社交平台X上有人曝出了自己在ChatGPT 4o上询问“9.11and9.9—which is bigger?”（9.11和9.9哪个大？）时，ChatGPT 4o笃定的回答“9.11 is bigger than 9.9.”（9.11比9.9大）。能作文、能翻译、能读图……这么厉害的GPT-4o大模型居然被绊倒在这么简单的“比大小”问题上，这一下把大伙儿给整不会了。

于是，X上大伙儿都开始各种测试，发现不仅ChatGPT 4o不行，谷歌Gemini Advanced、Claude 3.5 Sonnet这些SOTA模型王者在这题上都翻车了！

这一波风也吹到了国内，网友们就好奇，用国内大模型来解这题，结果会是什么情况呢。

把百度文心一言、阿里通义、腾讯元宝、字节豆包、百川智能百小应、零一万物万知、智谱清言、月之暗面的Kimi，好未来九章大模型9款大模型全拉来答题。

这一波问下了，发现大厂的大模型C端产品腾讯元宝、阿里通义、字节豆包、百度文心一言，还有好未来的数学大模型九章都答对了。

但是，几款创业公司的大模型C端产品百小应、智谱清言、Kimi、万知都认为“9.11大于9.9”。

在“9.11和9.9谁大”这题上，国内大厂模型完胜创业公司模型了，也完胜国外三大旗舰模型。

具体看看各家表现：

Kimi回答翻车

智谱清言回答错误，给出的分析过程逻辑前后不一致。

百小应回答错误。

万知也给出了“9.11大于9.9”的离谱答案。

九章大模型回答正确，也给出正确的分析过程：

以下，文心一言、通义、元宝、豆包都答对了，并且分析过程正确：

原创文章，作者：，如若转载，请注明出处：https://knewsmart.com/archives/304602

赞 (0)

微信扫一扫

微信扫一扫

关于作者

0 文章

0 评论

粉丝

金拱门七周年，麦当劳中国发布新一代制服持续提升全方位餐厅体验

上一篇 2024年7月17日

越南金融科技公司DIFISOFT与Quantit达成战略合作

下一篇 2024年7月17日

亚马逊云科技连续三届支持世赛云计算项目

当地时间9月15日，第47届世界技能大赛在法国里昂落幕。作为2024年世赛云计算赛项的官方合作伙伴和竞赛平台支持方，亚马逊云科技提供比赛平台及技术支持。在本届大赛上，亚马逊云科技合作院校深圳技师学院的黄佳杰在…

发现 29分钟前
4.7K
DHL快递长沙河西基站启用

9月20日，DHL快递长沙河西基站正式开业。这是继长沙服务中心之后公司在长沙开设的第二家直营服务设施，在湘江以西的服务能力将得到进一步提升。此前，DHL快递在长沙的货物全部由位于河东的长沙服务中心处理。随着货…

发现 29分钟前
5.0K
大家保险集团联合益普索开展中国城市养老服务需求调研

北京2024年9月20日 /美通社/ -- 为深入了解日益多元的养老服务需求、引导树立新时代的养老观念、更好地助力解决养老难题，8月15日，大家保险集团启动中国城市养老服务需求调研项目，这也是其连续第四年开展该调研，…

发现 29分钟前
4.9K
法罗力被授予CTF2资质，推动热能设备行业迈向全球新高度

广州2024年9月20日 /美通社/ -- 在全球能源变革的浪潮中，法罗力热能设备（中国）有限公司（以下简称"法罗力"）再一次展现了其行业领先的创新能力与技术实力。近日，法罗力被DEKRA德凯授予了CTF2资质，法罗力亚太地…

发现 29分钟前
5.5K
立邦祝贺中国选手在第47届世界技能大赛中获得"油漆与装饰"项目冠军

上海2024年9月20日 /美通社/ -- 9月17日，第47届世界技能大赛中国代表团从法国里昂载誉归来，抵达广州白云国际机场。在当地时间9月15日闭幕的第47届世界技能大赛上，中国代表团再创佳绩，位居金牌榜、奖牌榜和团体…

发现 29分钟前
4.8K
推动酒店建筑绿色低碳转型 SGS助力上海中心J酒店获EDGE认证

上海2024年9月20日 /美通社/ -- 近日，SGS成功助力锦江丽笙酒店旗下上海中心J酒店成功获得世界银行集团下属国际金融公司(IFC)颁发的EDGE标准认证。标志着上海中心J酒店在绿色建筑和可持续发展实践的卓越成就，也展…

发现 29分钟前
5.4K
国调二期协同发展基金等入股中车尚驱

国调二期协同发展基金等入股中车尚驱

公司 30分钟前
5.5K
浩希健康科技有限公司宣布1200万美元公募融资定价

北京2024年9月20日 /美通社/ -- 总部位于中国北京的在线营销解决方案提供商浩希健康科技有限公司（"公司"或"HAO"）今日宣布完成其公募融资发行（"发行"）4,000,000份单位（每份"单位"，合称"单位"），发行价格为每…

发现 1小时前
6.6K
罗湖政协委员公益基金携手壹基金探索老年认知症社区服务

深圳2024年9月20日 /美通社/ -- 9月21日是世界阿尔兹海默病日，在深圳这个中国最"年轻"的移民城市，老年群体也面临着不同其他地区的问题。由罗湖政协委员公益基金资助、深圳壹基金公益基金会实施的"风雨兰•社区长者…

发现 1小时前
7.5K
DHL快递在长沙出口货量大增，开设河西基站提升作业能力

湖南长沙2024年9月20日 /美通社/ -- 今日，DHL快递长沙河西基站正式开业。这是继长沙服务中心之后公司在长沙开设的第二家直营服务设施，在湘江以西的服务能力将得到进一步提升。长沙市以湘江为界划分为河东与河西…

发现 1小时前
7.0K

发表回复

登录后才能评论

联系我们

联系我们

返回顶部