代码生成模型 Code Llama-34B 已在 HumanEval 测试中击败 GPT-4

品玩8月26日讯,据 phind 官方消息,研究团队在Phind 内部数据集上对 CodeLlama-34B 和 CodeLlama-34B-Python 进行微调之后发现,这两款模型微调之后在 HumanEval 测试中的通过率均已超过GPT-4在今年3月份的成绩。

Code Llama 是Meta发布的一款代码生成大模型,拥有7B、13B和34B三个尺寸,同时包含基础模型、Python专用版本等多款模型。 HumanEval  测试显示,未经过微调的CodeLlama-34B 和 CodeLlama-34B-Python 的通过率分别为48.8%和53.7%。

phind 研究团队通过在一个包含约 8 万个高质量编程问题和解决方案的专有数据集上对这两个模型进行了微调。这个数据集是 phind 研究团队内部推出的一个数据集,以指令-答案对为特征。这两个模型均经过了两次训练,训练量达到约16万个示例。此次训练并没有使用 LoRA(大语言低适应,一种微调方案),但研发团队对这两个模型进行了本地微调,并采用了 DeepSpeed ZeRO 3 和 Flash Attention 2 两种训练方法。训练耗时3小时,使用了32 个 A100-80GB GPU。研究团队表示,他们还对数据集采用了 OpenAI 给出的净化方案,确保结果有效且其中不含受污染的示例。

在经过测试之后发现,训练后的  CodeLlama-34B 通过率达到67.6% ,CodeLlama-34B-Python 的通过率达到69.5% 。而 GPT-4在今年3月份的成绩为67%。

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/196617

(0)
上一篇 2023年8月26日
下一篇 2023年8月26日

相关推荐

  • 员工挂“罪牌”戴纸托手铐引质疑,80后王云安创立的古茗又“翻车”了

    雷达财经鸿途出品 文|莫恩盟 编|深海 员工头挂“罪牌”、手戴形似手铐纸托的视频,将头部茶饮品牌古茗推至舆论的风口浪尖。被不少网友指责不尊重员工的舆论不断发酵后,古茗通过官方账号进行致歉:“对不起,我们玩梗…

    专栏 37分钟前
    6.8K
  • 精准学发布全球首个超拟人一对一AI老师

    作者:曾响铃 9月19日,在2024云栖大会上,一位可以给学生做学习计划、根据知识点讲课、能够培养和纠正学习习惯和方法的老师引起了巨大关注。与普通老师不同的是,这是一位依托于AI技术诞生的“超拟人AI一对一老师”…

    专栏 37分钟前
    6.5K
  • Gen.G与迪桑特合作发布新队服

    全球电子竞技公司Gen.G Esports宣布将携手运动品牌迪桑特推出2024英雄联盟全球总决赛(世界赛)纪念队服。这是迪桑特与电竞的首次跨界合作。由短袖队服和夹克组成的这套队服以白色为主,金色线条表现Gen.G LOGO,中间…

    发现 37分钟前
    6.2K
  • Gen.G与迪桑特合作发布新队服

    全球电子竞技公司Gen.G Esports(Gen.G)宣布将携手运动品牌迪桑特推出2024英雄联盟全球总决赛(世界赛)纪念队服。这是迪桑特与电竞的首次跨界合作,不仅为Gen.G征战2024世界赛提供支持,还设计了饱含对比赛信心和…

    发现 37分钟前
    5.4K
  • 国际商会发布第11版《广告和营销传播准则》

    全球最大的商业协会国际商会(ICC)呼吁广告商和营销商在面临行业混乱和自律挑战时,率先倡导健全的道德标准。ICC发布了《广告和营销传播准则》第11版,该准则85年来一直是全球广告行业自律的支柱。ICC指出,所有参与…

    发现 37分钟前
    6.0K
  • Cambrex新技术显著降低成本与环境影响

    Cambrex旗下公司Snapdragon Chemistry已成功开发出一种新型液相多肽合成 (LPPS) 技术,该技术利用传统的活性药物成分 (API) 批量反应器和连续流,避免了对专用固相反应器的依赖。与标准固态肽综合工艺相比,这种新…

    发现 37分钟前
    6.2K
  • 乐高与F1达成长期合作

    乐高集团与一级方程式赛车(F1)宣布建立新的长期战略合作伙伴关系,合作将从2025年F1赛季开始。此次合作将乐高积木拼搭的乐趣和F1的速度与激情巧妙融合,旨在将这项激动人心的运动带给全球更多家庭,让创新、技术与…

    发现 37分钟前
    5.5K
  • 普渡机器人发布初代类人形机器人PUDU D7

    9月19日,全球服务机器人领军企业普渡机器人发布其初代类人形机器人PUDU D7。基于仿生双臂和全向移动底盘设计,PUDU D7能够在多个场景中执行复杂任务操作,更好地满足跨行业客户的多样化需求。PUDU D7由普渡X实验室…

    发现 37分钟前
    5.6K
  • 欧洲首家锂精炼厂落成

    原材料公司AMG在德国Bitterfeld为欧洲首家锂精炼厂举行了落成典礼。该厂旨在帮助欧洲大陆提高电动汽车电池生产的独立性。Bitterfeld的新工厂是氢氧化锂精炼厂,每年将生产20,000吨氢氧化锂,供应匈牙利和波兰的正极…

    发现 37分钟前
    4.3K
  • TÜV莱茵与SID China启动显示行业新工作组

    TÜV莱茵与SID China共同发起的“显示产业链碳排放分析和计算方法工作组”和“独立第三方检测实验室工作组”正式成立。两个工作组旨在汇聚业界专家智慧,推进基础研究和技术交流,为显示行业发展提供有针对性的解决方案…

    发现 37分钟前
    5.2K

发表回复

登录后才能评论