大模型晚报|百川智能发布Baichuan-13B

大语言资讯:

百川智能发布Baichuan-13B

百川智能正式发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。

据介绍,Baichuan-13B中英文大模型集高性能、完全开源、免费可商用等诸多优势于一身,是目前所有33B以下尺寸开源模型中效果最好的可商用大语言模型。相比此前发布的Baichuan-7B,Baichuan-13B在1.4万亿token数据集上训练,超过LLaMA-13B 40%,是当前开源13B尺寸下训练数据量最大的模型

ChatGPT 向付费用户开发 Code Interpreter 插件

 OpenAI近日宣布,Code Interpreter 的Beta版向所有ChatGPT的付费用户(即ChatGPT Plus)开放。

Code Interpreter 可以略去代码过程,通过自然语言交互,直接得出结果。在 Code Interpreter 模式下,用户可以用它实现读取上传文件、执行代码、生成图表、统计分析等功能。

GPT-4被破解,训练成本,模型架构的秘密都被挖出来了?

SemiAnalysis的DYLAN PATEL和DYLAN PATEL发布了一个关于GPT-4的技术信息,包括GPT-4的架构、参数数量、训练成本、训练数据集等。

DYLAN PATEL和DYLAN PATEL表示,GPT-4比GPT-3大10倍,估计参数数量在120层、1.8万亿左右。GPT-4在约13万亿tokens上训练。这不是指不同的token数量,是根据epochs计算使用的token数量。OpenAI训练GPT-4的FLOPS约2.15e25,在2.5万个A100上训练了90-100天左右时间(MFU约32%到36%),如果是一个A100约1美元,那么训练成本约6300万美元(如果现在使用H100可能只要2150万美元)。

文章预测,未来几年,谷歌、Meta、OpenAI/微软等多家公司将在价值超过千亿元的超级计算机上训练模型。

英伟达将占AI芯片市场至少九成份额

花旗研究分析师Christopher Danely在周一的报告中表示,英伟达将占据AI芯片市场“至少90%”的市场份额,AMD位居第二。

Danely指出,上一代AI芯片(分别是MI250和A100) 中,AMD的硬件速度大约是英伟达的80%,而英伟达的H100与AMD的MI300相比,也具有类似的优势。

伊利诺伊大学推出新方法,利用大模型在水下导航

 springeropen 页面显示,伊利诺伊大学厄巴纳-香槟分校学者近日发布论文,称可以利用 AI 大模型在水下进行导航。

研究团队借助水下相机在不同的水下地区拍摄了约1000万张相片,并利用这些图片对大模型进行训练研究团队表示可以在最深 300 米以上进行水下定位,识别精度在 40-50 公里。

微软推出人工智能模型CoDi,可互动和生成多模态内容

微软近日推出了名为可组合扩散模型(CoDi),这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。

CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。

微软旗下全新 Microsoft Store AI Hub 现已开始推出

微软之前在 Build 大会上宣布的新 Microsoft Store AI Hub 功能现已开始面向 Canary 用户以及 Dev 用户推出。

Microsoft Store AI Hub 是由微软和开发者社区共同构建的 AI Hub,旨在提供最佳的 AI 体验。今年 5 月,微软在 Build 大会上宣布将 AI 的力量引入 Windows 11,并将通过 Windows Copilot 和 Dev Home 为用户和开发人员开启生产力新时代。

科大讯飞:讯飞星火认知大模型全面开放商用时间可期

科大讯飞7月11日披露投资者关系活动记录表显示,科大讯飞积极应对风险,在大模型价值观管理、用户隐私保护等方面都做了积极准备。

科大讯飞表示,相信只要坚持按照监管部门的要求,积极稳妥推进大模型技术攻关的同时,有效防范生成式人工智能风险,讯飞星火认知大模型全面开放商用时间可期,我们有信心成为第一批的厂商。

GenAI子公司获准加入英伟达初创加速计划

GenAI公司7月10日宣布,全资子公司Pulse AI已获准加入英伟达初创加速计划,并已发出采购订单,购买价值约180万美元的硬件,每年可提供超过35万小时的人工智能计算时间。

AI 工具每年或可帮助企业员工节省 390 个小时的工作时间

 HRNEWS 报道, Visier 的最新报告显示,借助AI工具每年可帮助企业员工节省 390 个小时的工作时间。

数据显示,在已经采用 AI 工具辅助工作的英国员工平均每天节省了1.55小时的工作时间。此外,调查显示有56%的受访者表示他们的雇主还没有接受使用 AI 工具来提高生产力。

腾讯 AI 登顶国际麻将平台并刷新全球最好成绩

腾讯官方今日宣布,腾讯 AI 登顶国际麻将平台,在日本麻将天凤平台特上房达到稳定段位 10.68 段,刷新了 AI 在麻将领域取得的最好成绩。

目前排名前三的麻将 AI 分别为绝艺 LuckyJ、Suphx 以及 NAGA。绝艺 LuckyJ 花了一千多局就达到了 10 段,在特上房所有对战数超过 1000 把的注册玩家,稳定段位历史排名第一。

重点论文:

Google DeepMind 学者研发Focused Transformer ,扩展大模型输出长度限制

 Arxiv 页面显示,Google DeepMind 研究团队近日联手华沙大学和波兰科学院等机构,研发一项名为 Focused Transformer 的技术。

Focused Transformer 技术通过对比训练来增强 (key, value) 空间的结构,从而扩展了上下文长度。这项技术使得已经预训练的大型语言模型可以被重新训练来延长它们的有效上下文。

经过实验,研究团队已经成功使用 LongLLaMA 模型在密码检索任务中实现了256K的上下文长度。

论文地址:点此前往

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/172066

(0)
上一篇 2023年7月11日 下午5:58
下一篇 2023年7月11日 下午6:57

相关推荐

  • 积极趋势显现,从阿里健康财报看长期价值

    分析大健康公司的发展态势并推测其未来走向,解读其财报是一条捷径。 11月13日,阿里健康发布2025财年中期业绩公告。财报显示,截至2024年9月30日止6个月内,阿里健康营收142.7亿元,同比增长10.2%;净利润达7.69亿…

    专栏 31分钟前
    7.1K
  • 这个热度飙升的赛道,正在悄悄搞定5亿人

    对所有运动户外服饰品牌来说,从“爆红”走向“长红”的关键,一是好产品,二是好内容。 来源|极点商业 作者|Cindy 刘霞 编辑|杨 铭 “今年有意想不到的消费热情。” 谈及最近双11的忙碌状态,迪卡侬抖音电商渠道负责人陈…

    专栏 31分钟前
    5.0K
  • 上新50分钟破百万元,单品均价超3000元的潮牌什么来头?

    来源 / 财经故事会 顺风、造风而不跟风,品牌独特调性和平台流行趋势的交叉地带,隐藏着确定性的增长机会。 采写/万天南 编辑/陈纪英 时尚会过去,但风格永存。 香奈儿的这句名言,或许是所有设计师潮牌的共识——…

    专栏 31分钟前
    6.0K
  • 京东2024年三季度收入加速增长 活跃用户和购物频次保持双位数增长

    作者:美股研究社 北京时间11月14日,京东集团【纳斯达克代码:JD,港交所代号:9618(港币柜台)及89618(人民币柜台)】发布了2024年三季度业绩。随着越来越多的用户在京东体验到“又便宜又好”的产品与服务,季度…

    专栏 31分钟前
    6.2K
  • 当代年轻人,正从百吋大电视收获情绪价值

    “二十多块的视频会员我到处借,但上万元的百吋电视我说买就买了。” 00后木木是个典型的游戏迷,前不久心爱的国产游戏《黑神话:悟空》发售后,他果断买了一台100英寸的海信大电视,只为更好的游戏画质和体验。 “别…

    专栏 31分钟前
    7.9K
  • 黑医美围猎“县城贵妇”

    来源 / 互联网那些事 《2023年医美人群洞察报告》指出,我国在2022年共有2093万名医美消费者,在2023年共有2354万名医美消费者,涨幅数据为12.5%。倘若站在城市县级角度去观察市场,我们就会发现四级及以下城市体验…

    专栏 31分钟前
    5.2K
  • 今年双11,8成年轻人青睐国潮

    出品/新摘商业评论 时至今日,大众对“国潮”一词早已不觉新鲜,但让人很意外的是,国潮本身的热力值却丝毫不减。最近,中国青年报社主办了一场2024青年国潮平台大会,很多人就再次为国潮热度感到震撼。 大会发布了最…

    专栏 32分钟前
    6.0K
  • 问界理想的新擂台:问界M8 VS理想L8

    作者:刘旷 要说近年来什么行业最“卷”,相信绝大多数人都会提名新能源汽车行业。事实也正是如此,伴随着消费者需求的提升、技术的持续迭代升级,新能源汽车正以前所未有之势迅速发展。为了在不断扩大的市场中获得更…

    专栏 32分钟前
    6.7K
  • 李子柒归来,牵扯许多人情世故?

    雷达财经出品 文|孟帅 编|深海 “这个大漆视频迟到了四年”,1200多个日日夜夜过后,李子柒终于回来了! 此番回归,李子柒带着满满的诚意和热情,两天内连续发布了三条视频,堪称“腹泻式”更新,让不少粉丝直呼“仿佛过…

    专栏 32分钟前
    6.6K
  • 魅族的“AI生态战略”,“投资人”苏静玩得转?

    文 | 智能相对论 作者 | 佘凯文 前不久,那个曾被称为国产机神的品牌——魅族,因一场发布会再次进入大众视野。 之所以被关注,是因为发布会上除了魅族Lucky 08 AI手机的发布,还发布了AR智能眼镜StarV View、StarV A…

    专栏 32分钟前
    5.2K

发表回复

登录后才能评论