给力!南开团队刷新图像生成模型质量和速度!浪潮信息AIStation支撑

北京2024年9月24日 /美通社/ -- 只要输入提示文字,大模型就能给我们高度拟真、准确的图像,相信很多人已经体验到这种前沿且酷炫的图像创作方式,这背后其实是能力强大的图像生成模型做支撑。

目前诸如Sora等前沿图像生成模型,基于的主体架构都是Diffusion Transformer(DiT)。DiT可以将生成模型扩展到更大的模型规模,从而实现高质量的图像生成。然而更大的模型规模导致训练成本飙升,为此,南开大学计算机学院研发了Masked Diffusion Transformer(MDT)图像生成模型,相比DiT训练速度提升10倍以上,实现了ImageNet Benchmark上1.58的FID score,再次刷新SOTA图像生成质量和学习速度。相关论文已在计算机视觉顶级会议ICCV 2023(计算机视觉国际大会)发表。

MDT开发和训练的背后需要强大的AI算力资源支持,为了建设满足MDT开发和训练需求的AI算力平台,南开大学与浪潮信息合作,借助浪潮信息AI服务器构建强大算力资源池,利用AIStation智能业务生产创新平台实现算力高效分发,提高计算资源利用率,加速MDT图像生成模型训练。

大模型创新面临海量算力资源挑战

DiT虽然在图像生成领域取得了显著的成功,但是DiT往往难以高效地学习图像中物体各部分之间的语义关系,这一局限性导致了训练过程的低收敛效率,经常需要数十万次地迭代训练才能生成高质量的图像。为了降低训练成本,提升训练效率,南开大学计算机学院程明明教授团队开展了大模型领域的深度研究,MDT就是重要科研成果之一。MDT利用mask modeling表征学习策略,增强DiT对上下文语义信息的学习能力,进而提升图像生成的质量和学习速度。

大模型技术进步的背后离不开强大算力的支持,为了进一步提升MDT的开发和训练效率,同时实现算力成本效益的最大化,南开大学对算力基础设施的建设提出了如下诉求:

需要强大的AI算力资源支持。以程明明教授团队为例,研发高峰期甚至需要付费租用更昂贵的云算力资源,特别是按照新引进的团队规模,现有设备的峰值算力已经无法满足科研需求,亟需构建高质量的算力资源池;

快速构建大模型开发环境,提高模型训练效率。大模型训练环境配置、框架匹配与参数调整经常会耗费大量的人力与物力,还可能会碰到环境算法配置复杂、模型结构多样适配繁琐等问题,这会耽误宝贵的模型研发时间;

算力资源高效调度,降低算力使用成本。大模型训练的不同任务、不同阶段对于算力的需求有着明显的波动性,如果无法精准调度算力资源,不仅会造成冗余算力在平常时段的闲置浪费,导致算力成本大幅提升,也很难满足资源高效管理调度的需求。

提升AI算力利用效率 加快大模型开发

南开大学采用了浪潮信息提供的算力方案,该方案包括浪潮信息高性能AI服务器、网络交换机、存储系统,满足模型训练过程中对算力资源的需求。同时,为了最大化利用AI算力资源、提升大模型开发效率,南开大学利用AIStation平台实现AI算力资源的高效调度。

全新升级的AIStation具备全面的大模型流程支持能力,帮助用户低门槛构建大模型微调任务,提供标准、安全的大模型推理服务,并针对大模型业务资源需求优化了算力管理功能,助力南开大学快速开展大模型业务创新与落地,获得稳定、高效、易用、高精度的大模型服务。

浪潮信息AIStation为大模型训练提供有力支持,助力南开大学的大模型开发能力:

构建端到端的大模型开发流程:AIStation支持端到端的大模型开发流程,支持TensorFlow、PyTorch、MxNet等主流大模型框架以及GoogleNet/VGG/ResNet等网络模型,一台GPU服务器可运行多种框架环境,并实现快速切换。AIStation通过自动环境部署和AI工作流,将MDT的开发准备时间大幅缩短,帮助南开大学有效降低构建大模型开发环境和训练任务等门槛。

提升AI算力资源利用率:AIStation支持更加细粒度的分配调度算力,帮助南开大学为每项AI训练任务合理匹配AI算力资源,实现资源的高效利用。针对MDT等优先级较高的应用,AIStation可设置GPU、CPU、内存数量,硬件资源隔离,应用环境独立,各应用之间互不影响。

实现算力资源快速调度:AIStation简化了算力调度和模型开发流程,实现了业务按需使用、秒级下发,并实现大模型实验室不同团队共用流程、共享环境,开发者与算力高效协同。平台还提供了实时、可视化的数据支持,支持训练进度、训练结果、资源利用情况等数据的可视化展示,助力南开大学精准进行算力调度。

浪潮信息提供的算力解决方案,为南开大学程明明教授团队在图像生成领域的研究提供了强大的算力支持和高效的资源调度能力,显著提升了MDT图像生成模型的训练速度和图像质量,对于艺术创作、游戏开发乃至医学影像分析等领域都有重大潜力。

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/310963

(0)
上一篇 4天前
下一篇 4天前

相关推荐

  • 中国算力大会召开,业界首个算力高质量评估体系发布

    北京2024年9月28日 /美通社/ -- 9月27日,我国算力产业领域的顶级盛会——中国算力大会在郑州召开,会上浪潮信息联合信通院发布了《人工智能算力高质量发展评估体系报告》(以下简称报告)。报告首次完整地构建了人工…

    发现 16小时前
    14.0K
  • 京东「送装一体」:电视行业增长的一块重要拼图

    来源 / 节点财经 文 / 六金  家电市场已经由单一的“增量时代”迈向了“增量与存量并重”的新阶段。数据显示,当前我国正处于家电报废的高峰期,每年有1亿至1.2亿的废旧家电被淘汰,并以平均每年20%的幅度增长。       …

    专栏 18小时前
    20.9K
  • “冰桶挑战”十年回归背后:互联网公益正走向长期主义

    涓涓善意细流汇成公益江海。“冰桶挑战”、WeTalk等诸多公益活动汇聚在一起,也就如同蝴蝶效应,让公益在互联网上触手可及,甚至成为很多网友日常生活的一部分。 作者|极点商业 作者|刘珊珊 编辑|杨 铭 将几大袋冰块…

    专栏 18小时前
    19.8K
  • 新茶饮卷出海,本土化成胜败关键

    爱·扬格说:“在那海水酣睡的宫殿里,铺满了多少奇珍异宝。”如今,新茶饮品牌正掀起出海狂潮,挖掘来自海外市场的财富机会。 近日,茶百道股价实现十连涨。消息面上,公司在韩国首尔建大站新店正式对外营业。根据茶…

    专栏 18小时前
    21.1K
  • 短剧向左,体育向右,快手前途未卜?

    最近,辗转于多项业务的快手收到了来自于市场“寓褒于贬”的评价。 麦格理发表报告表示,短剧业务正成为快手近期新的增长动力,亦维持对快手的正面看法,给予“跑赢大市”评级,预期上市前投资者出售2%股份对基本面没有…

    专栏 18小时前
    16.7K
  • 中小企业AI大变革,云栖大会上这些值得关注

    今年云栖大会的主题是“云启智跃·产业蝶变”。好,那问题来了:怎么跃?怎么变?倪叔的答案是:在一起。谁跟谁在一起?当然是阿里云和中小企业在一起,在一起就能百业创新,浪潮迭起。 在2024云栖大会中小企业AI创新…

    专栏 18小时前
    19.6K
  • “天翼云息壤杯”高校AI大赛开启:国云的一场“造林”计划

    文 | 智能相对论 作者 | 叶远风 2024年年初《政府工作报告》中明确提到了“人工智能+”行动,人工智能的发展被提到前所未有的高度。 如何落实AI在数字经济发展中引擎作用,是业界当下面临的课题。 9月25日,“2024年中…

    专栏 18小时前
    20.9K
  • 史诗级真金白银利好,喜迎指基的海阔天空

    来源 / 互联网那些事 最近,朋友圈被两拨人刷屏。 一拨是一起赚钱的好“基”友,彻底感受到什么叫触底反弹。 股市基金市场彻底摆脱前段时间的干涸,直接涨到“洪涝”:A股大涨站上3000点,白酒股全线爆发,地产股掀涨停…

    专栏 18小时前
    22.0K
  • 在成都建“圈”五年,鲲鹏让智能化新风吹遍巴蜀大地

    来源 / Alter 科技圈里流行着“互联网四大中心”的说法,即南边的深圳、东边的杭州、北边的北京和西边的成都。 深圳、杭州、北京几乎没有太大的争议,这里是国内著名的互联网公司聚集地,有着国内排行前三的互联网企…

    专栏 18小时前
    20.1K
  • 国货美妆,没有大牌命?

    这几年,一个明显的趋势是,用国货美妆的人越来越多了。比如越来越多的韩系日系欧美系美妆品牌逐渐退出中国市场。据不完全统计,上半年至少超过20个品牌宣布闭店或者退出中国,甚至有曾经大火的贝玲妃、NYX等等。就…

    发现 18小时前
    13.9K

发表回复

登录后才能评论