金融行业迎来大模型时代，存算基建成决胜关键

• 2023年9月21日下午2:21 • 发现 • 阅读 99

北京2023年9月21日 /美通社/ -- 去年年底，ChatGPT诞生，凭借强大、精准的自然语言理解和生成能力，令全球用户为之一震。

自此，各行各业纷纷投身大模型研发竞赛，掀起新一轮技术创新热潮。金融行业更是如此。如何构筑面向大模型时代的新型算力和存力基础设施，实现大模型能力向金融领域的迁移，成为金融机构热议的话题。

金融大模型在哪些场景有用武之地？

作为AI新基建，大模型在金融行业有着广泛的应用场景。

在前台，智能客服，是AI在金融领域最常见的应用方向之一。还记得钢铁侠电影里的AI管家贾维斯（Jarvis）么？金融大模型将大幅提升客户经理的专业水平和服务能力，大幅降低客户经理的运营成本，让每个人都拥有类似Jarvis的24小时在线的专业客户经理。

在中台，AI大模型有机会改变金融机构内知识获取、内容创作、会议与沟通、代码开发与测试的方式，提升内部办公效率，甚至引发研发测试模式变革，全方位提升金融机构内部运营效率。

在后台，大模型将成为智能科技底座的标配，大幅降低智能技术应用的门槛，只需少量标注数据就可以让智能技术覆盖广泛的场景。

总之，AI大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力，在金融行业有广泛的应用前景。

万卡规模、万亿参数，大模型有"高门槛"

大模型的快速迭代，需要高效算力和存储基础设施的加持。

一方面，算力是大模型的引擎。语言类、视觉类模型容量和相应的算力需求都在快速扩大，金融大模型发展的背后是庞大的算力支撑。如果用"算力当量"（PetaFlops/s-day，PD），即每秒千万亿次的计算机完整运行一天消耗的算力总量，来对人工智能任务所需算力总量进行度量，大模型训练需要几百甚至几千PD的算力支持，也意味着需要巨大的算力成本。

算力是大模型发展核心要素

例如，OpenAI在2020年推出的GPT-3，对算力的需求至少要上万颗A100 GPU，一次模型训练总算力消耗约3,640PD的算力。又如，浪潮信息推出的"源"中文语言大模型有近2500亿个模型参数，算力消耗达4000PD。再如，当前GPT-4和PaLM-2的算力当量已经达到GPT-3的数十倍。这还不算，谷歌正在开发的下一代多模态大模型Gemini，其训练量碾压GPT-4，达到后者5倍。

快速攀升的AI算力消耗，有限的IT预算，让大多数金融机构陷入两难境地：想做大模型，但资源匮乏、成本压力大、人才稀缺；不做大模型，又只能坐看机会错失。

对此，分而治之或许是一种可行的办法。所谓分，就是把大模型分为通用大模型和行业大模型。金融机构不用自己打造通用大模型，而是基于第三方的通用大模型，在此基础上专注打造行业大模型。根据信通院发布的《行业大模型标准体系及能力架构研究报告》，通用大模型缺乏专业知识和行业数据，而且构建和训练成本很高，难以实现商用。为更好解决特定行业为题，行业大模型应运而生。行业大模型可以满足特定场景需求，更好地为行业提供优质的服务，促进行业智能化转型升级。

浪潮信息AI服务器产品专家郭磊表示，"金融机构可以集中资源在行业大模型上，不是'在一千米的地上挖一米深的沟'，而是'在一米的地方挖一千米深'"。

大模型训练四个阶段

具体来看，大模型训练的第一阶段是无监督预训练阶段，训练周期往往持续数十天到数月，需要数千张GPU卡同时计算，算力消耗巨大，训练时间非常长，训练出来的模型是基础语言模型。金融机构可以通过使用开源平台或者第三方合作（如浪潮信息的"源"大模型），获得基础语言能力。第二到第四阶段是有监督精调阶段、奖励模型训练和强化学习，这3个阶段需要数十张乃至上百张GPU卡同时计算，算力消耗的规模和训练时长相比第一阶段都有明显下降，所以金融机构可以在这三个阶段进行训练，打造有金融行业优势的大模型。

另一方面，大模型光有算力远远不够，还取决于数据规模和数据质量。

大模型的优势在于海量信息的搜集、提取和分析能力，这是人类难以企及的。

近几年，通用大模型的参数量快速增长。2016年OpenAI发布Gym强化学习平台，2018年GPT-1问世，模型参数为1.17亿，经过不断迭代，GPT-4参数规模达到1.76万亿。Google从2017年发布Transformer（6500万参数）架构以来，陆续发布BERT（2018年，3亿参数）、T5（2019年，110亿参数），参数规模逐步提高。近期，Google发布通才模型PaLM-E，这是迄今为止全球最大的视觉语言模型，包含5620亿参数。

在垂直行业，金融大模型的数据集在通用大模型基础上还需包含诸如金融研报、股票、基金、银行、保险等方向的专业知识，通过在训练过程中加入大量金融对话数据并针对金融领域进行特定的预训练调优，提升其在金融垂直领域的表现。

同时，多模态、跨模态成为常态，金融大模型的数据类型变得更加丰富。其中无监督数据，即原始数据，数据格式可以是网页、文本或语音数据；有监督数据，即经过标注的数据，格式可以为json或Query。此外，为了给投资者提供实时市场舆情和风险预测等服务，金融机构还要高效处理金融行业新闻、股票交易，乃至社交评论等金融数据。这些巨量、多模态、实时的金融数据新需求、新特征，传统集中式存储难以应对，需要弹性、灵活的新型分布式存储架构来支撑。

由此可见，随着金融大模型的演进，整个数据中心的架构都会发生改变，从AI服务器、到存储、再到网络的全栈方案都需要适应大模型时代的需求。

基础设施如何"存得下、算得快、传得稳"

只有数据"存得下"、算力"算得快"、网络"传得稳"，数字基础设施才能充分发挥数据要素价值，推动大模型应用落地，带动新业态繁荣发展。

对此，浪潮信息基于智慧计算战略，从算力、算法、数据、互联四方面推进产品创新，为大模型打造强大底座。

算力方面，浪潮信息通过千亿参数规模的大模型创新实践，已在算力集群构建、算力调度部署、算法模型开发等方面，构建起全栈领先的大模型算力系统解决方案，助力大模型训练开发。其中最新一代融合架构的AI训练服务器NF5688G7采用Hopper架构的GPU, 较上代平台大模型实测性能提升近7倍，同时支持最新的液冷解决方案，可实现更低的集群能耗比与运行成本，PUE小于1.15，以一个4000卡的智算中心为例，每年可节电620万度、降碳1700吨。

存储方面，浪潮信息生成式AI存储解决方案用一套AS13000融合存储支撑生成式AI的全阶段应用，提供全闪、混闪、带库、光盘四种介质，支持文件、对象、大数据、视频、块多种协议。结合AIGC数据处理的五个阶段：数据采集、准备、训练、推理和归档，浪潮信息由同一套存储提供端到端的数据流支持，满足文本、音频、图像、视频、代码等多模态数据的存储和处理需求。

浪潮信息存储产品

在集群高速互联层面，浪潮信息基于原生RDMA实现整个集群的全线速组网，并对网络拓扑进行优化，可以有效消除混合计算的计算瓶颈，确保集群在大模型训练时始终处于最佳状态。

当前，国有大行、股份制银行以及部分城商行，均已经开展或计划开展金融大模型研发，AI算力和数据基建将迎来高速发展。根据IDC预测，未来5年中国智能算力规模的年复合增长率将达52%，分布式存储增速将达到中国市场增速的2倍。大模型时代，金融机构需要以AI的场景、架构为抓手，结合各行的数据特点，打造新一代智算基础设施。

原创文章，作者：，如若转载，请注明出处：https://knewsmart.com/archives/209322

0 0 打赏

微信扫一扫

关于作者

0 文章

0 评论

粉丝

夯实可持续领航者 Intertek收购太阳能全球龙头CEA

上一篇 2022年8月15日上午11:57

浪潮网络精彩亮相OCP China Day大会

下一篇 2022年8月15日上午11:57

发现

第三代元PLUS 11.99万元起正式上市全系搭载第二代刀片电池及闪充技术

5月21日，比亚迪第三代元PLUS正式上市，官方指导价11.99万-14.99万。新车定位元力智趣闪充SUV，凭借全能产品力契合元气青年、年轻家庭与科技实用派的多元出行需求，以全球车品质与年轻姿态解锁高品质纯电出…

新智派
2026年5月21日
4.8K
发现

人均16本？2026全国职场人阅读调查来了！

本雅明在一百年前写下过一个诊断：我们生活在一个体验超载的时代，但内心却感到贫乏，似乎没什么能真正沉淀下来。他把那种可传承、能生根的深厚经验称为“Erfahrung”，而把那些孤立的、转瞬即逝的刺激称为“Erlebnis…

新智派
2026年4月27日
14.2K
发现

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

一壶武夷岩茶，升腾起连接东西方的氤氲热气。近日，《哈萨比斯：谷歌AI之脑》作者塞巴斯蒂安·马拉比，与华为管理顾问田涛展开了一场深度对话，整整2个小时，围绕人类“重构巴别塔”的雄心与野心，两位观察家在茶香中…

新智派
2026年4月20日
11.1K
发现

为什么我们还要读书？世界总有答案

OpenClaw能打开浏览器、查资料、写邮件、填表格——像一个不睡觉的实习生。 Gemini CLI能一口气吞下整个代码库，三秒钟给你一份精准的优化建议。 MGIE动动嘴就能修图，连软件都不用打开。 2026年，这些AI智能体不再是…

新智派
2026年4月20日
7.6K
发现

博世舒适科技日立冷热科技亮相中国制冷展，以绿色与智能引领行业升级

北京2026年4月17日 /美通社/ -- 在2026中国制冷展期间，博世舒适科技集团日立冷热科技集中展示了覆盖压缩机、空调系统及大型机组在内的全系列产品与解决方案。围绕绿色低碳与智能化发展趋势，公司正加快由单一设备…

新智派
2026年4月17日
3.2K
新智•新速•新未来｜OCS 2.0-SPE工业控制系统新品发布暨OCS@NIICA生态合作伙伴签约仪式圆满举行

北京2026年4月17日 /美通社/ -- 2026年4月16日，"OCS 2.0-SPE工业控制系统新品发布暨OCS@NIICA生态合作伙伴签约仪式"圆满举行。本次会议汇聚行业认证机构、核心技术伙伴及生态厂商，共同见证新一代工业控制技术的诞…

新智派
发现 2026年4月17日
5.6K
以责任赋能发展以初心传递温度 -- 中通快递正式发布 2025 年度可持续发展报告

上海2026年4月17日 /美通社/ -- 2026年4月17日，中国行业领先且快速成长的快递公司中通快递（开曼）有限公司（纽交所代码：ZTO及香港联交所代号：2057）（"中通"或"公司"）正式发布了2025年度可持续发展报告。这是…

新智派
发现 2026年4月17日
10.7K
水隐之触悦然心生 GROHE SPA水悦淋浴系统耀世登场

设计美学：采用高特朗水悦恒温控制面板，内嵌式按钮设计让科技隐于无形。核心技术：模块化创新设计搭配SmartControl控温技术，一键精准调控个性化组合。感官体验：宽大的顶洒与情绪调频式手持花洒结合，打造沉浸…

新智派
发现 2026年4月17日
3.0K
雅诗兰黛集团连续第六年参展中国国际消费品博览会，彰显深耕海南的长期承诺

海口2026年4月17日 /美通社/ -- 作为世界领先的优质护肤品、彩妆、香水和护发产品的制造商与营销商，雅诗兰黛集团连续第六年亮相中国国际消费品博览会（以下简称"消博会"）。围绕"重塑美妆新境，焕启致美之旅"的主…

新智派
发现 2026年4月17日
3.2K
发现

毛源昌眼镜亮相消博会，向世界讲述中华老字号新故事

杭州2026年4月17日 /美通社/ -- 4月13日-18日，第六届中国国际消费品博览会在海南海口举行。毛源昌眼镜作为商务部首批认定的"中华老字号"受邀参展，在老字号"镇店之宝"专题展示区，向全球客商呈现百年品牌的文化底…

新智派
2026年4月17日
2.7K

发表回复

登录后才能评论

金融行业迎来大模型时代，存算基建成决胜关键

关于作者

相关推荐

发表回复