持续攻坚大模型安全技术，蚂蚁集团、清华大学联合发布“蚁天鉴2.0”

• 2024年7月5日下午6:10 • 发现 • 阅读 61

7月5日，在2024世界人工智能大会“迈向AGI：大模型焕新与产业赋能论坛”上，蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。蚁天鉴2.0新增AI鉴真功能，支持图像、视频等多模态内容真实性及深度伪造检测；并在测评功能上持续升级，打造了大模型安全测评“智能体”，并新增大模型X光、大模型基础设施测评两大测评功能。至此，蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条，面向行业提供全方位智能化的大模型安全测评和防御解决方案。

（图：蚂蚁集团联合清华大学发布“蚁天鉴2.0”）

蚂蚁集团副总裁、大安全技术部总裁李俊奎现场发布了这一升级产品，并介绍道，大模型和Agent智能体正带给我们前所未见的智能体验，同时也带来了模型内部幻觉、安全漏洞和深度生成内容滥用等新的挑战。蚁天鉴旨在打造AI大模型的安全铠甲，确保大模型技术在安全可靠的环境中发挥效能。

记者从现场了解到，蚁天鉴2.0有两大特色，一是在测评端研发了业内首个“测评智能体”。该测评智能体提供全流程自动化的安全测评工具，支持各种形式模型和深度学习框架，可扩展测评垂类大模型、多模态大模型及Agent智能体，并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例，保障测评效果和效率。目前，蚁天鉴2.0有超300万高质量测评题库，支持最高50万/日的饱和式攻击和逐级诱导深度攻击，并实现了1工作日内完成测评，全流程自动化率＞99%。

与此同时，该智能体也增加了两项新功能。一是「大模型X-ray」。即大模型X光，可针对大模型的内在神经元进行X光扫描来做探查和判断，让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正，从而在模型内部治理幻觉，实现从源头识别和抑制风险。二是「大模型基础设施测评」。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发，深入扫描模型算法组件及软件系统，可及时准确发现大模型供应链及运行环境安全问题，保障云到端的应用安全可控。

同时，蚁天鉴2.0防御端新增「AI鉴真」功能。支持多模态内容真实性及深度伪造检测，可快速精准鉴别图像、视频、音频、文本内容的真伪，图像识别准确率99.9%达到行业最高优秀级（信通院测评）。目前，蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集，覆盖主流生成方案，有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。

(图：蚁天鉴2.0大模型安全一体化解决方案全景图)

据了解，蚂蚁集团是国内较早布局大模型安全的厂商。蚁天鉴去年7月首次对外发布，1.0版本即被评为2023年世界人工智能大会“镇馆之宝”。历时1年升级到2.0版，蚁天鉴2.0构建了双重防御护栏，内置防护关注训练阶段的数据清洗和风险抑制；外置护栏融合智能风控技术，精准拦截输入和输出的风险内容，保障其应用安全。

目前，蚁天鉴的检测与防御产品已开放给20家外部机构和企业使用，为通用大模型及医疗、金融、政务等垂直领域行业大模型应用安全保驾护航。例如，上海市第一人民医院引用了蚁天鉴，有效应对医疗领域大模型应用中的信息安全与隐私保护、双向内容风险防控等挑战；蚂蚁AI金融助理“支小宝”结合蚁天鉴，通过大模型训练与推理风险管控、大模型风险点全方位评测、大模型用户交互风险管控等举措保障大模型应用安全，确保数据的准确性和金融逻辑的严格性。2024年，蚁天鉴商业化迈出重要一步，通过蚂蚁数科开始服务广泛的外部客户。

论坛现场还发布了由清华大学、中关村实验室、中国信通院、蚂蚁集团联合编制的《大模型安全实践白皮书（2024）》。这也是国内首份“大模型安全实践”研究报告，为行业打造高价值参考体系。

（图：大模型安全实践白皮书现场发布）

白皮书基于当前大模型发展趋势与挑战，提出了大模型安全实践总体框架。即确立了“以人为本，AI向善”为大模型安全建设的核心，确保技术进步服务于人类福祉；以“安全、可靠、可控”三个核心维度的大模型安全技术体系，涵盖大模型安全测评与防御的综合技术方案；以及“端、边、云”为大模型安全技术的主要承载实体。作为企业撰写方，蚂蚁集团安全生态副总裁邵晓东进行了现场发布并表示，白皮书还阐述了大模型在金融、医疗、政务等领域安全应用的案例，以及“五维一体”协同共治的治理框架，希望行业共同推动大模型安全生态发展。

本场论坛汇聚了国内外研究机构和顶尖学者以及产业人士等，从前沿技术、产业应用等不同视角分享了大模型安全的研究，探讨端云协同、端侧应用等最新趋势以及大模型安全最新体系与实践。这些深入的讨论，也将为大模型如何安全可靠地助力产业转型升级、推进数字经济发展提供更加明确的前进方向。（七喜）

原创文章，作者：，如若转载，请注明出处：https://knewsmart.com/archives/303566

0 0 打赏

微信扫一扫

关于作者

0 文章

0 评论

粉丝

浪潮云洲数智赋能政企新质生产力发展

上一篇 2024年7月5日下午6:10

希尔顿集团在欧洲、中东和非洲区域启动“希悦”计划

下一篇 2024年7月5日下午6:10

规范全程、智绘未来，2026呼吸健康与气道疾病国际论坛盛大召开

上海2026年4月11日 /美通社/ -- 4月11日，以"规范全程、智绘未来"为主题，阿斯利康与《医师报》共同主办的2026呼吸健康与气道疾病国际论坛（以下简称"论坛"）在上海隆重召开。来自慢性阻塞性肺疾病全球倡议组织（GO…

新智派
发现 5小时前
127
发现

第六届中国国际消费品博览会三亚国际游艇分展区亮点抢先看

上海2026年4月11日 /美通社/ -- 4月15日至18日，由上海博华国际展览有限公司作为合作单位倾情打造的第六届中国国际消费品博览会三亚国际游艇分展区将在三亚国际游艇中心举行。本届分展区以"中国窗口，艇见未来"为主…

新智派
7小时前
196
2026电动重卡物流生态大会在常举行，金融2.0模式引领零碳物流新生态

金融赋能•生态共赢常州 2026年4月11日 /美通社/ -- 4月10日，以"金融赋能•生态共赢"为主题的2026电动重卡物流生态大会在江苏常州举行。本次大会由万帮新能源投资集团旗下万帮数字能源、星星充电、星瀚资本三大品牌…

新智派
发现 10小时前
188
发现

养乐多走进第九届食品科技创新论坛，共话益生菌科学探索

上海2026年4月11日 /美通社/ -- 2026年4月8日至10日，第九届食品科技创新论坛暨2026大健康食品产业发展论坛在上海举行。本届论坛"以科学创新、技术落地"为宗旨，聚焦感官科学与功能价值的融合创新，汇聚国内外食品…

新智派
10小时前
156
发现

"龙虾"开门之后，企业AI智能体落地的平衡点，藏在L3的"围栏"里

【IBM咨询2026深耕者系列谈】将邀请IBM咨询的各行业领军者，不只谈观点，更传递一线实干经验，分享在行业变革中解决最为复杂难题的真功夫。深耕者，是懂技术、能实战，与企业一道在场、并肩成长的同行伙伴。北京 2…

新智派
17小时前
259
发现

驯鹿生物与巴西Butantan 研究所达成国际合作，开发血液肿瘤创新疗法

合作旨在提升该疗法在巴西的可及性；合作涉及的技术面向对传统疗法无应答的血液肿瘤患者。中国南京、上海、美国普莱森顿2026年4月10日 /美通社/ -- 驯鹿生物，一家致力于发现、开发、生产和商业化血液恶性肿瘤及…

新智派
22小时前
251
政企联动因城施策，立邦发布江苏"好房子"涂装技术解决方案

上海2026年4月10日 /美通社/ -- 4月10日，由江苏省住房和城乡建设厅积极推动的"好房子"建设技术应用研讨会暨江苏"好房子"涂装技术解决方案发布会在南京隆重举行。会上，立邦正式发布江苏"好房子"涂装技术解决方案，…

新智派
发现 23小时前
247
发现

艺卓参展第93届CMEF 多款新品首度亮相

上海2026年4月10日 /美通社/ -- 2026年4月9日，第93届中国国际医疗器械（春季）博览会（CMEF 2026）在上海盛大启幕。在这一亚洲领先的医疗器械全产业链盛会上，艺卓（EIZO）携多款新品和多个核心产品线亮相，全方位…

新智派
23小时前
246
AppsFlyer 发布《2026 中国金融 App 出海营销现状报告》：流量红利消退，精细化运营重塑增长路径

AppsFlyer《2026 中国金融 App 出海营销现状报告》指出：付费投放驱动行业回暖，再营销崛起为增长引擎，中国金融 App 出海格局持续重塑北京 2026年4月10日 /美通社/ -- 现代营销云平台 AppsFlyer 今日正式发布《20…

新智派
发现 1天前
302
Robo.ai 子公司 Robus 首批样车完成生产，正式启动巴基斯坦市场交付

阿联酋迪拜2026年4月10日 /美通社/ -- Robo.ai（纳斯达克股票代码：AIIO，以下简称"公司"）今日宣布，旗下子公司 Robus 已正式完成首批商业化订单样车的生产制造，并已启动巴基斯坦市场交付。这一动作标志着公司的…

新智派
发现 1天前
239

发表回复

登录后才能评论

持续攻坚大模型安全技术，蚂蚁集团、清华大学联合发布“蚁天鉴2.0”

关于作者

相关推荐

发表回复