蚂蚁集团发布大模型安全一体化解决方案“蚁天鉴”。该方案包含了大模型安全检测平台“蚁鉴2.0”、大模型风险防御平台“天鉴”两大产品,拥有AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和可解释性检测等多项功能。这也是大模型浪潮以来首个可实现产业级应用的大模型安全检测与防御一体化解决方案。目前这两项产品已对外开放。

蚂蚁工作人员表示,大模型安全问题产生的本源主要为“用于训练的数据源头有毒、推理过程不可控、外部恶意诱导”三个因素。此次发布的“蚁天鉴”,主要从大模型安全性检测度量、智能风险防控、数据去毒对齐等方面,来保障大模型在生产和使用过程中更加安全、可控、可靠。


据蚂蚁方面介绍,“蚁鉴2.0”是业内首个产业级支持文本、图像等全数据类型的AI安全检测平台。它相当于站在“黑产”角度,通过智能攻击对抗技术,自动生成数百万的诱导性问题,对生成式大模型进行诱导式问答,并对大模型的回答实时、自动化的检测计算,24小时不眠不休“找茬”大模型存在的弱点和安全问题。


“蚁鉴2.0”最新实现对AIGC生成图片、视频等多模内容的“真伪”辨别和安全性检测,基于生成模型构建的近千万深度伪造样本,可快速分辨内容是机器生成还是人工生成,及是否存在伦理道德等风险。

责编:聚观365

此内容归聚观365整编发布,未经聚观365书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。


点赞(67)

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部