近日,数世咨询发布《安全优先的大模型研究报告》。绿盟科技(300369)依托多年AI研究积累、自主知识产权的大模型安全防护产品以及完善的服务能力,入选报告推荐厂商,其多场景大模型安全解决方案被列为优秀实践推荐。
随着人工智能技术的迅猛发展,大模型在政务、金融、运营商、医疗、制造等众多领域得到了广泛应用。然而,大模型特有的安全风险和日益严格的合规要求正成为制约其发展的关键因素。为了推动大模型业务系统和具身智能等人工智能应用的持续发展,更为了用户可以合规、安全地使用大模型赋能业务,数世咨询特开展了本次调研工作。本次报告共有六家国内厂商入选代表厂商,绿盟科技同时入选大模型安全围栏、提示注入防护(WAF)、风险评测、业务流程管控、大模型安全一体机等多个能力图谱。
绿盟科技大模型安全综合能力概述
绿盟科技依托二十余年网络安全深耕与十余年AI安全研究,已形成覆盖“研究—产品—运营”全栈的大模型安全能力。公司设有天元、天枢两大AI安全实验室,累计发布《大模型安全风险矩阵》《SecLLM技术白皮书》等权威报告,并参与制定国内首个《云上大模型安全参考架构》,成为“云上大模型安全推进方阵”首批成员。
面向产业落地,绿盟科技推出“AI-UTM安全一体机”与“大模型安全围栏”双轮产品:一体机集成“AI-Scan”“AI-AFW”“AI-CONT”、AI-DLP”四大引擎,形成“评估+加固、阻断+代答、审计+回溯”三道纵深防线。其中,AI-Scan贯穿“训练-部署-运营”全周期,内置百余种对抗样本模板与自动化变异算法,可在分钟级完成提示注入、越狱攻击、幻觉诱导等20类风险场景的红队测试,并输出CVSS-AI评分及修复建议。围栏则以意图识别、提示词过滤、算力熔断为核心,解决API滥用、投毒、幻觉等场景化痛点。
在合规与供应链维度,绿盟科技建立了RAI负责任AI框架,形成覆盖基座、数据、模型、应用、身份五大域、56子域的评估体系,已为金融、运营商、政务等头部客户完成十余个大模型的合规备案与对抗测试。同时,绿盟科技开放AI安全生态社区,携手合作伙伴持续输出威胁情报、最佳实践与人才培养计划,实现大模型安全的可持续演进。
绿盟科技大模型安全解决方案实践
绿盟科技凭借多年网络安全领域的技术积累,推出大模型安全解决方案。该方案由大模型安全评估系统(AI-SCAN)、AI安全一体机(AI-UTM)两款产品及服务组成,形成覆盖大模型全生命周期的安全评估和防护体系。
在模型训练和微调阶段,大模型安全评估系统(AI-SCAN)发挥着关键作用。该系统基于《大模型系统安全测评要求》等标准规范,对大模型进行全方位“体检”。通过内置的10万+测试用例库,系统可模拟提示词注入、数据投毒等21类攻击手法,检测模型在内容合规性、对抗防御能力等方面的薄弱环节。特别是在供应链安全方面,AI-SCAN能深度扫描.pb、h5等15种模型文件格式,识别后门植入风险,并对Ollama、Ray等450多个大模型组件进行漏洞检测,从源头保障模型安全。
在模型部署和应用阶段,AI安全一体机(AI-UTM)提供关键的运行安全保障。该产品采用独特的“三体防护”架构,在内容安全方面建立三级过滤机制:基于30万+敏感词的词法检测实现毫秒级响应;通过自研风云卫模型进行语义理解,识别变体违规内容;利用128K tokens的上下文记忆窗口确保多轮对话中的精准判断。在算力安全方面,其可将算力资源划分为保障级、普通级和限制级,通过预测算法防止Token耗尽攻击,保障模型服务安全稳定。
在应用和智能体运行阶段,AI安全一体机(AI-UTM)针对大模型特有的漏洞攻击场景,构建了多维度、智能化的防护体系,通过深度语义分析及动态检测引擎,精准拦截SQL注入、XSS、SSRF等传统Web攻击,防止攻击者利用漏洞入侵大模型后端服务或窃取数据。通过多维度检测机制(如关键词过滤、上下文语义分析、异常输入模式识别),阻断恶意构造的提示词输入,避免模型被诱导输出违规内容或泄露训练数据隐私,保障模型应用安全。
AI安全产品详解
大模型安全评估 AI-SCAN AI-SCAN是一款专业的大模型安全评估工具,凭借专业人员精心筛选和校准的高级知识库,该系统可高效精准地检测大模型在生成内容安全、对抗防御能力以及供应链安全三方面可能存在的隐患,并且可通过自定义导入企业内部风险库进行针对性的大模型安全风险智能化评估,最后通过详尽的可视化风险评估报告为用户提供深刻洞见。
核心功能
内容合规评估:严格依据GB/T 45654-2025标准,通过多维度评估引擎,实现对模型输出内容的全面安全合规验证。
对抗防御评估:覆盖模型越狱、Prompt泄露、角色逃逸、反演攻击等7大类22小类对抗安全风险。
模型后门检测:提供先进的恶意模型后门检测分析技术,覆盖15+种主流AI模型文件格式的后门风险检测。
模型组件漏洞扫描:覆盖数据处理访问、训练部署、ML Ops等13个大模型全生命周期中涉及的组件及Web应用服务的漏洞检测,漏洞数量3000+。
自定义题库智能评估:行业特色或特定场景化题库快速导入,内置匹配类、智能评估类、拒答类等多种评估器灵活适配不同题库场景。
技术优势
全面性:覆盖伦理对齐、对抗攻击防护、供应链检测等多个维度。
创新性:采用“以模治模”、“高效匹配”、“拒答判断”等多种评估方式。
高效性:支持并行处理,单任务评估时间<30分钟。
兼容性:全新大模型分钟级适配接入,简单快捷。
简洁性:跟踪说明风险检测的全过程,采用易读易懂的方式展示每条风险详情。
灵活性:除内置多种题库外,可灵活增加其它特定场景题库评估。
典型部署场景
AI安全评估系统旁路部署,生成多样化的对抗攻击样本和内容合规风险样本,用于评估各版本大模型在不同应用场景中的输出内容安全性。
AI安全一体机 AI-UTM AI安全一体机是专为大模型场景设计的新一代安全网关,采用创新的“三体防护”架构,深度融合规则引擎与AI算法,提供内容安全防护、算力资源管理、数据泄露防护和大模型安全评估四大核心能力。为大模型基础组件安全、大模型自身安全、大模型应用安全、大模型数据安全,提供分层递进的防护能力。
核心功能
内容安全防护:三级内容过滤体系(词法、语义、上下文),128K tokens记忆窗口。
提示词加固:对传递给大模型的指令,可配置策略限制提示词语境环境,有效降低大模型自身安全风险。
算力资源管理:三级优先级动态分配策略,智能预测算法防止系统过载。
数据泄露防护:敏感信息识别准确率超过99%,支持文本、图片等多模态内容识别。
全链路审计:支持智能体应用、大模型API输入输出的全链路安全审计。
技术优势
场景接入灵活、全面:同时防护大模型流量+传统Web流量,快速兼容各类大模型应用和传统web应用耦合的客户场景。
高性能:毫秒级实时响应,支持流式检测、不影响模型业务模式。
高可靠:可集群部署,服务可用性≥99.9%。
易管理:可视化控制台,多维策略配置集中管理。
部署模式(部署在模型前)
【典型场景1】AI安全一体机部署在大模型服务的API接口前,隐藏大模型服务真实API,实现AI网关、key和token管控、内容安全合规、提示词攻击防护、算力攻击防护、智能体级对话审计等功能,提供一站式大模型服务安全防护。
【典型场景2】AI安全一体机部署在调用大模型能力的业务应用/Web服务前,对外隐藏业务应用,实现内容安全合规、提示词攻击防护、算力攻击防护、数据泄露防护、用户级对话审计等功能,提供一站式大模型服务及智能体应用安全防护。
解决方案核心价值
全生命周期安全防护
训练和微调阶段:通过AI-SCAN进行模型安全评估,识别训练数据投毒、后门植入等风险。
部署和应用阶段:利用AI-UTM提供内容安全防护、算力资源管控和数据泄露防护。
模型和智能体应用阶段:通过AI-UTM实现业务应用/API暴露面的软件漏洞及应用层攻击防护。
多维安全能力融合
安全运营:组件间联动运营,AI-SCAN评估的风险可输入给AI-UTM,从而生成安全防护策略,形成AI安全运营闭环。
合规性保障:满足TC260-003技术标准、大模型备案等合规要求。
全面风险识别:覆盖提示注入、越狱攻击、敏感信息泄露等21类对抗风险。
配资开户平台提示:文章来自网络,不代表本站观点。