您现在的位置是:首页 > 特别推荐 >
360发布大模型安全“五重铠甲”:从DeepSeek攻防战看AI未来治理
2025-02-24 10:34:46作者:来源:信息主管网
摘要360集团正式推出DS大模型安全解决方案,覆盖模型训练、推理、运营等大模型落地应用全过程,满血守护DeepSeek发展,促进国产大模型企业向安全、向善、可信、可控的方向发展,为全球人工智能技术治理提供了可借鉴的“中国方案”。...
DeepSeek发展面临五大安全挑战
DeepSeek以其强大的数据处理能力、精准的算法模型以及深度的用户洞察,重塑了AI领域的游戏规则。然而,以DeepSeek为代表的大模型作为新质生产力推动者的同时,也面临传统网络安全与新型安全风险交织的双重挑战。具体而言:
系统安全:此前DeepSeek遭遇网络攻击导致新用户注册受阻的事件就暴露了其在大模型系统安全方面的脆弱性。DeepSeek运行所依赖的硬件设施、软件框架、操作系统等基础层以及提示工程、缓存、向量库等训练和推理过程中使用的生态链工具共同构成庞大复杂的系统,系统中每个环节的缺陷都可能被恶意利用,加之开发运维过程中存在的不当使用和滥用等行为,技术脆弱性与人为风险因素相互叠加,使得大模型面临严峻的系统安全风险。
数据安全:数据在大模型各阶段流动创造价值,也带来数据泄漏、篡改、滥用等各类隐私及合规风险。在数据收集训练阶段,可能使用未经授权版本数据训练,导致侵权;在部署能力及开发阶段,使用不同供应商的服务时,可能存在黑盒以提取大模型记忆隐私数据;在对外提供服务时,可能存在API滥用隐患问题;在推理使用阶段,用户交互数据可能会泄漏或者滥用,违反隐私合规风险。
内容安全:由于DeepSeek依赖大量公开数据进行训练,模型可能在无意中学习到不当的行为,输出的内容可能会存在政治敏感、暴力违禁、色情低俗等不良内容,造成信息污染和伦理风险。例如2024年,Google大模型Gemini被指无法正确生成白人历史图像,引发人们对人工智能存在种族歧视问题的担忧,google不得不停用人物图像功能。此外,不法分子通过数据投毒、对抗样本、Prompt注入等手段,直接模型的“认知逻辑”予以扭曲,进而引发信息泄露、危害公共安全等严重后果。此前,用户以伪装成开发者的指令,让ChatGPT生成可被用于网络犯罪的电脑病毒等危险内容,便引发公众对大模型内容安全的担忧。
幻觉问题:大模型在运行过程中,其自身的幻觉问题往往会导致生成错误信息,不仅造成虚假内容的传播,还极大降低了模型的可用性。2023年,美国一位资深律师因在诉讼中引用了ChatGPT提供的6个完全不存在的判例,而被罚款5000美元。除了司法领域,在金融、医疗、安全等垂直行业应用中,大模型的幻觉问题也可能存在误导性建议、未经验证的治疗方法、错误的防御策略等特定隐患,进而误导用户判断和决策。
行为失控:大模型发展过程中,Agent自主性不断增强,嵌入到业务工作流中,可能带来新的安全隐患。Agent在复杂交互中因逻辑缺陷、环境误判等原因,可能导致出现指令劫持、任务偏离、资源滥用等非预期行为,即执行一些未经授权的操作,或者导致系统资源的过度消耗,甚至引发系统崩溃等严重后果。
对症下药,首个DS版大模型安全解决方案上线
作为兼具数字安全和AI双重能力的科技企业,360很早开始关注大模型安全风险,提出“以模制模”理念,利用安全大模型来检测和防范大模型可能出现的安全风险。针对以DeepSeek为代表的国产大模型厂商面临的安全挑战,360推出DS大模型安全解决方案,锚定系统安全、内容安全、幻觉问题、Agent失控、数据安全五大挑战,对症下药,守护DeepSeek大模型训练、推理和运营全流程,为全球人工智能技术治理提供“中国方案”。
安全体检员360智鉴:全天候扫描系统安全
针对大模型系统安全问题,360智鉴以全链路、精细化和动态进化的检测能力为核心,融合红蓝对抗思路和大模型自身技术优势,为企业提供一套全面、智能、高效的大模型系统安全检测方案,帮助企业在大模型上线前进行全方位的安全评估,保障大模型系统的可靠性与业务稳定性。
360智鉴覆盖了从数据清洗、模型训练、模型推理、部署上线的整个生命周期中的系统安全检测,支持近百个组件的400+公开漏洞检测,覆盖RAG、Agent、prompt等场景的安全性分析,同时,能够快速集成新的安全检测技术和方法,适应不断变化的安全威胁形势。
数据仓管员360智数:守护模型数据使用安全
针对DeepSeek面临的数据安全挑战,360基于智能化数据安全管理平台围绕大模型资产梳理分级、模型边界审查、模型数据风险监测三大维度构建闭环解决方案360智数,全方位护航大模型数据全生命周期,守护大模型数据流动安全,具体而言:
全链路数据资产梳理,通过AI动态资产识别技术,构建大模型数据地图。对大模型元数据分析,实现训练数据合规追溯、知识库重要数据识别、模型数据隐私内容检测三重治理;动态数据分级分类,对大模型智能体数据知识库、向量库、开放服务、记忆等位置进行动态分类分级,定期检查合规性和区域合法性,保证用户及企业使用安全;智能风险监测,通过大模型对数据开放及调用行为进行监测,识别异常调用、算法漏洞、知识库偏差,通过趋势分析及预测实现异常发现-风险研判-流程处置,以模制模,全面防控隐私数据、重要数据泄漏及模型行为失控风险。
信息净化器360智盾:全流程审核内容安全
为保障大模型内容安全,360智盾打造了全流程、多种类、多模态、场景化的内容安全体系,通过精准的风险检测、高效的内容拦截与替代机制,帮助企业确保生成内容的合法性、合规性与伦理可靠性,同时提升用户体验和模型输出的可信度。
360智盾支持100多类风险内容的识别过滤,涵盖超200种对抗内容防御机制,支持文本、音频、图片、视频等多种模态的风险防护,并通过平台定制化场景风控策略,满足不同场景的风控需求,检测识别正确率超90%。
安全领航员360智搜:把模型拉出幻觉泥潭
为避免大模型陷入幻觉泥潭,360智搜通过精确的知识整合,减少虚假或不准确信息,提升大模型的可信度与可靠性,有效减少大模型生成幻觉内容的可能性。同时,360智搜支持基于企业私域数据的知识提炼与总结,为企业提供更安全、更高效的业务支持。
360智搜整合多领域精品知识库,实现全网与私域知识的无缝对接,提升信息获取效率。实际应用中,在幻觉检测agent加持下,大模型通用场景下幻觉比例下降50%以上。
调度指挥官360智控:Agent流程可控可管
为确保Agent在执行任务时严格遵循既定流程,避免失控行为的发生,360智控通过原生安全的AI Agent可控框架对大模型场景进行统一编排调用,原生设置安全措施、监督任务规划全程、监控工具调用过程,把大模型能力关在笼子中,解决大模型不可控的问题。
360 DS大模型安全解决方案支持多种部署及交付方式,满足以DeepSeek为代表的通用大模型企业对便捷、成本、安全等多种因素个性化需求。此外,360大模型安全解决方案已在政务、税务、医疗等垂直行业落地应用,守护千行百业智能化转型。未来,360将继续护航大模型安全,为全球人工智能技术治理提供了可借鉴的“中国方案”。
(本文不涉密)
责任编辑:路沙