9月8日,ISC.AI 2025上海大模型安全論壇暨大模型安全衛士產品發布會在上海舉行。會上發布的360大模型安全衛士以“四大智能體”為核心,系統化破解AI安全難題,全面夯實智能化發展基座。
近年來,大模型技術迅猛發展、智能體應用加速落地。人工智能正在重塑百行千業,成為推動新一輪科技革命與產業變革的核心動力。 不過,AI在帶來機遇的同時,也衍生出眾多新挑戰。
360集團創始人、ISC大會主席周鴻祎在致辭中表示,AI發展面臨著惡意利用、內容安全、“幻覺”問題、提示詞攻擊等風險,大模型既是生產力工具,也可能成為新的攻擊載體和攻擊入口,政府和企業的數據資產、商業機密面臨著前所未有的暴露風險,保障AI安全是一項長期而艱巨的任務,需要各方協同努力。
360數字安全集團副總裁余凱表示,面對AI安全新挑戰,傳統安全企業在大模型技術領域積淀不足,往往是“盲人摸象”,難以系統把握全局;而多數大模型企業缺乏必要的安全技術積累與攻防實踐經驗,往往難以提出行之有效的解決方案。
作為兼具數字安全和人工智能雙重能力的企業,360充分發揮跨領域優勢,基于“以模制模”理念打造360大模型安全衛士,聚焦解決AI的“可靠、可信、可控、向善”核心問題,以四大智能體系統性解決大模型生命周期中各環節的安全問題。
具體來看,其內容安全智能體通過垂直領域專業模型訓練,提供智能判定、風險內容檢測及安全回復代答等關鍵能力。通過建立五道“內容防線”,提供超過100個風險類目識別能力,確保輸入輸出雙向安全。同時以測促防,持續對模型回復內容進行評測,識別潛在攻擊風險。
AI Agent安全智能體通過原生安全機制,全面保障AI Agent在執行任務過程中的數據安全與權限控制,有效防范自動規劃與執行中可能出現的行為失控問題,把大模型能力“關在籠子里”。
幻覺抑制智能體通過搜索增強、知識增強與對齊增強技術,提升大模型推理過程的準確性,有效抑制因內容時效性缺失、數據過時等因素引發的大模型“幻覺”問題,確保生成內容真實可信。
軟件安全智能體能夠高效識別開源軟件,精準定位AI軟件的安全漏洞。覆蓋從模型訓練到推理的全鏈路安全檢測,支持識別模型服務相關組件、生態鏈漏洞掃描與多語言代碼審計,保障AI軟件供應鏈生命周期的安全性。
此外,360將大模型安全衛士融入安全運營體系,通過整合安全大模型、安全大腦平臺、大模型安全衛士及終端探針工具的核心能力,構建“網數模一體化”安全運營平臺,實現安全運營系統性重塑與升級。
余凱表示,AI安全是一個高門檻的技術領域,需要同時具備AI技術積淀、安全實戰經驗、真實場景驗證和海量語料積累。360通過自身大規模AI業務場景驗證產品能力,同時沉淀了海量安全語料,構建起核心競爭力。目前,360大模型安全衛士已在公司內外多項業務中實現深度應用。