“磐石·Y”大模型安全實踐優(yōu)秀案例 | 天融信:“天融信天問大模型”在安全領(lǐng)域中的實踐應(yīng)用
2024年4月,在中國軟件評測中心(工業(yè)和信息化部軟件與集成電路促進中心)聯(lián)合數(shù)據(jù)安全關(guān)鍵技術(shù)與產(chǎn)業(yè)應(yīng)用評價工業(yè)和信息化部重點實驗室、中國計算機行業(yè)協(xié)會數(shù)據(jù)安全專業(yè)委員會開展的大模型安全性測評“磐石·X”榜單計劃中,天融信天問大模型順利通過了五大維度測評,獲得A級證書,成為首批通過大模型安全性測評“磐石·X”榜單計劃的單位之一。
本次“磐石·Y”大模型安全實踐優(yōu)秀案例分享,從多角度、全方位、立體式呈現(xiàn)大模型安全防護方案,為更多行業(yè)用戶在大模型產(chǎn)品選型提供重要參考,護航大模型的高質(zhì)量發(fā)展。

天融信天問大模型
天問大模型使用高質(zhì)量數(shù)據(jù)進行增量預(yù)訓(xùn)練、微調(diào)和人工對齊等操作,同時結(jié)合RAG、思維鏈等技術(shù),大幅降低了幻覺、偏執(zhí)等大模型內(nèi)容安全問題。采用關(guān)鍵字過濾、規(guī)則匹配、模型檢測等多種技術(shù)手段,防護大模型輸入提示詞和輸出響應(yīng)內(nèi)容,確保天問大模型在網(wǎng)絡(luò)安全、數(shù)據(jù)安全、內(nèi)容安全、模型安全和提示安全等方面達到先進水平。
天融信持續(xù)推動天問大模型在研發(fā)、應(yīng)用、部署、運營、管理和服務(wù)等方面的工程化進程,將AI技術(shù)與行業(yè)實踐深度融合。在檢測防護方面,研發(fā)的TAI系列智慧引擎,廣泛應(yīng)用于天融信多款檢測和防護產(chǎn)品中,通過智慧引擎整體提升檢測效果,既能檢測各種傳統(tǒng)攻擊行為,也能夠檢測未知威脅,提高整體的安全檢測能力,大幅提高安全檢測的效率和準確性。在大數(shù)據(jù)防護方面,可為運維工程師創(chuàng)建安全分析模型提供有力引導(dǎo),通過自然語言輸入,如描述安全事件或提出創(chuàng)建分析檢測需求,大模型能快速分析并提取關(guān)鍵特征和模式,為運維人員提供有價值的參考和啟示。在智能交互方面,提供智能問答能力,提升產(chǎn)品風險分析能力和處置效率,降低產(chǎn)品應(yīng)用門檻;并提供面向各行業(yè)客戶推出的安全問答與能力訂閱服務(wù)。
安全解決方案
天融信天問大模型支持云端部署,并以云服務(wù)方式提供外部使用,為了防止模型被濫用或惡意利用,天融信提出了前后端聯(lián)合的安全防護方案,整體防護架構(gòu)如下:

天問大模型防護方案由大模型系統(tǒng)前端接入防護和大模型系統(tǒng)后端安全加固兩部分構(gòu)成。前端接入防護主要實現(xiàn)大模型安全接入和數(shù)據(jù)泄露防護。后端安全加固實現(xiàn)對大模型系統(tǒng)核心軟硬件威脅檢測與分析、系統(tǒng)操作安全審計及容災(zāi)備份功能。天融信API安全網(wǎng)關(guān)可以提供流量管控、身份認證、訪問控制、API檢測等功能,可以有效拒絕非法訪問用戶和流量。天融信數(shù)據(jù)防泄漏可以提供prompt注入檢測、敏感詞過濾、隱私信息過濾、基于語義的內(nèi)容檢測等功能,實現(xiàn)大模型輸入輸出內(nèi)容的敏感數(shù)據(jù)識別、攔截。除上述安全防護措施外,天問大模型系統(tǒng)還引入人工審查機制,保障大模型輸入輸出的內(nèi)容安全性,降低不良信息輸入和輸出概率。
成果與效益
天融信天問大模型的惡意域名監(jiān)測智慧引擎在某運營商試點項目中運用,監(jiān)測到IPv6下DGA惡意域名5672個,涉及DGA家族超過12種,監(jiān)測捕獲到IPv6環(huán)境下僵尸網(wǎng)絡(luò)32個,預(yù)計每年能帶來2144萬元的經(jīng)濟效益。對IPv6 DNS日志進行基于人工智能神經(jīng)網(wǎng)絡(luò)技術(shù)的檢測分析,填補了維護IPv6 DNS服務(wù)安全的空白,有效地遏制了IPv6環(huán)境下網(wǎng)絡(luò)安全風險的蔓延,有力地防范了新互聯(lián)網(wǎng)環(huán)境下的未知風險。

實踐經(jīng)驗總結(jié)
天融信將安全性視為天問大模型的核心需求。天問大模型系統(tǒng)在對外提供服務(wù)時,全生命周期中都可能存在安全風險,包括:輸入輸出風險、外部工具風險、軟件平臺風險、硬件平臺風險、AI模型文件風險、訓(xùn)練語料風險、系統(tǒng)管理和運營風險等。
為此,天融信將在現(xiàn)有安全防護基礎(chǔ)上,圍繞天問大模型系統(tǒng),打造大模型全生命周期安全防護體系,不斷優(yōu)化和改進現(xiàn)有大模型安全防護技術(shù)手段,推動大模型安全管理相關(guān)工作,構(gòu)建完整的安全管理體系,保障天問大模型系統(tǒng)的安全性、可靠性和大模型服務(wù)運營合規(guī)化。
(來源 :中國數(shù)據(jù)安全產(chǎn)業(yè)網(wǎng))