在中央網信辦網絡安全協(xié)調局指導下,中國網絡安全產業(yè)聯(lián)盟 (CCIA) 主辦“2024年網絡安全優(yōu)秀創(chuàng)新成果大賽”。在大賽中,永信至誠“春秋AI大模型測評「數(shù)字風洞」平臺”憑借技術創(chuàng)新能力、行業(yè)應用價值榮獲網絡安全創(chuàng)新產品優(yōu)勝獎。
本次大賽旨在挖掘具備國際或國內領先技術水平、應用前景廣闊、符合行業(yè)發(fā)展方向的網絡安全創(chuàng)新產品和解決方案,激發(fā)網絡安全企業(yè)加強自主創(chuàng)新能力,推動網絡安全產業(yè)高質量發(fā)展。
春秋AI大模型測評「數(shù)字風洞」平臺是永信至誠針對通用大模型產品綜合能力測評打造的技術平臺。平臺以春秋AI大模型為核心,基于動態(tài)問題檢測與海量測試題庫,能夠針對大模型的智能度、安全度、匹配度三個維度進行能力測試,精準評估大模型在智能水平、應對安全攻擊以及任務匹配上的表現(xiàn),幫助用戶識別潛在風險并優(yōu)化系統(tǒng)性能。
智能度測評:平臺針對不同場景下的任務表現(xiàn)進行智能性測試,涵蓋基礎認知、邏輯推理等方面,衡量模型在復雜任務中的認知能力,并支持與市面主流大模型進行智能水平的橫向對比測評;
安全度測評:平臺從攻擊者視角出發(fā),基于安全行業(yè)垂直語料數(shù)據集和測試載荷,實現(xiàn)對通用大模型基礎設施安全、內容安全、數(shù)據與應用安全等方面深度體檢,及時發(fā)現(xiàn)AI大模型的脆弱性及數(shù)據缺陷;
匹配度測評:平臺通過對AI大模型在特定應用場景下的任務執(zhí)行效果進行深入分析,確保模型的輸出與業(yè)務需求匹配,避免大模型在應用過程中偏離業(yè)務目標或在關鍵任務中失效。
隨著AI等新技術在各行業(yè)的廣泛落地,安全風險與能力評估的需求也不斷攀升。作為數(shù)字安全測試評估賽道領跑者、網絡靶場和人才建設領軍者,永信至誠依托「數(shù)字風洞」產品體系,持續(xù)為行業(yè)用戶提供專業(yè)測評服務和專有人才支撐,推動新技術與新產品安全應用,共同助力行業(yè)生態(tài)健康發(fā)展。
評論