工研院首座AI測試實驗室提供語言模型可信任評測服務

工研院首座AI測試實驗室提供語言模型可信任評測服務。（工研院提供）

隨著生成式AI應用範圍日益拓展，數位科技正在重新塑造我們的生活與商業模式，語言模型作為其重要核心，相關資安、準確性等問題，也是產業關心的重要議題。為確保AI人工智慧更安全的發展，提升人民對AI的信賴，在數位發展部數位產業署支持下，工研院今（29）日宣布打造臺灣首座AI測試實驗室，全方位確保產業客戶的語言模型能安全可靠的在各個領域穩定運行。

語言模型是自然語言處理（Natural Language Processing；NLP）不可或缺的關鍵，也是AI人工智慧理解文本、生成內容、語音辨識、情感分析等重要依據，經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵，進而產生類似人類的自然語言。然而，模型也可能因為數據偏差或失真，導致產生錯誤或不當資訊，甚至在處理敏感數據時更有資安風險存在。因此，儘管生成式AI當紅，但語言模型的開發和部署還是得小心謹慎，以確保輸出結果準確、穩定且可靠。

在數發部數產署支持下，工研院成立臺灣首座AI測試實驗室，參考國際可信賴AI的相關框架及標準，透過AI產品與系統評測中心（Artificial Intelligence Evaluation Center；AIEC）專家以及技術委員會開發可信任語言模型評測工具，提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案，協助國內廠商評估及改善語言模型，以確保語言模型及AI應用能在不同場景下保持穩定及可靠，並滿足企業和使用者需求。

工研院量測技術發展中心執行長藍玉屏表示，隨著生成式AI滲透到各個領域，對AI模型進行可信任性的測試與評估至關重要，因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室，透過參考國際以及國內專家審議的測試題庫，來評估生成內容的可信任性，促進企業在應用AI技術時更具信心。

未來，跟隨AI應用更進一步拓展，工研院將持續加強對AI技術的測試和把關，並探索新興技術應用的測試與評估，確保臺灣在全球AI技術競爭中的發展。此外，為了強化國際合作，工研院也同時與法國國家計量院（LNE）簽署合作協議，針對AI進行國際合作與技術交流，助力臺灣AI評測技術接軌國際。

工研院首座AI測試實驗室提供語言模型可信任評測服務

訂閱必聞電子報

標籤:

新聞留言板

關注必聞網

工研院首座AI測試實驗室 提供語言模型可信任評測服務

訂閱必聞電子報

標籤:

新聞留言板

關注必聞網

工研院首座AI測試實驗室提供語言模型可信任評測服務