烏克蘭正在利用谷歌技術開發自己的大型語言模型(LLM)。這個大型語言模型將經過訓練,以準確理解烏克蘭的語言環境、方言和少數民族語言。
培訓將首先在Google的基礎設施上進行,之後再轉移到本地伺服器。管理人員預計系統上線初期可能會遭受網路攻擊,並正在準備防禦措施,以應對諸如即時注入等威脅。
烏克蘭啟動了一項國家人工智慧項目
烏克蘭正在利用谷歌的開源Gemma框架開發大規模語言模型。該國的目標是創建一個完全獨立的人工智慧系統,用於軍事和民用領域。
烏克蘭數位化部和烏克蘭行動營運商Kyivstar週一宣布了該計畫。該計畫將利用Google的IT基礎設施進行初始訓練,之後將完全過渡到本地基礎設施,從而使烏克蘭能夠完全掌控其2300萬公民每天可以訪問的人工智慧系統。
路透社報道, 知情人士透露,經過慎重考慮,谷歌最終被選中負責該項目。先前,Google曾考慮其他方案,包括Meta公司的Llama和法國的Mistral人工智慧模型。
包括DeepSeek和 Qwen 在內的中文模型也被該專案拒絕。
烏克蘭軍方已將人工智慧工具應用於空中和衛星偵察、無人機作戰和戰場分析。
烏克蘭數位轉型部副部長奧列克桑德·博爾尼亞科夫解釋說,烏克蘭武裝部隊有意避免依賴像 OpenAI 的 ChatGPT 這樣的系統,因為他們打算將人工智慧整合到戰場管理系統中,用於部隊協調和敵情監控。
彌合語言差距
該專案的部分原因在於目前人工智慧系統普遍存在的溝通障礙。博爾尼亞科夫指出,現有的人工智慧系統難以處理他家鄉敖德薩州博爾赫拉德的方言,那裡使用的語言是烏克蘭語、俄語和保加利亞語的混合語。
負責該專案的 Kyivstar 首席產品長 Misha Nestor 強調了法律文件中翻譯錯誤以及人工智慧產生的錯誤等問題。四個諮詢委員會將分別負責新模型的技術、法律、文化、歷史和語言方面,確保其除了支持俄語外,還支持烏克蘭語和克里米亞韃靼語等少數民族語言。
這些數據來自90多個政府機構,包括法院書記官、教育出版機構、地區檔案館以及俄羅斯在持續戰爭期間的行動記錄。這一全面的數據集將使人工智慧能夠比通用的全球模型更好地理解烏克蘭的脈絡和術語。
數位轉型部的專家聲稱,Gemma 是目前最高效的開源模型之一,在規模和品質方面都表現出色,能夠在性能和資源利用之間實現穩定的平衡。該模型的多語言支援已涵蓋烏克蘭語,其擴展的分詞器最多可處理 128,000 個詞元,並支援文字和圖像的多模態處理。
訓練將在Google提供的、位於烏克蘭境外的安全圖形處理單元上進行,之後最終模型才會部署到本地資料中心。這是烏克蘭應對俄羅斯持續攻擊其基礎設施威脅的解決方案。
博爾尼亞科夫表示,官員們預計該系統發布後會立即遭到攻擊。團隊正在開發針對各種網路威脅的防護措施,包括「快速注入」攻擊,即惡意指令被植入人工智慧的指定任務中。
為因應俄羅斯持續針對烏克蘭能源基礎設施的攻擊,Kyivstar已安裝了超過3500台備用發電機以穩定運作。截至9月,這家電信公司擁有超過2,250萬行動用戶和超過120萬固定電話用戶。