Chat-GPT 等具有大型語言模型的人工智慧平台的出現,開創了人工智慧驅動互動的新時代。儘管中東地區對人工智慧技術的興趣和發展不斷增加,但阿拉伯語模型往往落後。然而,阿布達比穆罕默德·本·扎耶德人工智慧大學(MBZUAI)、矽谷Cerebras Systems 和阿聯酋人工智慧公司G42 之間的合作推出了一款專為阿拉伯語使用者量身定制的革命性人工智慧工具,名為「Jais」。這項發展不僅滿足了阿拉伯語使用者的需求,而且還有可能推進人工智慧領域中代表性不足的其他語言的大型語言模型。
阿拉伯語言模式的挑戰
雖然現有的語言模型(例如 Meta 的 ChatGPT 和 LLaMA)具有一些阿拉伯語言的功能,但它們主要是根據來自互聯網的英語資料進行訓練的。 MBZUAI 臨時教務長兼自然語言處理教授 Timothy Baldwin 表示,Jais 採取了不同的方法。它結合使用了英語和阿拉伯語數據集,重點關注中東內容。這種獨特的教育方法使 Jais 對阿拉伯語的理解和熟練程度達到了一定水平,這使他在同行中脫穎而出。
以拉丁字母為主的語言
網路上使用拉丁字母的語言占主導地位,其中英語位居前列,導致為這些語言創建了更大的數據集。中東研究所戰略技術與網路安全計畫主任穆罕默德·索利曼指出,獨家使用特定語言的人工智慧工具可能會讓社會各階層處於不利地位。主要用英語訓練的語言模型通常缺乏文化意識和對不同背景的理解,這可能會對使用者體驗產生負面影響。
阿拉伯語的文化差異和方言
阿拉伯語是全球第六大語言,由於方言的多樣性帶來了獨特的挑戰。現代標準阿拉伯語通常用於官方文件和正式著作,而當地方言則在部落格和社交媒體中流行。 Jais 擁有多元化的背景,能夠駕馭這些方言並理解文化的細微差別,這使他更加多才多藝,適用於不同的行業。
拓展可能性
隨著 Jais 的不斷發展,開發團隊正在尋求將其功能擴展到基於文字的互動之外。他們計劃整合處理圖像、圖表或表格數據的能力,為解釋醫學掃描、分析投資數據或處理衛星數據的應用開闢可能性。
人工智慧開發的責任
Jais 與其他生成式 AI 模型一樣,實施指令最佳化以防止有害或有毒內容的生成。遵守當地規則和習俗,確保回應符合道德和文化規範。 Jais 的開發過程涉及與阿聯酋政府和其他機構的對話,以確保負責任地實施人工智慧。
阿拉伯聯合大公國的區域發展
阿聯酋一直處於開發生成人工智慧系統的前沿。 2017年,它成為世界上第一個任命人工智慧部長的國家。值得注意的是,阿布達比先進技術研究委員會和技術創新研究所 (TII) 推出了該地區最大的生成式人工智慧模式 Falcon。儘管 Falcon 目前僅提供英文版本,但它擁有 1800 億個參數,並且在推理、編碼和知識測試方面優於競爭對手。 Falcon 和 Jais 都是開源的,任何人都可以使用或修改它們的程式碼。
人工智慧對中東的潛在影響
根據普華永道 2018 年的一份報告,到 2030 年,中東地區將從人工智慧中受益高達 3,200 億美元。該地區熱衷於發展人工智慧能力,以充分利用這項技術的潛力。普華永道中東首席數位長 Ali Hosseini 指出,該地區已經開發了一些最好的開源人工智慧模型,並以 Falcon 和 Jais 為例。
Jais 是一款專為阿拉伯語使用者量身定制的人工智慧工具,它的推出代表著在解決人工智慧領域的語言差距方面向前邁出了重要一步。它不僅滿足了阿拉伯人的需求,也開創了為全球代表性不足的語言開發語言模型的先例。憑藉著理解方言和文化差異的能力,Jais 預計將對各行業產生深遠的影響,進一步推動中東及其他地區人工智慧的發展。隨著人工智慧技術的不斷進步,語言模型的包容性對於確保世界各地不同人群都能享受到人工智慧的好處至關重要。 Jais 代表了朝這個方向邁出的充滿希望的一步,並且有望實現更多創新發展。