11月25日消息,在最新的中文語言理解領域權威榜單CLUE中,阿里AI以86.685的總分成績創造了新紀錄,這是該榜單誕生近三年以來,AI首次超越人類成績(86.678),意味著AI模型的中文語言理解水平達到了新的高度。此次參評的AI模型為阿里通義大模型系列的AliceMind(以下簡稱“阿里通義AliceMind”), 其基礎模型已在ModelScope平臺開放。
CLUE最新榜單:阿里通義AliceMind總分超越人類成績
作為業界最權威的中文自然語言理解榜單之一,CLUE從文本分類、閱讀理解、自然語言推理等9項任務中全面考核AI模型的語言理解能力。過去三年,該榜單吸引了眾多國內頂尖NLP團隊的參與,盡管榜首位置多次易主,但參評AI模型一直未能超越人類成績。根據最新的結果,阿里通義AliceMind在4項任務中的表現超過人類水平,同時實現了總榜平均分的首次超越。
中文語言理解是AI業界亟待攻克的難題之一。為提升AI模型對詞語、句子以及語言整體的理解力,在預訓練階段,達摩院沿用超大規模模型訓練所使用的海量高質量中文文本,同時對模型結構和訓練技術進行了一系列優化,如使用激活函數GLU、字詞混合的大詞表等獲得更強的文本建模能力,使用StrongHold訓練加速技術縮短迭代周期、節約算力成本,進而獲得性能的顯著提升。在精調階段,面對文本分類、閱讀理解、自然語言推理等下游任務,達摩院采用了遷移學習、數據增強、特征增強等技術,進一步提升模型表現。
以CLUE榜單的CHID成語閱讀理解填空任務為例,該任務需要AI模型選出正確的成語進行填空。阿里通義AliceMind可通過海量文本數據的學習達到“博聞強識”的效果,在預訓練階段掌握選詞填空所依賴的語義理解能力,并將其進行成語數據的領域遷移訓練,最終模型在測試任務中的成績遠超人類。
作為最早投入預訓練語言模型研究的團隊之一,達摩院研發了阿里通義AliceMind,該體系涵蓋預訓練模型、多語言預訓練模型、超大中文預訓練模型等,具備閱讀理解、機器翻譯、對話問答、文檔處理等多種能力,該模型體系已斬獲36項冠軍。目前,相關技術已應用于醫療、電商、法律等領域,在跨境電商領域,達摩院的機器翻譯系統能提供214種語言的互譯服務,每天為國內200萬中小商家翻譯上億文字,助力國貨走向全世界。
【推廣】:以上內容為廣告推廣信息,所涉及內容不代表本網觀點,不構成投資建議、消費建議。