通義千問2.5版發表 阿里雲:性能全面追趕GPT-4Turbo

阿里雲 5 月 9 日召開高峰會,正式發表「通義千問 2.5」,並開源通義千問 1100 億參數模型。阿里雲聲稱,模型效能全面追趕 GPT-4-Turbo,成為「地表最強」中文大模型。

在高峰會當日,原通義千問 APP 宣布更名為「通義 APP」,將通義大模型全套能力集於一身,致力於成為 “通情達義” 的 AI 助手。

據報導,通義千問 2023 年 4 月問世以來,從初代模型升級至 2.5 版本。相較於上一版本,2.5 版模型的理解能力、邏輯推理、指令遵循、程式碼能力分別提升 9%、16%、19%、10%。

通義正成為最受中國企業歡迎的大模型之一。根據最新數據,通義透過阿里雲服務企業超過 9 萬、透過釘釘服務企業超過 220 萬,現已落地 PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

同時,通義也發布了 1100 億參數開源模型 Qwen1.5-110B,該模型在 MMLU、Theorem QA、GPQA 等基準測試中超越了 Meta 的 Llama-3-70B 模型;在 Hugging Face 推出的開源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 衝上榜首,再度證明通義開源系列業界競爭力領先。

此外,在多個多模態標準測試中,通義千問視覺理解模型 Qwen-VL-Max 得分超越 Gemini Ultra 和 GPT-4V,這款模型已在多家企業落地應用;通義千問代碼大模型 Code Qwen1.5-7B 則是 Hugging Face 代碼模型榜單 Big Code 的頭號選手,這款模型是國內用戶規模第一的智慧編碼助手通靈靈碼的底座。

阿里雲 CTO 周靖人表示,開發者的回饋與開源社群的生態支持,是通義大模式技術進步的重要助力。未來通義大模型還會持續開源。

2023 年 10 月,阿里雲發表了百煉大模型平台,開發者可透過「拖曳」5 分鐘開發一款大模型應用,幾小時「煉」出一個專屬模型,把精力專注於應用創新。

阿里雲 CTO 周靖人表示:「當下企業應用大模型有三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基於模型開發應用,其中最典型的需求是 RAG,以企業資料對大模型進行知識增強。」