通義千問2.5版發表阿里雲：性能全面追趕GPT-4Turbo

鉅亨網新聞中心2024年5月9號18點40分

阿里雲 5 月 9 日召開高峰會，正式發表「通義千問 2.5」，並開源通義千問 1100 億參數模型。阿里雲聲稱，模型效能全面追趕 GPT-4-Turbo，成為「地表最強」中文大模型。

在高峰會當日，原通義千問 APP 宣布更名為「通義 APP」，將通義大模型全套能力集於一身，致力於成為 “通情達義” 的 AI 助手。

據報導，通義千問 2023 年 4 月問世以來，從初代模型升級至 2.5 版本。相較於上一版本，2.5 版模型的理解能力、邏輯推理、指令遵循、程式碼能力分別提升 9%、16%、19%、10%。

通義正成為最受中國企業歡迎的大模型之一。根據最新數據，通義透過阿里雲服務企業超過 9 萬、透過釘釘服務企業超過 220 萬，現已落地 PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

同時，通義也發布了 1100 億參數開源模型 Qwen1.5-110B，該模型在 MMLU、Theorem QA、GPQA 等基準測試中超越了 Meta 的 Llama-3-70B 模型；在 Hugging Face 推出的開源大模型排行榜 Open LLM Leaderboard 上，Qwen1.5-110B 衝上榜首，再度證明通義開源系列業界競爭力領先。

此外，在多個多模態標準測試中，通義千問視覺理解模型 Qwen-VL-Max 得分超越 Gemini Ultra 和 GPT-4V，這款模型已在多家企業落地應用；通義千問代碼大模型 Code Qwen1.5-7B 則是 Hugging Face 代碼模型榜單 Big Code 的頭號選手，這款模型是國內用戶規模第一的智慧編碼助手通靈靈碼的底座。

阿里雲 CTO 周靖人表示，開發者的回饋與開源社群的生態支持，是通義大模式技術進步的重要助力。未來通義大模型還會持續開源。

2023 年 10 月，阿里雲發表了百煉大模型平台，開發者可透過「拖曳」5 分鐘開發一款大模型應用，幾小時「煉」出一個專屬模型，把精力專注於應用創新。

阿里雲 CTO 周靖人表示：「當下企業應用大模型有三種範式：一是對大模型開箱即用，二是對大模型進行微調和持續訓練，三是基於模型開發應用，其中最典型的需求是 RAG，以企業資料對大模型進行知識增強。」

通義千問2.5版發表 阿里雲：性能全面追趕GPT-4Turbo

通義千問2.5版發表阿里雲：性能全面追趕GPT-4Turbo