阿里云通义千问2.5发布全面超越GPT-4 Turbo 成地表最强中文大模型

【HowToTech科技】5月9日消息，阿里云正式推出了通义千问2.5版本，该版本在模型性能上全面超越了GPT-4
Turbo，被宣称为地表最强的中文大模型。此次升级不仅展示了阿里云在人工智能领域的持续努力，也再次巩固了其在中文大模型领域的领先地位。

据了解，通义千问2.5相较于之前的2.1版本，在理解能力、逻辑推理、指令遵循以及代码能力等方面均有了显著提升，分别提升了9%、16%、19%和10%。特别是在中文能力方面，通义千问2.5继续保持了业界的领先地位。在权威基准OpenCompass上，通义千问2.5的得分与GPT-4
Turbo相媲美，这也是国产大模型在该基准上首次取得如此优异的成绩。

同时，通义还发布了最新款的开源模型Qwen1.5-110B，该模型拥有1100亿参数。在MMLU、TheoremQA、GPQA等多个基准测评中，Qwen1.5-110B均超越了meta的Llama-3-70B模型，展现出强大的实力。在HuggingFace推出的开源大模型排行榜Open
LLM Leaderboard上，Qwen1.5-110B更是荣登榜首，证明了通义开源系列在业界的竞争力。

除了通义千问2.5和Qwen1.5-110B外，通义的多模态模型和专有能力模型也备受关注。其中，通义千问视觉理解模型Qwen-VL-Max在多模态标准测试中超越了Gemini
Ultra和GPT-4V，已经在多家企业得到实际应用。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big
Code的领先者，并作为国内用户规模第一的智能编码助手通义灵码的基石。

通义大模型自问世一年多以来，已经发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力。企业客户和开发者可以通过API调用、模型下载等方式接入通义，而个人用户则可以通过通义APP、官网和小程序免费使用通义家族的全栈服务。