阿里云通义千问2.5发布 全面超越GPT-4 Turbo 成地表最强中文大模型

【HowToTech科技】5月9日消息,阿里云正式推出了通义千问2.5版本,该版本在模型性能上全面超越了GPT-4
Turbo,被宣称为地表最强的中文大模型。此次升级不仅展示了阿里云在人工智能领域的持续努力,也再次巩固了其在中文大模型领域的领先地位。

据了解,通义千问2.5相较于之前的2.1版本,在理解能力、逻辑推理、指令遵循以及代码能力等方面均有了显著提升,分别提升了9%、16%、19%和10%。特别是在中文能力方面,通义千问2.5继续保持了业界的领先地位。在权威基准OpenCompass上,通义千问2.5的得分与GPT-4
Turbo相媲美,这也是国产大模型在该基准上首次取得如此优异的成绩。

同时,通义还发布了最新款的开源模型Qwen1.5-110B,该模型拥有1100亿参数。在MMLU、TheoremQA、GPQA等多个基准测评中,Qwen1.5-110B均超越了meta的Llama-3-70B模型,展现出强大的实力。在HuggingFace推出的开源大模型排行榜Open
LLM Leaderboard上,Qwen1.5-110B更是荣登榜首,证明了通义开源系列在业界的竞争力。

除了通义千问2.5和Qwen1.5-110B外,通义的多模态模型和专有能力模型也备受关注。其中,通义千问视觉理解模型Qwen-VL-Max在多模态标准测试中超越了Gemini
Ultra和GPT-4V,已经在多家企业得到实际应用。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big
Code的领先者,并作为国内用户规模第一的智能编码助手通义灵码的基石。

通义大模型自问世一年多以来,已经发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力。企业客户和开发者可以通过API调用、模型下载等方式接入通义,而个人用户则可以通过通义APP、官网和小程序免费使用通义家族的全栈服务。

大鱼的头像

这个人很懒,什么都没有留下~

延伸阅读:

OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens

【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...

大鱼的头像
大鱼
2024 年 8 月 1 日
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战

7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...

大鱼的头像
大鱼
2024 年 7 月 31 日
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型

“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...

大鱼的头像
大鱼
2024 年 7 月 31 日
阿里通义免费开放奥运AI大模型

7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以...

大鱼的头像
大鱼
2024 年 7 月 31 日
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式

【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...

大鱼的头像
大鱼
2024 年 7 月 31 日