阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo(图1)

阿里云于2024年5月9日正式发布了通义千问2.5版本,这一版本的模型性能在多个基准测评中取得了最佳成绩,全面超越了GPT-4 Turbo,并被誉为地表最强的中文大模型。

通义千问2.5是一个开源的1100亿参数模型,其在理解能力、逻辑推理、指令遵循和代码能力等方面相比上一版本有显著提升。相比通义千问上一版本2.1,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界,阿里云表示,在权威基准OpenCompass上,通义千问2.5得分追平GPT-4Turbo,是国产大模型首次在该基准取得该项成绩。

通义千问2.5融合了语音、LLM(大型语言模型)、多模态和翻译能力,具备实时语音识别、说话人分离功能,能够处理多达50个音视频文件的全文摘要、总结发言和关键词提取等功能。这些能力已经在多个行业得到广泛应用,如钉钉的会议智能纪要功能、新东方的AI课堂笔记功能和蚂蚁面试等。

据披露,目前通义大模型已通过阿里云服务企业超9万、通过钉钉服务企业超过220万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

通义千问2.5的发布,不仅展示了阿里云在人工智能领域的持续努力,也再次巩固了其在中文大模型领域的领先地位。同时,通义千问APP也宣布更名为"通义APP",并将集成通义大模型的全栈能力,免费为所有用户提供服务。这一系列动作体现了阿里云对开源社区的支持和对技术创新的承诺。