“我们坚持开源!”阿里云发布“地表最强”中文大模型:半年一迭代、性能翻倍?
5 月 9 日,在通义大模型宣布一周年之际,阿里云大模型生态迎来一次重大升级,主要有“四个最”: 通义千问 2.5 正式宣布,“模型性能全面赶超 GPT-4 Turbo
作者 | 褚杏娟 华卫
5 月 9 日,在通义大模型宣布一周年之际,阿里云大模型生态迎来一次重大升级,主要有“四个最”:
通义千问 2.5 正式宣布,“模型性能全面赶超 GPT-4 Turbo,成为地表最强中文大模型”;
Qwen1.5-110B 参数开源模型在多个基准测评收获最佳成就,超出 Llama-3-70B,成为开源范畴最强中文大模型;
ModelScope 魔搭成为中国最大的开源社区;
通义大模型通过阿里云服务企业超 9 万,成最受中国企业欢迎大模型。
同时,阿里云对通义大模型的品牌也进行了升级,正式将“通义千问 APP”更名为“通义 APP”,集成通义大模型全栈才能,免费为所有用户供给服务。阿里表现,通义 APP 将把通义试验室前沿的文生图、智能编码、文档解析、音视频懂得、视觉生成等才能“All in one”,成为每个人的全能 AI 助手。
从初代模型升级至 2.5 版本的路,阿里云仅仅走了一年。
去年 10 月底,阿里云 CTO 周靖人在 2023 年云栖大会上,宣布了参数目晋升到千亿级别的通义千问 2.0。当时,阿里表现,目前通义千问的综合性能已经超过 GPT-3.5,相比 4 月宣布的 1.0 版本,通义千问 2.0 在庞杂指令懂得、文学创作、通用数学、知识记忆、幻觉抵抗等才能上均有明显晋升。
如今,相比通义千问 2.1 版本,通义千问 2.5 的懂得才能、逻辑推理、指令遵守、代码才能分离晋升了 9%、16%、19%、10%。在威望基准 OpenCompass 上,通义千问 2.5 得分追平 GPT-4 Turbo,这也是该基准首次录得国产大模型取得如此精彩的成就。
在多模态模型和专有才能模型方面,通义千问视觉懂得模型 Qwen-VL-Max 在多个多模态尺度测试中超出 Gemini Ultra 和 GPT-4V,目前已在多家企业落地运用。
通义还宣布了最新款开源模型:1100 亿参数的 Qwen1.5-110B,该模型在 MMLU、TheoremQA、GPQA 等基准测评中超出了 Meta 的 Llama-3-70B 模型。在 HuggingFace 推出的开源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 冲上榜首。
“生态非常主要,我们会保持开源体系、保持我们的开源模式。”周靖人泄漏。
“现在已经是 2024 年了,我信任开源对全部全球技巧范畴的贡献是毋庸置疑的。”周靖人说道,“阿里云不是简简略单的开源,我们是要开源最强的模型。”
去年 8 月,通义宣布参加开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺码”开源路线陆续推出十多款模型。小尺码模型如 0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC 等端侧装备安排;大尺码模型如 72B、110B 能支撑企业级和科研级的运用,都曾登顶 Open LLM Leaderboard 榜首。
“阿里云是全球唯一一家既连续做模型开发,又做大批模型开局模式的企业。”周靖人表现,Llama 3 等在必定水平上把竞争拉得很高。坦诚地讲,不是所有闭源的公司都能做过开源模型。做闭源的,至少要能够超过开源模型水准,才能今天有机遇参与。另一方面,实践中,大模型才能并不是越强越好,还要斟酌成本等方面因素,所以阿里云愿望把选择权给到企业和开发者。
通义千问代码大模型 CodeQwen1.5-7B 则是 HuggingFace 代码模型榜单 Big Code 的头名选手,具备优良的代码生成才能、长序列建模才能、代码修正才能和 SQL 才能,还是国内用户范围第一的智能编码助手通义灵码的底层模型。
现场,阿里还宣布推出通义灵码的企业版,满足企业用户的定制化需求,赞助企业晋升研发效力。
据介绍,通义灵码熟练控制 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等 200 多种编程语言,可以帮助写代码、读代码、查 Bug、优化代码等。依据官方数据,2023 年 10 月宣布至今,通义灵码的插件下载量已超 350 万,每日推举代码超 3000 万次,被开发者采用的代码超亿行。
依据阿里云颁布的最新数据,通义大模型通过阿里云服务企业超 9 万,通义开源模型累计下载量突破 700 万。通义落地运用过程加速,现已进入 PC、手机、汽车、航空、天文、矿业、教导、医疗、餐饮、游戏、文旅等范畴,成为最受中国企业欢迎的大模型。
周靖人表现,各行各业、各个企业都是特别的,非常明白的就是让基本模型直接对接业务需求是很难的,因此现在的大模型落地必定要联合业务的场景。
小米旗下的人工智能助手“小爱同窗”已与阿里云通义大模型达成合作,强化其在图片生成、图片懂得等方面的多模态 AI 生成才能,并在小米汽车、手机等多类装备落地。此外,微博、众安保险、完善世界游戏等企业也宣布接入通义大模型,将大模型运用于社交媒体、保险、游戏等范畴。
更早之前,新东方、同程旅行、长安汽车、西部机场团体、亲宝宝等企业也都与通义大模型达成合作。中国科学院国度天文台人工智能组基于通义千问开源模型开发了新一代天文大模型“星语 3.0”,这是大模型首次运用于天文观测范畴;陕煤建新煤矿等十余座矿山推出由通义大模型支撑的新型矿山重大风险辨认处理体系,成为大模型在矿山场景的首次范围化落地。
截至目前,通义大模型通过阿里云服务企业超过 9 万、通过钉钉服务企业超过 220 万。与此同时,海内外大批中小企业和开发者以下载开源模型的方法应用通义,在 HuggingFace、魔搭 ModelScope 等开源社区,通义开源大模型的累计下载量超过了 700 万。
在阿里云体系里,把模型才能和业务场景联合起来的纽带就是百炼平台。本次大会上,百炼升级成为阿里云承载云 +AI 才能的主要平台,供给一站式、全托管的大模型定制与运用服务。开发者可通过“拖沓拽”5 分钟开发一款大模型运用,几小时“炼”出一个专属模型,把精神专注于运用创新。
周靖人介绍,当下企业运用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微折衷连续训练,三是基于模型开发运用,其中最典范的需求是 RAG,以企业数据对大模型进行知识加强。环绕这些需求,百炼打造了模型中心和运用中心,供给最丰硕的模型和最易用的工具箱。
百炼供给了提醒词模版、拥抱开源框架,包含供给开放灵巧可配置的检索加强运用服务、供给实时 API 等,此外还供给可视化流程,供给微折衷评测。
此外,百炼集成了上百款大模型,除了通义、Llama、ChatGLM 等系列,还托管百川等系列三方模型,笼罩国内外主流厂商,联动魔搭开源社区,同时支撑企业上架通用或行业模型,给开发者供给足够多的模型选择。
问世一年多来,通义大模型发展出了文生图、智能编码、文档解析、音视频懂得等才能,企业客户和开发者可以通过 API 调用、模型下载等方法接入通义,个人用户可从通义 APP、官网和小程序免费应用通义家族全栈服务。
未来,阿里云的 AI 之路会走得如何,我们也拭目以待。