大模型618提前开战,永久免费意味着什么?

已有471人围观 来源:CSDN企业招聘 发布于:2024-05-24 18:30:59
万万没想到,当我们在说经过上一年的百模大战,2024 年将成为大模型应用落地的关键一年,不承想,AI 大模型价格战疯狂席卷而来。
这场战役始于巨头。字节、阿里、百度、科大讯飞、腾讯先后官宣降价或免费,价格战所带来的是对于所有行业用户、开发者用户而言,究竟谁家的模型 API 才是物美价廉的优选,AI 赛道真正的产品力竞争由此拉开了序幕。
在这之中,科大讯飞的动作颇引开发者注目。其官宣讯飞星火 API 能力正式免费开放,Lite 版本 API 永久免费开放,Pro/Max 版 API 大幅降价,低至 0.21 元/万 tokens。
消息一出,无疑加剧价格战的火药味,也直接推进大模型市场的竞争进入新阶段。对开发者而言,大模型打响价格战之时,究竟该选哪家 API 大展身手?如何更丝滑地深入应用场景创新、探索大模型在不同领域的应用潜力?讯飞星火又有着怎样的优势,为开发者们带来了哪些利好?

基础版本永久免费、顶配版低至 0.21 元/万 Tokens
话不多说,先来看科大讯飞对讯飞星火大模型的具体定价调整情况:
亮点一:讯飞星火 Lite API“永久免费”

这也是业界首个宣布大模型基础版本「永久免费」的公司。从功能上来看,讯飞星火 Lite API 支持在线联网搜索,适用于需要在较低计算能力环境下进行模型推理和精调的定制化场景,旨在为开发者提供一个易于接入且成本效益高的轻量级大语言模型。讯飞星火已经学习了包括金融、能源、工业等 12 个行业的知识,这使得 Lite API 在这些领域内提供更加精准的服务。
它的永久性免费,不仅降低了开发者的使用门槛,还通过不断学习和更新,提供了更加丰富和高效的服务。

亮点二:顶配版迎来史上最低价,输入输出同为 0.21-0.3 元/万tokens

本次科大讯飞也在顶配的 Spark3.5 Max/Spark Pro 版本上实现了更低的价格
以输出价格为例,支持联网搜索与天气等内置插件、System 角色人设与 Function Calling 函数调用的 Spark3.5 Max API 价格低至 0.21元/万Tokens。在讯飞星火,1 token 相当于 1.5 个中文汉字,因此 2.1 元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。

这一点,和近期同样宣布降价的百度文心一言 ERNIE-4.0 和阿里通义千问 Qwen-Max 1.2元/万tokens 的价格相比,讯飞星火定价为百度、阿里的五分之一,更具性价比。
对此,科大讯飞在投资者关系活动上表示,讯飞星火 API(应用接口)免费的相关商业逻辑在讯飞人工智能开放平台已经有成功实践和验证:讯飞开放平台面向全行业提供人工智能能力和整体解决方案,以免费+扶持的策略为主,基本能力免费,对于其他企业做不了的、性能更高的、个性化的定制服务收费。

讯飞星火降价的背后——全国产算力

回看科大讯飞、百度、阿里等国产大模型厂商相继大幅降价的举措,这也不禁让人好奇的是,曾几何时,都说大模型是一场“钞能力”的战争,就连外媒也曾多次报道,走在 AI 大模型前沿的 OpenAI 主要通过三种方式来就生存问题“自救”。

其一是向消费者提供会员订阅服务,即每月收取 20 美元 ChatGPT Plus 订阅服务费,从而提供更快的响应服务,并带来优先使用功能更强大的 GPT-4 等模型策略;二是提供面向开发者的 API 接口调用收费模式;三是借助微软等投资者的投资来加大研发。在过去一年,据 The Information 透露,OpenAI 获得了 16 亿美元的收入,然而这与外媒报道的为运营 ChatGPT 每天要消耗 70 万美金相比,这笔买卖还是亏了很多。

在这种趋势下,科大讯飞何加入了“降价”这波浪潮,也更加引人关注。

事实上,在过去一年的时间里,国内的大模型制造商在算力、推理和算法等多个方面取得了显著的突破,从而实现了技术层面的成本降低,同时,「基于国产自主可控大模型工程化优势」也是科大讯飞如此做的底气所在。

在算力层面,由于国际竞争环境日趋复杂,为了抢抓通用人工智能时代的发展主动权,有「居安思危」意识的科大讯飞多年前起就加大国产算力的投入,构建一套自主创新的体系,并投入大量的精力展开国产化移植优化的工作。

此前,科大讯飞公布与华为联合打造的“飞星一号”平台,集算、存、运、管四位一体,是首个能够支持万亿参数大模型训练的大规模算力平台。

2023 年 10 月,科大讯飞宣布“飞星一号”万卡国产算力平台正式启用。如今这一平台实现了全国产化,采用昇腾 AI 硬件训练服务器和先进的网络技术,单机算效提升 50%,通信带宽利用率提升 40%,并行训练算法优化 10%,其国产芯片的训练效率已经与英伟达 A100相当,为 AI 提供强大的算力支撑,使得处理复杂任务的大模型训练成为可能,同时极大地降低了算力成本。

借助“飞星一号”,科大讯飞于今年 1 月推出的讯飞星火 V3.5 模型在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了升级。其中语言理解、数学能力超过 GPT-4 Turbo,代码达到 GPT-4 Turbo 96%,多模态理解达到 GPT-4V 91%,推动了数智化生产力的进一步发展。
与此同时,在技术实现上,讯飞星火大模型融合了深度学习和自然语言处理等尖端技术,使其能够高效地处理包括文本、图像在内的多种类型的信息,从而实现全面且深入的认知能力。这种多模态的信息处理机制为模型提供了丰富的知识来源和强大的环境适应能力。

 
大模型狂卷价格战,对开发者意味着什么?

对于这波降价,CSDN 和多位 AI 资深开发者讨论,有人认为这是大模型厂商的一种营销手段,一方面,厂商通过提供免费或低价服务吸引用户,积累数据来优化自家的模型;另一方面,他们也期待用户在体验基础版本后,转向更高阶的付费服务;还有人认为,这反映了大模型行业内现有性能评测标准的缺乏,既然没有统一的标准,通过直白的比拼价格可以让用户更容易理解和选择。

实际上,许多大模型 C 端产品如 ChatGPT、讯飞星火自发布之日起,便采用了免费的政策。如今 API 的免费与降价,某种程度上表明大模型本身不再稀缺,真正稀缺的是开发者资源,让更多的开发者能够用得起或才是此轮降价的本质,所谓得开发者得大模型的天下,只有用了,才有更多应用、落地场景、数据随之而来。

正因此,科大讯飞表示,焕新的价格体系将帮助开发者降低调用成本,驱动产品创新验证,解决真实世界的刚需。

价格战的开启,就一线开发者而言,如何选用也成为当前亟需解决的难题?

面对不同版本,明确需要完成的任务和处理的数据量,预计产品的用户数量和使用频率,都是选择合适 API 的重要考虑因素。

首先,开发者可利用免费的大模型调用额度进行初步测试和开发,如科大讯飞此次免费提供的 Lite API 已经足够用于小规模应用,虽然这一版本的 QPS 低,但它的 tokens 总量是无限的,较适合个人开发者使用。你可以使用 Lite API 来完成语言理解、内容创作、知识问答、逻辑推理、数学能力这些任务。在不增加预算的情况下,调用 API 为应用添加基本的 AI 功能。

而更高阶的星火 Pro/Max API 则能提供更高级的 AI 服务,适用于代码理解与编写、多模态交互等复杂任务。结合不同 API,开发者可以创造出新的复合服务,如结合语音识别和自然语言处理,开发更智能的语音助手等。

大模型发展至今,除了价格之外,开发者还普遍关注以下几个方面:
  • 生态系统的支持,对于许多垂直行业的应用,使用微调模型和专用部署模式能够更好地体现效果,这超出了 API 服务的范畴。
  • 技术支持,现在很多人并不清楚如何将业务接入 AI 能力,或者只是一知半解。对于相对复杂的任务,如果不能合理拆解步骤,大模型将难以实现相应功能,进而被认为“模型不行”。如果大模型平台能够提供一些典型案例,帮助用户理解复杂任务的拆解过程,明确哪些部分可以通过工程化方式解决,哪些部分推荐接入 AI,将会极大地帮助开发者。
  • 好用性,业务接入 AI 时,最大的挑战在于模型能力。如果模型能力能够满足业务需求且价格合理,开发者会乐于接受;但如果模型能力不足,即使免费也不会使用。
在生态系统维度,科大讯飞也在很早之前便做了战略布局,其采用“1+N认知大模型”实现模型赋能,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
以教育为例,基于讯飞星火大模型的智能编程助手iFlyCode已成为教师和学生的得力助手。办公场景中,讯飞听见、智能办公本等产品大幅提升了工作效率。智慧城市中,利川的县域智算中心推动了城市公共基础资源的发展。讯飞星火大模型还渗透到了科研、金融、汽车等多个行业。

其次在技术支持上,科大讯飞近日宣布,面向大模型开发者,讯飞星火开通了专属服务通道,聚焦零故障运行的 SRE 体系、1+X+N 的模型能力矩阵、技术专家 1V1 在线支持、全年近百场交流活动四大核心维度,全面升级服务体系。
最后,相对于免费和降价的策略,大模型厂商也需要进一步的打磨自己的高精尖能力,怎么实现低价、高速、好用才是硬道理,这其间又将涉及到诸多的 PK。有专家向 CSDN 预测,大模型的价格之战,最后必然只存活两三个通用模型,其竞争激烈程度可见一斑。

面向未来,科大讯飞加快了脚步,即将于 6 月发布直接对标 GPT-4-Turbo 的讯飞星火大模型 4.0 版本。科大讯飞董事长刘庆峰于近日 BEYOND 国际科技创新博览会上对即将发布的新一版本表示,「我们与 GPT-4 的差距在半年之内,今年 6、7 月前后就能赶上 GPT-4 目前水平。一旦 GPT-5 发布后,差距可能会被拉到约一年,但我们会再次赶上。」

我们也将共同见证讯飞星火大模型 4.0 版本的到来,期待更多开发者利用大模型 API 大展身手,加速更多应用落地,助力 AI 普惠。

© 2022-2024. All rights reserved. 梦想PHP.

声明:本站所有内容均为自动采集而来,如有侵权,请联系删除 苏ICP备06013646号-6