自家通用大模型面世100天后,科大讯飞再次升级。
【资料图】
对于科大讯飞来说,大模型意味着什么?“进一步整合各个专用领域人工智能、彻底改变内容生产和人机交互方式、反哺整个人工智能生态”,科大讯飞董事长刘庆峰用三点总结道。
尽管面临外界争议,但是刘庆峰再次强调了讯飞星火大模型的推进节点:10月24日,讯飞星火认知大模型将全面对标ChatGPT——中文超越、英文相当,明年将进一步对标GPT-4。
“大模型的商业化,大家一直都在探索中。”在接受时代财经等媒体访问时,科大讯飞研究院院长刘聪表示。
从年初至今,国产通用大模型混战远未结束。在这之中,已有焦点玩家尚未正式亮相就黯然离场。
在刘庆峰看来,不可否认,面对国际领先玩家的时候,行业一度是焦虑的;但更重要的是,在通用人工智能的基础上,如何将创新落到实处。
公布大模型阶段性成果
与5月6日的首发相比,讯飞星火大模型2.0版本主要在于代码能力和多模态能力的升级。
为什么这两项能力需要单独拿出来展示?
刘庆峰解释道,代码能力对大模型的长文本理解、逻辑推理及任务规划能力有较好的提升,同时能够大幅降低数字经济的创业门槛。另一方面,多模态能力也是科大讯飞既定的人工智能技术长期战略。
在现场,科大讯飞研究院院长刘聪全程以语音交互的形式实时演示了讯飞星火大模型升级后的能力。
不是程序员,在人工智能时代如何写代码?“马上七夕就要来了,我们来应景地画一个爱心。”刘聪用语音发出指令,要求星火使用Python画出红色的心形线。一键复制代码、运行,一颗红色爱心便出现在大屏幕上,台下观众纷纷举起手机记录。
这只是一次易于理解的展示。基于此,科大讯飞发布了一款新产品“智能编程助手iFlyCode”。通过iFlyCode,用户可以在不用自己动手写一行代码的情况下,完成部分编程工作。
在过去的一个月,这项工具已经在讯飞内部实现试点应用。刘庆峰公布了一组数据:有2000多名员工使用,代码采样率超过30%,编码效率提升30%以上,综合工作效率提升15%。
多模态能力上,在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面,讯飞星火大模型也进行了全面升级,并推出讯飞智作2.0,作为AIGC内容的生产工具。
刘聪现场输入几张图片,平台实时分析后,依据图片内容配上文案,加上声音,再设定虚拟人形象朗读,一段黄山毛峰的介绍视频在不足5秒的时间内生成,且可以一键切换至中英双语输出。
举例来看,讯飞智作2.0的应用范围,包括企业宣传文案、产品出海,旅游博主、美食博主的视频输出等等。
“如果大家用一些很复杂的图,它还不能搞得那么好。”刘聪在会后与媒体的交流中坦言,讯飞星火仍然在不断优化迭代之中。“大家顶住压力,能把现在这样一个阶段性成果拿出来,我个人还是比较自豪的。”
教育领域率先落地
“谁能够在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。”刘庆峰此前强调。
尽管平台发布时间不算领先,但讯飞星火甫一推出,就已经明确了六个行业应用场景:教育、医疗、金融、办公、汽车、工业。
在过去的三个月里,与讯飞星火结合的硬件产品相继落地。5月6日,首款搭载大模型能力的AI学习机T20系列首发,并进行持续升级。8月9日,讯飞发布智能办公本X3。
“(C端产品)一拿到手,马上就能用。”在刘庆峰看来,面向大众的硬件产品能够更直观地让用户感受到大模型的价值。
财报显示,讯飞星火认知大模型发布后,带来科大讯飞学习、办公等消费类硬件产品销售的显著增长。2023年5月-6月,讯飞 C端硬件GMV创历史新高,同比翻倍增长。其中,以学习机为例,5月-6月,大模型加持后学习机 GMV分别同比增长136%和217%。
“可以看到,通用人工智能认知大模型可以实实在在推动产业前进。”刘庆峰说道。
时代财经注意到,从营收占比上来看,近年来,教育业务是科大讯飞的主要收入来源。2023年上半年,科大讯飞实现营收78.42亿元,来自教育业务的收入为24.21亿元,占比约三成。
升级后的星火大模型,围绕教育领域,也落地了多款产品和功能。
讯飞星火代码能力的升级,应用在讯飞教育数字基座上,零编程基础的老师也能使用教育数字基座作为开发助手。例如,教师只需要简单的指令就能搭建离校管理应用,满足学校管理数字化转型中的个性需求和定制开发。
该教育数字基座已经在上海、湖北等学校试点落地。数字校园的投资成本可以降低约90%,从15万元左右降至1.5万元。
在教师端,科大讯飞在现场发布了星火教师助手,协助老师设计教学活动、一键生成课件。科大讯飞透露,这一功能至今已服务全国超过2.5万所学校、超过1200万名师生。
面向学生,6月9日,科大讯飞发布了讯飞语伴APP。发布会上,结合升级多模态能力,刘聪现场展示了讯飞语伴APP用AI实现真人口语陪练。目前,其口语模考功能已支持CET、雅思、托福等大型权威考试。
除此之外,讯飞AI学习机也升级了AI编程空间和AI创意画板两项功能。前者支持Python语言的学习、练习以及代码自动生成、修改、运行调试等功能;后者主要基于大模型对图像的理解能力,理解和分析孩子的画作并加以引导。
同时,讯飞输入法“AI创作助手”也正式开启内测,可在办公、学习、生活、社交等多个领域为用户提供场景化文案服务。
未来商业化怎么走?
不可忽视的是,大模型是一条长期投入、商业化路径尚未探明的赛道。
一项来自印度新闻媒体平台Analytics India Magazine的报告显示,OpenAI每天需要花费约70万美元运行其人工智能服务ChatGPT,且尚未产生足够的收入来实现收支平衡,有可能在2024年面临破产威胁。
尽管结论有些危言耸听,但这一消息也挑明了大模型公司的商业化困境。只谈投入、不谈回报,是不现实的。
星火大模型发展节点 图源:时代财经摄
“大模型的商业化大家一直都在探索中。”刘聪在会后采访中表示,现在还无法判定这一探索何时能够反映到公司的经营数据上。
在刘庆峰看来,以通用大模型为目标的竞争将在明年水落石出,而垂直行业大模型将会呈现“百花齐放”的态势。
“通用大模型是做好垂直大模型的前提。”他强调,“对科大讯飞这样的公司,不做通用大模型就不可能在国际舞台上未来争得一席之地,你连上桌的机会都没有。”
而谈及应用落地的困难,刘庆峰认为,首先要在国产算力安全和数据安全的前提下进行讨论,另一方面,一定要回归场景驱动。“知道这个场景给客户带来的价值是什么,新增效益,还是节约成本、提高质量,同时能够让用户在使用过程中非常快速地、低技术门槛地做训练,才能够使它赋能千行百业。”
时代财经注意到,在8月12日的投资者关系活动中,科大讯飞详细解释了讯飞星火的商业模式如何落地。除了与学习机、办公本等已有硬件产品结合,拉动C端销售增长之外,还包括多条B端路径。
首先,开发者与平台之间可以按调用量付费、应用合作分成、流量分成及订阅付费。截至2023年6月30日,讯飞人工智能开放平台已有497.4万开发者。
其次,在通用大模型的基础上,面向重点行业客户以私有化部署的方式,协助行业客户构建自主可控的行业大模型。讯飞透露,目前已经与人保科技等多家行业头部客户达成合作意向。
此外,星火大模型可以应用到企业数字化转型场景中(如智能客服),以及未来面向C端用户提供AI助手。
在发布会上,科大讯飞还和华为联合发布了讯飞星火一体机,意在为每一家企业提供专属的大模型,联合打造全国产化算力底座。刘庆峰介绍,科大讯飞和华为已在联合攻关算力“卡脖子”的问题,未来可以对标英伟达的A100芯片。