明年对标GPT4,这一国产AI大模型重大发布

中国基金报   2023-08-15 21:59:56


(资料图片仅供参考)

中国基金报记者 冯尧国产大模型迎来又一次“升华”。8月15日,科大讯飞如期发布“讯飞星火认知大模型V2.0版本”(简称:星火V2.0)。星火V2.0此次最大的升级在于代码能力和多模态能力的大幅提升。据科大讯飞董事长刘庆峰介绍,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。同时,他明确了星火大模型远期目标:到10月24日星火大模型代码能力全面超越ChatGPT,明年上半年将正式对标GPT4。现场演示代码生成游戏据了解,相比之前的星火V1.5版本,星火V2.0的文本生成能力提升72%,语言理解提升78%,知识问答提升70%,逻辑推理提升60%,数学能力提升72%。最为显著的能力升级自于两个方面,其一是代码生成、代码补齐、代码解释、代码纠错和单元测试生成等能力。刘庆峰在发布会上坦言,星火认知大模型目前数学能力目前已经超过ChatGPT,“但离我们的期望还有一段距离”。科大讯飞在发布会现场也演示了星火大模型最新的代码能力。演示人在现场向星火大模型下达一段指令,即用Python完整实现以下功能:判断输入字符串是否符合码规则,密码规则为长度不小于8位,必须包括大小写、数字及特殊符号。随后,星火大模型给出的代码在系统中顺利跑通。另外,星火大模型还可以使用Python处理视频。在演示过程中,星火V2.0使用Python处理了一段长达2分钟的视频,从中提取第二到第十秒,把画面缩小一半,同时加速5倍,然后保存成gif图片。在现场演示中,星火大模型甚至完成“贪食蛇”游戏的代码生成,并令游戏流畅运行。据刘庆峰介绍,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C++进行代码生成能力已高度逼近ChatGPT,差距仅为1%和2%。同时,与星火V1.5相比,其Java和JS语言的生成能力也分别提升了15个百分点和23个百分点。在科大讯飞看来,代码是一项硬碰硬的能力,不存在任何主观评分标准,所以其也被视为大模型聪明程度的重要标志。根据GitHub数据显示,92%的美国程序员正在使用 AI工具。国海证券认为,代码能力的提升将进一步提升大模型的用户规模。据透露,在科大讯飞内部,星火V2.0的代码采纳率提升了30%,编码效率提升了30%,综合效率提升15%。多模态能力价值将凸显星火V2.0另一重大升级则在多模态能力方面。据了解,这一最新版本大幅提升了多模态理解(包含视觉问答、描述、推理等)及多模态生成(文图生成、可控语音合成)方面的能力。刘庆峰直言,“多模态能力是人工智能必由之路。”而且在业内看来,近期随着妙鸭相机、Midjourney等爆款频出,未来大模型的多模态能力价值将会凸显。据了解,在多模态能力领域,星火V2.0在图片理解、图片描述、图片推理、文图生成、虚拟人合成等能力取得重要进展,显著提升大模型对场景的理解能力及面向生活和工业领域的智能化支撑能力。在现场演示环节,演示者甚至直接现场拍摄会场照片,抛给星火V2.0识别并令其作出描述。星火V2.0随后将发布会现场描述为一个“重大而正式”场景,同时将并不清晰图片中的文字获取,写出相应文案。而且,基于多模态能力升级,科大讯飞还同时发布“讯飞智作2.0”工具。这一工具能进行视频分析,写创意文案,进行AI配音,提供配图生成、AI主播功能。在现场演示中,讯飞智作2.0直接为一段视频配上字幕、并生成虚拟主播以及语音配音,大幅度提升图文创意、视频配音和视频制作工作效率。此外,在此次发布会上,科大讯飞还宣布联合华为推出讯飞星火一体机。据介绍,讯飞星火一体机将使所有企业更方便、更自主、更安全可控地私有化部署大模型能力,在完全国产自主创新的平台上进行私有化部署,保护数据安全。近期已有不少合作者开启与科大讯飞的合作。就在8月14日,万兴科技宣布旗下绘图创意软件亿图图示、亿图脑图以及墨刀,将以插件的方式入驻讯飞星火认知大模型平台,并将结合大模型平台能力,为用户提供强大的AI绘图创意解决方案。明年上半年将对标GPT4据了解,自星火大模型5月6日发布后,讯飞人工智能开放平台的开发者团队数量在两个月内增加85万。在6月9日,星火V1.5版本进一步优化,包括开放式问答取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升等。星火大模型下一个重要节点是今年10月24日。按照此前规划,星火大模型将对ChatGPT实现中文超越、英文相当。而刘庆峰在此次发布会上又抛出更进一步目标:到今年10月24日各项代码的能力都会超越ChatGPT,明年上半年将正式对标GPT4。值得注意的是,科大讯飞近日公还对2021年股票激励计划第三个行权期的业绩考核指标进行修订,其中便加入关于大模型技术先进性考核,其一是完全基于国产自主可控算力平台,实现通用人工智能“讯飞星火认知大模型”的训练和推理;其二是在性能上,对标 ChatGPT(指GPT3.5),中文超越,英文相当,处于国内领先水平。同时,科大讯飞还对2023年业绩进行阶梯考核。按照最新考核方法,2023年营收对比2020年增长率超过50%-70%以上,分别对应了相应的行权比例。有券商机构认为,新激励机制要求增加了星火认知大模型先进性验证的考核,体现了科大讯飞在新战略规划下对经营发展和大模型能力的信心。编辑:舰长

审核:许闻