2023年,自从2月份火了之后,AIGC产业持续升温,近期,冲击中国大模型的队伍当中又迎来了一支国家队。
2023年5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行,在发布会现场,科大讯飞董事长刘庆峰、研究院院长刘聪分别在现场实测讯飞星火认知大模型的七大核心能力以及大模型在教育、办公、汽车、数字员工四大行业应用成果。
据刘庆峰介绍,在文本生成和数学能力(一定程度代表通用认知大模型的智慧水平)上,星火认知大模型已经国内显著领先,且相比也具有一定优势;在语言理解和知识问答方面也达到接近水平,处于国内领先水平。
与此同时,他还现场公布了讯飞星火认知大模型在2023年的三次升级时间点,“10月底将整体赶超。后续科大讯飞还将联合开发者推动大模型应用落地,共建人工智能‘星火’生态。”
在AIGC领域后来者居上,讯飞星火认知大模型到底有何优势?科大讯飞又将如何彻底赶超?
AIGC竞争升级 讯飞星火认知大模型后来者居上
2023年,在带动下,中国的AIGC产业真的火了。
公开资料显示,在短短2个月的时间里,以AICG能力为代表的AI大模型成为社会各界关注的焦点,百度、阿里、360、商汤等新老科技巨头纷纷发布了自己的AI大模型,目前已经亮过相的大模型就至少有20个,还有一大批AI大模型即将与公众见面。
不仅各大公司都在研发自己的大模型,AI大模型领域也掀起了一股创业潮。但AI大模型是个极度考研资本和耐心的领域,有投资机构直呼“投不起”。线性资本创始合伙人兼CEO王淮在一次论坛上坦言,2023年年后,投资大模型的“入场券”(投资门槛)已经从5000万美元提高到1亿美元了,竞争激烈由此可见。
在此背景下,当前国内较为领先的AI大模型基本上都来自各科技巨头、顶尖院校或科研机构、相关领域的头部企业,如推出文心一言的百度、推出通义千问的阿里巴巴、推出MOSS的复旦大学、-6B的清华大学。
虽然大模型的具体功能五花八门,但总的来说均是围绕文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力、多模态7大项能力与具体应用场景相结合。因此,这7项能力被中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同认定为科学测评大模型的标准。
而如果从这个角度来看的话,虽然相比互联网大厂推出的时间稍晚,但是科大讯飞的讯飞星火认知大模型的能力却丝毫不差:
在文本生成方面,讯飞星火的中文文本生成能力已经超越,由于能使用的语料资源不同,讯飞星火的英文文本生成略逊于,但在评分上,讯飞星火为4.29,为4.48,二者较为接近;
在语言理解方面,讯飞星火已经能够精准识别同一句话在不同语境下的含义;在多模态输入和表达能力方面,讯飞星火不仅支持文字输入和输出,给讯飞星火一张景区图片,讯飞星火就可以为用户介绍是什么景区,有什么特色,为用户提供详细的旅游攻略。
在知识问答方面,在中国科学院支持下,讯飞星火可以持续不断学习更多科学资料,不断提升科学问答能力;在此基础上,讯飞星火还可以指出用户问题中的明显错误,如在发布会现场,讯飞星火就明确指出提问中的错误,而不是像部分友商的大模型那样“将错就错”,用错误的条件给出一个明显不符合逻辑的答案,展现了惊人的逻辑推理和数学能力。
代码能力或许是讯飞星火认知大模型目前的一个短板,但科大讯飞也在迅速提升讯飞星火的代码能力,并宣布预计于8月在代码方面实现突破。
此外,另据2023年5月9日,中文通用大模型综合性评测基准发布的报告显示,在包括基础能力测试、中文特性测试的中文通用大模型基准测评的总榜单当中,星火认知大模型的排名仅次于GPT-4及GPT-3.5-turbo,排名第三,同时在中文大模型当中排名第一。
“行家一出手,就知道有没有。”
可以说,作为国家队的一个代表,讯飞星火认知大模型可谓代表了国家队的实力,因此,虽然AIGC产业竞争激烈,且从时间上来说,讯飞星火认知大模型并不具备先发优势,但是从能力上来说,讯飞星火认知大模型可谓是后来者居上。
落地四大行业应用 讯飞星火认知大模型值得期待
在AIGC的激烈竞争当中,讯飞星火认知大模型后来者居上,这引发了很多人的质疑?到底讯飞星火认知大模型凭什么能够做到这一点?
其实,答案并不复杂,那就是讯飞星火认知大模型拥有足够多的数据,且面向所有用户开放。
随着AI技术向通用大模型发展,单纯一家企业已经无法满足大模型研发的需要,数据来源就是主要的制约因素质疑。
而科大讯飞作为国内一家长期深耕医疗、教育、汽车、金融、C端消费硬件等领域的AI企业,本身就有非常大的数据积累。但随着AI大模型逐渐成为AI技术发展的焦点,数据量仍需不断扩充。正因如此,科大讯飞副总裁、研究院院长刘聪将讯飞开发平台上400多万开发者研发的将近200多万应用,每年产生的数十亿次真实的数据看作是科大讯飞的主要数据优势。
正是由于敢于向公众开放,科大讯飞一方面可以获得大量真实行业数据,通过这些数据提升讯飞星火大模型能力,另外一方面,科大讯飞还用这些数据和AI能力进一步服务开发者,让开发者能够利用其大模型做出真正自己需要的应用或内容。
同时,大量专业开发者的加入带来的还有最真实而广泛的市场需求,让科大讯飞可以避免闭门造车,做出来的大模型成为一个成绩优异却找不到工作的“高材生”。此外,大量专业开发者也是最好的数据标签员,可以及时帮助讯飞星火纠错,从而进一步提升各项能力。
多年来对行业和技术的深耕以及敢于开放的心态,这让讯飞星火一经发布就直接给出了在教育、办公、汽车、数字人四大行业应用场景中取得的优异成绩。
比如,在将AI 应用到教育的过程当中,讯飞星火大模型与教育结合最引人瞩目的可能就是在语文教学中作文批改方面的应用成果。语文是最具感性色彩的一门学科,特别是在作文方面,只是没有错别字没有病句谈不上是好作文,更何况很多AI大模型连这样的基础批改工作都无法胜任。面对学生手写的作文,特别是面对低龄段孩子歪歪扭扭的字迹,即便是真人老师也不敢说读起来没压力,更不用说交给AI了。
凭借讯飞星火认知大模型,科大讯飞的相关产品不仅可以对学生作文进行基础批改,还能针对每篇作文的情况给出针对性的建议,帮助学生提升写作水平。在英语学科教学方面,科大讯飞的相关产品也能借助讯飞星火,弥补以往英语教学中只有在课堂上才能获得听说机会的问题。
在办公领域,科大讯飞早已是国内主要的办公产品供应商之一、如其录音笔办公本常年位居各种消费榜单前列。凭借讯飞星火大模型,科大讯飞的办公产品所能提供的服务也同步升级,比如过去科大讯飞会议记录方面,以往的产品只能尽可能的提高录音的文字转换效率和准确度,但还是别人说什么就翻译什么,遇上废话连篇的嘉宾或领导,又臭又长的翻译简直就是灾难。科大讯飞的办公产品已经可以实现自动生成会议纪要,一键成稿等功能,这也是靠讯飞星火的大模型实现的。
在数字人领域,科大讯飞不仅凭借其讯飞星火大模型形成了1127个定制形象资产、386个专业声音库、30万用户自定义音库,还通过基于大模型的RPA为企业提供更加智慧的数字人员工,并已经在科大讯飞的投标、招聘、法务、采购等多个方面得到了实质性的应用。
此外,科大讯飞也正逐渐成为汽车行业的重要供应商。在汽车领域,凭借讯飞星火认知大模型,科大讯飞在不知不觉间已经服务了超1330个车型的4200万用户,为汽车提供多轮、多人、多区域、多模态智能汽车人机交互。
由此可见,讯飞星火大模型能够在短时间内就在这四大行业当中实现应用,这也同时正是科大讯飞1+N的战略成果,即1个大模型讯飞星火与N个应用场景相结合。据科大讯飞董事长刘庆峰介绍,大模型已经过了需要大量增加算力的阶段,把各个子模型协同联动起来才代表未来。
“在巨人的肩膀上前进”
科大讯飞不仅迅速推出了讯飞星火,还同时在教育汽车等四个领域实现了具体的落地,目前,科大讯飞的“N”还在进一步扩充,有望在医疗、城市管理、工业等多个场景得到应用。
与此同时,正是由于对大模型发展方向的精准把握,讯飞星火还以超越不少同行的速度发展。据科大讯飞介绍,仅2023年,讯飞星火还将分别在6月9日、8月15日、10月24日分别进行三次大的技术迭代,不断迭代升级的科大讯飞正试图向人们证明,在AI这种需要大量技术沉淀和积累的领域,后发并非没有优势,若科大讯飞能够如期甚至提前完成迭代目标,那就意味着国产大模型不仅在中文应用领域领先,在英文应用领域也将达到世界领先水平。
前途很美好,但科大讯飞到底能不能按时完成其迭代计划,以及迭代后能否达到其所说的应用水平,让我们拭目以待。