chatgpt进行产品结构设计 科大讯飞刘聪:“直道冲锋”挑战ChatGPT,技术力和产品力的系统工程

AI资讯1年前 (2023)发布 fengdao
39 0

在苹果用户尝鲜两个月后,安卓版也如约而至。美东时间7月25日周二,宣布,现在美国、印度、孟加拉、巴西四个国家的用户可以在谷歌的 Play下载安卓版的App,并提供了相关链接。称,计划下周将这一App推广到更多国家。

近期国内外大模型产业竞争的势头迅猛,有关大模型的标准在国际国内的权威性与认可度是什么样的状态?大模型与产业端怎样才能有效的结合?国外相关企业的在产品设计和占据用户心智方面是否会影响中国AI生态的竞争力?科工力量就以上几个问题对科大讯飞副总裁,研究院院长刘聪进行了采访,实录如下:

科工力量:近期人工智能的全球竞争格局继续白热化,能否为大家一下最新的态势?

刘聪:国内外大模型产业竞争目前呈现“激烈迅猛”的势头,过去的半年应该说是日新月异,例如大家熟知的,从11月30日的发布,两个月之后活跃用户过亿,很快进行了几轮更新,在今年3月14日进一步发布了多模态大模型GPT-4,并基于插件接入互联网实现各种APP的调用及复杂任务。

从另外一个层面,我想强调的是产业竞争,应该说现在都很卷,全球大模型产业的竞争既激烈又迅猛。

的GPT-4在3月14日推出之后,3月22日,微软发布相关产品、将GPT-4的能力全面接入全家桶;谷歌这边,把原来Jeff Dean的 Brain和合并成 。可以看到,国际上从技术到产业的变化在过去这段时间里非常之快。

图源:

比尔·盖茨说,大模型的历史意义不亚于PC和互联网的诞生。应用方面,已经有报道说美国89%的大学生用来写作业。更重要的是产业,在很多专业方向上,大家都已经开始使用,国内一些大模型出来之后,生活、工作各个方面都有越来越多的人来使用它。

国内大模型正在呈现百花齐放的态势,各家人工智能企业纷纷加大投入力度,相继发布了大模型及产品,在这次WAIC 2023上,大家也能看到包括讯飞星火认知大模型在内的各类国内大模型技术及产品;同时,国内部分大模型也在行业结合应用上进行了探索,取得了一定的成果。

科工力量:关于大模型标准。不久前,讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,覆盖7大类481个细分任务类型,目前来看,这套标准在国际、国内的权威性和认可度如何?

刘聪:在智慧涌现的通用人工智能时代,亟需为认知大模型技术提供科学系统的评测体系。

在讯飞启动大模型攻关专项之初,我们结合发布时给出的48类任务,以及国家新一代人工智能开放创新平台上面的400多万开发者对这些能力的需求分析,将当前的通用人工智能划分为以下的7个维度,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力。在这个基础之上,认知智能全国重点实验室联合了相关的权威机构和专家,提出了通用认知智能大模型评测体系,把上述7大类的任务进一步分解到481个细分任务,同时构建了丰富的测试语料集合。

在这套体系出来之后,与中国科学院人工智能产学研创新联盟和长三角人工智能产业链联盟众多的专家、合作伙伴进行共同探讨,达成广泛共识,并于6月3日举行的长三角企业家联盟产业数字化峰会正式发布。

产品结构设计注意事项_结构性产品设计_chatgpt进行产品结构设计

下一步希望与联盟单位基于通用评测体系,共同推动行业评测方案落地,让认知大模型技术真正解决社会刚需。

科工力量:上述的标准体系是通过调研400多万开发者需求产生的,目前全球人工智能竞争白热化,“涌现”的速度也非常快,比如GPT-4表现出了四大高阶能力,需求是否会跟不上技术供给的速度,这套标准是否会继续迭代演化?

刘聪:讯飞研究院有一句话:“从技术中来,到产品中去”,大模型技术和实际需求必须紧密结合。

上述所提的通用认知大模型评测体系会随着大模型技术的演进与发展,动态迭代。同时,结合大模型在行业的应用,也会建立面向行业场景任务的测试体系。

图源:

科工力量:“涟漪效应”是否意味着中国丰富的真实产业应用场景会是一个富矿?

刘聪:这里先解释一下“涟漪效应”。2010年时讯飞推出了讯飞云平台(后为讯飞开放平台)与讯飞输入法后,我们提出了“涟漪效应”——人工智能相关技术被人们使用时是一点点扩散的,越来越多的人使用,也会不断贡献数据和反馈,系统误差也会随之越来越小,就像水波纹的振浮一样。以语音为代表的感知领域的确受益于涟漪效应,例如我们的语音识别系统,集合算法、数据等之后其错误率连续8-10年每年相对下降30%以上。

认知智能和感知智能涟漪效应不太一样,指的是认知智能数据标注工程里和原先感知智能数据标注不太一致,原来的数据标注属于劳动密集型,普通人通过简单培训之后就可以操作。但认知大模型涉及到繁多的领域、专业,数据标注已转化成知识密集型,源源不断的增量知识数据是大模型智能涌现的坚实基础,丰富的产业应用场景提供了宝贵的数据,这个时候怎么样去获取知识,怎么样去能形成这种涟漪的迭代,对整个系统的效果是至关重要的。

科工力量:产业端,特别是传统产业的发展节奏远没有那么快,您怎么看大模型与产业模型的结合、与产业的结合与落地?

刘聪:我们认为,人工智能价值兑现有三大标准:真实可见的实际应用案例、能规模化推广的对应产品,以及可用统计数据证明的应用成效,大模型也是如此。

讯飞星火认知大模型从攻关启动便已明确“1+N”的体系,其中1是指通用认知大模型,N指的是大模型在教育、医疗、工业、汽车、办公等各个领域的落地。之所以“1+N”同步进行,一方面是此前讯飞在“N”的行业领域中有较好的业务和场景基础,第二也是因为“N”会让“1”的能力持续迭代进化,所以双方是互相促进、共同进步的。

我想说一个很有意思的话题,是科大讯飞联合创始人徐景明在今年年初提到的一个观点:之前,是拿着AI技术寻找场景与问题,但其通用能力很难在不同的场景实用,就像拿着锤子找钉子却发现每个钉子都不一样,衍生了行业定制复杂、成本昂贵、不可持续等问题,锤子的价值也在市场的激烈竞争中消失。但是认知大模型的出现像“雷神之锤”,从三个方面进行破局:面向不同场景结合不同工具更高效地自动捶打钉子、能够捶打各种各样的钉子、锤子也变得更加便宜。在降本增效的基础之上,认知大模型与行业场景的紧密结合也能不断反哺大模型自身能力持续进化。

chatgpt进行产品结构设计_结构性产品设计_产品结构设计注意事项

从PC时代的win-tel,到移动互联网时代iOS和安卓两个生态系统,再到搜索生态系统,我们相信未来大模型本身就能带动一系列的上下游产业链、技术链,形成新的生态。

图源:

科工力量:您刚才提到中国AI大模型既要“弯道超车”,也要“直道冲锋”,怎么理解?怎么做?

刘聪:首先,目前国内与国际顶尖的认知智能大模型对比还存在综合实力、平台能力等差距,要正视差距,并且以最先进水平为目标奋起直追。在“直道冲锋”的过程中,我们会遇到各种困难与阻碍,例如芯片、高质量数据、系统迭代等方面仍然挑战严峻;但国内在大模型各技术领域方面有长期的探索与积累,核心技术方面的系统性创新也“开花结果”,加上国家对这一领域的高度关注,我们在认知智能大模型的长跑中要有底气和信心。

“直道冲锋”是一场“持久战”,这条道路上产业需要先行,创新应用后带动生态圈的整体发展;但想要对标目标并保持差距不断缩小,“后劲”也至关重要。在做出阶段性成果之后,产业发展与科研创新必须协同并进,彼此范式持续迭代、相互促进,才能为我国自主大模型的发展源源不断注入长跑动力,实现革新和蜕变。

在后续的“长跑”过程中,通过产业界和学术界的紧密协同,科研领域也会诞生多方面的开源大模型,让科研界的各位科学家可以在这些模型平台基础上进行更加前沿的创新性工作,语音、图像、自然语言处理等领域的科研任务和目标可能也会出现新的变化。大模型除了对产业界实现生态的革新外,协同并进的方式可能也会为以高校、院所、新型研发机构为代表的科研生态圈带来新的变化。

科工力量:不论是此前的(阿尔法狗)还是这次的,国外企业在产品设计和占据用户心智方面要比国内企业要强,您如何看待这个问题?这个方面是否会影响中国AI生态的竞争力?

刘聪:在产品上真正让亿万用户体验后发表自己的观点和感受,在产品设计上确实值得我们思考与学习。

目前国内大模型百花齐放,大家也都纷纷推出大模型技术和相关产品,都在结合不同场景和用户体验持续探索努力。以讯飞为例,6月9日,讯飞星火发布V1.5同时也推出了讯飞星火APP,面向生活、工作等高频场景上线了小助手,目前已有1200+个,用户创作中心还支持持续共创和分享,为大家打造大模型时代的随身助手。

科工力量:有人提到数字技术和人工智能对个人的赋能将进一步放大技术鸿沟,加剧个体差异,影响社会公平,您怎么看这个问题?

刘聪:人工智能的应用就目前看来,更多还是工具:AI能够了解成长的秘密,但没有代替母亲,AI能掌握所有的医学知识,但没有代替医生。未来不是属于AI的,而是属于掌握了AI的新人类。

海量资讯、精准解读,尽在新浪财经APP

© 版权声明

相关文章

暂无评论

暂无评论...