随着人工智能技术、云计算、5G移动通信等技术的发展,数智人行业不断加快的各种应用场景落地。数智创研院的《2022数智人分析洞察报告》显示,中国AI数智人市场规模呈现高速增长趋势,预计到2026年将达102.4亿元。
在过去,要完成一个超写实、高精度数智人的制作,可能需要数十小时的烘焙和渲染——而在今天,一项数智人技术的突破,或许会让这项技术,变成以后每个人都共有的“标配”。
什么是数智人
数智人是由中国工程院院士钱旭红和赵星等团队提出的概念,原本定义为进化了数据智能能力和手段的新人类,如今已发展为“多源数据+智能算法+领域专家”的“数智人”框架体系。
赵星指出,“自主可控、包容审慎、敏捷治理”是中国数智人产业发展、政府治理和社会管理可以考虑的主要路径与原则,美学化、工具化和智能化是“数智人”的未来发展方向,其中,智能化是最为关键的一步,并在C端、G端和B端都具有巨大潜力空间,“数智人指向了人类意识永生的终极梦想,是一个无论有没有元宇宙概念,都具有极高成长性的前沿科技行业。”
简单来说,数智人如同它的名字,是智能的数字人。因此,数智人不仅具备数字人强劲的变现优势,而且数智人更拥有智能化与交互性特征,这也是“数智人”与普通的数字人最大的区别。
在AI技术、5G技术、XR技术以及深度学习等技术的支撑下,数智人将拥有更智慧的头脑、更灵活的动作、更丰富的表情以及更人性化的心智等特征。
数智人技术
生成式人工智能(AI)技术经过不断发展进步,融合计算机视觉、人工智能强化学习和生物信息学等学科和技术后,其应用范围已拓展至更多行业和领域,并支持处理文本、图像、音频、视频等多模态数据。
与此同时,应用平台、计算硬件、数据库功能等不断优化升级,持续提升生成式AI的性能表现,并逐步降低其使用门槛,通过技术进步与应用反馈共同推动AI技术发展迭代。
数字资产平台/推进NeRF技术在3D建模领域广泛应用
美国数字资产平台公司近日宣布与Luma Labs AI、RECON Labs、 AI三家神经辐射场( Field, NeRF)技术公司开展合作,其中NeRF是一种基于深度神经网络的3D模型重建技术,以推动AI技术在3D建模领域更加广泛、便捷的应用。
在线服务
目前Luma Labs AI和RECON Labs均面向公众提供AI驱动的在线服务,通过上传真实物体的视频片段生成3D模型。希望借助这项服务,将这两家公司平台上的3D资产整合进旗下的数字资产平台,并获得商用许可。
与 AI的合作旨在探索NVOL(存储NeRF文件的格式)文件许可和分发技术。通过其专业的NeRF工具套件提供全面的NeRF相关产品和服务,以支持虚拟摄制、视效制作、广播电视、XR和视频游戏。和还将联合为用户创建一个高质量内容的NVOL库,并搭建专用于生产定制NVOL的服务平台。
数字资产平台资产示例
将在资产平台发布首个完整、可直接用于制作的NeRF环境,作为其虚拟位置( )产品的首个用例,未来还将与更多NeRF和生成AI领域的技术公司密切合作,制定高质量NeRF的技术规范和最佳实践标准。
Puget /推出生成式AI和机器学习训练推理工作站
美国计算机设备商Puget 近日推出生成式人工智能(AI)和机器学习工作站,用于处理密集的生成式AI和机器学习任务,有效管理实时渲染、图形、AR/MR/VR/XR、计算和深度学习处理。该工作站已获得 2023的CGW银边奖。
Puget AI训练和推理工作站的CPU采用Intel Xeon w7-3455,最多可搭载4块英伟达RTX 6000 Ada显卡,外观根据不同配置可选择塔式机箱或机架式机箱,可为基于Web聊天界面的大语言模型(LLM)运行提供服务,并支持多用户同时使用。该硬件还支持根据GPU内存限制内对基本模型进行微调。
用于AI训练的Puget工作站
Puget系统实验室团队测试了最高配置下,搭载四块英伟达RTX 6000 Ada显卡的工作站性能。实验室使用 TGI(文本生成推理)服务和 提供Web界面,运行Meta的Llama-2-70b-chat-hf大语言模型测试该系统,测试模型使用了约130GB的视频内存(VRAM)。
当使用大语言模型-40b进行测试,运行内存空间需求更少,只需两块RTX 6000 Ada GPU即可完成任务。
Neo4j图数据库/新增矢量搜索功能可优化大语言模型(LLM)
美国图数据库供应商Neo4j近日宣布在其图数据库中提供矢量搜索( )新功能,其能够快速搜索上下文相关信息,找出数据中的隐藏关系,从生成式人工智能中获得更丰富的资讯。
区别于传统关系数据库,图数据库不使用行和表来组织数据,通常使用节点和边来构建信息知识图谱。“点”表示实体,“边”表示实体间的关系。结合矢量搜索功能,大语言模型(LLM)开发者能够利用技术,进一步改善模型回应精确度。是指在LLM创建和返回响应之前向其提供有关用户问题答案的相关信息的过程。
用Neo4j知识图谱为LLM提供事实响应(显式)和上下文相关(隐式)响应,从而提高了LLM的准确性、上下文和可解释性。开发者可利用特定的机器学习模型,将文件、视频、音频和图像等各种数据形态编码成矢量,以Neo4j创建矢量索引,执行算法,找到与特定矢量相似的矢量。
随着新一代人工智能的兴起,对具有矢量功能的数据库的需求也相应增长。内容通过向量转换为数值,并使用近似最近邻( ,ANN)等技术来实现相似性搜索。除现有数据库平台外,还有许多专门构建的矢量数据库,例如和,这些数据库平台正在扩展以支持包括、和Redis在内的矢量。
腾讯云智能数智人工厂再升级
今年4月,腾讯云智能小样本数智人生产平台首次对外发布,平台具有训练样本小、生产效率高、自动化生产等特性,可以轻松实现“自助式”数智人生产制作。依托行业大模型,腾讯云智能数智人工厂全新升级,覆盖三大方向:生成效率更高、应用场景更广、3D数智人生产运营更智能。
在生成效率上,全新发布的“通用口型”版小样本数智人,生产时间、生产素材需求都进一步降低。在AI大模型技术的加持下,基于自监督机制的通用多模态模型,通过扩充人像特征提取及口型关系绑定,无需训练即可生成每个人的个性化口型特征。
这推动2D小样本数字人生产时长可从24小时缩短至1小时,生产素材简化至只需要1分钟真人口播视频。
在应用场景上,全新升级的“交互式”小样本数智人,支持“倾听等待状态”识别,能够根据真实对话场景进行手势的停顿、变化。这将使得“交互式”小样本数智人不再局限于短视频生产等单向播报场景,也可以广泛用于服务咨询等交互场景。
在生产运营上,依托AI建模绑定算法,腾讯云智能实现照片式生成3D形象,改变手工作业形式,大幅提升3D形象生成速度,支持批量打造3D数智人;同时,全面升级“智能驱动”3D数智人,可以基于语义为3D数智人自动匹配动作,让3D “数智员工”服务体验接近于真人员工。
例如,围绕大模型客服,数智人可以依据大模型实时生成的答案,匹配相应的表情、动作,实现更自然的交互。
9月7日举办的2023腾讯全球数字生态大会上,腾讯云智能数智人产品公布三大升级,依托行业大模型技术,实现数智人生产效率及交互体验提升,降低数字人应用门槛,加速推动AI数字人普惠。
其中,全新发布“通用口型版”小样本数智人,只需要1分钟真人口播视频,平台便可通过多模态数据输入,无需训练生成个性化口型,在1小时内制作出与真人近似的“数智人”。
数智人形象
国博虚拟数智人“艾雯雯”
2022年7月,依托多模态人机交互技术,国家博物馆就与腾讯SSV数字文化实验室联合打造出首个虚拟数智人“艾雯雯”,成为国家博物馆虚拟世界的代言人,助力让文物活起来,成为文化数字化战略发展的典型案例。
总台首个国风AI数智人“国小风”
2023年9月8日,《中央广播电视总台首届青年京剧演员大会》暨重点戏曲节目发布仪式在京举行。由总台打造的首位国风AI数智人“国小风”也将在节目中亮相。融合诗词、美景、历史、风物等元素的融媒体系列活动《戏韵家国情》,汇集彰显爱国主义精神的戏曲经典唱段,将于国庆节期间在央视频“CMG戏曲”频道页上线,营造出浓厚的节日氛围。
中国移动咪咕数智人“王小濛”
2022年,12月17日,咪咕视频推出的世界杯衍生综艺《濛主来了之我的眼睛就是尺》中,“空降”了一位“濛”友——数智人“王小濛”。咪咕高度还原出王濛的身体特点,实现毫米级复刻。同时,本次复刻采用AI技术复刻了王濛的语音,最大程度地还原了她的“相声式解说”的腔调。
科大讯飞虚拟数智人“小颜”
2022年10月24日,世界人工智能大会期间,科大讯飞最新版本的AI虚拟“数智人”——“小颜”首次亮相元空间大放送直播间,与主持人共同讨论了“什么是极客精神”、“未来制造”等问题。
科大讯飞技术团队运用人脸识别技术让“数智人”主播的形象更加真实生动,情感分析技术使“数智人”主播具备更充沛的情感表达能力,多模态交互技术则可以让用户通过多种方式与“数智人”主播进行互动,比如语音、手势等。
中国移动杨杰董事长“数智人”
2023年2月27日,中国移动杨杰董事长首次以“数智人”方式出席大会开幕式。据了解,杨杰董事长的“数智人”形象,是中国移动综合运用人脸建模、表情迁移、语音合成等技术打造的,并依托于中国移动5G+算力网络实时渲染等超前数智技术,能够仿真人类的外貌、行为,未来甚至能够实现思想的“数字复刻”。
中国移动周杰伦合作推出“周同学”
2023年,5月8日,周杰伦亮相中国移动元宇宙总部,与中国移动达成元宇宙领域系列合作,共同推出了数智人“周同学”,并公布“周同学”三重新身份——中国移动动感星推官、中国移动5G元宇宙星际开拓官、中国移动5G视频彩铃推广大使。
据介绍,“周同学”是由中国移动联合巨星传奇公司以及好莱坞顶级特效团队维塔工作室为周杰伦量身打造。未来,双方还将以元宇宙手办为载体续写品牌文化内涵,并将在元宇宙空间中举办虚拟演唱会。
中信金控“数智人”财富顾问——“小信”
2022年9月1日,中信金控官宣了业内第一位“数智人”财富顾问——“小信”,搭载行业先进的智能建模、智能人像驱动、智能对话引擎等AI能力,建立了“超脑”知识库AI模型,为客户全面的提供银行、证券、信托、保险等综合项目服务;运用了精细的3D建模技术,使其更好地交互和适应多变应用场景;为客户提供沉浸式体验服务。
无论是“数字人”还是“数智人”,究其根本都是通过计算机图形学技术( ,CG)创造出与人类形象接近的数字化形象,并赋予其特定的人物身份设定。基于全真互联网,或者元宇宙概念,建立在IoT、云计算、AI技术、5G技术、XR技术等多种先进技术的基础上,并且需要这些技术的整合应用。在进行深度学习后,在视觉上拉近和人的心理距离,为人类带来更加真实的情感互动。
在未来,数智人基于底层大模型技术将使其更加智能,期待有更多的数智人同各行各业应用场景结合,创造出更多价值。
图文素材来源于影视制作、电影科技动态、腾讯云智能、 数据猿及网络