《技术与商业模式及产业发展布局》高端培训 课程大纲一、 培训背景分析:
(全称Chat Pre- ),聊天式预训练生成转换模型,是一种生成式语言模型,俗称 “通用聊天机器人”,是人工智能研究实验室开发的一种基于人工智能(AI)技术的自然语言处理工具。该模型基于神经网络架构,即GPT3.5架构,并且还在继续演进与发展。
的总体技术路线是:采用自然语言处理+搜索引擎集成的架构,构建GPT3.5+大型语言模型(LLM)+强化学习微调训练模型(RLHF),通过连接大量的语料库,在效果强大、基于自注意力机制的GPT3.5架构的大型语言模型(LLM)基础上,引入RLHF(基于人类反馈的强化学习)技术,通过预训练方法处理大模型序列数据来训练模型,通过“人工标注数据(人工反馈)+强化学习”来不断微调(Fine-tune)预训练语言模型,从而实现拥有语言理解和文本生成的能力,以完成特定任务。实现的关键要素是:NLP(自然语言处理)是核心 ,搜索是辅助,算力是硬核。
是生成式人工智能技术,是一个创造性的新世界。模型以对话的方式进行人机交互,包括普通聊天、连续对话,语言翻译、信息咨询、方案策划、撰写诗词作文、编写程序、修改代码等,不仅能够回答后续问题,还能承认错误,质疑不正确的问题,并拒绝不适当的请求。具备上知天文、下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。于2022年11月30日上线测试,2022年12月5日,用户数突破了100万,目前,月活用户数超过一亿。
习近平总书记曾指出:“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程”。在当前数字世界和物理世界加速融合的大背景下,以为代表的人工智能生成内容(AIGC)技术正在悄然引导着一场深刻的变革,重塑甚至颠覆数字内容的生产方式和消费模式,将极大地丰富人们的数字生活,是未来全面迈向数字文明新时代不可或缺的支撑力量。
基于上述分析,为进一步推动以为代表的人工智能生成内容(AIGC)技术的广泛应用及产业发展与布局,赋能我国数字经济、数字政府、数字社会高质量发展,为培养数字转型时代急需的高端人才,特在全国开展《技术与商业模式及产业发展布局》高端咨询类培训课程。
本课程技术交流的主要宗旨是:
从的技术方案中,学习更多有价值的东西,不仅仅是单纯的技术,单纯的软件、工具或算法,更重要的是学习其中的逻辑思维方法、科学研究方法、技术与产品创新方法等。让我们深刻领悟,技术方案中的某一点点创新,却可以引发革命性的巨变,创造巨大的价值。
本课程的主要亮点是:
(1)本课程以前瞻性、独特的视角,按照概念篇、架构篇、技术篇、算力篇、体验篇、应用篇、商业篇、产业篇、建议篇九大模块,对技术进行系统、全面,深刻、而又富于创新地阐述。
(2)关注诉求与商用落地,从商机挖掘、产业发展、行业应用布局等维度,阐述以技术为代表的生成式人工智能(AI)技术的创新应用理念与产业发展和行业应用布局。
二、 培训主要内容:
本课程采用模块化教学方法,总体架构主要包括以下9个教学模块:
模块一:概念篇-概念诠释及技术发展
模块二:架构篇-系统架构及工作流程
模块三:技术篇-关键技术及原理详解
模块四:算力篇-算力需求及算力布局
模块五:体验篇-基本功能及使用体验
模块六:应用篇-应用场景及行业布局
模块七:商业篇-商业模式及商机挖掘
模块八:产业篇-产业发展及投资分析
模块九:建议篇-面临挑战及发展建议
三、 培训内容及时间安排:3天,6小时/天
授课时间
授课内容
授课时长
第一天
上午
模块一:概念篇-概念诠释及技术发展
1小时
模块二:架构篇-系统架构及工作流程
2小时
下午
模块三:技术篇-关键技术及原理详解(1)
3小时
课程小结、答疑、交流讨论与互动环节
0.5小时
第二天
上午
模块三:技术篇-关键技术及原理详解(2)
3小时
下午
模块四:算力篇-算力需求及算力布局
3小时
课程小结、答疑、交流讨论与互动环节
0.5小时
第三天
上午
模块五:体验篇-基本功能及使用体验
1小时
模块六:应用篇-应用场景及行业布局
2小时
下午
模块七:商业篇-商业模式及商机挖掘
1小时
模块八:产业篇-产业发展及投资分析
1.5小时
模块九:建议篇-面临挑战及发展建议
0.5小时
课程总结、答疑、交流讨论与互动环节
0.5小时
四、 培训对象:
人工智能及技术产业链各厂家、芯片/模组/终端厂家、互联网公司、互联网服务提供商(ISP)、互联网内容提供商(ICP)、互联网软件开发公司、电信运营商、广电运营商、游戏公司、新媒体制作公司、各行业客户、企事业单位、咨询公司、科研院所与大专院校等单位,从事人工智能及技术相关工作的管理人管、技术人员等。
五、 课程详细大纲:
培训主题
详细内容
模块一:概念篇-概念诠释及技术发展
1.概念诠释及技术发展
1.1什么是?(技术视角、、维基百科的定义)
1.2 技术核心要点诠释
1.3 问题:如何理解?-理解的关键点
1.3.1 是如何工作的?
1.3.2 的训练数据来源于何处?
1.3.3 如何进行模型预训练?
1.3.4 是如何自动生成文本的?
1.3.5 如何准确回答问题?
1.3.6 如何按照人类思维回答问题?
1.4问题:的主要技术有哪些?
1.5 的主要特点有哪些?
1.的最大创新点是什么?
1.优化对话语言模型的优化目标是什么?
1.与普通聊天机器人的区别是什么?
1.存在的问题与不足是什么?
1.界面及网址
1.的基本功能
1.12 和AIGC的关系是什么?
1.13 、AIGC和元宇宙的关系是什么?
1.14 对推动元宇宙的商用落地与快速发展有何影响?
1.的产生、发展及影响
1.15.1 的产生
1.15.2 的发展历程(GTP-1,GTP-2,GTP-3, , GTP-4)
1.15.3 的研究现状
1.15.4 的产生与发展对人类社会将带来什么影响?
1.15.5 对哪些职业和工作产生挑战和影响?
1.16 对我们的启示有哪些?
1.17如何从的技术方案中学习有价值的东西?
1.18 如何运用基于人工智能的技术方案赋能行业智慧应用与商用落地和快速发展?
模块二:架构篇-系统架构及工作流程
2. 的系统架构及工作流程
2.1 的总体技术路线是什么?
2.1.1自然语言处理+搜索引擎集成架构
2.1.2 GPT3.5+大型语言模型(LLM)+强化学习微调训练模型架构
2.1.3 实现的关键要素有哪些?
2.2 构建系统架构需要考虑哪些关键问题?
2.2.1 技术架构的关键点是什么?
2.2.2 预训练模型有哪些?
2.2.3 预训练数据集有哪些?
2.2.4 如何进行模型预训练?
2.2.5 进行模型训练的步骤有哪些?
2.3 的工作流程-理解架构的基础
2.3.1 有监督微调(SFT)
2.3.2 奖励模型(RM)训练
2.3.3 PPO模型强化学习
2.3.4 基于人类反馈的强化学习-RLHF
2.3.5 例子:语言处理的工作流程
语言处理数据流转流程:输入文本、语言识别、情感分析、信息抽取、命名实体识别、句子相似性处理、文本分类、全文搜索、文本生成、上下文管理、问题解答、输出文本
2.4 的系统架构-架构
2.4.1什么是?
2.4.2 模型的作用
2.4.3 总体架构及组成
(1)输入部分,(2)输出部分,(3)编码器部分,(4)解码器部分
2.4.4 -编码器-解码器框架
2.4.5 输入部分的实现
(1)文本嵌入层及作用,(2)位置编码器及作用
2.4.6编码器部分的实现
(1)掩码张量,(2)注意力机制,(3)多头注意力机制,(4)前馈全连接层,(5)规范化层,(6)子层连接结构,(7)编码器层,(8)编码器
2.4.7解码器部分的实现
(1) 解码器层,(2)解码器
2.4.8 输出部分的实现
(1)线性层,(2)层
2.4.9模型构建
2.5案例分析:使用构建语言模型
2.6 GPT3.5预训练模型架构
2.7 大型语言模型(LLM)架构
2.8 强化学习微调训练模型架构-RLHF架构
2.9 应用系统架构及组成-端边网云(水平分割)
2.9.1 应用终端(PC机、智能手机、PAD等)
2.9.2 边缘计算(边缘算力)
2.9.3 互联网/移动互联网
2.9.4 云(超级计算机、超级算力)-云数据中心( Azure、国资云(国家云)、天翼云、移动云、沃云、华为云、百度云、阿里云、腾讯云等)
2.10 系统架构优化及应用推广
模块三:技术篇-关键技术及原理详解
3. 关键技术及原理详解
3.1 的关键技术体系
3.2 的技术基础-AI:人工智能
3.2.1机器学习- ML
3.2.2深度学习
3.2.3 神经网络
3.2.4自然语言处理-NLP
3.2.5 人工智能生成内容-AIGC
3.3 的关键技术-技术
3.3.1什么是?
3.3.2 -技术
3.3.3 分类模型
3.3.4 算法-GTP3.5预训练模型
3.3.5预训练模型-自然语言理解
3.3.6预训练模型-长序列建模
3.3.7预训练模型-模型优化
3.3.8 算法流程
3.3.9 问题:算法的改进及主要优点是什么?
3.4 的关键技术-GPT:预训练生成模型
3.5 的关键技术-LLM:大型语言模型
3.6 的关键技术-RLHF:基于人类反馈的强化学习
3.7 的关键技术-数据标注
模块四:算力篇-算力需求及算力布局
4. 算力需求及算力布局
4.1 人工智能(AI)复杂算法的算力需求分析
4.1.1 人工智能不同算法的算力需求分析
4.1.2 算力需求分析
4.1.3 算力需求举例
4.2算力的概念及量纲
4.3 算力的分类
4.3.1基础算力(基于CPU芯片)
4.3.2 智能算力(基于AI芯片,包括GPU/DPU/FPGA/ASIC芯片等)
4.3.3 超算算力(超级计算机、计算集群)
4.3.4 量子算力(量子计算机)
4.4 算效的概念
4.5 综合算力(算力+存力+运力)
4.6算力应用场景
4.7 算力部署策略-“东数西算”工程
4.7.1“东数西算”的概念
4.7.2 “东数西算”的应用场景
4.7.3 “东数西算”的数据处理
4.7.4 “东数西算”工程总体架构(8大枢纽中心、10大数据中心集群)
4.7.5数据中心业务类型
4.7.6数据中心集群建设规模
4.7.7 “东数西算”工程建设方案:联接力+运力+算力+智力
4.8算力部署方案-算力网络
4.8.1 算力网络的定义及技术特点
4.8.2 算力网络与现有通信网络的区别
4.8.3 算力网络的工作原理及业务流程
4.8.4 算力网络的标准架构与接口
4.8.5 算力网络系统架构与组成
4.8.6 算力网络的建设方案
4.9 基于“东数西算”工程的部署策略-安全、高可靠运行等
4.9.1 西部数据中心-大型语言模型建模与训练
4.9.1 东部数据中心-推理服务等
4.10 基于“算力网络”的部署策略-海量数据处理、超级算力、高可靠、低时延、安全等
模块五:体验篇-基本功能及使用体验
5. 基本功能及使用体验
5.1 的基本功能及特征
5.2 的基本功能-语言处理功能及描述
文本生成、文本补全、文本分类、文本校正、诗歌生成、内容创建、问答、翻译、摘要、改写、情感分析、聊天机器人等
5.3 的高级功能-高端应用功能及描述
编写和调试计算机程序、程序修改、模拟Linux系统、企业策划、方案设计、项目咨询、文学创作、撰写演讲提纲、撰写分析报告、金融分析、工业自动化、医学诊断、教育、供应链管理、销售和营销、法律应用、科学研究等。
5.4 使用体验及效果评估
模块六:应用篇-应用场景及行业布局
6. 应用场景及行业布局
6.1 应用总体思路:运用技术方案及思想赋能行业数智化转型及落地实施
6.2 应用场景及行业领域分析
6.3 +机器人场景应用方案及布局
6.3.1 生成式预训练模型升级各行业机器人
6.3.2 +行业机器人赋能行业应用
6.4 聊天机器人+智慧家庭应用方案及布局
6.4.1 聊天机器人精心陪伴老人
6.4.2 聊天机器人陪伴儿童成长
6.5 基于聊天机器人的智能客服应用
6.6 +工业场景应用方案及布局
6.6.1 GPT生成式预训练模型+专家系统融合应用
6.6.2 GPT生成式预训练模型优化专家系统
6.6.3 GPT预训练优化模型提高产品质检效率
6.6.4 GPT预训练优化模型提高设备预测性维护的能力
6.6.5 GPT预训练优化模型提高设备精准故障定位的能力
6.7 +农业场景应用方案及布局
6.8 +医疗场景应用方案及布局
6.9 +教育场景应用方案及布局
6.10 +金融场景应用方案及布局
6.11 +展览宣传场景应用方案及布局
6.12 +新媒体场景应用方案及布局
模块七:商业篇-商业模式及商机挖掘
7.商业模式及商机挖掘
7.1 商业模式架构-MaaS(模型即服务)
7.1.1 什么是MaaS(模型即服务)?
7.1.2 MaaS(模型即服务)架构
7.1.3 MaaS(模型即服务)架构基座-大模型
7.1.4 MaaS(模型即服务)整体产业架构
7.1.5 MaaS(模型即服务)商业模式的核心:“模型→单点工具(如)→应用场景”的服务路径
7.2 的商业模式
7.2.1 订阅制收费模式-直接收费
7.2.2 通过API接口提供技术服务-赋能收费(根据API的使用量和质量级别收取费用)
(1)提供大模型服务-赋能行业应用
(2)许可证销售服务
7.3 案例: Face商业模式
7.3.1 模式
7.3.2 API & 模式
7.3.3 Hub模式
7.3.4 模式
7.3 的商机挖掘-赋能行业应用
模块八:产业篇-产业发展及投资分析
8. 产业发展及投资分析
8.1 产业生态构建与参与角色
8.2 涉及的上下游产业链分析
8.2.1 算力相关产业分析(AI芯片/GPU/DPU/FPGA/ASIC芯片等,服务器、数据中心、云计算、边缘计算等)
8.2.2 算法服务相关产业分析
8.2.3 算力网络相关产业分析
8.2.4自然语言处理(NLP)相关产业分析
8.2.5人工智能生成内容(AIGC)相关产业分析
8.2.6数据标注相关产业分析
8.2.7 下游应用场景相关产业分析(智能客服、搜索引擎、图像、文字、代码生成等)
8.2.8 产业发展的切入点及路径分析
8.2.9 对我国AI技术和产业发展的示范效应分析
8.2.10 产业发展市场前景分析
8.3 产业投资机会及方向分析
8.4 我国相关上市公司核心竞争力及投资分析
模块九:建议篇-面临挑战及发展建议
9. 面临的挑战及发展建议
9.面临的挑战分析
9.1.1 技术及应用发展面临哪些挑战?(数据的实时性问题,数据的真实性问题,模型在线推理端成本问题,算法过度优化对性能的影响(古德哈特定律),数据标注产生算法偏见等)
9.1.2 面临的最大挑战是什么?如何应对?(错误的数据,挑逗性提问等导致产生法律、道德、宗教信仰、歧视性等方面的问题)
9.1.3 黑客利用进行网络攻击面临的挑战及应对策略
9.2 主要的创新点和技术壁垒分析
9.3 给我们的启示是什么?(从产品创新角度分析)
9.4 的发展对相关产业的影响分析及应对策略
9.5 的发展对相关职业领域的影响分析及应对策略
9.6 的发展对人类社会的生活、工作和学习等产生的影响分析及应对策略
9.7 技术及应用发展建议
9.7.1 技术及应用发展的切入点及路径
9.7.2 基于的示范效应推动我国AI技术和行业赋能应用的发展
9.7.3 基于的示范效应加快我国AIGC产业商用化落地进程
9.7.4 基于和AIGC技术变革数字内容的生产方式和消费模式
9.7.5 基于和AIGC技术推动元宇宙应用与发展的商用进程,赋能我国数字经济高质量发展
六、 课程总结:
(1)重点知识回顾与总结;
(2)互动与讨论:问与答。
就学员提出的问题进行分析、讨论、模拟演练和点评。
七、 培训方式/工具及方法
培训方式及方法:
本课程采用模块化教学方法通过理论讲授,案例分析,方法传授、动画演示、互动讨论,讲师点评、实战演练、项目展示等多种教学手段与方法,将关键技术、商业模式及产业发展布局与大量的典型案例结合起来,达到学以致用、解决实际问题的目的。
培训工具:PPT讲义、项目案例演示、投影仪、白板、白纸、彩笔、音响设备、话筒等。
评估方法:(1)学员学习成果(项目解决方案)评估;(2)学员打分评估。