3、 延迟更低、响应更快;
4、 更省成本,无需在提问中重复多次示例,减少token用量。
集简云平台()已支持模型训练,让您无需开发,就可以基于4种官方提供的原始模型, curie, 和ada,来完成你的自定义模型训练。
●节省成本,无需API开发、研发投入,即可一键训练;
●功能强大,训练后的可直接与你的办公系统快速对接;
●自定义您的使用场景,并实现自动化,让真正融入你的工作中。
二、如何训练一个自定义模型
前置准备:
账号
API接口Key:
开始训练前,您需要准备好已注册的账号,并创建获取API接口Key。
如果您没有账号,您可以使用集简云()付费版:()付费版如何使用?
在集简云使用模型训练,大致分为以下几步:
1、收集训练问答,整理训练文件
2、上传训练文件并训练自己的模型
3、使用训练完成的自建模型
1、 准备训练文件
训练文件是模型训练成功与完成质量好坏的关键,我们通过训练文件的数据列表将信息传递给API接口,进行模型训练。
训练文件的每一行都是一个训练示例,由”“和”“两列构成。
●在”“字段中,您需要输入一条”提示文本“。
●在”“字段中,您需要输入对应的”理想回答文本“。
例如:假设您想确保您网站上的广告文本提到的是正确的产品和公司,又不希望投入大量的人力审核成本,您可能需要训练出一个分类器,来过滤掉不正确的广告。这时,您就需要准备好一些训练示例,用于教会模型识别和区分广告。
你的训练示例可能会是下面这样:
: 阿邦保险公司为您提供全方位保险,满足您所有的保险需求的一站式服务!
: 正确
:张师傅五金店,让您几周内就能拥有整齐的牙齿!
: 错误
示例训练文件下载地址:下载示例文件
以下是对训练文件的必须要求:
●训练文件由”“和”“两列构成
●每次训练任务的问答数需要≥100个
●文件格式为jsonl
以下是对训练文件的建议:
●模型训练的“”提示字段,与使用基础模型的提问不同,训练示例中无需给出详细的说明或在同一个“”中包含多个示例。
●训练示例越多,训练结果会越好。数据量每翻一倍,模型质量就会线性增加。我们建议尽可能多地准备训练示例。
●您需要提前准备好jsonl训练文件的url链接,您可以使用集简云内置应用【文本处理】将csv文件转换为jsonl格式的url:如何将CSV文件转换成JSONL格式文档URL链接?
2、训练新的自建模型
2.1 登录集简云平台:集简云让连接更简单
2.2 创建一个流程
●创建一个新流程:集简云让连接更简单
●或使用流程模板搭建:
2.3 添加执行动作,选择 ”“应用, 选择动作为“上传训练文件”,点击“保存,进入下一步”
2.4 输入“”,点击“下一步”完成账户授权。
2.5 输入训练文件url地址,点击“保存,进入下一步”。
点击“发送数据”。
2.6 继续添加步骤,选择“”-“开始训练任务”,选择账户,进入字段匹配。
●“训练文件id”填入上传步骤生成的“训练文件id”数据;
●基础模型可按需选择,这里我们选择ada作为示例。参考文章:如何选择模型;
●填入自定义模型名称后缀,点击“保存,进入下一步”
2.7 点击“发送数据”,此时模型训练任务就会开始启动。
通常等待几分钟,模型训练就可以完成。
但如果队列中有许多任务或者您的数据量很大,可能会需要几个小时的时间。
训练任务开始后,退出当前页面不会影响已经开始的任务。
2.8 如果您想要查询训练任务进度和状态,可以在 ”“应用的执行动作中,对应选择“查询训练进度”,并按页面提示完成操作。
在样本数据底部会显示任务状态,””表示任务正在队列中等待,””表示任务正在进程中,””表示训练任务已完成。
2.9 如果您想暂停训练任务,可以在 ”“应用的执行动作中,对应选择“暂停训练任务”,并按页面提示完成操作。
状态显示“”,即表示取消成功。
如需增加更多训练示例,您可以按照上述步骤继续添加一个训练任务。
3、使用训练完成的自建模型
当训练完成后,您就可以在“”的执行动作“按照自定义设置提问”的字段匹配中,找到刚刚训练好的模型了。如下图所示:
这时,您就可以将已训练的自建模型,应用到您的流程中,开始服务于业务了。
四、如何使用已训练的模型在自己的办公系统中?
1、使用步骤
使用自定义训练过/或官方训练的,在集简云系统中的操作步骤基本一致,具体如下:
(1)登录集简云平台:集简云让连接更简单
(2)创建一个流程:
创建一个新流程:
或使用流程模板创建
(3)选择触发应用与动作。
(4)执行应用选择“”,动作选择“按照自定义设置提问”,“模型”字段选择列表中的已训练模型。
(5)完成其他字段配置,保存流程,就设置好了。
2、使用示例
●微信公众号++微信公众号:当用户在微信公众号中发送文本消息时,自动使用回答,并将回答回传至微信公众号发送给指定用户。点击使用此模板
●飞书即时消息++飞书即时消息:当飞书即时消息机器人接收到消息时,自动回答,并将回答数据传回至飞书即时消息。点击使用此模板
●邮件触发++SMTP邮件发送:用户发送邮件咨询问题时,自动使用回复,在自动使用邮件将回复内容发送给指定用户。
●抖音++抖音:抖音收到新评论时,自动回答,并经回答内容自动回传至都应发送给指定用户。点击使用此模板
●定时启动任务+抖音++百度百家号:定时查询抖音热词通过生成文章,并且百家号自动发布。
●抖音 + + 抖音:当抖音用户收到私信消息时,我们可以设置自动提问,并自动发送私信消息给用户。点击使用此模板
●企业微信(代开发) + + 企业微信(代开发):当企业微信(代开发)当接收到客服消息时,自动回答。
五、常见问题
常见问题与解决方案 | 集简云连接数百款软件无需API接口开发
“提问”()字段插入规则 | 集简云连接数百款软件无需API接口开发
训练文件id如何获取? | 集简云连接数百款软件无需API接口开发