chatgpt可以调整token么 GPT-3.5支持微调模型了

AI资讯2年前 (2023)发布 fengdao
58 0

GPT-3.5 Turbo的模型微调功能已正式上线,而GPT-4的模型微调则计划在今年秋季推出。此次更新为开发者提供了一个机会,可以根据特定应用场景定制出性能更优的模型,并支持这些模型的大规模部署。初步实验结果显示,经过微调的GPT-3.5 Turbo在某些特定任务上,不仅可以与GPT-4基础版本相媲美,甚至有可能超过其性能。值得注意的是,与所有的API服务一样,通过微调API传输的所有数据都是客户的私有数据,或其他任何机构均不会使用此数据进行其他模型的训练

微调应用场景

自GPT-3.5 Turbo发布之初,开发者和企业一直在寻求更深度的模型定制能力,以为其用户提供更加特色化和差异化的交互体验。借助此次的更新,开发者可以采用有监督的微调方法,进一步优化模型以满足特定应用场景的需求。

在的封闭测试阶段,一些客户已经通过微调技术,在多种常见应用场景中实现了显著的模型性能提升,例如:

此外,微调技术不仅提升了模型的性能,还为企业提供了更为简洁的提示内容( their ),且仍能保持高效的性能。微调后的GPT-3.5 Turbo能够处理高达4k的token,是之前模型的两倍。早期的测试人员通过对模型本身的指令进行微调,将提示内容缩减了高达90%,这不仅提高了每次API调用的响应速度,还有的效降低了成本。

值得注意的是,当微调与其他技术,如提示工程、信息检索和函数调用相结合时,其效果更为显著。而对于函数调用以及gpt-3.5-turbo-16k的微调,计划将在今年秋季晚些时候推出。

微调步骤

从微调到使用微调模型,共包含4个基本步骤。

调整可以换成什么词语_调整可以与哪些词语互相搭配_chatgpt可以调整token么

下面是简单的示例:

1.准备训练数据

{
  "messages": [
    { "role": "system", "content": "You are an assistant that occasionally misspells words" },
    { "role": "user", "content": "Tell me a story." },
    { "role": "assistant", "content": "One day a student went to schoool." }
  ]
}

2.上传训练数据

curl -https://api.openai.com/v1/files 
  -H "Authorization: Bearer $OPENAI_API_KEY" 
  -F "purpose=fine-tune" 
  -F "file=@path_to_your_file"

3.训练新的微调模型

通过创建微调作业,来训练新的微调模型。

curl https://api.openai.com/v1/fine_tuning/jobs 
-H "Content-Type: application/json" 
-H "Authorization: Bearer $OPENAI_API_KEY" 
-d '{
  "training_file": "TRAINING_FILE_ID",
  "model": "gpt-3.5-turbo-0613",
}'

调整可以换成什么词语_chatgpt可以调整token么_调整可以与哪些词语互相搭配

一旦完成了模型的微调过程,就可以立即在生产环境中使用,并且具有与底层模型相同且共享的速率限制。

4.使用新的微调模型

curl https://api.openai.com/v1/chat/completions 
-H "Content-Type: application/json" 
-H "Authorization: Bearer $OPENAI_API_KEY" 
-d '{
  "model": "ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role": "system",
      "content": "You are an assistant that occasionally misspells words"
    },
    {
      "role": "user",
      "content": "Hello! What is fine-tuning?"
    }
  ]
}'

详细微调请参考:

还计划在不久的将来推出一个微调用户界面(UI),这将使得开发人员能够更加容易地获取正在进行的微调任务、已完成的模型快照等信息。

价格

微调成本分为两部分:初始训练成本和使用成本。

例如,对于一个gpt-3.5-turbo微调任务,如果它的训练文件有100,000个,并且进行了3个训练周期,那么预计成本为$2.40。

参考

© 版权声明

相关文章

暂无评论

暂无评论...