chatgpt 使用的数据集 AI观察|ChatGPT应用带来高质量数据的重要性上升

AI资讯1年前 (2023)发布 fengdao
39 0

随着人工智能(AI)技术的快速发展,像这样的生成型AI备受关注,AI数据需求急剧增加。预计全球生成型AI市场规模将从2022年的13万亿韩元迅速增长至2030年的142万亿韩元。随着这一趋势,韩国企业也开始开发本土大模型,为此需要紧急获取高质量的数据。

根据2023年4月发布的Grand View 报告,从等生成型AI中产生的数据服务和解决方案需求在2022年全球人工智能数据市场中占据了约0.9万亿韩元。同时预计,到2030年这个数字将增长到约6.6万亿韩元。在韩国国内市场上,由于生成型AI的数据需求,预计2022年的493亿韩元将增长到2030年的4261亿韩元,年复合增长率为31.8%。

chatgpt 使用的数据集_数据集格式_数据集文件

在这种情况下,韩国国内企业面临着必须克服与数据获取相关的问题,以获得全球竞争力的挑战。特别是政府的支持和获取使用韩语的高质量数据的重要性变得更加突出。

韩国一家主要电信公司的首席技术官(CTO)在接受媒体采访时表示:“由于没有足够的数据可以用于LLM(大语言模型,Large Model)的学习,我们已经花费了相当大的费用购买数据。”他请求政府支持数据生态系统建设和版权问题。

数据集文件_数据集格式_chatgpt 使用的数据集

一位人工智能研究所的相关人员提到,数据相关成本在超大型语言基础的人工智能服务开发中占据很高的比重,强调了获取使用韩语的内容和数据的重要性。另一位人工智能研究员也表示,利用开放数据集可能会出现版权问题,因此购买图像数据。

鉴于数据的重要性,韩国科技信息通信部发布了“人工智能大模型竞争力强化计划”,宣布计划投入3901亿韩元。该计划包括:扩大高质量文本数据;解决人工智能大模型的关键技术等。

计划向多种客户提供这种框架。通过这样做,企业可以最小化引入AI模型可能带来的风险,并构建更高效、更可靠的基于人工智能的解决方案。公司表示,“我们将为企业提供稳定的引入和利用AI技术的环境,从而提高整个产业的竞争力。”

© 版权声明

相关文章

暂无评论

暂无评论...