如何用chatgpt来做图像识别 OCR是否能和ChatGPT结合?可以产生什么样的火花?

AI资讯1年前 (2023)发布 fengdao
29 0

1、OCR技术是什么?OCR技术在我们生活中有哪些应用

OCR 是光学字符识别 这几个英语单词首字母。OCR技术主要是通过光学数字化设备比如扫描仪、数码相机等采集到图像,然后从这类图像中获取文字信息的技术。

在这里,我想多补充几个概念,第一个是DAR,意思是文档分析和识别。它是一个更广泛的概念,包含了OCR、版面分析、文档结构化技术等。第二个概念是STR,也叫场景文字识别,主要是识别自然场景中的文字,像街景广告牌识别任务就属于这个范围。第三个是,意思是在线手写识别,它主要将手写的文字传输服务器端,然后由服务器进行识别并返回这么一个过程。

我刚刚提到的其实是几种不同的场景,但大家听到最多的就是OCR这个词。所以现在大家也普遍把跟文字相关、文档处理相关、还有字迹相关的任务,都归为是OCR领域的问题。

OCR技术在我们生活中的应用还是挺多的。

图像识别用什么做_如何用chatgpt来做图像识别_的识别图像

第一个是交通场景上的应用。车牌识别就是一个很成熟的OCR应用。另外,在无人驾驶方向,也是需要通过OCR技术去识别出路面还有路标的文字信息,从而指导车辆做出下一步的决策。

第二个是教育场景上的应用。像现在很多公司都已经实现了自动阅卷,像小学数学的口算题,只要对着拍一张图片,OCR可以很快给出批改结果,这大大节约了老师和家长的时间。

第三个是企业业务场景上的应用。目前很多单位都有智能报销系统,智能报销最主要的就是通过OCR技术完成对行程单、住宿单等材料解析。另外在一些政企单位中,也是通过OCR技术完成对合同、报表,营业执照等材料的识别,从而缩短业务办理的时间。

第四块是在金融方面的应用,像银行的话大多利用OCR技术实现对证照、票据的信息采集,比如身份证、银行卡、汇票、支票等等。

除了我刚刚提到的一些领域,OCR其实在很多场景都有着广泛的应用。

如何用chatgpt来做图像识别_图像识别用什么做_的识别图像

OCR是否能和结合?可以产生什么样的火花?

OCR能够从图像中获取文本信息,而的输入正是文本信息,我觉得两者是可以紧密结合做一些好的应用的。这边我想到几个场景:

首先是:旧文档的修复。OCR识别出部分信息,把它交给GPT,让GPT补全缺失的信息。

第二个是:生成类的一些工作。比如我输入一篇文章,我需要GPT帮忙创作出一篇类似主题或者类似风格的文章等等。

另外,我想到一些更大的人工系统,比如盲人的指引系统,我们通过OCR获取周围的文字,比如门牌,路牌,货架标签等,结合GPT以及其他智能系统,最终帮助盲人像正常人一样出行、购物等。

我相信在不久的将来会有很多这样的智能系统诞生,人工智能一定会真正的造福人类,让我们的生活更加便捷。

© 版权声明

相关文章

暂无评论

暂无评论...