期货交易自动化论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 28|回复: 0

什么软件可以将扫描出来的图片,自动转成文本格式?有哪些软件推荐? - 比特币今日价格

[复制链接] |主动推送

285万

主题

285万

帖子

855万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8553710
发表于 2022-9-11 07:30:29 | 显示全部楼层 |阅读模式
这里以Python为例,简单介绍一下,如何从图片中识别文字,主要用到Tesseract这个开源软件,感兴趣的朋友可以尝试一下:
01安装Tesseract这个直接到官网下载即可,Tesseract是谷歌一个非常著名、开源的OCR识别引擎,可以轻松识别图片中的任何文字,包括中文、英文等,Windows是一个exe文件,直接双击安装即可,如下,32位、64位都有,选择适合自己平台的版本就行:

安装时候,建议勾选“中文简体”和“中文繁体”这2项,这样在识别中文的时候,才能更好的支持,准确率也会有所提升:

02识别图片文字Tesseract安装完成后,这里还需要先安装pytesseract模块,直接在cmd窗口运行命令“pip install pytesseract”即可,程序会自动检测相关依赖并安装,接着我们就可以直接编程调用Tesseract识别图片文字了,测试代码如下,这里包括英文和中文图片识别,基本思路先读取图片,然后加载tesseract,最后再直接调用image_to_string函数识别即可:

程序运行截图如下,第一幅图为英文识别效果,准确率还是非常高的,第二幅图是中文识别效果,效果有些不理想,个别文字存在较大误差,需要改进和优化:


至此,我们就完成了利用Python从图片中识别文字。总的来说,整个过程非常简单,借助于Tesseract,我们可以快速从图片中提取文字,只要你熟悉一下上面的操作过程,很快就能掌握的,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。
mxc官网下载

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|期货交易自动化论坛

GMT+8, 2024-11-26 17:21 , Processed in 0.128075 second(s), 27 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表