当前位置:天才代写 > tutorial > Python教程 > python图像文字识别 – PyTesser

python图像文字识别 – PyTesser

2017-11-02 08:00 星期四 所属: Python教程 浏览:47

最近在想没有一个图片文字识此外东西呢?我想到了OCR,海内较量牛逼的汉王OCR。那借助python可否实现呢?于是我找啊找查啊查有关PYthon在这方面探讨的资料,发明PyTesser 这样一个好玩的措施!拿出来分享接头一下:

PyTesser 是python的一个光学字符识别模块,它团结Tesseract OCR引擎来利用 ,能从一个图片或图像文件取出的字符串并输出。

利用PyTesser ,你无须安装Tesseract OCR引擎,但就必需要先安装PIL模块(Python Image Library, python的图形库)

官方先容说明:

PyTesser is an Optical Character Recognition module for Python. It takes as input an image or image file and outputs a string.

PyTesser uses the Tesseract OCR engine, converting images to an accepted format and calling the Tesseract executable as an external script. A Windows executable is provided along with the Python scripts. The scripts should work in other operating systems as well.

PyTesser 官方下载地点:http://code.google.com/p/pytesser/downloads/list

PIL库资源地点: http://www.pythonware.com/products/pil/

不外,在测试利用进程中,觉察只对英文内容识别较抱负,而对中文无法处理惩罚识别!

有乐趣的同学可以试验一下

 

    关键字:


天才代写-代写联系方式