OCR光学文字识别系统
OCR (Optical Character Recognition,光学字符识别)可将扫描或拍照得到的图像转换为电子的文本或表格。
所用到的软件:
尚书七号,可识别简体,简繁混合以及英文,图片的分辨率要求在300dpi或更高 MS office组件 OneNote2007以上
第1步 整理图片,jpg,bmp,tiff等都行,这张图是扫描得到的,300dpi。最好用TIFF格式的图片,因为它没有压缩,图片包含的信息更丰富,更有利于文字识别,但图片比较占空间。可用ps进行图片的水平较正,删除文字外的其它东西。
第2步 打开尚书七号,打开图像,按F5自动分析版面,或直接拖动鼠标画出区域,点击按
钮
,设置区域的类型,橫排文字、竖排文字、表格,图片等。