计算机工程与设计
COMPUTER ENGINEERING AND DESIGN
Nov. 2017Vol. 38
No. 11
第 38 卷第 11 期
Retinex在光照不均文本图像中的研究
曾凡锋,刘树鹏
(北方工业大学计算机学院,北京100144)
摘
要:为提高文本图像在光照不均条件下的OCR识别率,提出一种基于Retmex的光照不均校正方法。采用分块Otsu
二值化减弱光照不均的影响程度,分析其得到的二值图像,判断光照情况并获得光照不均图像块,利用改进的Retmex方 法对光照不均图像块进行重新处理,采用Sauvola二值化得到清晰的校正图像。实验结果表明,该算法能很好地消除光照 不均的影响,取得较好的二值图像,在各式样本以及不同光照情况下都有较高的OCR识别率。关键词:光照不均;Retinex理论;二值化;光照检测;Sauvola算法中图法分类号:TP391
文献标识号:A
文章编号:1000-7024 (2017) 11-3072-08
doi: 10. 16208/j. issnl000-7024. 2017. 11. 033
Research on Retinex in uneven illumination document images
ZENG Fan-feng, LIU Shu-peng
(College of Computer, North China University of Technology, Beijing 100144, China)
Abstract: To improve the OCR recognition rate of the document image under the condition of uneven illumination, a Retinex-
based illumination correction method was proposed. The influence of uneven illumination was weakened using the block Otsu bi- narization, and the obtained binarization images were analyzed to determine uneven illumination image blocks, the improved Retinex method was used to re-process uneven illumination image blocks? while clear correction image was obtained using the Sauvola binarization. Experimental results show that the proposed algorithm can eliminate the influence of uneven illumination, and obtain good binary image, and it has higher OCR recognition rate in various samples under different illumination conditions.
Key words: uneven illumination; Retinex; binarization; light detection; Sauvola
峰,所以往往会很难确定适合的阈值,从而导致大面积的 文字空白区被误认为是文字。尽管常用的局部二值化能适 当地减少光照对文本的影响,但也会产生大量的噪点,并 且耗时也过长。文献[2]提出了一种基于背景提取的阈值 分割方法,该算法能较好地处理小块且背景不是很复杂的 图像,但对常见书籍以及纸张的文本图像,在处理时间上 会相对比较慢且容易虚化前景文字。文献[3]提出了一种 基于分块的自适应文档图像二值化方法,其主要是通过统 计各图像分块中灰度级分布的情况,从而判断是否为光照 不均图像块,因为灰度级分布情况是由统计的方法从整体 去分析的,缺少像素之间位置关系分析,因此该方法在判 断图像块是否为光照不均块的准确度还需要进一步地优化; 再者,该方法对环境偏暗的文本图像处理效果也不是很好, 识别率受影响比较大。为了解决特殊光照环境问题,也有 学者针对特定环境下的文本图像为该图像重建模型[4’5],对
〇引言
文本图像的信息通常需要被计算机处理识别成文档信 息后,才能被我们更好地利用和传播。当前,也存在很多 种文字识别,但是使用最为广泛且也最为高效的方法依然 是光学字符识别技术(optical character recognition,
OCR)。然而,由于受到拍摄环境的影响以及拍摄图片本身
对光线的吸收和反射不同,造成拍摄到的文字图片质量良 莠不齐,严重地影响OCR的识别率。其中,光照不均匀的 影响较为突出,会造成大面积文字识别错误或误识别为图 片,使文本图像的识别率大幅度下降。
目前,常用的方法是直接对文本图像二值化方法[1]进 行改进。二值化方法可分为全局二值化和局部二值化。全 局二值化是对整张文本图像采用一个固定阈值去分割图像, 但一般光照不均匀图像的灰度直方图都会有两个以上的驼
收稿日期:2016-09-12;修订日期:2016-09-15
基金项目:国家自然科学基金项目(61371142);北方工业大学校内专项基金项目(XN060)
作者简介:曾凡锋(1966 -),男,江西吉安人,硕士生导师,副研究员,研究方向为图像处理、信息安全等;刘树鹏(1990-),男,江西 吉安人,硕士研究生,研究方向为图像处理。E-mail: 822189143@qq.com
第38卷第11期
曾凡锋,刘树鹏:Retinex在光照不均文本图像中的研究
• 3073 •
针对的环境会有相当好的效果,但是现实中光照环境总是 不稳定且多样化的,所以处理方法的普适性也是相当 关键的。
图像增强算法[6]能尽量将文本图像受局部阴影或亮光 影响的程度降到最低。所以,适当地使其与局部二值化结 合能达到良好的效果。本文采用针对文本图像改进的Reti- nex[7]增强算法结合SauV〇la»’9]二值化方法对光照不均匀图
上式中的环绕函数FCx, y)可以表示如下
F(x,y) = Kexp^— X ^ ^ )
⑶
式中:c为环绕函数尺度参数,K为归一化的常数,作用是 使得环绕函数Fb, y)满足如下公式
^F(.x,y)dxdy = 1
(4)
从上面所述SSR算法中,可以看见,该算法很依赖于 尺度参数c,其直接决定着SSR算法对图像处理效果的好 坏,相对来说不是很灵活。于是,Jobson等又在SSR算法 像进行处理。相对于其它单一性的二值化法或增强算法, 其能很好地减少断笔和噪点情况。同时,针对图像光照情 况的判断,提出基于Otsu算法的反馈式判断方法,其比仅 仅通过统计一些图像特征来判断的方法更加准确。
考虑到一般文本图像分辨率比较大,采用局部化处理 时间相对较长,本文对图像先进行分块处理。通过对不同 块的光照不均匀的程度判断,分别进行〇tsu[1°]二值化处理 和Retinex、Sauvola算法结合处理。
1 Retinex理论简介
在众多的图像增强算法当中,Retmex理论(remtal- cortex theory)算是比较经典的一种,该理论是建立在人类
视觉系统是颜色恒常的特点基础上的,颜色恒常的特点也 是通过大量的科学实验和分析得到的。
Retinex理论的基本思想是人类对物体感知的颜色取决
于该物体表面的反射性质,而与环境中光的光谱特性无关。 所以,此理论将每幅图像都看作是照射图像分量和反射图 像分量的乘积,如下公式所示
I(x,y) = L(x,y) • R(x,y)
(1)
式中:LGr, y)表示物体所处环境的照射分量, 尺(工,y)表7K反映物体本身IPJ色性质的反射分量,而Kx, y) 则表示我们通过眼睛或者采集设备抓取的图像信息。
Retmex理论是建立在以上模型基础上,其目的是在获
取得到原图像信息Kz, y)后,通过有效的估算算法计算 出照射分量信息LU, y),从而滤去照射分量的影响,最 终得到能表示采集或者看到的物体的本来样貌信
息'R(x
, y')。Retmex理论之所以经典且现在依然得到广泛的应用,
首先是该理论模型的正确性,再者是随着学者们不断地改 进和优化,照射分量估算准确性进一步提升。而其中,使 用最为多且效果优良的算法是由Jobson等提出来的Smgle- ScaleRetmex算法,又称SSR,该算法可以表示如下公式
Ri (x,y) = log!,- (x,y) — log[F(x,y) * I,- (x,y)] (2)式中:A y分别表示图像像素对应的横、纵坐标;I和i? 依然如式(1) 一样,分别表示反射分量和原图像信息,而z 代表的是RGB颜色模型中的3个颜色通道,分别为红、 绿、蓝;FCx, y)则表示的是环绕函数,用于和反射分量 做卷积运算,从而估算出照射分量。再者,该算法是建立 在对数空间上的,因为人眼视觉系统比较符合对数空间。
基础上提出了 Multi-Scale Retinex,又称MSR,公式如下
N
Ri(x,y) = ^jOjrA log!,- (x,y) — log[F„ (x,y) * Ii(x,y)J}n=l
(5)
从式子中,可以看见,主要是添加了 N个权重尺度的 控制,对于不同尺度参数c得到的环绕函数,分配不同的 权重。一般可以分为3个尺度,分别是高、中、低尺度, 而%则表示对应的尺度加权系统。
MSR优势主要在于,通过获得多尺度计算得到的反射
图像信息,可以依赖于适合的权值设置,最终得到各方面 都比较均衡的反映物体真实面貌的反射图像信息。
2
基于Retinex的校正算法技术方法研究
2. 1
光照不均图像特征分析及判断
在处理光照不均匀文本图像上,很多方法是直接针对
原始图像的一些图像特征,例如灰度级像素频数,进行统 计,然后进行大量文本样本测试,取得判断文本图像块是 否为光照不均匀的一个经验值。这种直接针对原始图像得 到的统计数据,会限制其适用范围。对于一些光照情况变 化比较快的图像往往判断会不够准确。
本文针对的文本图像大部分为纯文本图像,即不包含 大量复杂类型图片,最后得到的前景只有纯文字和一些简 单类型的线条图片。经过针对各类二值化的处理效果和性 能研究,发现针对一些光照比较均匀的文本块,大津法 (Otsu)分割算法能在很好地分割出前景和背景的条件下, 同时保持相对较短的耗时,其各方面性能都比较好。Otsu 算法作为众多二值分割算法中的一种,使用也相当广泛, 其主要步骤是:先统计图像灰度级分布信息得到灰度直方 图,然后计算比较得到一个使类间方差最大的灰度级,并 以此灰度级作为分割阈值对经过灰度化后的图像进行图像 分割。但是,对于一些光照不均的图像块,Otsu算法得到 的效果却相当不好。
图1中的3幅图,图1(b)是由原图1(a)直接进行全 局Otsu算法得到的。从视觉上可以看到,结果会出现大量 的黑块,且黑块的区域基本上与原图1(a)阴影区域相符, 体现了 Otsu算法对光照情况变化的敏感度。而图1(c)是
• 3074 •
计算机工程与设计
元既两―
2017 年
先将原图1(a)分为均匀的图像块(4*4块),然后再对其 图像块分别进行Otsii处理。单纯地从整体处理视觉效果上 来看,图1(b)无法分割好的下半部分图像,经过分块的方 法能大幅度提供分割的准确率,从而在一定程度上降低光 照不均匀对图像的影响。同时,从分块的处理效果也能很 明显地观察到受光照不均匀影响的区域块依然会将少鐘的 背景误认为文宇,从而产生部分黑块。利用Otsii算法针对 光照均匀和光照不均匀的图像块处理得到的效果的明显差 异,去判断光照均匀块和光照不均匀块。
针对每个分块进行Otsii二值化,并统计得到的结果图 像块中的黑色像素(即前景)占该分块的比例。记黑色像 素数量为从2<:々朽歡/,图像块宽高则
得到黑色像素比例为
blackRatio = bLackPixelfiriWidth
•
nHeight)
(6)
各图像块得到的^见表1$
表1图像块的 blackRatio fS
第一列
第二列第三列
第四列第一行0.0160. 048a 047
0.018第二行0430:. 0930. 082
0. 036第三行0. 0380.090a. 076
0. 496第叫行
0, 235
0. 043
0. 046
0. 353
在使用Otsii二值化处理光照不均图像块的时候,因为 受到光照的影响,无法很好地区分出文字和背景,所以会 产生大量的黑色块,
值也就会相对较高&如图2
所示,光照不均程度相对较低的图像块(即第四行第一列) 的比例也达到了 0. 235,而图3文宇相对比较密 集的光照均勻块,其
才
到
达
0. 093。通过表1的
实验数据可以发现光照不均块与光照不均块在
比例上有明显的差距,从而可以通过处于中间的一个临界 值来区分光照均匀块与光照不均匀块#
采集大量光照不均文本图像样本后,按如上所述,分 别进行分块Otsu处理,对各图像处理结果的值 统计表现:光照均匀的图像块的值都是偏低, 此处设置上限为0.150,并记为光照不均的图像块
图 2 blackRatio = 0. 235
BK工业热象仪”等项目,成功应
^工业的回转窑、闪速炉、高炉驾 即中心等橡胶和电力行业的温度t丨ijta:界同类产品的先进水平,解衩 i•司科技进步二等奖。
_家“八.五”攻关项目“用红外 艮用图像的分布式并行处理技术、
寸6台熟料窑的窑壳温度实时监沾 司科技进步三等奖。
图 3 blackRatio = 0. 093
值都是偏高,此处设置下限为0.100,并记为 而
值
介
于
和
之间的,都
是那些文¥极小的光照均匀文本图像块或文宇适当大小的
光照不均文本图像块。
为了尽量区分开两种情况,可以先根据值 统计出,分块处理后,各分块处在各分段的个数情况,具 体统计情况如下:
用于统计,当
《0. 100时的图
像块数;
wC〇W7?fM 用于统计,当 0. lO0 wCow沉H用于统计,当 > 0. 150时的图 像块数。 通过上述的图像块的统计,可以根据如式(7)得到作 为区分是否光照均匀块的阈值T/zrdoW ratioThreshold = {IRatia ^ hRatio)/2 ;?iCountM = 0 IRatio -h inCountL/jiCountH) • Aratio ;?iCountM ^ 0 (7) 其中 Aratio = hRatio — IRatio(8) 根据式(7 )得到的阈值rahoT/zre5/ioW与每块图像的 第38卷第11期 曾凡锋,刘树鹏:Retinex在光照不均文本图像中的研究 • 3075 • 比较,从而以此为依据判断出该图像块是光照不 均匀图像块还是光照均匀图像块。 当当 小大 于 于或 等时 于 ,将该图像块划分 时 ,则认为该 为光照不均匀的情况;图像块是光照均匀的情况 经过以上处理,常见的光照不均图像中,大部分相对 光照比较均匀的图像块就已经通过O tsii二值化分割好了文 字和背景,而只剩下少量块区域需要进一步处理。接下来, 保存这些块在图像上对应的坐标位置,以便进一步重新针 对原图像块做基于Retinex算法的增强处理。2. 2 Retinex算法的改进及二值处理 考虑到Retinex环绕函数算法中的SSR和 MSR 的优缺 点,选择SSR算法来处理文本图像,在时间和效果上会达 到一定的平衡。虽然算法是以效果为主,但是本文采集到 的文本图像一般都比较大,过长的处理时间是不能被接受 的,而M SR —般耗时是SSR的2 .5 倍以上,同时对文本图 像效果提升幅度几乎没有。 大多数M SR 算法应用在类似去雾[12a3]等类型研究上, 这些类型的图像一般会有多种前景物,而只是希望尽量在 滤去模糊遮挡物的情况下,依然保持各类前景的尽可能多 的原貌,所以需要多尺度的融合,处理效果会比较好。但 是,本文针对的对象是文本图像,前景只有文字,且一般 都是单色或颜色比较鲜明和统一,与背景灰度级分布相差 也比较大,所以,即使使用M SR 算法,耗去了时间,也可 能得不到比SSR更理想的处理效果。 同时考虑到,光照情况影响的是图片的亮度信息,先 将样本不均匀块颜色空间转换至Y UV[14]。然后仅针对其Y 分量进行单尺度SSR增强,这样可达到不影响其样本的颜 色信息。 至于SSR算法尺度的选择,从采集到的文本图像分析 来看,除了标题,其它正文文字的笔画宽度所占的像素点 一般不会超过6个,因此无需选择高尺度的SSR算法,选 择尺度过高,在增加计算时间的前提下,反而会是文字边 缘更加模糊。 如图4所示,是使用小尺度原SSR算法对图1 (a) 处 理得到的效果。 从视觉上说看,按 Retinex理论模型,去除了环境照度 分量的影响,也间接地使整体偏暗。虽然,在很大程度上 减少了光照不均的影响,但是由于文字和背景灰度级比较 接近,且图像动态范围过小,导致分割图像步骤还是有一 定的难度。所以,本文希望修改环绕函数,使 SSR 算法能 尽量拉伸灰度级偏低的区域,让后续的分割处理效果更好。 综上对Retinex算法所述,以及对文字笔画像素的分 析,环绕函数局部框范围可选择3-5左右,而为了尺度调 节比较灵活,本文改进SSR算法的环绕函数公式如下 F(^y) = kl.Jio oooexp(~fSS) (9) 式中: 々2、d/都是可以给定值的数,々2取值在 5. 0-8. 0比较适宜,而W/的取值在800-1600比较适宜。总 体上来讲,减小系数,可以提高背景的灰度级,从而使文 字和背景分割更为准确,但是依然需要在保证文字的清晰 度的基础下进行调节。 式(9)所述的怂、々2、W/仅相对于各块图像来说是定 值,每个图像块调节到适当的值,从而得到相适应的效果。 本文是依据上文得到的值来确定当前图像 块需要指定的3个系数值,其公式如下 (k\\ = kn ~\\~ /\\k • (ratioThreshold — IRatio)/Aratio 人 k2 = k2h — /^k • (hRatio — ratioThreshold)/Aratio ^alf = alfi + Aalf • {ratioThreshold — IRatio)/Aratio (10) 式中:々1/表系々1取值范围内的最小值,々2A表系々2取值范 围内的最大值,而M为々1、々2取值范围长度大小,AaZ/ 则为《//取值范围长度大小。 从经过改进的SSR算法处理后的图5来看,对于那些 光照不均块,相对于原SSR算法,文字和背景较容易被区 分开来。从中可以很好地观察到经过Otsu处理不是很好的 光照不均匀块(按上述比例进行判断得到的), 在进行改进的SSR算法处理后,背景与文字在视觉上能很 好地区分开来,受光照的影响程度也明显的下降,虽然文 字有稍微的虚化,但这种程度基本上不影响OCR对 其识别。 当然,对于一些文字比较少的文本图像,在众多分块 中,依然可能会有光照不均匀的文字空白区,而此中分块 无需使用SSR进行处理。本文使用直接置为背景色处理, 有利于进一步凸显文字和背景的差别。当然,是否为文字 空白区还需要经过有效的判断。本文是以统计图像块的灰 度级分布作为依据来判断的,文字为深色,则灰度级偏低, 当低灰度级分布只有零星的一些像素点,则可以判断为文 字空白区。 SSR处理过后,接着将其分块重新转换回RGB颜色空 • 3076 • 计算机工程与设计 2017 年 赭ansi*鱗tr料目相趴,剌_觖 朗料干轴綈雔蚣柳蟓鵡鼬鼸辦饨等赴 _ 家胳細細i 纖、 隱觖£gfi. 家繼触中中心心.轴_电方肫M魏m«,在總 _終.鼸了鼬』m|唯miI:m教上金 im■专r.搴|卜躲脾域 Mama 有色金«公司_二等奖, 兢了 but几r找«目朗綱谈躲餓B0T.料目的 线撕脚§|_式將_肩駆即动髑以及禽刖恥■郎 林ftTOS台糾艄6繩餅篇私明^动嫌制!• 3卵5舯B« 色金_戀m 突銥‘厕跗离灌鼸醜系項目,_多将細树熟§求1酬11咖明_数•鼴麵 笔 M__ ____热1_脚M能恥棚篇矜s&嘟 議鉼鼸亂 分_.贴M,緘目馘中中31肫 研纖步二1 图5 改进的SSR块处理 间,再对其分块分别进行灰度化处理。接着再进行局部二 值化处理。 典型的局部二值化有Niblack算法[15]、Sauvola算法0 Niblack算法虽然可以很好地将灰度级偏低的字符分割出 来,但是由于只考虑了像素点的局部信息,会产生大it的 噪点。而Sauvola算法克服了 Niblack算法的这些不足,其 使得在相同标准差的情况下,对于灰度值较高的背景点, 阈值更加小,从而达到过滤掉背景中一定量的噪点。经过 改进后的SSR处理后的图片再进行Sauvola算法,可以得 到很好的效果,对于常见的光照不均样本,基本不会产 生噪点。 从图6可以观察到,本文算法消除了所有光照的影响, 使用二值图像的表现形式,将文字与背景明显地分割开来 了。同时,从图7局部图像也能很好地看到,基本不会因 为分割不明确而产生噪点,且文宇的结构也很饱满,很少 出现文字断笔情况。 图6 最终二值图像 2. 3 本文校正方法设计 对于光照不均匀文本图像处理的难点在于对光照不均 匀区域的判断以及校正方法的适应性。由于光照不均图像 的灰度直方图不会有明显的两个峰值,所以不可能使用单 一的阈值的全局二值化对其进行处理,然而仅使用局部二 值化处理耗费的时间偏多且容易产生大量噪点,很影响最 后的OCR识别。而对于分块本身其实就在减少图像信息世 完成了国家“八.五” 主要创新是采用图像的分; 术解决同时对6台熟料窑( 色金属总公司科技进步三< 完成的“JRD近红外| 和高温特征提取,解决生F 图7 局部图 的同时,在一定程度上降低了某些图像块光照对文本的影 响程度,使用Otsii处理将这些光照相对比较均匀的块与光 照不均匀的块进行区分开来,并且Otsii进一步地强化了光 照不均匀块的光照情况并反映在=值图像下,能很明显地 判断出,其与光照均匀块的区别。针对光照不均匀块再进 行改进的SSR和Sauvola二值化,最终得到理想的效果。 首先,将灰度化后的图像均分为N*N (N取2-8)个 图像块。对于一般文本图像,其文字区域大部分会处于图 像中间,图像边界区域也会有适当的空白区域,N取值过 大,会造成分割块中文字前景信息过少,并且随着块的增 多,也容易出现块效应以及处理时间增多;N取值过小, 会很难将光照均匀区域和光照不均匀区域分开来,从而达 不到理想的处理效果。经过实验得到,对于一般文本图像, 在N取4的时候能在处理效果和时间上达到平衡,取得最 佳的效果和性能。 然后,对图像块进行Otsii二值化处理,并对处理得到 的二值化图像结果进行判断,如果判断为光照不均块,则对该块重新做改进的SSR增强和Sauvola处理。图8为本 文校正方法的基本流程& 2.4算法步骤描述 依据前文讲述,本校正方法的详细步骤如下:(1) 将图像均分为4*4的子图像块。(2) 遍历图像块,利用公式 第38卷第11期 曾凡锋,刘树鹏:Retinex在光照不均文本图像中的研究 + 1U*B • 3077 • L = 0. 299 *i? + 0. 578 将图像块进行灰度化。(3) 对图像块进行Otsu二值化处理,并统计得到结果 他 = ra h o r------------------------------------';i:. 的黑色像素比例。将图像块 ra- 原图局部 Siblack 算法 处理得到的二值图像作为结果输出。取 (4) 得 ■持绍与 l=i jfe. Sauvola 算法 生持人介绍与 文献[2] 的图像块位置坐标,并转至步骤⑷, 取得该块原图像,统计其灰度级大于90的像素点 J Tf b 频数sum,如果sum<10,则直接灰度化后二值化并置为 白色;否则转至步骤(5八 (5) 利用环绕函数为式(9)的单尺度SSR式(2)进行增强处理,并转至步骤(6)。 (6) 进行Sanvola算法二值分割,作为结果进行输出。(7) 合并(3)得到的结果,输出最终的二值图像。 3实验结果与分析 3.1测试实验环境 测试本文方法的实验环境主要分硬件和软件部分。软硬件环境,见表2。 表 2 软硬件环境 电脑 Intel(R) Core(TM) i5-6200U CPU @ 2* 30GHz 亮度测试仪器DT-1顧)多功能USB照度1卩/光度讣图像采集设备500万像素摄像头(2560 * 1920) 操作系统Windows 7旗舰版编译调试软件Micros Visual Studio 2005 编程语言VC++/C+ + 识别接口 汊王OCR北方工业大7 1. 0版 通过图像采集设备采集的文本图像样本共有2G0张, 都以bmp图片格式存储在Windows系统下&其中,拍摄对 象有A4复印纸、中英文书籍、期刊等,但都不存在过于复 杂,色彩变化过快的图像信息6主要包括常规型的文本图 像(文字密稀不一,且排版不一)、表格类图纸以及简单线 条类型图形。3. 2 结果对比与分析 实验中,为了达到可视的对比,本文实现了如上文所 述的常用的局部Niblack算法和Sanvola算法,以及文 献[2]提出来的基于灰度级统计的分块算法,其中各算法 的参数选择都参考原文以及针对文本图像适合的大小修改。 本文算法对于纯文本的实验视觉效果可以参考图6和图7。 图9为表格类型和简单图形类型经过各个算法进行处理 的效果。 光照不均文本图像分别通过4种算法进行处理,从视 觉上来看,Niblack算法能完整地提取出文宇信息,文宇基 本不会发生断笔的情况,但是字的周围会产生大量的噪点, 主持人介绍与 本文算法 疆卜醒鍵麵靖汞 , Niblack 算法 程。赴理流程如图4所示t I光学识别J |语 文献[2] 程。处理流程如图4所示, 关学芋符识别 语音合成.OCR TTS 本文算法 图9各个算法处理结果 从而影响识别。Sanvola算法原理是在Niblack算法基础做 改进的,其能减少大M的噪点产生,但字周围依然会存在 很多噪点。而对于文献[2]提出的算法,对于处理一些灰 度级过渡过快的图像块,会产生少量的噪点,同时经过大 鐘样本的测试,其对稍微偏暗的图像处理效果不佳。本文 算法,首先在图像的背景区基本不会产生会影响识别的噪 点,再者文字周边存在的噪点也极少,同时对于图像方框、 简单的线条也会清晰地作为前景被提取出来,以便于OCR 更好地版面分析。 表3为所有样本的测试结果,主要参考衡量依据是 OCR识别率和耗时。从表中,可以看到Niblack算法的识 别率欠佳,主要是因为文字周边的噪点暈太多;Sanvola算 法的识别率有一定的提升,但依然达不到令人满意的效果, 并且以上两种耗时基本都较长,实用价值相对较低。文 献[2〕提出的基于灰度级判断的分块算法,对于常见的光 照充足下遮挡型光照不均图像,处理效果比较好,但是在 环境整体偏暗下,识别率会大幅度降低。而本文算法,在 可接受的时间内,都可以获得较高的OCR识别率,对光照 环境的适应能力也很好。 实验结果表明,本文研究的校正算法对常见的文本类 型光照不均图像,都能得到清晰的j值图像,在OCR识别 率和时间上能达到平衡,能尽量消除光照对文本识别 的影响。 方法 • 3078 • 计算机工程与设计 表 3 2017 年 算法识别率和耗时情况 整体偏暗 8-35 binarisation method for uneven illumination document images [J], Computer Applications and Software, 2015,32 (11): 185-196 (in Chinese).[ 常见光照不均图像 光照(Lux) 75-220 曾凡锋,王战东,郭正东.非均匀光 J]. 照文档图像快速二值化方法[ 32 (11): 185-196.] 计算机应用与软件,2015, 平均识别率/% 纯文本 原图 Niblack 算法Sauvola 算法 15. 544. 789. 7表格 15.143. 389.1简单图形纯文本 14. 343. 188. 314. 321.746. 3表格简单图形 11.420.443.111.219. 742.1[4] Meng Gaofeng, Xiang Shiming, Zheng Nanning, et al. Non parametric illumination correction for scanned document images via convex hulls [J], IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35 (7) : 1730-1743. [5] Meng Gaofeng, Pan Chunhong, Xiang Shiming, et al. Metric 文献[2]算法97. 296. 896. 685. 785. 285.1 本文算法 98.1 97. 7 97. 3 97. 7 97.4 97. 2 平均耗时/ms 原图 00Niblack 算法27812792Sauvola 算法 28002832文献[2]算法265330 文本算法 680 693 4结束语 本文首先利用对光照比较敏感的OtSU算法提出了更为 准确的判断光照不均块的算法,同时在Retmex算法的基础 上,改进并提出了一种识别率稳定、适用性广的光照不均 文本图像校正算法。相对于常用的且有一定消除光照不均 效果的局部二值化方法,在时间和识别率上都有一定的提 升,而相对于文献[2]提出的算法,本文算法判断也更为 准确、适用范围也更宽。 目前,对于正常环境下的光照不均文本图像都能得到 很好的效果,但是对于一些在光源不是很稳定的环境下, 采集到的灰度级过渡不是很平滑的文本图像,处理效果欠 佳,会在该区域出现少量噪点,影响识别,其效果还有待 进一步地提尚。 参考文献: [1] ZHU Lei, BAI Ruilin, JI Feng, Local threshold segmentation based on grayscale wave for uneven illumination image [J], Computer Engineering and Applications, 2015,51 (12) : 144149 (in Chinese).[朱嘉,白瑞林,吉峰.光照不均匀图像的 灰度波动局部阈值分割[ J]. 计算机工程与应用,2015, 51 (12): 144-149.] [2] WANG Zhong, ZHENG Ronghao, FU Luhua, et al. Thres hold segmentation of uneven illumination images [J], Application Research 〇£ Computer, 2015,32 (11) : 3467-3470 (in Chinese).[王仲,郑镕浩,付鲁华,等.光照不均匀图像的阈 值分割[J ]. 计算机应用研究,2015,32 (11): 3467-3470.] [3] ZENG Fanfeng, WANG Zhandong, GUO Zhengdong. Fast rectification of curved document images [J], IEEE Transac tions on Pattern Analysis and Machine Intelligence, 2012,34(4): 707-722. [6] LIANG Lin, HE Weiping, LEI Lei, et al. Survey on en hancement methods for non-uniform illumination image [J], Application Research 〇£ Computer, 2010,27 (5) : 1625-1628 (in Chinese).[ 梁琳,何卫平,雷蕾,等.光照不均图像增强 方法综述 [J ]. 计算机应用研究,2010, 27 (5): 1625-1628.] [7] LIU Qintang. Research of the color image enhancement based on Reintex algorithms [D], Harbin: Harbin Engineering Uni- versity,2012 (inChinese).[刘钦堂.基于 Retinex 算法的彩 色图像增强研究[D ]. 哈尔滨:哈尔滨工业大学,2012.] [8] XU Haiyang,MA Longlong, WU Jian. Document image bina risation based on background estimation and edge detection [J], Computer Applications and Software, 2014,31 (8) : 196-200 (inChinese).[许海洋,马龙龙,吴健. 基于背景估计和边缘 检测的文档图像二值化[ J]. 计算机应用与软件,2014, 31 (8): 196-200.] [9] Hassan Najafi M, Mostafa E Salehi. A fast fault-tolerant architecture for sauvola local image thresholding algorithm using stochastic computing [J]. IEEE Transactions on Very Large Scale Integration Systems, 2016, 24 (2): 808-812. [10] Siva Sindhuri M, Anusha N. Text separation in document ima ges through Otsu? s method [C] //International Conference on Wireless Communications, 2016 : 2395-2399. [11] Wang Guodong, Dong Qian, Pan Zhenkuan. Retinex theory based active contour model for segmentation of inhomogeneous images [J], Digital Signal Processing, 2016,50: 43-50. [12] LI Changling, SONG Yuqing, LIU Xiaofeng. Haze removal method for traffic images based on multi-scale Retinex theory [J]. Computer Application, 2015,35 (S2) : 234-237 (in Chinese).[李长领,宋裕庆,刘晓锋. 基于MSR的交通图像 去雾霾方法[J ]. 计算机应用,2015, 35 (S2): 234-237.] [13] CHENZhibin, ZHANG Chao, SONG Yan, et al. Applica tion of Retinex with grayscale stretching in large dynamic range smoke image enhancement [J], Infrared and Laser Enginee- ring,2014,43 (9): 3146-3150 (inChinese).[ 陈志斌,张 超,宋岩,等.灰度拉伸Retinex在大动态范围烟雾图像增 第38卷第11期 强中的应用[ 3150.] J]. 曾凡锋,刘树鹏:Retinex在光照不均文本图像中的研究 红外与激光工程,2014,43 (9): 3146- • 3079 • (1): 168-172.] 小型微型计算机系统,2016,37 [15] SHEN Sen, LI Aihua, YAO Liang, et al. Gun code binary image algorithm based on wavelet packet an Niblack method [J]. Acta Photonica Sinica, 2013, 42 (3Chinese).[ [14] QIN Xujia, CHENG Feiyan, FAN Yinglin, et al. Image en hancement algorithm based on Retinex of trilateral filter in HSV color space [J], Chinese Computer Systems, 2016,37(1): 168-172 (in Chinese).[秦绪佳,程飞燕,范颖琳,等. ): 354-358 (in 申森,李艾华,姚良,等.基于小波包和Niblack J]. 法的枪号图像二值化算法[ 光子学报,2013, 42 (3): 基于三边滤波的H SV 色彩空间Retinex图像增强算法[J]. ( 上接第3060页) [2] HUANG Tiejun, ZHENG Jin, LI Bo, et al. Visual perception and processing for intelligent video surveillance: A review [J], Journal 〇£ Image and Graphics, 2014,19 (11) : 1539-1562 (in Chinese).[ 黄铁军,郑锦,李波,等.多媒体技术研究: 2013-面向智能视频监控的视觉感知与处理[J] .中国图象图形 学报,2014,19 (11): 1539-1562.] [3] HUANG Kaiqi, CHEN Xiaotang, KANG Yunfeng. Intelli gent visual surveillance: A review [J], Chinese Journal of Computers, 2015, 38 (6): 1093-1117 (in Chinese).[黄凯 奇,陈晓棠,康云峰.智能视频监控技术综述[J]. 计算机学 报,2015,38 (6): 1093-1117.] [4] ZHANG Yun, LI Wenhua, YU Hui. Applying balanced score card based resource allocation stratege to intelligence decision support system [J]. Journal of Northwestern Polytechnic University, 2014, 32 (2): 329-336 (in Chinese).[ 张蕴,李伟 华,于会. BSC资源分配策略在智能决策支持系统中的应用 [J]. 西北工业大学学报,2014, 32 (2): 329-336.] [5] HE Jinrong, DING Lixin, CUI Mengtian. Marginal Fisher analysis based on matrix exponential transformation [J], Chinese Journal 〇£ Computers, 2014,37 (10): 2196-2205 (in Chinese).[何进荣,丁立新,催梦天.基于矩阵指数变换的边 界Fisher分析 [J]. 计算机学报,2014, 37 (10): 2196-2205.] [6] WANG Zhongfeng, WANG Zhihai. An optimization algorithm of Bayesian network classifiers by derivatives of conditional log likelihood [J], Chinese Journal of Computers, 2012,35 (2):364-374 (in Chinese).[ 王中锋,王志海.基于条件对数似然 函数导数的贝叶斯网络分类器优化算法[ J]. 计算机学报, 2012, 35 (2): 364-374.] [7] Foo B, Schaar MV. A distributed approach for optimizing cas caded classifier topologies in real-time stream mining systems 354-358.] [J], IEEE Transactions on Image Processing, 2010,19 (11):3035-3048. [8] Teisseyre P. Asymptotic consistency and order specification for logistic classifier chains in multi-label learning [J]. Machine Learning, 2016 (3) : 245-258. [9] DucasseR,Turaga D, Schaar MV. Adaptive topologic optimi zation for large-scale stream mining [J]. IEEE Journal of Selected Topics in Signal Processing, 2010,4 (3) : 620-636.[10] Gagliolo M, Schmidhuber J. Algorithm portfolio selection as a bandit problem with unbounded losses [J], Annals of Mathematics and Artificial Intelligence, 2011,61 (2) : 49-86. [11] ZHANG Juan, JIANG Hesong. Spectrum sharing based on multi-armed bandit online learning [J], Computer Engineering and Design, 2014,35 (7): 2515-2519 (in Chinese). [张娟,姜和松.基于多臂赌博机在线学习的频谱共享方法 [J]. 计算机工程与设计,2014, 35 (7): 2515-2519.] [12] Rusmevichientong P, Tsitsiklis JN. Linearly parameterized bandits [J]. Mathematic Operator Research, 2010,35 (2): 395-411. [13] Anantharam Y, Varaiya P, Walrand J. Asymptotically effi cient allocation rules for the multiarmed bandit problem with multiple plays-Part I: 1.1. D. rewards [J], Numerical Heat Transfer Part a Applications, 2009,56 (1): 42-59. [14] Anandkumar A, Michael N,Tang AK, et al. Distributed al gorithms for learning and cognitive medium access with logarithmic regret [J], IEEE Journal on Selected Areas in Communications, 2011,29 ⑷:731-745. [15] Sidiropoulos P, Mezaris Y, Kompatsiaris L. Enhancing video concept detection with the use of tomographs [C] //In Proceedings of IEEE International Conference on Image Processing, 2013: 3991-3995. 因篇幅问题不能全部显示,请点此查看更多更全内容