王姝华 作品数:17 被引量:130 H指数:7 供职机构: 中国移动通信集团江苏有限公司 更多>> 相关领域: 自动化与计算机技术 经济管理 建筑科学 社会学 更多>>
基于最小二乘法的文档图像倾斜检测方法 被引量:17 2001年 在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为页面倾斜方向。同时,本文介绍了一种基于直线拟合的快速倾斜校正算法。实验证明,该算法速度快,准确度高。 王姝华 李佐 蔡士杰关键词:倾斜校正 文档图像 最小二乘法 图像处理 办公自动化 基于规则的建筑结构图钢筋用量自动识别系统 被引量:19 2002年 传统的手工建筑工程量统计方法不仅费时而且容易出错,利用计算机自动完成工程量统计工作则可以很好地解决这一问题.介绍了一个基于规则的建筑结构图自动识别系统(automatic interpretation of structuredrawings,简称AISD).该系统以矢量化后的电子图档为基础,通过总结建筑工程图结构特征及绘图规则,自动分析图中的各种图形元素、符号以及其关系,理解各种部件信息,并加以综合,以获取正确的建筑工程钢筋用量.通过对工程图的特征进行详细的研究,总结出一套基于规则的适应不同类型工程图的理解方法.试验结果表明,这种方法为建筑工程图的自动识别和理解提供了一个可取的解决途径. 王姝华 曹阳 杨若瑜 蔡士杰 李恒关键词:建筑结构图 钢筋用量 自动识别系统 CAD 基于直线连续性的页面倾斜检测与校正 被引量:31 2001年 在文档扫描过程中 ,输入的文档图像不可避免地会发生倾斜现象 ,而布局分析及字符识别算法对页面倾斜都十分敏感 ,因此倾斜检测和校正是文档分析预处理的重要环节 .文中提出了一个基于直线连续性的倾斜检测方法 .它将字符连通区包围盒底边中心点作为特征点 ,利用文本行中特征点与基线的关系 ,计算出基线的方向 ,即为页面倾斜方向 .接着 ,介绍了一种基于偏移值的倾斜校正方法 .实验证明 ,该算法速度快 ,准确度高 . 王姝华 李佐 蔡士杰关键词:文档处理 计算机 字符识别 文档分析与理解中若干技术的研究 该文对文档分析与理解这一具有重要理论意义和广阔应用前景的课题中的若干技术进行研究和探索.由于所处理的目标文档的复杂性,文档分析与理解技术所涉及的内容十分广泛.广义上的文档主要包括文本文档和图形文档两类,而表格是文本文档与... 王姝华关键词:页面分割 逻辑结构 文档分析 页面分割 文献传递 计算机读图技术研究 蔡士杰 宋继强 曹阳 路通 杨若瑜 苏丰 陈克彰 李恒 王姝华 张习文 邹荣金 李佐 胡笳 蔡敏 杨大纲 王仪科 杨华飞 本项目提出了一种全新的“对象式逐步简化的矢量化模型”,有效地解决了工程图矢量化中处理线线相交、字线相交和字线粘连的难题。提出了以特征方向为指导的直线和圆弧的象素跟踪方法,克服了现有线条识别方法因为相交、粘连造成线条的分段...关键词:关键词:矢量化 计算机读图 移动通信企业数据仓库系统设计初探 2004年 移动通信市场的迅速发展,使运营企业都十分重视利用企业宝贵的数据资源建立数据仓库系统,并在此之上进行深入分析,以及时应对激烈的市场竞争和提供个性化服务。介绍了移动通信企业建立数据仓库的背景;阐述了目前在业务系统中进行数据分析的局限性,同时指出数据仓库系统建设的必要性;针对移动的行业特点,对数据仓库系统体系结构的设计和其中几个关键性问题进行了深入的探讨;最后,阐述了数据仓库建设中面临的风险和挑战。 王姝华 仲华 吕明关键词:移动通信 数据仓库 系统结构 一种基于前端预测识别的粘连字符分割方法 被引量:28 2001年 在字符识别领域 ,对粘连字符的识别是一个被广泛关注的技术难点 ,未能准确分割粘连字符是产生识别错误的主要原因之一 .在总结已有方法的特点及不足的基础上 ,提出了基于前端预测识别来分割粘连字符的方法 .首先根据粘连字符图像的特征初步确定前端字符的候选字符集 ,并通过验证候选字符与前端字符图像匹配的必要条件进一步对其筛选 ,然后使用候选字符的屏蔽码自适应地提取前端字符图像 ,最后由分类器对提取结果加以验证 ,达到分割和识别粘连字符的目的 .该方法可以适应多种类型的粘连字符 ,准确性高 ,且在字符图像质量较差时具有较强的鲁棒性 . 李佐 王姝华 蔡士杰关键词:字符识别 抗干扰 VHTender标书处理系统的设计与实现 王姝华基于特征行必要—充分性匹配的OCR方法 R技术已得到了很好的发展,但仍有可改进之处,该文介绍一种基于特征行的必要-充分性匹配的OCR方法,以及字符骨架重迭显示的查错界面。该文无论是在识别率和识别速度方面均有较好结果。 蔡士杰 李佐 王姝华关键词:识别率 基于特征行必要-充分性匹配的字符识别方法 被引量:14 2002年 字符识别系统的性能在很大程度上依赖于所选取的字符特征.提出了一种基于特征行必要-充分性匹配的OCR(optical character recognition)方法.该方法使用字符模板的特征行集,通过对待识字符位图进行必要性和充分性双向匹配来识别字符.并采用基线对齐归一化方法在特征匹配时准确定位,使识别率和识别速度都较为理想.同时,对字符位图特征行的交互选择、测试和调整等方法做了详细介绍.另外,还提出了字符骨架与位图重叠显示的方案,有效地提高了对识别结果校对的速度.最后,通过测试和比较,对识别效率进行了分析. 李佐 王姝华 蔡士杰关键词:计算机图形学 字符识别 特征抽取