搜索到1144篇“ 汉字字形“的相关文章
基于图像特征的汉字字形相似度计算
2024年
汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方法。对《通用规范汉字表》的8105个汉字进行了相似度分析,结果表明,该方法和人的认知结果比较一致。
王昭杨婧杨敏
关键词:汉字字形形似字相似度计算尺度不变特征变换
汉字字形演变的秘密——以“戎”“戒”“戍”为例
2024年
汉字历经数千年的演变,形态不断发生变化,一些我们现在看上去长得十分相似的汉字,它们的初始形态实际上是完全不同的,代表的含义也不同。比如“戎”“戒”“戍”三个字,它们都有“戈”部,左下也都有撇,看上去形体相似,实际上含义不同。如果追根溯源,从甲骨文中寻找这三个字的痕迹,就会清楚地看到汉字字形演变的过程,进而更好地了解汉字的含义。
张学鹏
关键词:汉字字形甲骨文追根溯源
动态调整参数的汉字字形与布局设计方法和系统
本发明公开了一种动态调整参数的汉字字形与布局设计方法和系统,包括:(1)针对每个汉字,确定字形图像与字形矢量轮廓对应关系,并提取字形图像中的字骨架,对字骨架剪枝后构建骨架点集,将字形轮廓上的轮廓节点与最近的骨架点匹配,被...
殷叶航陈泽文赵延吉伍文棋张瑞张克俊
融合汉字字形结构信息的中文命名实体识别被引量:1
2024年
提出BCBGAC(BERT-CNN-BiGRU-Attention-CRF)模型,通过在汉字嵌入中集成字形结构信息来提高中文命名实体识别精度.BCBGAC使用五笔法将汉字按书写顺序分解为基本汉字组件,汉字组件由Skip-Gram方法编码,汉字组件编码矩阵输入卷积神经网络CNN,提取汉字字形结构特征,生成汉字字形结构向量.字形结构向量与BERT模型生成的汉字基本向量拼接得到最终的汉字嵌入向量.然后将汉字向量输入到BiGRU网络中,以捕获向量之间的上下文关系.引入注意力机制来对字符向量进行加权,通过CRF解码层获得实体序列的最佳标注.在两个数据集上的实验结果表明,BCBGAC模型取得了比基线模型更好的实体识别效果.F 1在两个数据集上分别达到96.06%和95.48%,验证了BCBGAC模型在中文命名实体识别任务中的有效性.
陈金玉王名扬刘旭
关键词:命名实体识别
基础教育汉字字形偏误分析
2023年
汉字字形偏误是基础教育阶段的学生在语文学习中出现的比较普遍的现象。文章根据汉字构形的特点划分汉字偏误类型,从笔画、部件、整字三个层面讨论基础教育阶段学生的汉字字形偏误。笔画层面,主要有混淆相似的笔画、笔画数目的增加或减少、笔画误断误连、笔画配合偏误、笔顺不合规范等。部件层面,主要有部件的增加或减少、部件改换、部件组合偏误等。整字层面,主要有形近别字、音近别字、义近别字等。文章通过分析汉字字形偏误的类型,以期对基础汉字教学有一定的帮助。
黄利华
关键词:基础教育汉字
守“本”创新——汉字字形优化设计研究
汉字不仅是记录汉语的符号和沟通交流的工具,而且是文化和设计的载体,是中华传统文化的核心。汉字的“字形设计”聚焦于汉字的结构设计,如结构的创造、简化、繁化等;“字体设计”则主要是汉字的风格设计。本文的主要研究对象是汉字字形...
李朝胜
关键词:汉字设计字形设计汉字文化本义表意
汉字字形中的中国古代战争文化
2023年
《说文解字》是我国首部系统完备的字典,其中关于军事、战争的汉字在一定程度上反映了当时的武器装备和战争文化礼仪。现主要从汉字的形体结构出发,阐述汉字形体中蕴含的文化内涵,以更好地实现《说文解字》的文化解读,发挥其现实意义。
师晴
关键词:《说文解字》汉字形体汉字字形文化礼仪文化解读
一种基于汉字字形扰动的字体风格迁移方法
本发明公开了一种基于汉字字形扰动的字体风格迁移方法,本发明设计风格迁移网络,使用注意力增强卷积替换普通卷积,弥补普通卷积在图像处理时只关注局部信息的不足,先编码提取汉字骨架特征,再解码生成目标字体风格的汉字变体。同时设计...
姚晔高旭东王晨张祯王秋华任一支陈临强吴国华
《国际中文教育水平等级标准》初等手写汉字字形对比分析
2023年
《国际中文教育水平等级标准》初等手写汉字表作为权威的中文学习字表,要充分考虑不同汉字规范的字形差异。通过考察在中国内地、香港地区、台湾地区的汉字规范下,初等手写汉字字形差异情况,我们发现:两岸三地字形相同的汉字占49.7%。这体现了其教学使用的普遍性与适用性。同时,繁体字背景的留学生在学习初等手写汉字时面临的主要难点是不同汉字规范之间的字形微型差异。如首笔、折笔以及笔画关系的差异、字形讹变带来的部件混同等现象。
江凯业
基于汉字字形和词语边界特征的命名实体识别方法及系统
本公开涉及自然语言处理技术领域,提出了一种基于汉字字形和词语边界特征的命名实体识别方法及系统,识别方法包括如下步骤:将获取的待处理医疗文本输入到微调好的BERT预训练语言模型中,获取包含上下文信息的字符级特征向量;对获取...
于晓梅张劲松马铭骏李真李延青郑向伟

相关作者

连宙辉
作品数:72被引量:13H指数:2
供职机构:北京大学
研究主题:笔画 中文字库 汉字笔画 字库 汉字字形
唐英敏
作品数:107被引量:41H指数:3
供职机构:北京大学
研究主题:字库 笔画 汉字笔画 中文字库 缩放
肖建国
作品数:117被引量:336H指数:10
供职机构:北京大学
研究主题:笔画 汉字笔画 中文字库 字库 汉字字形
林民
作品数:75被引量:174H指数:6
供职机构:内蒙古师范大学
研究主题:蒙古文 汉字字形 形式化描述 主题模型 汉字
宋柔
作品数:96被引量:381H指数:13
供职机构:北京语言大学信息科学学院
研究主题:标点 自然语言处理 中文信息处理 汉字字形 现代汉语