徐智婷
- 作品数:2 被引量:37H指数:1
- 供职机构:上海市智能信息处理重点实验室更多>>
- 发文基金:国家自然科学基金上海市科委科技攻关项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 自然语言处理中专名识别方法的研究
- 专有名词的识别在针对各国语言的自然语言处理系统中都是一个具有挑战性和研究意义的课题。目前已有多种专名识别的方法,基于各自的出发点,各有利弊。本文对这些方法作了大致的分类和概述,目的是为了阐明专名识别问题的本质要求以及研究...
- 张玥杰徐智婷钱晶张涛
- 关键词:自然语言处理专名识别未登录词识别专有名词
- 融合多特征的最大熵汉语命名实体识别模型被引量:37
- 2008年
- 最大熵模型能有效整合多种约束信息,对于汉语命名实体识别具有很好的适用性.因此,将其作为基本框架,提出一种融合多特征的最大熵汉语命名实体识别模型.该模型集成局部与全局多种特征,同时为降低搜索空间并提高处理效率,而引入了启发式知识.基于SIGHAN 2008命名实体评测任务测试数据的实验结果表明,所建立的混合模式是一种组合统计模型与启发式知识的有效汉语命名实体识别模式.基于不同测试数据的实验说明,该方法针对不同测试数据源具有一致性.
- 张玥杰徐智婷薛向阳
- 关键词:命名实体识别最大熵模型启发式知识