许牧
- 作品数:1 被引量:22H指数:1
- 供职机构:厦门大学软件学院更多>>
- 发文基金:福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于门循环单元神经网络的中文分词法被引量:22
- 2017年
- 目前,学术界主流的中文分词法是基于字符序列标注的传统机器学习方法,该方法存在需要人工定义特征、特征稀疏等问题.随着深度学习的研究和应用的兴起,研究者提出了将长短时记忆(long short-term memory,LSTM)神经网络应用于中文分词任务的方法,该方法可以自动学习特征,并有效建模长距离依赖信息,但是该模型较为复杂,存在模型训练和预测时间长的缺陷.针对该问题,提出了基于门循环单元(gated recurrent unit,GRU)神经网络的中文分词法,该方法继承了LSTM模型可自动学习特征、能有效建立长距离依赖信息的优点,具有与基于LSTM神经网络中文分词法相当的性能,并在速度上有显著提升.
- 李雪莲段鸿许牧
- 关键词:自然语言处理中文分词循环神经网络