索南才让
- 作品数:6 被引量:10H指数:2
- 供职机构:青海师范大学计算机学院更多>>
- 发文基金:国家社会科学基金国家自然科学基金青海省科技厅基金更多>>
- 相关领域:自动化与计算机技术语言文字社会学经济管理更多>>
- 面向语言信息处理的藏语短语及其分类方法研究被引量:5
- 2018年
- 短语作为语言分析的一个层次,占有十分重要的位置。有效的短语分析对降低其后句法分析的难度,缩小句法分析器的搜索空间,提高机器翻译的翻译正确率是很有帮助的。而目前面向信息处理的藏语短语的研究刚刚起步,有待于进一步发展。该文在藏语短语与藏语句子的界线研究的基础上,根据藏语信息处理的特点和要求,按照语法功能和便于计算机自动分析和处理的原则对短语进行分类,并规定了信息处理中藏语短语类别单位的标记代码。
- 才藏太索南才让索南才让
- 关键词:藏语短语
- 融合词典的BERT-BiGRU的藏语句子情感分类方法
- 2025年
- 针对藏文情感分析研究中,由于藏文缺乏公开的情感词典和能结合上下文的深度学习模型等导致的分类效果欠佳问题,构建一个规模可观的藏文情感词典,结合基于改进的BERT-BiGRU的藏语句子情感分类方法,在哈工大开源的CINO多语言的通用预训练语言模型上进行微调。实验结果表明,本文方法能够有效提高情感分类的准确率,验证了方法的有效性。模型在分类准确率和泛化能力上的表现优于相关工作,为进一步研究藏文文本情感分类问题提供一种思路和实验证据。
- 公确多杰索南才让索南才让
- 关键词:情感词典
- 基于卷积神经网络的藏语情感词典自动构建方法被引量:1
- 2024年
- 针对藏语情感分析研究中的特殊挑战,包括缺乏标注数据和有限的语言资源等问题,文章提出一种基于卷积神经网络CNN和词频结合的C-TF藏语情感词典自动构建方法。藏文有许多丰富的情感文本,文章对藏族传统文献八大藏戏和社交媒体评论中的情感词汇进行词频统计,结合词频和卷积神经网络计算出情感种子词,采用了大规模无标注数据进行预训练,并使用少量标注数据进行了微调,最终构建了包含12503条情感词汇的藏语情感词典。文章提出的情感词典构建方法为进一步研究藏文文本情感分类问题提供了新的思路和实验证据。
- 公确多杰索南才让
- 关键词:CNN
- 藏语语料库语言学的研究内容与应用
- 2019年
- 藏语语料库是一门与应用语言学、自然语言处理及计算机科学直接相关的新型交叉学科。它的目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。文章通过对其语料库的概念、分类、发展历程、研究范围、研究方法及其研究意义方面的论述,对语料库语言学进行综述。
- 索南才让
- 关键词:语料库语言学
- 基于锚点信息和句子长度相结合的汉藏句子对齐方法研究被引量:2
- 2016年
- 语料库资源对于自然语言处理研究的巨大价值已经得到社会各界越来越多的认可。特别是句子级对齐的双语平行语料库,已经成为机器翻译、翻译知识获取以及双语词典编纂研究不可或缺的重要资源。本文结合青海省科技厅项目《汉藏句子自动对齐技术研究》的研究经验,提出了一种利用句子长度和锚点信息相结合的汉藏双语句子对齐方法,该方法利用(1:1)型的句珠作为候选锚点,用锚点将双语文本分割成几个分块,在对应双语分块中用基于长度的对齐实现句子的对齐。
- 才藏太索南才让
- 关键词:句子对齐锚点
- 面向自然语言处理的藏语虚词la格研究被引量:2
- 2013年
- 藏语虚词研究是藏语自然语言处理中一项不可缺少的基础性工作,有着极其广泛的实际应用价值。它是藏文信息处理的核心和藏语自然语言理解的基础,在藏文校对、信息检索、双语对译、自动分类等技术中有着广泛的应用前景。文章在前人研究的基础上,结合信息处理,从不自由虚词的分类体系、形式化描述等角度对藏语虚词la格的语法功能做了一些探讨,重点论述了藏语虚词la格的语法功能,提出藏语虚词规范的初步设想和处理方法。
- 索南才让
- 关键词:自然语言处理语法功能