马博
- 作品数:73 被引量:124H指数:6
- 供职机构:中国科学院新疆理化技术研究所更多>>
- 发文基金:中国科学院西部之光基金国家自然科学基金新疆维吾尔自治区重点实验室开放课题基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信语言文字更多>>
- 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质
- 本发明公开了一种基于注意力机制多特征融合的虚信息检测方法、装置、电子设备及存储介质,获取微博和推特数据集,对所述微博和推特数据集中文本和图片进行预处理;将预处理得到的文本数据输入到BERT预训练模型中获取语义信息提取文本...
- 马博地力夏提·阿布都热依木杨雅婷王磊周喜董瑞
- 文献传递
- 一种小样本槽值提取方法、装置、设备及存储介质
- 本发明公开了一种小样本槽值提取方法、装置、设备及存储介质,该方法获取槽值提取数据集,对数据集进行处理,构建小样本槽值提取数据集;利用辅助集上的全部数据,训练基础领域上的槽值提取模型,获得历史信息编码器;将生成的历史信息特...
- 周喜杨奉毅杨雅婷马博董瑞艾比布拉·阿塔伍拉
- 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质
- 本发明公开了一种基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质,涉及信息处理领域,尤其涉及文本过滤、内容监管领域。具体实现方案为:利用汉维双语将汉语关键词翻译为维吾尔语关键词;对获得的维吾尔语关键词进行...
- 杨雅婷艾孜麦提·艾尼瓦尔董瑞马博王磊周喜
- 文献传递
- 基于transformer的场景图像文字修改方法、装置、电子设备及存储介质
- 本发明公开了一种基于transformer的场景图像文字修改方法、装置、设备以及存储介质,利用基于深度卷积神经网络的编码器和解码器,对原始风格图像进行前景风格特征提取,将其文字字体,字体颜色,文字形状等前景风格迁移到目标...
- 艾孜麦提·艾尼瓦尔杨雅婷马博董瑞王磊周喜
- 面向连续时空加油数据的异常检测方法
- 本发明涉及一种面向连续时空加油数据的异常检测方法,该方法涉及面向多个加油站的实时采集数据,基于统计与机器学习相结合,通过预置的基于无监督的时序数据异常检测模块、基于半监督的时序数据异常检测模块和基于多视图的时空深度异常检...
- 马博蒋同海周喜杨雅婷王磊马玉鹏赵凡王轶
- 文献传递
- 维吾尔语口语语音语料库的设计与研究
- 在分析维吾尔语语音语料特点的基础上,结合实际语料库建设需求和地域语言特色,提出了适用于维吾尔语口语语音语料库建设的语料库设计规范、语科内容、语音采集和标注方法,并就不同信道对语音特征参数的影响进行分析。研究拟建立时长30...
- 杨雅婷马博王磊吐尔洪·吾司曼李晓
- 关键词:维吾尔语口语语料库特征参数
- 文献传递
- 维吾尔语语音识别中发音变异现象被引量:5
- 2011年
- 维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。
- 杨雅婷马博王磊王磊李晓
- 关键词:语音识别维吾尔语数据分析
- 区域信息化水平评价方法研究被引量:4
- 2010年
- 提出贯穿区域信息化全生命周期的信息化水平评价模型及体系,运用数据仓库模型分析特征数据,给出区域信息化水平多指标分层综合评价算法,建立模糊评价矩阵,设定九分位法权重系数,逐层依次计算得到信息化水平综合评价结果,并通过实例演示评价过程,证明了该方法的优越性和普遍适用性。
- 杨雅婷马博苏国平蒋同海李晓
- 关键词:区域信息化数据仓库
- 一种面向叙事文本的事理图谱构建方法、装置、设备与存储介质
- 本发明公开了一种面向叙事文本的事理图谱构建方法、装置、设备与存储介质,该方法首先获取叙事文本文档并进行主题分类,随后运用基于指令微调的统一信息抽取技术,从文档中提取出实体、关系以及事件信息,接着,利用这些信息以及预定义的...
- 马博杨雅婷艾孜麦提·艾尼瓦尔恩卡尔·奴尔太董瑞王磊周喜
- 基于真值发现的加油站车辆号牌缺损数据填充方法
- 2019年
- 由于数据采集设备的不完善以及数据在传输过程中的不可靠性等原因,致使加油站车辆加油数据中经常会产生数据的丢失和错误,降低了车辆加油数据的完整性,严重影响了后续的数据分析工作。目前虽然已有许多算法可以解决连续型数值数据的缺损问题,但是它们并不适用于车辆号牌这种离散型分类数据。提出一种基于改进TruthFinder算法的缺损值填充框架。基于真值发现算法,考虑到离散数据相似度的计算方式,改进原算法对数据值支持度的计算模型。通过在真实加油站车辆数据集上的实验,相较于原算法及更加通用的Voting算法,正确率分别提升了7%和23%。该方法能部分解决类似加油站车辆加油数据这种多源离散型数据的缺损值填充问题,大大提高了此数据的可用性。
- 彭新亮程力王轶王轶赵凡马博
- 关键词:数据清洗