许侃
- 作品数:53 被引量:166H指数:9
- 供职机构:大连理工大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理语言文字更多>>
- 融合专利表示的技术路线图构建研究被引量:4
- 2021年
- [目的/意义]通过对专利数据进行定量分析,结合深度学习方法对专利文本进行表示,构建技术路线图,弥补技术路线图易受专家主观认识限制的问题。[方法/过程]提出一种基于深度学习的技术路线图构建方法,通过专利文本表示构建专利聚类;提出专利簇技术主题生成算法及语义距离计算方法,融合时间信息和领域知识生成技术路线图。[结果/结论]选取冠状病毒领域专利进行实证研究,依据所提出的方法构建冠状病毒领域技术路线图。充分发挥技术路线图效用对相关技术发展进行探究,并提出有利疫情防治的相关建议。
- 林原张乐丁堃许侃
- 关键词:专利数据技术路线图冠状病毒
- 一种基于局部格兰杰因果分析的因果网络学习方法
- 本发明属于数据挖掘领域,提出了一种基于局部格兰杰因果分析的因果网络学习方法。本发明先将采集到的数据进行预处理,对缺失数据采用平均值插补方法进行补全。然后对补全的数据进行平稳性检验及处理,以满足建立模型的假设。之后将数据进...
- 马德伟韩敏秦晓梅许侃王钧
- 基于似然损失函数的组样本排序学习方法被引量:1
- 2017年
- 组样本用于模型训练,为排序学习方法的构造提供一种新的思路.文中改进已有的组样本排序学习方法,构造组样本损失函数,用于排序学习模型的训练.基于似然损失函数,采用样本偏序权重损失函数和最优初始序列选择方法,构造基于神经网络的组排序学习方法,实验证明文中方法能够有效提高排序准确率.
- 林原徐博孙晓玲林鸿飞许侃
- 关键词:信息检索
- 基于文本聚类方法的我国科技管理研究领域的计量研究被引量:7
- 2007年
- 运用文本挖掘的聚类方法,以1994-2006年间14种学术期刊的41015载文为计量对象,揭示出科技管理研究的六大领域及其发展状态,对各个领域的热点问题进行自动识别。为比较准确把握科技管理研究态势提供定量根据,也为文献的内容分析提供一种有效的工具。
- 丁堃许侃
- 关键词:科技管理文本聚类EM算法
- 一种基于语义资源词表示和搭配关系的语义双关语识别方法
- 一种基于语义资源词表示和搭配关系的语义双关语识别方法,属于自然语言处理领域,用于解决双关语识别问题。识别方法包括:S1预处理语义双关语语料;S2构建基于语义资源词表示模型;S3使用Bi‑LSTM识别语义双关语;S4构建基...
- 林鸿飞刁宇峰杨亮樊小超申晨吴迪许侃
- 文献传递
- 面向社交媒体文本抑郁倾向性分析的基于排序学习模型的特征加权方法
- 一种面向社交媒体文本抑郁倾向性分析的基于排序学习模型的特征加权方法,该方法包括以下步骤:S1、采集和预处理社交媒体文本数据;S2、面向抑郁情绪的文本特征抽取;S3、训练排序模型;S4、基于排序模型的抑郁风险评估。采集社交...
- 徐博宗林林林鸿飞王健林原许侃
- 文献传递
- 卓越大学联盟人文社会科学领域潜在合作机会发现研究
- 2019年
- 发展高水平的人文社科是理工科高校建设一流大学、世界知名高水平大学寻求突破的方向。通过统计分析理工科大学人文社科合作基础,实现高校潜在合作机会的发现。以我国9所"卓越大学联盟"高校为例,基于共同合作机构、学科分布、关键词三个合作基础指标,分析合作动机,挖掘出高校潜在合作方向。同时基于高校信息向量的相似度度量方式,对比分析高校信息差异,从而给出潜在合作的建议。定量分析与向量表示相结合挖掘出五对高校的潜在合作方向,为高校潜在合作机会的挖掘提供一种可行的信息表示模型,希望该方法可以为高校合作提供借鉴。
- 林原李鲁莹许侃刘盛博
- 关键词:人文社会科学理工科高校
- 基于词向量和EMD距离的短文本聚类被引量:11
- 2017年
- 短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Mover's Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。
- 黄栋徐博许侃林鸿飞杨志豪
- 关键词:相似度计算聚类
- 基于ECPA神经网络的情绪原因识别方法被引量:2
- 2021年
- 情绪原因识别是文本情绪分析领域中的一个前沿研究方向。传统情绪原因识别方法需要进行规则制定、抽取特征,而该文从情绪原因的语言特点出发,结合Bi-LSTM模型和注意力机制,提出一种基于情绪上下文位置注意力神经网络的情绪原因识别方法(ECPA)。该方法考虑了情绪词和情绪类别中的情绪信息,学习了Bi-LSTM模型建模后的上下文语义信息,引入了基于位置信息的注意力机制模型,进而构建情绪原因识别模型。实验结果证明,该方法在情绪原因识别任务中的有效性,并取得了目前最优的性能,同时对情绪归因方法具有一定的指导作用。
- 刁宇峰杨亮林鸿飞樊小超樊小超吴迪张冬瑜张冬瑜
- 关键词:情绪信息位置信息
- IPv6在教学中的研究进展
- 2016年
- 随着互联网的发展,IPv4暴露的缺陷越来越多,网络正在向着IPv6平稳的推进。高校在国家的大力支持下,积极完成校园网的改造升级,成为互联网的先锋。主要利用网络分析方法挖掘了IPv6在高校教学中的应用情况,包括各个高校的关注程度、发表论文数目、以及关注热点的分析与变化等。通过分析,能够对目前高校中研究IPv6教学的现状有清楚地了解,为下一步的计划开展提供参考。
- 许侃孙晓玲林鸿飞林原韩敏刘盛博高山
- 关键词:IPV6教学校园网网络分析