胡勇军
- 作品数:14 被引量:51H指数:2
- 供职机构:广州大学更多>>
- 发文基金:国家高技术研究发展计划国家留学基金广东省自然科学基金更多>>
- 相关领域:文化科学经济管理自动化与计算机技术更多>>
- 基于LDA高频词扩展的中文短文本分类被引量:37
- 2013年
- 针对短文本特征稀疏、噪声大等特点,提出一种基于LDA高频词扩展的方法,通过抽取每个类别的高频词作为向量空间模型的特征空间,用TF-IDF方法将短文本表示成向量,再利用LDA得到每个文本的隐主题特征,将概率大于某一阈值的隐主题对应的高频词扩展到文本中,以降低短文本的噪声和稀疏性影响。实验证明,这种方法的分类性能高于常规分类方法。
- 胡勇军江嘉欣常会友
- 关键词:高频词LDA
- 基于TRIZ创新价值空间的产业创新测度
- 2024年
- 数字经济时代下大数据创新测度是挖掘创新情报、感知创新态势、提升创新价值的重要手段。本文基于TRIZ理论,构建了一种新的产业创新价值空间,面向产业专利数据从内、外价值层面进行产业创新测度与对比分析。利用2017—2022年刀剪产业的发明专利进行企业创新得分计算与价值维度映射,发现刀剪产业2019—2021年期间的创新更为活跃,且主要聚焦在面向市场的产品外观和结构创新。
- 朱柳茜姜檬檬胡勇军
- 关键词:TRIZ理论
- 一种个性化定制下的价值链知识发现方法
- 本发明公开了一种个性化定制下的价值链知识发现方法,属于信息技术领域。由以下步骤组成:对给定领域文本划定价值主题,进行价值锚定种子词抽取;根据所述价值锚定种子词构建价值语义拓扑空间;对所述价值锚定种子词进行扩充,得到初始主...
- 胡勇军朱柳茜
- 基于主题相似度的网页信息获取方法、装置及系统
- 本发明公开了一种基于主题相似度的网页信息获取方法、装置及系统。所述基于主题相似度的网页信息获取方法包括:响应于用户交互端发送的目标主题,生成网页获取请求;将所述网页获取请求发送至目标服务器;接收所述目标服务器返回的所有所...
- 胡勇军李奕臻谭钻华刘洁怡
- 文献传递
- 专利视角下广东省软件产业创新发展现状、面临的挑战与对策分析
- 2023年
- 为助力广东省软件产业进一步创新发展,从专利视角出发,基于2019—2021年《广东省软件和信息技术服务业统计年报》数据,通过对29家省重点检测企业的研发投入和产出数据梳理,以及与北京、上海、浙江的相关指标数据对比,分析广东省软件产业技术创新的现状特征及其所面临的挑战。结果发现,广东省软件产业的综合实力和发展规模仍位居全国前列,尽管受到新冠疫情冲击等各种不利因素影响,仍能保持市场收入年增长率10%以上,并且以华为技术有限公司为主力的软件出口业务依旧活跃,呈现逐步国际化态势,其中著作权登记及发明专利申请数量在研发费用快速增加的推动下逐年增加,创新实力不断增强;但同时仍存在龙头企业引领作用不足、人才支撑作用不强、创新集群效应未凸显、工业软件发展势头难等问题。针对此,从做好顶层发展规划角度研究构建一种产业融合下的软件产业发展公共服务平台,结合产业、高校院所和政府等多方主体的优势与力量,以产学研新型“问诊”方式赋能产业发展生态体系,通过顶层科学问题的探析与突破、培养青年学者和引导企业发展3层协同,实现“数据—知识—决策”技术路线的两次飞跃,同时充分发挥指挥棒作用,保障软件产业创新系统生态健康可持续发展。
- 杨雨清姜檬檬胡勇军
- 关键词:软件产业产业生态
- 基于区块链的信息标注方法
- 本发明公开了基于区块链的信息标注方法,包括以下步骤:根据获取的原始信息对生产者和消费者进行标注,确定生产者代表和评论者代表,得到原始标注数据;通过区块链对原始标注数据进行打包,并计算打包结果的哈希值;将所述哈希值记录至区...
- 胡勇军
- 文献传递
- 一种支持跨语言迁移的细粒度情感分析方法
- 本发明公开了一种支持跨语言迁移的细粒度情感分析方法,方法包括以下步骤:对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;把标注数据集放进语义‑长短时记忆网络进行训练,得到文本的语义团;...
- 胡勇军
- 文献传递
- 大型公共建筑投资中公众态度网络舆情主题发现研究被引量:2
- 2017年
- 我国大型公共建筑投资因其牵涉利益主体多、涉及公众切身利益,受到各级政府高度重视。然而,受公众意见分散多样、信息不对称等影响,公众的真实态度往往难以在事前纳入决策中。在事后,如因决策不当损害到公众切身利益时,会遭致抵制,形成"邻避效应",甚至诱发群体性事件,对大型公共建筑的投资带来巨大的损失和影响。如何在事前采集公众真实态度纳入到决策中并改善决策?文章通过采集网络舆情数据,基于时空情境语义分析建立了面向事前决策的公众态度网络舆情主题发现模型,实现了对公众利益相关方中不同群体意见的挖掘及情感分类。
- 庞永师胡勇军
- 基于区块链的信息标注方法
- 本发明公开了基于区块链的信息标注方法,包括以下步骤:根据获取的原始信息对生产者和消费者进行标注,确定生产者代表和评论者代表,得到原始标注数据;通过区块链对原始标注数据进行打包,并计算打包结果的哈希值;将所述哈希值记录至区...
- 胡勇军
- 一种支持跨语言迁移的细粒度情感分析方法
- 本发明公开了一种支持跨语言迁移的细粒度情感分析方法,方法包括以下步骤:对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;把标注数据集放进语义‑长短时记忆网络进行训练,得到文本的语义团;...
- 胡勇军
- 文献传递