杨京
- 作品数:10 被引量:220H指数:8
- 供职机构:南开大学商学院信息资源管理系更多>>
- 发文基金:国家社会科学基金国家自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:文化科学政治法律自动化与计算机技术更多>>
- 我国情报学理论的来源、应用及学科专属度研究被引量:38
- 2016年
- 迄今国内情报学研究对理论本身的关注不够,全面的量化研究尤其不足。为完善情报学学科体系,本文系统揭示了我国情报学研究中理论的来源与应用情况。融合人工标注、机器识别、维基百科等多种途径收集到情报学理论1257条,采用内容分析法对应用于53本情报学期刊中的817条理论在1991~2015年的应用频次进行了统计分析,追溯并分析了理论的来源学科,定义并计算了理论的学科专属度。研究发现我国情报学所应用理论的学科来源广泛,借用其他学科的理论解决问题的成果较多,对情报学原创理论的应用频次偏低,情报学理论对其他学科的贡献有限。
- 王芳陈锋祝娜杨京
- 关键词:情报学
- 大数据背景下数据科学分析工具现状及发展趋势被引量:39
- 2015年
- 文章根据大数据时代的特征,分析了海量数据给数据科学分析工具带来的主要挑战,介绍了为应对挑战而发展的大数据分析工具,并对比分析了R语言、Rapid Miner、Mahout三种数据科学中比较流行的大数据分析工具,发现R语言和Rapid Miner功能全面,而Mahout具有突出的大数据分析能力,最后指出了数据科学分析工具的发展趋势。
- 杨京王效岳白如江祝娜
- 关键词:R语言大数据
- 大数据背景下科学数据互操作实践进展研究被引量:5
- 2015年
- 文章在梳理科学数据互操作的基本概念和最新研究进展的基础上,重点介绍了欧盟科学数据基础设施建设项目GRDI2020、美国安全数据研究组织IJIS以及医学数据研究所West Health三个不同性质的国际机构对科学数据互操作的实践研究状况,进而指出目前科学数据互操作实践研究中面临的政策落实困难、难以制定共同的标准协议、缺乏定义互操作的共同框架、数据质量低等问题。
- 杨京王效岳白如江
- 关键词:大数据科学数据互操作WESTHEALTH
- 面向火灾应急管理的本体构建研究被引量:19
- 2020年
- 火灾是威胁人民生命财产安全的多发性突发事件之一。大数据时代火灾突发事件报道数量呈指数增长,如何在海量的火灾报道中对知识进行获取、抽取与表示,形成火灾应急知识库,以此来指导火灾应急管理工作智能化的开展,成为影响我国应急管理能力提升的关键因素之一。本文在文本挖掘的基础上构建了面向火灾应急管理的本体模型FEO (fire emergency ontology)。首先,基于领域专家指导,构建火灾应急上位本体FE-SUMO;然后,从火灾突发事件、燃烧要素、燃烧结果、火灾应急组织、火灾应急资源、火灾应急角色等方面建立FEO概念、关系、函数、公理和实例的五元组,选择Protégé对火灾应急本体进行实现;最后,通过定性评价和OntoQA定量评价两种方法对所构建的火灾应急本体的有效性和完整性进行了验证。
- 王芳杨京徐路路
- 关键词:火灾突发事件应急管理本体
- 情报学研究中理论应用的国际比较被引量:2
- 2018年
- 本研究融合词典和规则抽取方法对3份国际情报学期刊2007—2016年的2872篇论文中应用的理论进行自动识别,进行了论文国家编码、理论编码、论文主题编码、理论来源学科编码,在此基础上,利用文献计量和比较研究方法分析了各国家在情报学研究中理论应用及来源学科的差异,并将研究结果与基于《情报学报》的已有研究结果进行了比较,发现了各国家情报学研究中理论应用及来源的特点与区别。
- 王芳王芳杨京
- 关键词:情报学
- 单篇学术论文评价研究现状与发展趋势被引量:26
- 2015年
- 学术论文作为科学研究的主要成果形式之一,如何有效评价学术论文的学术水平和影响力一直是文献计量学领域的研究重点。文章在分析学术论文评价外在与内在影响因素的基础之上,梳理了目前国内外主要的学术论文评价方法,包括基于外在引用指标分析方法、基于网络分析方法、同行评议方法、替代计量学方法、基于论文内容评价方法、综合评价方法。最后,指出了学术论文评价方法的未来发展趋势。
- 白如江杨京王效岳
- 关键词:学术论文影响因素
- 一种基于研究主题对比的单篇学术论文创新力评价方法被引量:39
- 2018年
- [目的/意义]创新是学术论文的本质要求,如何有效评价学术论文的创新力一直以来备受国内外专家和学者关注。随着信息技术的发展,利用计算机技术从论文内容角度对单篇学术论文的创新力进行评价逐步成为可能。[方法/过程]提出一种基于研究主题对比的单篇学术论文创新力评价方法。该方法首先利用Keygraph算法提取代表论文研究主题的关键词,然后,将论文的研究主题与科学研究前沿主题进行相似度计算,最后,结合期刊影响因子和Altmetrics两项外在指标提出一种论文创新力综合评价模型。[结果/结论]通过对“碳纳米管”材料研究领域的实证研究证明,该方法能够有效、迅速和准确地从论文内容角度对单篇学术论文的创新力进行评价。
- 杨京王芳白如江
- 关键词:学术论文创新力研究主题
- 基于研究水平的单篇学术论文创新力评价研究——以碳纳米管材料领域为例被引量:15
- 2017年
- [目的/意义]创新是学术论文的本质要求,如何有效评价学术论文的创新力一直以来备受国内外专家和学者关注。随着信息技术的发展,利用计算机技术从论文内容角度对单篇学术论文的创新力进行评价逐步成为可能。[方法/过程]文章提出了一种基于研究水平的单篇学术论文创新力评价方法。该方法首先利用规则抽取技术从论文中抽取具有研究水平信息的句子;然后,构建正则表达式从具有研究水平信息的句子中精确抽取出能够代表单篇学术论文研究水平的数值信息;最后,通过对比分析抽取出的研究水平数值信息进而判断学术论文的创新力。[结果/结论]通过对碳纳米管研究领域的实证研究证明,该方法能够有效、迅速和准确地从论文内容角度对单篇学术论文的创新力进行评价。
- 杨京王芳白如江
- 关键词:学术论文
- 基于LDA的科技创新主题语义识别研究被引量:18
- 2015年
- [目的 /意义]由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法 /过程]提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果 /结论]通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。
- 祝娜王效岳杨京白如江
- 关键词:LDA模型3D打印
- 基于大规模政府公文智能处理的知识发现及应用研究被引量:28
- 2018年
- 政府公文是一种重要的知识资源。对公文资源的智能处理,实现公文中的知识发现,有利于促进公文的智能知识管理,提高政府公文在拟制、审批、传阅和归档等流转处理中的智能化水平和行政效能,对推进数字政府建设和提升政府治理能力都具有重要意义。但当前,鲜有面向我国政府公文智能处理和知识发现的相关研究。鉴于此,本文对该内容进行探索与研究。为实现大规模政府公文的智能处理,本文提出了政府公文的内容结构解析、主题自动标引、产生式自动摘要、重点内容提取与排序计算、面向政策/政令/行政执法文书的知识抽取与链接、基于公文的政令任务分解与责任对象自动匹配等处理流程及研究相关技术方法,并在此基础上构建知识发现系统和分析该系统的应用,也对其应用于特定类型公文中的知识发现进行了实例分析。
- 赵洪王芳王芳王晓宇杨京
- 关键词:电子政务知识发现