王传清
- 作品数:39 被引量:319H指数:13
- 供职机构:中国科学院文献情报中心更多>>
- 发文基金:国家社会科学基金国家自然科学基金国家教育部“985工程”更多>>
- 相关领域:文化科学自动化与计算机技术经济管理政治法律更多>>
- 基于评审意见的科技论文要点识别与利用被引量:1
- 2023年
- 科研用户查找文献往往瞄准特定任务,如寻找选题、方法、结论等,面对检索出的大量文献需要甄别要点,判断价值,这一过程既需要熟悉专业知识又耗时费力。论文评审意见中蕴含了同行专家的权威看法,包括对论文要点和参考价值的揭示,可以为满足上述需求提供有效帮助。本文以论文评审意见为对象,围绕科研活动中的典型要素定义评审意见中的要点类型,通过有监督学习方法提取评审意见所述的论文要点,不但为论文提供了结构化要点概括,还能用于辅助文献检索。本文采集《心理学报》期刊2014年年初至2020年年底发表的549篇论文及其对应的评审意见,将其中概括信息划分为概述、方法、结果和亮点4种要点类型,用SVM(support vector machine)、FastText、TextCNN(convolutional neural networks)及BiLSTM(bi-directional long short-term memory)4种方法训练分类模型并比较效果。研究结果表明,BiLSTM方法对要点识别效果最佳,在5次交叉检验中的平均识别准确率达到91%。要点中的亮点进一步分为选题、价值、方法和写作4种类型,采用SVM方法识别,F1值达到85%。作为对研究结果的应用,本文采用识别出的论文要点辅助对论文的理解,并按亮点做检索结果分类,改进了论文检索的组织与服务形式。本文创新之处在于:①提出了从评审意见中挖掘论文要点的研究问题,制定了要点类型的框架和层次;②将识别要点转化为分类问题,通过比较评价找到综合最优的识别方法;③实现了基于要点的检索结果分类组织,帮助用户理解论文并进行价值判断。
- 陈翀程子佳王传清李蕾
- 科学数据发布平台的内容建设机制研究被引量:3
- 2022年
- [目的/意义]系统剖析科学数据发布平台的内容建设机制,旨在为我国相关平台的建设与完善提供借鉴。[方法/过程]综合采用文献调研法、网站调研法、案例研究法等,结合国内外发展较成熟的科学数据发布平台建设实例,从数据采集、数据分类、数据描述及数据质量控制等流程对科学数据发布平台的内容建设机制进行系统剖析。[结果/结论]研究发现:采集数据时要综合考虑数据价值、完整准确性及数据格式;科研机构、资助机构和政府机构是采集科学数据的主要渠道;平台通常从科学数据的主题、类型、地理区域、机构等角度对所采集数据进行分类;平台建设者可根据所收录数据的学科与类型来选择适合的元数据标准,重点关注核心元素项;平台的数据管理人员须重视审核科学数据的形式质量和内容质量。
- 屈亚杰黄国彬王传清
- 关键词:科学数据数据采集数据分类数据描述
- 信息管理学科整合的变革路径研究被引量:15
- 2014年
- 在评述35年来图书情报与档案管理(简称"图情档")学科整合变革争议的基础上,阐释在新形势下学科由职业教育向学科教育变革的理论依据。构建理论性(A)-核心领域(C)-规模性(S)-开放性(O)变革指标模型,围绕ACSO模型论证制约学科发展的关键因素。研究发现,职业教育定位与市场经济环境下的学科教育理念不匹配是制约信息管理教育事业发展的根本原因。构建学科教育与图情档职业教育的分层关系模型,提出走信息管理学科教育之路的研究范畴与理论基础。建议成立学术性学会开展学术交流环境的整合,创办公共信息管理专业推动图书馆学与档案学专业的整合,增设信息管理专业硕士拓展学科的公共责任,扩大中上层理论课程在课程结构中的比例。
- 陶俊王传清
- 关键词:信息管理学科整合学科教育
- 数字图书馆自动化语义标注工具系统模型研究被引量:5
- 2014年
- 【目的】分析和总结国外语义标注工具特点,构建数字图书馆资源自动化语义标注模型框架,为中文语义标注工具的设计与应用提供参考。【方法】通过归纳和分析语义标注的平台框架的技术方法,结合与国外成熟工具的比较分析,使用系统开发及模块化思想构建模型。【结果】构建包含系统输入模块、语义处理模块、本体知识模块、语义标注模块和存储模块的自动化语义标注工具的系统模型,分析整体算法思想以及自动本体标注算法思想。【局限】自动语义标注系统涉及的相关算法及改进仍在不断发展,本文仅给出主要算法思想和说明。【结论】本研究构建的自动化语义标注模型可以为中文语义标注工具设计提供借鉴。
- 王传清毕强
- 关键词:数字图书馆语义标注知识组织知识服务系统模型
- 我国图书馆学情报学期刊的发行被引量:3
- 2005年
- 调查和分析我国图书馆学情报学期刊发行现状,指出入世后我国图书馆学情报学期刊发行面临的机遇。在此基础上,提出我国图书馆学情报学期刊应注重提高质量和联系读者,并可采取以邮局发行为主自办发行为辅、代理发行、网络出版发行、读者俱乐部、研究会、差别定价、异业渠道发行、编委宣传等多种行之有效的发行方式。
- 王传清
- 21世纪图书馆学研究方法体系探析被引量:3
- 2011年
- 通过对21世纪图书馆学研究方法体系发展轨迹的梳理,提出在新的背景和环境下,现有的层次论、过程论、三维论等图书馆学研究方法体系已不适应图书馆学理论发展的需要,并初步架构合理的图书馆学方法体系。
- 刘伟王传清刘桂玲张莉莉刘鹏年
- 基于被引位置的数据论文价值分析--以数据期刊Scientific Data为例被引量:2
- 2022年
- [目的/意义]调查目前研究人员对数据论文的引用行为特点,发现数据论文管理和获取过程中的问题,促进数据出版进一步发展。[方法/过程]选取2015-2019年Scientific Data上被引频次最高的数据论文,追溯其在施引文献中出现的位置及上下文,借助EXCEL、“百度图说”等可视化统计工具,将引用位置分为引言、综述、数据/方法、结果、讨论、结论、附录、致谢八个部分进行分类统计,判断数据论文的具体功能并进行总结分析。[结果/结论]数据论文往往在引言和数据/方法部分被大量引用并发挥价值,与传统学术论文相比,数据论文在数据/方法部分的被引更能体现其独特的价值。此外,引用数据论文中数据方法、数据集的内容更能体现数据论文在科学数据共享中发挥的价值。数据论文出版与数据共享模式的高效管理,以及数据论文发表格式的统一规范,可以进一步提高科研效率,维护相关研究人员的权益及学术道德规范。
- 吴宁王传清黄国彬
- 关键词:科学数据
- 用户跨社交媒体信息行为研究——概念界定、主题归类与未来展望
- 2024年
- [目的/意义]通过对过去10余年国内外相关文献的梳理,把握用户跨社交媒体信息行为研究的特征和不足,并提出值得关注的研究方向,为该领域的发展和理论突破提供助力。[方法/过程]在文献检索的基础上,根据研究目的和质量评估筛选文献,再通过内容分析的方式从概念界定、理论基础和主题归类等方面进行总结整理。[结果/结论]用户跨社交媒体信息行为研究具有用户类型多样性、社交媒体异质性、信息线索一致性、行为模式协同性等概念内涵,理论基础聚焦在研究背景、信息需求和信息行为等维度,研究主题可归类为不同用户在不同社交媒体中的信息行为和同一用户在不同社交媒体中的信息行为。未来研究应当进一步扩展概念特征的外延,构建专有的理论模型和深挖其实践价值。
- 毕达天黄伟鑫王雨菲王传清
- 关键词:社交媒体信息行为一致性
- 数字时代图书馆网络系统危机分析及应对策略被引量:16
- 2012年
- 文章从介绍数字时代图书馆网络数字化系统及其发展历程入手,对图书馆网络数字化应用平台危机进行分析,包括图书馆管理系统、数字资源平台、资源整合系统和门户等。然后,从图书馆馆内网络危机、馆内计算机终端危机、馆内服务器危机、图书馆存储危机、网络风险防范、图书馆机房安全、图书馆安全管理制度等方面对图书馆数字网络硬件建设危机进行了分析,并提出应对策略。以期对数字时代的图书馆网络信息系统安全危机管理提供参考。
- 王传清王欣刘伟周金龙
- 关键词:图书馆网络图书馆危机危机管理网络安全
- 我国科学数据共享中的隐私治理探析被引量:16
- 2020年
- [目的/意义]针对我国当前科学数据共享中的隐私问题,探索隐私治理方法和对策以便更好地实现科学数据共享。[方法/过程]运用文献调查法和建模法,在厘清科学数据共享隐私问题的基础上,提出4项隐私治理原则,构建隐私治理模型,探索科学数据共享中的隐私治理对策。[结果/结论]可以采用完善隐私保护法律体系、加强隐私保护配套制度建设、采用隐私增强技术、提升利益相关者隐私素养、构建隐私伦理保护规制、加强科学数据流程管理等措施来实施隐私治理,从而有效促进科学数据共享。
- 朱贝王传清
- 关键词:科学数据共享