欧石燕 作品数:51 被引量:490 H指数:11 供职机构: 南京大学信息管理学院 更多>> 发文基金: 国家社会科学基金 教育部人文社会科学研究基金 江苏省“青蓝工程”基金 更多>> 相关领域: 文化科学 自动化与计算机技术 医药卫生 历史地理 更多>>
基于论证结构的科学论文内容呈现模式研究 被引量:4 2022年 [目的/意义]科研人员在写作和阅读科学论文时分别扮演着作者与读者两类不同角色,对科学论文内容存在不同程度的语义解构。目前的出版平台主要是从作者写作角度呈现科学论文内容,缺乏适应读者阅读的科学论文内容呈现模式。[方法/过程]为了弥补这一研究空白,文章提出了基于论证结构的科学论文内容呈现模式。首先从读者阅读角度,在图尔敏论证模型基础上构建了科学论文通用论证结构模型;然后以化学领域的科学论文为样本,采用内容分析法对该模型的学科适用性进行了验证,并基于该模型设计了基于论证结构的科学论文内容呈现模式;为了评估该呈现模式的可用性,将其与目前新兴的面向语义出版的RichHTML论文内容呈现模式进行了用户对比测评。[结果/结论]实验结果表明,与RichHTML呈现模式相比,基于论证结构的呈现模式显著降低了读者获取科学论文主旨大意的阅读时间,提高了获取主旨大意信息的准确性以及用户满意度。 牛丽慧 欧石燕关键词:科学论文 面向信息检索的术语服务构建与应用研究 被引量:23 2016年 在信息检索中,叙词表作为一种辅助有效检索的工具变得日益重要。术语注册与术语服务是在网络环境下对叙词表进行维护和应用的一种理想方式,能够极大促进叙词表在信息检索中的应用。本文的研究重点是面向信息检索的术语服务构建与应用。首先,以《汉语主题词表》为来源词表,采用语义网技术和REST架构构建术语服务。其次,以"获取同义词"服务为例,对术语服务在图书馆OPAC系统和百度搜索引擎中的有用性进行测评,结果表明,采用这一服务使OPAC系统的F值提高13%,使百度搜索引擎的P@5查准率提高16%。最后,设计了四种术语服务在信息检索系统中的应用方式,即复选扩检式、单选替换式、混合式和自动扩检式,并采用用户测评法对这四种应用方式进行可用性测评,结果表明,复选扩检式是可用性最佳的术语服务应用方式。图13。表9。参考文献34。 欧石燕 唐振贵 苏翡斐关键词:信息检索 叙词表 REST架构 有用性 可用性 层次分析法 基于深度挖掘的学术论文关联数据构建与可视化分析 被引量:17 2019年 自关联数据被提出以来,其已成为在网络上发布结构化数据的主流方式,随着关联数据集的急速增多,如何有效地消费和利用关联数据正成为研究人员关注的焦点。本研究对关联数据的深度挖掘和可视化分析进行了探索。首先,采用文本挖掘技术,深入挖掘地质领域学术论文元数据中的隐含信息;接下来,基于设计的“学术论文-学者”本体模型对学术论文元数据和挖掘出的信息进行语义化表示,以构建RDF关联数据。在此基础上,利用不同的可视化分析方法,从多个维度对学术论文关联数据中蕴含的宏观和微观知识进行可视化展示。结果表明:①基于深度挖掘的学术论文关联数据能够更加深入和全面地展示学术论文元数据中蕴涵的知识;②关联数据可视化分析能够以直观的图形展示关联数据中的宏观和微观知识,帮助用户快速对关联数据进行消费和利用。 曲佳彬 欧石燕 凌洪飞关键词:关联数据 可视化分析 学术论文 东华大学图书馆自动化及网络化建设 被引量:2 2000年 介绍了东华大学图书馆自动化及网络化现状,并提出了具体的改进方案。主要包括三方面的内容:改善图书馆网络化环境;更新图书馆计算机集成管理系统;建立先进的光盘检索系统,利用网络共享电子化资源。 欧石燕关键词:图书馆 自动化 网络化 计算机集成管理系统 科学论文全文语步自动识别研究 被引量:9 2021年 [目的/意义]科学论文的语步结构对于读者理解论文内容、快速定位特定信息具有重要作用。[方法/过程]本文对化学领域科学论文的语步自动识别方法进行了探索,比较了基于文本分类和序列标注两种解决模式以及机器学习和深度学习两种技术的多种语步识别模型的效果,并在此基础上提出了将深度学习预训练模型BERT与传统机器学习分类算法深度森林相结合的混合模型。[结果/结论]实验结果表明,文本分类模式的语步识别效果要优于序列标注模式;传统机器学习技术和深度学习技术的语步识别效果总体相近;通过将两者进行结合的混合模型可以获得更好的语步识别效果,在整篇论文7个语步类别上的宏平均F1值达到73%。 欧石燕 陈嘉文关键词:科学论文 国内数据监护平台研究热点与进展探析 被引量:10 2016年 [目的 /意义]对国内数据监护平台相关研究成果进行调研分析,归纳研究热点、研究特征和研究框架,总结研究中存在的不足,提出发展建议,为今后国内数据监护平台研究提供参考和借鉴。[方法 /过程]以中国知网(CNKI)和维普中文科技期刊库为来源数据库,采集国内2011年1月至2016年6月间发表的有关数据监护平台的期刊论文(CSSCI收录)和学位论文,采用比较法和归纳法分析并揭示研究热点,并对相关研究成果进行评述;利用文献调查法和网络调查法,对国内主要数据监护实践平台进行比较分析。[结果 /结论]研究结果表明:1国内对数据监护平台的研究发展很快,研究热点集中在数据监护平台理论框架、科学数据组织、科学数据集成、数据监护平台构建4个方面;2国内数据监护平台研究还存在不足,需要在数据监护框架与功能模块、科学数据语义描述、数据整合与统一检索、数据服务方式等方面进行深入研究。 周宇 欧石燕关联数据可视化研究进展分析 被引量:8 2018年 关联数据集的规模不断扩大,如何使用和消费关联数据逐渐成为研究的主要问题。关联数据可视化可以直观、清晰地展示关联数据集,有较高的用户接受度。目前对关联数据可视化研究主要分布在本体可视化、关联数据可视化浏览和关联数据可视化应用三个方面。从技术原理和实现方法入手,对这三方面所涉及的工具和应用进行通用的关联数据可视化分析框架构建,可以发现:关联数据可视化研究呈阶梯状发展,从辅助性的本体可视化到关联数据的列表式和图形化浏览,进一步深入到关联数据的可视化应用;图形化浏览是关联数据可视化的发展趋势,通过简单配置就可以使用的工具将会逐渐受到青睐;在关联数据集上构建可视化Web应用以丰富的图形展示关联数据的知识,将会是未来关联数据可视化研究的重点。 曲佳彬 欧石燕关键词:关联数据 可视化 面向主题模型的主题自动语义标注研究综述 被引量:3 2019年 【目的】对面向主题模型的主题自动语义标注方法进行总结与评述,以促进主题模型的发展与应用。【文献范围】在Web of Science和CNKI数据库中分别以“Topic Labeling OR Topic Labelling OR Topic Tagging ORTopicIndexing”和“主题模型AND(标注OR标签)”等检索式进行检索,通过手工筛选获得代表性文献57篇。【方法】对相关论文进行深入阅读与分析,以主题标注过程中主题标签的生成来源为线索,对已有方法进行分类与比较分析。【结果】面向主题模型的主题自动语义标注包括候选标签生成与排序两个主要步骤,根据候选标签的生成来源可分为依靠自身语料库和依靠外部语料库两类方法。【局限】目前该领域的研究还不是很丰富,分析与评述不够系统和全面。【结论】该领域的研究仍具有较大探索空间,面向社交媒体内容的主题语义标注是未来研究方向,可结合更丰富的知识库并采用深度学习技术进行改进提升。 凌洪飞 欧石燕关联数据在图书馆领域的应用研究 被引量:7 2012年 论文简要介绍关联数据的定义、基本原则及其优势,并对关联数据的发展现状进行概述。着重阐述关联数据在图书馆这一领域的应用情况,并选取国外图书馆的几个典型应用实例进行分析。通过对关联数据应用状况的分析比较,旨在促进关联数据在我国图书馆领域的应用,识别并关联更多的开放数据集,扩展数据之网。 王薇 欧石燕关键词:关联数据 语义网 图书馆资源 国外科学数据监护平台调研分析 被引量:6 2019年 目前国内外均涌现出各种数据监护平台,旨在为科学研究提供数据服务保障。但与国外发达国家相比,我国数据监护平台的开发建设起步较晚且数量少,缺乏成熟的建设经验。因此,本文选择了20个国外代表性数据监护平台,对其使用的数据生命周期模型、技术规范、组件、软件工具、功能等各方面进行了全面调研、分析和比较,并在此基础上,提出一个整体的数据监护平台构建框架,为我国数据监护平台的开发与建设提供参考。 汤子钰 欧石燕