近年来,在国家科技图书文献中心(National Science and Technology Library,NSTL)业务流程再造总体规划指导下,NSTL数据库建设模式发生了深刻变化与全面转型。本文总结梳理了由“全自主加工”到“自主加工+第三方数据利用”,再到当前“多源异构文摘数据深度融合利用”的发展脉络,展现了NSTL数据库建设模式正从人工密集型向计算密集型转型的特点,而近十年来文摘数据加工与第三方数据利用情况印证了这一发展历程。在此基础上,本文以期刊文摘数据加工为例,重点探讨多源异构文摘数据深度融合利用模式,包括基本原则、总体框架、规则设计与算法实现、融合系统设计与实现。最后指出,NSTL数据库建设最终将实现从人工密集型到计算密集型、从加工流程驱动向多源大数据驱动的全面转型发展,也将为NSTL构建下一代新型、智能化的知识发现服务体系,提供坚实的数字科技文献大数据支撑。
本文选取Scopus、Web of Science、CiteSeerX等国际著名的引文数据库,从文献收录范围、元数据描述、检索功能、统计分析功能4个维度与国际科学引文数据库(Database of International Science Citation,DISC)进行对比分析,总结归纳当下国际先进引文数据库在收录范围、检索途径、分析评价等方面所具有的特点,为进一步完善DISC的建设与服务工作提出相关建议。