数字时代的图书形式充满了无限可能,出版商、作者、技术提供商、研究机构都在挖空心思把"书"做得更有意思.近期,一款名为"哈姆林漫炖食谱200例"(200 Slow CookerRecipes from Hamlyn)的应用(App)备受英语国家移动阅读用户的青睐.这是英国章鱼出版集团联合技术提供商Papertrell公司推出的一款电子书App,它的独特之处在于把一本食谱做成了独立的App.
出版的数字化转型给"书"带来了无限可能.2013年1月在纽约举办的"第四届世界电子书大会"(the Digital Book World conference,DBW)为电子书发展提供了诸多启发.其中,电子书内容的碎片化和重组成为大会关注的焦点之一.
新媒体环境易使人们失去阅读的耐心,快节奏的现代化生活方式又养成人们碎片化阅读的习惯.图书种类太多、鸿篇巨制大量存在,想读却没有时间和精力逐字逐篇阅读的读者不在少数.如果能够合理地将整本书的文字删繁就简,将重点内容提取出来加以重组,阅读起来就可相对省时省力.这便是电子书内容重组和碎片化呈现的初衷和意义.
2011年二三月间,全球出版业的研究智囊之一出版研究协会(PBC)委托两位荷兰研究者Eefke Smit和Maurits van der Graaf进行了一项有关期刊论文内容挖掘的研究工作.项目访谈了29位内容挖掘研究专家并针对学术出版商展开问卷调查,最终就内容挖掘的发展现状、利益相关者、政策和趋势等问题做出了回答.
所谓内容挖掘(content mining)是指为满足信息检索、信息提取或荟萃分析的需要而采用自动化的工具、技巧和技术来处理大量非结构化或非均一结构的数字内容.内容挖掘的应用范围很广,受到了从早期信息科学家和药物研发人员到近来市场营销人员、广告从业人员、商业分析师和法律从业人员的欢迎.举例来说,药物学家可以通过挖掘记载药物副作用的文献来发现药物的新用途;市场人员可以通过情感分析等挖掘技术来处理脸书、推特等社交媒介上的信息,从而了解人们对于产品或服务的真实态度.