您现在的位置是:首页 > 头条新闻 >

打造大数据时代的数字图书馆

2013-02-05 09:19:34作者:许娓玮来源:

摘要数字图书馆时代的到来,给传统的图书馆模式带来了巨大挑战,从线下传统图书馆过渡到线上,需要解决的首要问题是数字化后的千万数量级书籍的数据存储问题。...

  【中国信息主管网独家 记者许娓玮】近两年,“大数据”已经成为IT界继“云计算”之后最热门的词,伴随着大数据时代的到来 ,承载着知识存储、利用和开发重任的传统图书馆也开始向数字图书馆转型。数字图书馆时代的到来,给传统的图书馆模式带来了巨大挑战,从线下传统图书馆过渡到线上,需要解决的首要问题是数字化后的千万数量级书籍的数据存储问题。

  国家图书馆中央控制室主任、总工程师于洪波对中国信息主管网记者表示,为实现国家图书馆全面数字化,目前国家图书馆正在进行一期维修改造,建成之后的数字化图书馆的非结构数据存储量将达到800TB左右。

  迎接“数字图书馆时代”

  网络环境使图书馆赖以提供服务的资源基础以及图书馆和读者获取资源的方式都发生了根本性的变化,图书馆的馆藏建设已经从过去的实体馆藏建设延伸到了虚拟馆藏建设,数字化图书馆成为图书馆的未来发展方向。

  在谈到数字化图书馆时,于洪波告诉中国信息主管网记者,“数字图书馆时代”可以理解为,数字时代的图书馆模式,应该是既有传统意义上的图书馆和读者,也有网络终端模式的图书馆和读者,它所带来的影响是方便、快捷、及时、有效。


国家图书馆中央控制室主任、总工程师 于洪波

  作为互联网上重要的信息内容提供者,国家图书馆很早就意识到了自己在中文数字资源建设与服务方面的重要责任。从1987年起,国家图书馆开始致力于电子出版物的收集与馆藏书目数据库的建设,2000年起开始有计划地进行馆藏特色资源的数字化建设。2005年10月,由国家图书馆主持建设的国家数字图书馆工程获得国务院批准开始建设,工程明确提出了建设世界上最大的中文数字信息保存基地和中文数字信息服务基地的目标。目前正在进行的一期维修改造工程完成后,建成的数字化图书馆的非结构数据存储量将达到800TB左右。

  数字化图书馆发展的根本是馆藏资源数字化。于洪波认为,解决大数据问题是一个全球性的问题,目前,世界发达国家都在积极策划和运筹大数据,如果没有认识到这一问题,那么我们将再次在这方面落后,这样的落后必将在信息产业方面造成致命的缺陷。为了迎接大数据时代,实现馆藏资源的数字化是未来图书馆大数据战略的基础,不断扩充建设网络服务和其他服务手段,使之适合社会需求成为国家图书馆的目的。

  数据存储面临的挑战

  在大数据时代,图书馆具有了一定的大数据特征,图书馆的数据资源有所藏文献资源中的纸制纯印本、光盘资源、网络资源、数据库资源等结构化信息,也有日常读者信息、服务信息等非结构化信息,还包括图书馆自身建设的相关数据,这些数据形成了大量的异构数据。此外,图书馆的信息资源总量日益庞大且每天在迅速增长。国家图书馆具有更加丰富的数字资源,其主要来源包括四个方面:一是接受缴送的数字资源,包括电子出版物和音像制品的缴送,随书/刊附送的电子出版物;二是购买的音像制品、中文光盘和网络数据库;三是自建中文书目、篇名、全文影像及多媒体资源库,以及对购买和缴送的音视频产品进行数字化转换;四是网络资源采集。

  大数据时代的到来,改变了传统的IT架构与数据存储、利用机构,也对作为社会中储存信息知识、提供信息服务的信息中心的图书馆形成冲击和挑战。在信息环境下,信息产生的成本快速下降,产生的方式也多种多样,存在于社会空间中的信息数据量迅猛增长,但大数据时代更是会促使数据产生的范围、方式、途径发生翻天覆地的变化,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化、非结构化信息数据,信息数据的组成结构、类型格式、存在形态等都愈加复杂。大数据时代来临后,图书馆对这些复杂数据进行的应用、存储将有着极强的挑战性,如何来更好地解决大容量的存储成为重要问题。“现在国家图书馆大数据面临的问题是存储问题。”于洪波介绍说,图文、视频是现在的表现形式,但是实际上存储量比较大的就是视频内容,国家图书馆中央控制室视频存储数据量非常大,达800T到900T。视频内容很大,一个是数据块大,都是连续的,如果中间有存储不好,就可能出现马赛克显示不了。另外,存储量也比较大,最后它在存储当中占的内容也比较大,2011年IDC企业外部存储市场季度跟踪报告显示,到2020年将达到35ZB,是2011年1.2ZB的近29倍,这是增长的一个需求,这个量大到不可想象,再过几年数据量可能会更大。
(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们