[提要] 随着大数据时代的来临,传统图书馆的服务也面临着巨大的冲击。本文以大数据为背景,分析当前图书馆服务现状,重点探讨大数据思想将会给图书馆服务带来有效改善,具有较强的现实意义和应用价值。 关键词:大数据;图书馆服务;数据挖掘 中图分类号:G25 文献标识码:A 收录日期:2014年2月27日 大数据(Big Data)的概念最早出现在2001年IT的行业研究报告中,至今仍没有统一的概念,较为一致的认识是大数据是一种数据量巨大、数据形式多样的非结构化数据。也有学者用4V来表示大数据的特性,即量级(volume)、速度(velocity)、多样性(variety)和价值(value)。对于这些数量庞大、结构复杂、内容多样的大数据需要专门的技术进行处理,从而能够解析出这些数据内在的规律性,进而加以利用。随着全球信息化进程的加速,不同行业对于大数据的应用和发展都极为重视。业界普遍认同的是通过数据处理技术的创新与发展,以及对数据的采集、共享、感知和分析,使数据在具体行业之中,能够基于不同情况做出决策,会带来巨大的拓展空间。 同样在于图书馆的服务中大数据的思想及其应用也越来越受到重视,基于大数据思想的图书数据的收集、整理、分析,以及进一步的数据挖掘都成为下一步发展的方向,本文正是基于当前这种大数据的背景,针对国内图书馆服务存在的共性问题和不足展开分析,并探讨了大数据思想将会给图书馆服务带来有效改善,具有较强的现实意义和应用价值。 一、当前图书馆服务存在的问题 1、单一的结构化数据库无法满足用户需求的多样性。我国对于图书馆的信息化建设工作一直较为重视,早在《国家信息化“九五”规划和2010年远景目标(纲要)》中就提出了政府主导、全社会参与的门户网站、特色数据库、数字图书馆建设的规划,近年来随着国家一系列信息政策、法规、技术标准、规范的出台和完善,我国国民经济信息化的进程不断加快,到目前为止,我国的图书馆均已基本完成了信息化建设。虽然成绩是喜人的,但具体分析来看,我国图书馆信息化的发展,其主要仍是数据库、XML等同类型、不能再细分的单一数据,即都是结构化数据。对于民众需求迫切的人性化、个性化的高满意度的服务却无法较好地给予满足;同时,单一的结构化数据也不符合大数据的特征,不能很好地处理非结构化的复杂数据,无法较好地凸显出大数据的巨大优越性。此外,结构化的数据结构弱化了现在的图书馆人员在面对一些“可能是机会的数据”时的认识,降低了管理和分析各种结构化、半结构化和非结构化数据能力,无法建立软硬件一体化集成的大数据的知识获取、存储、组织、分析和决策的一体化的解决方案。
2、图书馆的信息化数据存储和分析能力不强。相较于图书馆所拥有的不断增长的数据量而言,图书馆的存储和数据分析的比例却在不断降低。在当前的环境下,信息产生的成本快速下降,产生的方式不断增加,人们的一举一动、一言一行、行为规律等都将产生出大量的半结构化、非结构化信息数据,使得社会空间中的信息数据量迅猛增长,而且信息数据的组成结构、类型格式、存在形态等都更加复杂。这对于图书馆对这些复杂的数据进行存储将有着极强的挑战性。另外,如何充分较好运用以上数据进行分析,加强知识服务的智能辅助决策能力更为关键。对于传统的对于用户群体、馆员和其他服务对象的个人信息,借阅记录进行统计归纳的方法分析能力明显不足,还需要更深层次的用户信息行为、搜索方式、行为痕迹等半结构化、非结构化数据。 |