摘要:在介绍传统世界的信息组织模式的基础上,从传统世界信息组织的缺陷入手,比较分析数字世界的信息组织在检索语言、元数据、分类方式、组织理念上的变革和优势。从不同角度论证传统世界的信息组织存在的必然性,进而探讨新信息环境中信息组织的发展趋势,指出信息组织应沿着传统世界与数字世界的融合、社会网络和知识关联方向发展。
关键词:信息组织 传统世界 数字世界 发展趋势
1 传统世界的信息组织
传统世界的信息组织是指对由原子构成的实体资源的组织,包括简单的安排事物——如餐具如何在橱柜中摆放,商品如何在货架中排放。但是,其最重要的组织对象是附着于各种载体上的信息,即文献信息的组织。是一种线型模式,如图1所示:
其中信息标引、信息描述、信息排序是关键的三个阶段。信息标引是指在对信息内容进行分析的基础上,根据一定规则给信息的内容属性以标识,并作出描述的过程;信息描述是指根据信息组织和检索的需要,对信息资源的主题内容、形势特征、物质形态等进行分析、选择、记录的活动;信息排序是在信息标引后,按一定规则和方法把所有信息描述记录组织排列成一个有序的整体。在传统世界中,庞杂、无序的文献信息群经过选择、标引、描述、排序后,很好地实现了有序化,保证了原子世界中的每个实体在一定空间内的唯一性,这种机制,对信息资源的开发利用以及用户检索信息有着不可替代的作用。
但是,由于传统世界的信息组织对象是原子所构成的物质,而原子的运行是遵循特定规律的:①由原子构成的物质随着时间的推移会越来越不稳定,纸张会泛黄和分解,照片底片会溶化,所以必须采取一些措施来让大自然的作用偏离它的轨道;②原子构成的物质需要占据空间,为了节省空间,必须为物质安排唯一的位置,同时要建立目录、索引等检索工具来指示物质的位置,但是这些检索工具不可能记录某个实体信息资源的所有信息,当实体信息资源的规模大到一定程度时,即便是引用计算机与网络技术,信息的查找利用也很难做到高效、准确。在传统世界中,无论采用何种信息组织方式,都要受其信息组织对象自身以及环境的限制,毕竟在一个图书馆中,很难会把一本书放在它可以归属的多个书架上,因为这样太浪费空间。
2 数字世界的信息组织
与传统世界相比,数字世界的信息组织发生了很大变化。信息内容被数字化成比特;信息组织的范围更为广泛,不再停留在对文献特征的描述,而是深入到了知识单元;信息组织的空间更为广阔,它不再需要如传统世界那般就单一的信息组织框架体系达成一致。随着Web2.0的深入发展,信息组织在检索语言、元数据、分类方式、组织理念上蓬勃发展,展现出全新的特征,这不仅是技术上的变革,更是理念上的颠覆。
2.1 检索语言的发展——标签语言
标签语言是一种纯自然语言,它的语词来自于一个平面的命名空间,不受任何预先制定的词汇间的关系限制。以受控语言为基础的传统分类法和主题法主要应用于图书馆的文献信息组织中,这类信息资源在一定意义上具有同质性,即由原子构成,由于实体空间的限制,它们一般是集中分布、规模有限、增长速度可控的;同时用户一般都具有一定的知识基础,对信息检索的查全率与查准率要求比较高。在这种情况下,采用受控语言的分类法和主题法可以通过较为严密的机制满足用户的需求。但是,对于数字世界中由用户产生的海量、动态、异质的信息资源,由一个采用受控语言的系统集中控制和组织的难度加大、成本增加,而标签语言的优势恰好可以解决这些困难。
2.1.1 多维度揭示信息资源 标签既不同于分类法的类目,也不同于主题法的主题词,它是在对信息进行概括和理解基础上产生的,是基于对信息内容个人理解上的私人标注,可以是针对主题,也可以是与文章主题无关的语词,因此标签的设定要比主题词自由、方便,它可以从多个维度来揭示信息内容,从多个语境来丰富其含义,例如,一张以长城为背景的照片,可能拥有“长城”、“艳阳高照”、“旅行”、“恐高”等标签。
2.1.2 具有大众性传统世界的信息组织需要专业人员或计算机来完成信息标引、描述工作,而标签语言没有采用预先定义的分类法和词表,不需要用户拥有分类法或者本体相关的知识。这样,用户可以在几乎不需要任何学习和使用成本的情况下独立、轻松的完成信息的标注和分类。
2.2 元数据的发展——任何信息都是元数据
元数据一股被认为是“关于数据的数据(date a—bout date)”,它由专家制定,具有严格的规范性,以信息内容为出发点。其实它并不是一个全新的概念,早已广泛应用于传统世界的信息组织当中了,像图书中的版权页说明、图书馆中的目录卡片等都是元数据。元数据经过了10余年的发展,其标准越来越复杂,随着网络信息的快速增长,信息类型越来越多样化,任何标准都面临着“滞后”的风险,同时其严格的规范性也限制了用户的使用。
在数字世界中,元数据正在打破那些严格的限制,也在挑战传统的元数据的概念。如果你记不清罗贯中某部著作的名称,可以求助于Google图书的搜索框,输入“罗贯中”,就可以看到一张罗贯中著作列表。只要点击《三国演义》的链接,你就可以查到全文,其中包括那句经典的原文:“滚滚长江东逝水”。相反,如果你想知道“滚滚长江东逝水”这句话的出处,只要将这句话输入Google图书的搜索框,就能够看到《三国演义》被列出来。在第一个例子中,是用罗贯中的名字作为元数据来找到书中的内容,而在第二个例子中,是用书中部分内容作为元数据来找到作者和书名。可以说,在多元的数字世界中,不仅一本书中的每一个词都可以被看做元数据,而且链接到这本书的每一种信息也是如此,元数据和数据的唯一区别就是,元数据是你已经了解的信息,而数据是你试图找出来的信息。
2.3 分类方法的发展——Folksonomy
分类在传统世界的信息组织中占有重要地位,传统世界对信息的分类主要采用等级分类法。等级分类法将类目体系组织成一个树状结构,其结构显示直观,类目设置比较均衡,非常适和文献的分类排架。但是,这种树形结构必须以牺牲丰富性和深度为代价来达成广泛性,它构建的基础就是一遍又一遍地使用隶属关系:“B是A的一种”,或者“B应该向A报告”,又或者“B是A的孩子”。无论各个分支体系是何种关系,这种关系都太过简单化了,根本不能体现事物自身及其相互关系的复杂性。
在数字世界中,信息空间更为广阔,由下而上的Folksonomy正在崛起。与传统的树形分类结构相比,Folksonomy拥有立体化的、非等级结构的类目体系。如果把等级分类法比喻成一颗树,那么Folksonomy可视为一堆离散分布在一个立体空间中的树叶。在这里,利用Folksonomy对“索尼照相机”这一类目进行组织,以明晰其组织原理。首先,对“索尼照相机’’这一类目进行分析,由用户对“索尼照相机”添加各式各样的标签,标签完全不受限制,包括照相机、索尼产品、生日礼物、旅行用品等。这样“索尼照相机”就分散在多个类目下,将一片叶子挂在了属于它的多个枝头上,用户可以更方便地找到它;另外,这种标签立体图揭示的关系更为丰富多彩,例如,“索尼笔记本”、“索尼手机”这两个类别同样可能被标上“索尼产品”这个标签,然后“索尼笔记本”、“索尼手机”、“索尼照相机”就通过“索尼产品”这个标签形成了聚类,同样,通过“照相机”、“生日礼物”、“旅行用品”这些标签又可以与其他的多个类别、多个事物形成联系,这样就构成了一个密集的信息网络,就如同漫天飘舞的树叶,而且,这些飘散的树叶又是智能的,通过一个叶片可以联系到多个叶片,只是叶片之间的联系是潜在的,等待着用户去发掘和创造而已,如图2所示:
2.4 信息组织理念的发展——用户中心论
信息是普遍存在的,它与现实世界一样的广博,没有哪个个体能够完全理解它。因此,需要有人利用他们积累的知识、经验来行使信息过滤器的职能,这些人被称为专家。在传统世界中,由他们负责选择、筛选信息,制定元数据的标准,完成信息的标引与描述工作。从这个角度看,用户能看到什么信息,能找到什么信息,都是由专家决定的,信息的控制权牢牢的掌握在他们手里。与此同时,专家们在信息组织过程中无形的把“以用户为中心”与“以文献信息为中心”等同了起来,认为只要实现了文献信息资源的有序化就满足了用户的信息需求,殊不知,在对信息施以选择、分析、排序等程序虽然有利于文献信息的有序化,但这种有序化依靠的是文献信息本身的意义与他们自己的判断力来完成的,它虽然利于信息组织工作本身,但无法充分的满足用户的信息需求,毕竟专家们也无法预测每个人到底对什么感兴趣,每条信息对用户将会有什么意义。
数字世界的信息组织以构建主义哲学和自由主义哲学为指导思想。构建主义哲学思想认为:信息从本质上来说是主观的东西,无论是被记载下来的信息(信息1)还是人脑中的信息(信息2)都不可能是现实世界的如实的、客观的反映,它们永远只能是外部世界的片面的反映。认识的这种不完整性就决定了特定用户在特定背景需要寻求特定的信息来填补认识上的空白。而要满足这样的信息需求,信息组织应该关注的不是信息本身,而应该是用户的个体性以及他的具体背景,因为每个用户及其背景都是独特的,因而其信息需求也是独特的。自由主义哲学思想认为:所有的人都有权按自己的意志安排生活,都有能力为自己的需要做出适当的选择(包括信息的选择)。所以,信息组织不应该是替用户选择信息,不应该以各种权威来制约用户,信息的所有者应该主动的把信息组织的控制权转交到用户手里,为用户提供一个开放式的架构,让用户自己来选择、组织信息。
3 新信息环境下信息组织的发展趋势
3.1 传统世界的信息组织不会消亡
首先,从哲学的角度看,在传统世界中,我们对实体信息资源的组织实际上是由亚里士多德的理性主义指导的。亚里士多德认为:要了解一件事物,就必须看穿它的本质,并且不被恰巧符合其特点的表象所迷惑、误导。而对于这些“本质”的定义就决定了哪些东西属于一类,解释了为什么这些东西属于该类别而另外一些则不属于,这样归拢和分割的结果就是一棵分类树,其中的各个枝叶都既与一些东西聚合又与其他东西分离。这种树形结构对于理解事物是很有帮助的,例如,当有人告诉你某种动物属于鸟类时,你不需要更多解释就会明白它是动物,是有脊类的,可以繁殖,会死亡,是实物……以及其他一些信息,更重要的是,你不需要在每次看到一只鸟的时候才会考虑所有这些信息,只要是在需要的时候,你随时都可以调用这些类别信息。
在日常生活中,亚里士多德的理性主义和树形结构一次次体现在各种组织体系中,比如各种传统分类法,将一本书分成章节和次级标题,越来越专业化的机构部门,菜单上菜品的安排等。这一切都源自于我们所处的信息环境中离不开原子物质,这种物质形态必然产生一种与之相适合的意识形态,理性主义正是其产物之一,而由理性主义指导的传统的信息组织必然是与传统世界相匹配的信息组织形态。
其次,从传统世界的信息组织所依存的实体看。纸质文献是其主要对象,图书馆是其依存的主要机构。关于纸质文献和图书馆是否会被取代的争论已经持续了几十年,然而,纸质文献、图书馆在电子文献和电子图书馆的挑战下非但没有消亡反而呈上升趋势发展。显然,不能仅凭技术的进步与经济的发展就认定纸质文献和图书馆的消亡,其存在的社会和政治意义也是不容忽视的。比如,数字时代给我们造成了“谁都可以及时地、自由自在地纵览世界各地的信息”的柏拉图式的印象,实际上,它却加深了数字鸿沟,而图书馆在保证信息自由和公平中具有的潜在和巨大的作用更有利于消除数字鸿沟。
可见,在当前我们所处的信息环境中,传统世界的信息组织纵然有诸多缺陷,但它并不会消亡。
3.2 新信息环境下信息组织的发展趋势
3.2.1 传统世界的信息组织与数字世界的信息组织的融合 数字世界的信息组织也有诸如标签模糊、滥标等缺陷,需要传统世界的信息组织来校正。所以,信息组织的发展不应该是简单的替代的关系,而应该是两者之间的融合关系。这种融合可以通过网站提供的个性化服务与图书馆的连接来实现,比如,把图书馆书目数据嵌入到豆瓣网,用户在浏览一本图书相关评论的同时也可以查找哪些图书馆藏有这本书;反过来,也可以把个性化的信息组织方式引入到图书馆中,提高书目数据信息的丰富性和可利用性。除去上面两种简单的连接方式外,更值得研究的是利用web2.0的原理和理念来架构图书馆信息网络,实现真正意义上的融合,如图3所示:
3.2.2 基于社会网络的信息组织 社会网络普遍存在于传统世界与数字世界中,只不过在传统世界中,由于时空等多方面的限制,由个体之间形成一个群体,由群体形成社区面对着诸多困难。而在数字世界中,个体之间通过社会性网络软件,打破时空限制,建立更加紧密的社会关联,由此产生的各种相关的信息通过多种交互关系而联系组织在一起,从而形成一个个大小不一的紧凑型与松散型网络社区。这种社会网络以交互为基础,包括个体间的小范围的交互,也包括群体间、社区间的大范围的交互,在交互的过程中产生的相关信息会以“话题”为标准形成具有一定方向性的聚合。同时,基于社会网络的信息组织伴随着信息流的多向运动,它是对处于即时运动、变化中的信息的组织,而非以往的对静态信息的组织,而且,其深受社会关系的影响与控制。可见,基于社会网络的信息组织面临着更为复杂的情境,而如何建立一个稳定的、有效的信息组织机制仍需继续探索。
3.2.3 知识关联任何形式的信息组织都是基于信息元素之间一定的关联性而存在的,只不过传统世界的信息组织是基于文献实体关联,数字世界的信息组织则基于知识关联,而研究和揭示知识之间相互关联的规律又是有效组织、检索和管理知识的基础。目前,各种知识组织方式,无论是语词的还是符号的,大都是基于概括知识内容的概念之间的关联性来组织、存储的,这种关联性体现的是一种概念逻辑,但是,知识之间的关联性是多样的,概念逻辑仅是其中的一种,显然,加强对那些潜在的、隐含的知识关联的研究是很有必要的。
此外,随着现代信息技术的快速发展和广泛应用,信息组织的发展方向不应该是仅仅简单实现信息、知识的整序、存储,而应该是根据知识之间的相互关联通过融合分析、归纳、推理等方式来实现知识创造、知识挖掘和知识发现。