中国科技信息研究所所长 梁战平
情报学是一门研究有效地运用信息、知识和情报的规律性的科学,它发源于图书馆学和文献学,已发展成为自然科学、技术科学和社会科学的交叉学科。
情报学作为学科的出现,通常以布什(V.Bush)在1945年发表的《诚若所思》著名论文中提出的机器检索思想为标志。情报学在20世纪70年之前被认为是理论孕育期和学科产生期,20世纪70年代是学科发育期,20世纪80年代至90年代是学科成熟期,先后跨跃了文献规律的研究和文献加工、机器自动查找情报、情报系统的建立和数据库的出现以及信息管理结构的转变这四座里程碑,目前正处在面向21世纪的未来发展期。
一、信息与情报
信息与情报是情报学的核心问题。什么是信息?什么是知识?什么是情报?对这些基本概念如果没有明确的认识,就不可能获得对情报学及其相关学科的科学理解。英语的Information是一个连续体的概念,“信息链”由Facts(事实)、Data(数据)、Information(信息)、Knowledge(知识)、Intelligence(“情报”、“智能”)五个链环构成。简单地说,“事实”是人类思想和社会活动的客观映射。“数据”是事实的数字化、编码化、序列化、结构化。“信息”是数据在信息媒介上的映射。“知识”是对信息的加工、吸收、提取、评价的结果。“情报”、“智能”则是运用知识的能力。“事实”、“数据”、“信息”、“知识”、“情报”五个链环组成“信息链”(Information Chain)。在“信息链”中,“信息”的下游是面向物理属性的,上游是面向认知属性的。作为中心链环的“信息”既有物理属性也有认知属性,因此成为“信息链”的代表称谓。
英国科学哲学家卡尔·波普尔(K. Popper)提出的“三个世界”的理论,从哲学高度阐述了信息的属性。波普尔认为,信息有“三个世界”:第一世界是物理领域,第二世界是主观现实领域,第三世界是客观知识领域。根据这个理论,信息分为三大类:第一类是有关客观物理世界的信息,即本体论意义上的信息,它反映事物运动的状态及其变化的方式;第二类是有关人类主观精神世界的信息,即主体论或认识论意义上的隐性信息,它反映人类能感受的事物运动状态及其变化方式,处于意识、思维状态;第三类是有关客观意义上概念世界的信息,即主体论或认识论意义上的显性信息,它反映人类所表述的事物运动状态及其变化方式,用语言、文字、图像、影视、数据等各种载体来表示,汇成一个实在的自主的“信息世界”。以“三个世界”的理论来研究信息、知识、情报,它们之间存在以下关系:
1.并列关系。事实——数据——信息——知识——情报。
2.转化关系。数据不会自动变成信息,信息也不会自动变成知识,数据、信息、知识同样也不会自动变成情报。实现从数据到情报的关键要素是人。是人通过信息组织与管理,知识组织与管理来实现信息、知识、情报相互转化。知识本身也是一种信息,情报本身也是一种信息,相互之间可以转化。但是,知识、情报不是一般的信息,而是体现人的认知因素而且在运用中能改变人的行为的特殊信息。
3.包含关系。信息存在于全部的三个世界中(主观世界、客观的物理世界、客观的概念世界),知识存在于主观世界和客观的概念世界,但不存在于客观物理世界中,因此知识包含于信息之中。情报也存在于主观世界和客观的概念世界中,是活化了的知识信息,包含于知识、信息之中。
4.层次关系。从数据提升到信息,主要是对数据之间建立相关性,使其有序化和结构化。从信息提升到知识,主要根据信息的相关性、有序性,进行比较、分析、综合和概括,从中发现问题的本质。从数据、信息、知识提升到情报,主要是采取各种有效的手段和方法激活它们,满足用户的需求。
二、国内外情报学发展现状
20世纪80年代至90年代以来,情报学研究范式的多元化,拓展了情报学研究视野和研究内容,使情报学研究带有时代特征,同信息科学群的其他学科协调、融合、互补,进入了一个情报学整体更新的发展阶段。信息技术是情报学创新的原动力,但国外情报学研究迅速改变“技术至上”的倾向,技术与理论并重,技术与人文并重,技术与经济并重,不断探索情报与技术最佳匹配模式。情报学研究从强调信息需求和信息利用,重视以用户为中心来设计信息系统和情报检索开始,逐步引入解释学、认知观、人文因素等新成分,现在关注的焦点移向知识管理和利用、以人为本、用户/信息/技术/社会和谐共处的生态平衡。情报学不断对传统观念提出质疑,与时代的要求俱进,与技术的发展俱进,与社会的进步俱进,不断拓宽情报学研究领域和研究内容,目前已形成为一门多范式交叉、多学科集成的全方位情报学。
中国情报学研究在20世纪80年代掀起了两个高潮。一个高潮是引进国外情报理论,开始学习和探讨波普尔的信息“三个世界”理论、布鲁克斯的知识方程式以及系统论、信息论、控制论、耗散结构论、协同论等,为我国情报学基础理论研究打下基础,一些有影响的情报学专著如《情报学概论》、《情报研究方法论》、《文献计量学》、《情报数学》等相继问世。另一个高潮是开始计算机情报检索的试验、应用和研究,出现了计算机编制主题表、汉字切分、中文全文检索、自动标引等应用研究。中国情报学关注领域和研究重点开始从文献转向技术,从理论转向应用。截至1998年,新中国成立50年来情报学领域发表论文计18369篇,按11个论文主题分类,论文数排名分别是情报组织管理、情报基础理论、情报检索、情报分析研究、情报服务、情报搜集、情报技术、情报事业、国外情报事业、情报整理、情报教育。关于理论研究方面,情报学界出版了《现代情报学理论》等专著,近年来在面向21世纪的情报学、情报学研究的定量化、情报学认知观、经济情报学、知识组织和管理、竞争情报、内容开发等领域也出现了许多有影响的论文,说明中国情报学研究有新的发展。据2000年9月统计,中国目前培养情报学硕士的高等院校和情报中心有22个;培养情报学博士单位有4个;情报学作为一级学科单位有北京大学、武汉大学两所高等院校。
三、情报学核心研究内容
情报学应该有自己的核心研究内容。情报学作为信息科学群一门独立的学科,必须阐述信息现象并回答有关信息查寻过程中的智力行为问题,而且这种回答必须是科学的并基于在一定程度上是本领域独有的调研方法。ASIS主席萨拉塞维克)认为,情报学科分为两大块:情报分析和情报检索。现在情报分析与情报检索之间存在鸿沟,情报学的任务就是填平这道鸿沟。他认为,“待这两端成功相连之际,便是情报学这门学科羽翼丰满之时”。综合萨拉塞维克等学者的观点并从现实出发,情报学的核心研究领域主要是理论方法、信息管理和服务、情报分析、信息检索、知识管理、信息技术应用等。
1.理论方法。主要探讨和研究情报的性质、现象和过程、各种理论范式、情报学与相邻科学的关系等学科建设方向。当前尤其需要关注信息与社会进步、信息与经济活动、信息与大众传媒、信息与教育、信息与人文、信息构筑、信息生态、信息政策法规、信息伦理、知识产权、行为科学等课题。 2.研究方法。需要关注文献计量学、信息计量学、网络计量学、科学计量学以及情报的量化分析、引文分析、文献知识发现等课题。
3.信息管理。包括信息的收集、整理、存储、传播、分析和服务活动;信息资源开发和利用、信息资源的分类、信息资源管理体系、信息资源共建共享等;信息生产者与用户的关系;信息系统质量评价等;有关信息格式、内容加工和传输的各种标准和规范等。
4.信息检索。以信息处理和情报内容加工为主的研究。包括:元数据、界面设计、可视化、主题词表、分类表、概念分类、Web网站构筑、多媒体检索、跨语言检索、检索策略、搜索引擎等。
5.知识管理。知识单元、知识存储和管理、知识获取、知识提取、知识发现、知识表述和分类、知识挖掘、自然语言理解、语料库、知识工程应用研究、知识管理与统计学、机器学习、自动推理、问题求解、人类常识和专业知识的分析研究、最佳实践(Best practice)和实践团体(Community of Practice, COP)、协同网等。
6.情报分析研究。从信息挖掘、抽取,对信息进行分析、加工,提供情报咨询服务,以及其相应的信息系统,如竞争情报(CI)、电子数据处理系统(EDPS)、决策支持系统(DSS)、群体决策支持系统(GDSS)、在线分析处理(OLAP)系统、计算机支持协同工作(CSCW)等。
7.应用和服务。应用范围包括电子商务、电子政务、在线教育、在线学习、在线保健、在线娱乐、在线金融等。服务范围包括网络接入商(IAP)、网络服务商 (ISP)、网络内容商 (ICP)、应用服务商 (ASP)、网络培训商 (ITP)、系统集成商(SI)、网络咨询等。
8.技术应用。包括技术对情报学发展的影响;信息数字化、全文检索、搜索引擎、多媒体内容检索、自动标引、自动翻译、自动摘要、数据挖掘、文本挖掘、信息提取等信息内容技术;计算机与网络技术支持的知识内容加工和知识吸收、转换等;数字图书馆技术。
9.信息教育与人才培养。包括数字鸿沟、计算机文明、信息技能、专业结构、人才素质、教育制度、在职培训、继续教育、网络教育、网络学习等课题。
四、情报学研究方法
1.社会调查法。情报调查法是指人们在社会情报实践活动中对客观情报情况的调查了解与分析研究方法,是搜索、跟踪、获取和开发利用情报资源的一种基本的、有效的方法。这种方法又可分作直接方法与间接方法两大类,前者主要是用现场观察法,后者又分作访问调查与调查表调查。
2.引文分析法。研究文献的被使用和被引用,也就是研究质量问题。自20世纪60年代初以来,由于“科学引文索引”(SCI)的创办,引文分析法已成为一个有相当深度和广度的情报学分支。对引文这一线索进行研究,可以了解某项发明或技术的应用范围、现状、著作水平、学科发展趋势等。
3.系统科学方法。从系统论、控制论和信息论出发,主要研究科技情报系统的结构、功能和最优设计,以及解决科技情报系统的最佳运行、实现最优服务等问题。
4.文献计量法。文献计量是情报学与数学、统计学等相互交叉和结合而产生的研究方法。在文献计量研究方法中,布拉德福定律、洛特卡定律、齐夫定律、引文规律、文献老化规律、文献增长与冗余等已形成理论体系。文献计量法开始向其它学科输出、扩散、渗透,利用文献计量统计方法,可以描述和解释许多分布机制相似的社会现象,如收入分布、利润分布、人口分布、通信间隔分布等。
5.科学计量法。科学计量法试图通过定量方法寻找科学活动的内在规律和准规律,并为更有效率地开展科研提供指导。20世纪60年代初,D·普赖斯等人倡导并采用定量方法来研究科学自身,E·加菲尔德创建了“SCI”大型数据库,是为科学计量学的肇端。30多年来,许多情报学研究人员在该领域作出了许多重要成果,此外社会学和政策研究人员也投入到这一新领域的研究,使其研究对象不断增加、研究领域不断拓展——科学研究的生产率问题、科研资金投入的最优化、预测学科发展趋势、识别不同学科之间以至科学活动同技术活动之间的联系、科研绩效评估、描述科学活动规律和准规律、研究科技人才和科技教育问题等等,形成蔚为大观之势。
6.信息计量法。1988年,英国情报学家布鲁克斯和他的学生埃格希(L·Egghe)主张用信息计量学代替文献计量学,提出了如下信息计量的发展逻辑过程:书目统计学→文献计量学→科学计量学→信息计量学。信息计量学的提出表明情报学定量化研究已由文献单元深入到文献中的各个信息单元、知识单元;已由文献计量分析发展到信息计量分析,而达到了一个新的高度,最终将真正实现“知识信息的计量必须从语法层次向语义和语用层次发展”的这一飞跃。
7.网络计量法。1997年,Almind和Ingwersen首次提出网络环境下引文分析的概念和“网络计量学”(Webometrics),将传统信息计量方法应用在Web分析上,对诸如语言、单词、词汇、频次、作者特征、作者合作的能力和程度,以及对作者的引文分析,学科或数据库增长的测量,新概念、新定义的增长,信息的测量,检索措施的形式与特征进行了研究。网络计量法可用于研究因特网的知识结构、学科性质、信息组织特征, 研究网络环境下的科学信息交流规律,探讨学科、机构、国家、地区的科学发展趋势,研究网络用户的信息需求和网络查寻行为,指导网络建设和网站管理。
8.基于文献的知识发现法。由于科技文献和知识的爆炸增长,科学分工越来越细,跨学科的信息传递变得更加困难,知识也随之产生分裂,并且随着知识的持续增长,分裂现象将会更加严重。尽管现代每个人懂得的东西越来越多,但是必定有许多未被人们发现的知识点、知识领域之间的相互联系。假设某学科发现医学状况A与症状B相联系,另一个完全不同的学科发现某营养成分缺乏C与症状B相联系,则A与C也发生了关系。但是两个完全不同领域的学科隔行如隔山,A与C的联系则长期蛰伏着,未被发现。1986年,美国芝加哥大学情报学专家K·Swanson博士创立了基于文献的知识发现法,并开发了Arrowsmith系统。
五、情报学前沿领域
情报学将通过与不同学科的碰撞交叉而产生前沿研究领域,不断丰富它的内涵和扩大研究范围。据有关研究,前沿领域有:
1.“数据库知识发现”研究
数据库知识发现(Knowledge Discovery in Databases,缩写KDD)是目前十分活跃的跨学科研究领域,情报学家利用“基于文献的知识发现法”,开发出各种软件系统,揭示数据库中不同领域知识的联系和问题的答案,找到了知识发现的新途径。
2.语义网研究
语义网实际上是一种智能网络技术,能理解人类语言,并能推理,不仅可以理解词和概念的涵义,而且还能理出其间的逻辑关系。语义网技术一夜之间得出的组合方式将比一个人穷尽一辈子心力想得到的还要多,有助于人们提高自身的直觉和分析能力,促进全球范围内不同文化背景的人们之间合作。现在,语义网越来越为世界所关注,它也将是情报学大有作为的领域。这方面的研究项目有:面向自然语言处理的语法、语义计算机模式的研究,潜在的语义索引,复合词的分析模型研究,自动构成多语种词库,存取多语种信息,用户自适应集合分类法研究,知识共生现象研究,网络知识搜寻代理等。
3.3G(Great Global Grid)研究
欧洲各国正在投入大量人力、物力研究3G技术,主要目的是将各种网络信息资源连接起来,像今天的电力网格一样,方便地送到每个用户那里。目前在因特网上,信息资源分散在各个网络站点,将来可以通过网格技术,在世界范围内对用户提供各种一体化的信息服务基础设施,也就是将分布于全世界的计算机、数据、信息、知识等组织成一个逻辑整体,用户可通过网格门户透明地使用整个网格资源。其核心技术包括:信息优化使用技术,网格资源管理技术,网格中的作业调度技术,网格安全技术。
4.信息构建(Information Architecture)
美国建筑师Richard.S.Wurman于1976年在美国建筑师协会年会上首次提出IA的概念。1989年,他在《信息悬念》(Information Anxiety)一书中对IA的定义是:如何组织信息,把复杂的信息变为明晰,以帮助人们有效地实现其信息需求。随着因特网的发展,IA的理念和应用获得了迅速的发展,特别是在情报学界和信息管理学界。IA是把传统图书馆学、情报学同现代科学技术结合,组织信息和构建信息环境,以满足用户信息需求的一门科学和艺术,已引起国际情报学界重视和关注,成为情报学的核心问题,并把它的理念合理地运用到情报学研究领域上来。
5.知识管理研究
知识管理不仅包括对知识本身的管理,还包括对知识有关的各种有形资源和无形资源的管理,涉及知识组织、知识设施、知识资产、知识活动、知识人员等全方位、全过程的管理。目前的研究热点在于:知识组织、知识链、知识发现、自然语言理解、知识管理工具、知识转换模式和4力场(4Ba's)研究、实践社区、最佳实践库、智能代理、知识网络化研究等。
6.数字图书馆研究
数字图书馆正引发一场全球范围内的文化媒介迁移运动。图书馆、博物馆、档案馆等一些文化机构将进入经济开发的中心地带,传统文化资源将被开发成经济资源,导致一个国家的文化生态根本上发生变化。数字图书馆需要跨行业、跨学科、跨地区、跨国界的合作,共同解决技术问题、管理问题、运营问题和法律问题等,不同学科将从不同领域对发展数字图书馆作出贡献。情报学的理论、方法、技术是建设数字图书馆的重要支柱,同时情报学也将吸收数字图书馆集成的各个学科的养分进一步实现现代化。
7.信息技术应用
技术方面前沿课题很多,包括:元数据技术、语料库技术、海量信息存储与压缩技术、信息可视化技术、图像检索技术、语言检索技术、人机界面技术、多语言浏览器、跨语言信息检索、自然语言理解、人工智能、大规模真实文本处理、自动抽词、自动索引、自动分类、自动文摘、概念分类(Ontology)、信息安全和保护技术等。当前要着重内容和知识开发利用的新技术和新应用的研究和探索以及实现这些技术和应用不可或缺的基础研究、基础建设和标准规范的采用。
8.小世界现象
从很大的人口中任意挑出两个人,这两个人彼此认识的概率有多大?任意挑出的两个人当中要达到彼此认识的最短链条是多长?1967年,哈佛大学社会心理学家斯坦利·米尔格拉姆(Stanley Milgram)作了一个实验。他给内布拉斯加州奥马哈市随意选择的300多人发信,要求他们把他的这封信寄到波士顿市一个独一无二的“目标”人,分别由每个人独自联系。米尔格拉姆告诉每个发信人有关目标人的信息,包括姓名、所在地、职业,如果发信人不认识这个目标人,他们把这封信寄给他们认为与目标人比较近的,而且是他们认识的一个人。于是形成了发信人的链条,链上的每个成员都力图把这封信寄给他们的朋友、家庭成员、商业同事或偶然熟人,以便很快到达目标人。米尔格拉姆发现,有60个链条最终到达目标人,链条中平均步骤大约为6,这个结果说成“六度分离”(Six degrees of separation)而广为传播。“六度分离”在学术上称为“小世界现象”或“小世界问题”。近年来,小世界现象引起了数学家、情报学家、物理学家、计算科学家、行为科学家、数理经济学家的广泛兴趣,并对其进行了深入研究,展现出广阔的应用领域。现在,我们生活在一个网络的世界中,互联网上的信息传播是我们情报学的重要研究课题,而且统计表明,尽管互联网上信息数以亿计,但网络的特征路径长度L最多达到19,因此互联网连接具有小世界现象。可以运用小世界网络理论来改善Internet中的信息流。“小世界现象”对于情报工作者如何快捷、准确获取网上信息提供新思路。
情报学是一门研究有效地运用信息、知识和情报的规律性的科学,它发源于图书馆学和文献学,已发展成为自然科学、技术科学和社会科学的交叉学科。
情报学作为学科的出现,通常以布什(V.Bush)在1945年发表的《诚若所思》著名论文中提出的机器检索思想为标志。情报学在20世纪70年之前被认为是理论孕育期和学科产生期,20世纪70年代是学科发育期,20世纪80年代至90年代是学科成熟期,先后跨跃了文献规律的研究和文献加工、机器自动查找情报、情报系统的建立和数据库的出现以及信息管理结构的转变这四座里程碑,目前正处在面向21世纪的未来发展期。
一、信息与情报
信息与情报是情报学的核心问题。什么是信息?什么是知识?什么是情报?对这些基本概念如果没有明确的认识,就不可能获得对情报学及其相关学科的科学理解。英语的Information是一个连续体的概念,“信息链”由Facts(事实)、Data(数据)、Information(信息)、Knowledge(知识)、Intelligence(“情报”、“智能”)五个链环构成。简单地说,“事实”是人类思想和社会活动的客观映射。“数据”是事实的数字化、编码化、序列化、结构化。“信息”是数据在信息媒介上的映射。“知识”是对信息的加工、吸收、提取、评价的结果。“情报”、“智能”则是运用知识的能力。“事实”、“数据”、“信息”、“知识”、“情报”五个链环组成“信息链”(Information Chain)。在“信息链”中,“信息”的下游是面向物理属性的,上游是面向认知属性的。作为中心链环的“信息”既有物理属性也有认知属性,因此成为“信息链”的代表称谓。
英国科学哲学家卡尔·波普尔(K. Popper)提出的“三个世界”的理论,从哲学高度阐述了信息的属性。波普尔认为,信息有“三个世界”:第一世界是物理领域,第二世界是主观现实领域,第三世界是客观知识领域。根据这个理论,信息分为三大类:第一类是有关客观物理世界的信息,即本体论意义上的信息,它反映事物运动的状态及其变化的方式;第二类是有关人类主观精神世界的信息,即主体论或认识论意义上的隐性信息,它反映人类能感受的事物运动状态及其变化方式,处于意识、思维状态;第三类是有关客观意义上概念世界的信息,即主体论或认识论意义上的显性信息,它反映人类所表述的事物运动状态及其变化方式,用语言、文字、图像、影视、数据等各种载体来表示,汇成一个实在的自主的“信息世界”。以“三个世界”的理论来研究信息、知识、情报,它们之间存在以下关系:
1.并列关系。事实——数据——信息——知识——情报。
2.转化关系。数据不会自动变成信息,信息也不会自动变成知识,数据、信息、知识同样也不会自动变成情报。实现从数据到情报的关键要素是人。是人通过信息组织与管理,知识组织与管理来实现信息、知识、情报相互转化。知识本身也是一种信息,情报本身也是一种信息,相互之间可以转化。但是,知识、情报不是一般的信息,而是体现人的认知因素而且在运用中能改变人的行为的特殊信息。
3.包含关系。信息存在于全部的三个世界中(主观世界、客观的物理世界、客观的概念世界),知识存在于主观世界和客观的概念世界,但不存在于客观物理世界中,因此知识包含于信息之中。情报也存在于主观世界和客观的概念世界中,是活化了的知识信息,包含于知识、信息之中。
4.层次关系。从数据提升到信息,主要是对数据之间建立相关性,使其有序化和结构化。从信息提升到知识,主要根据信息的相关性、有序性,进行比较、分析、综合和概括,从中发现问题的本质。从数据、信息、知识提升到情报,主要是采取各种有效的手段和方法激活它们,满足用户的需求。
二、国内外情报学发展现状
20世纪80年代至90年代以来,情报学研究范式的多元化,拓展了情报学研究视野和研究内容,使情报学研究带有时代特征,同信息科学群的其他学科协调、融合、互补,进入了一个情报学整体更新的发展阶段。信息技术是情报学创新的原动力,但国外情报学研究迅速改变“技术至上”的倾向,技术与理论并重,技术与人文并重,技术与经济并重,不断探索情报与技术最佳匹配模式。情报学研究从强调信息需求和信息利用,重视以用户为中心来设计信息系统和情报检索开始,逐步引入解释学、认知观、人文因素等新成分,现在关注的焦点移向知识管理和利用、以人为本、用户/信息/技术/社会和谐共处的生态平衡。情报学不断对传统观念提出质疑,与时代的要求俱进,与技术的发展俱进,与社会的进步俱进,不断拓宽情报学研究领域和研究内容,目前已形成为一门多范式交叉、多学科集成的全方位情报学。
中国情报学研究在20世纪80年代掀起了两个高潮。一个高潮是引进国外情报理论,开始学习和探讨波普尔的信息“三个世界”理论、布鲁克斯的知识方程式以及系统论、信息论、控制论、耗散结构论、协同论等,为我国情报学基础理论研究打下基础,一些有影响的情报学专著如《情报学概论》、《情报研究方法论》、《文献计量学》、《情报数学》等相继问世。另一个高潮是开始计算机情报检索的试验、应用和研究,出现了计算机编制主题表、汉字切分、中文全文检索、自动标引等应用研究。中国情报学关注领域和研究重点开始从文献转向技术,从理论转向应用。截至1998年,新中国成立50年来情报学领域发表论文计18369篇,按11个论文主题分类,论文数排名分别是情报组织管理、情报基础理论、情报检索、情报分析研究、情报服务、情报搜集、情报技术、情报事业、国外情报事业、情报整理、情报教育。关于理论研究方面,情报学界出版了《现代情报学理论》等专著,近年来在面向21世纪的情报学、情报学研究的定量化、情报学认知观、经济情报学、知识组织和管理、竞争情报、内容开发等领域也出现了许多有影响的论文,说明中国情报学研究有新的发展。据2000年9月统计,中国目前培养情报学硕士的高等院校和情报中心有22个;培养情报学博士单位有4个;情报学作为一级学科单位有北京大学、武汉大学两所高等院校。
三、情报学核心研究内容
情报学应该有自己的核心研究内容。情报学作为信息科学群一门独立的学科,必须阐述信息现象并回答有关信息查寻过程中的智力行为问题,而且这种回答必须是科学的并基于在一定程度上是本领域独有的调研方法。ASIS主席萨拉塞维克)认为,情报学科分为两大块:情报分析和情报检索。现在情报分析与情报检索之间存在鸿沟,情报学的任务就是填平这道鸿沟。他认为,“待这两端成功相连之际,便是情报学这门学科羽翼丰满之时”。综合萨拉塞维克等学者的观点并从现实出发,情报学的核心研究领域主要是理论方法、信息管理和服务、情报分析、信息检索、知识管理、信息技术应用等。
1.理论方法。主要探讨和研究情报的性质、现象和过程、各种理论范式、情报学与相邻科学的关系等学科建设方向。当前尤其需要关注信息与社会进步、信息与经济活动、信息与大众传媒、信息与教育、信息与人文、信息构筑、信息生态、信息政策法规、信息伦理、知识产权、行为科学等课题。 2.研究方法。需要关注文献计量学、信息计量学、网络计量学、科学计量学以及情报的量化分析、引文分析、文献知识发现等课题。
3.信息管理。包括信息的收集、整理、存储、传播、分析和服务活动;信息资源开发和利用、信息资源的分类、信息资源管理体系、信息资源共建共享等;信息生产者与用户的关系;信息系统质量评价等;有关信息格式、内容加工和传输的各种标准和规范等。
4.信息检索。以信息处理和情报内容加工为主的研究。包括:元数据、界面设计、可视化、主题词表、分类表、概念分类、Web网站构筑、多媒体检索、跨语言检索、检索策略、搜索引擎等。
5.知识管理。知识单元、知识存储和管理、知识获取、知识提取、知识发现、知识表述和分类、知识挖掘、自然语言理解、语料库、知识工程应用研究、知识管理与统计学、机器学习、自动推理、问题求解、人类常识和专业知识的分析研究、最佳实践(Best practice)和实践团体(Community of Practice, COP)、协同网等。
6.情报分析研究。从信息挖掘、抽取,对信息进行分析、加工,提供情报咨询服务,以及其相应的信息系统,如竞争情报(CI)、电子数据处理系统(EDPS)、决策支持系统(DSS)、群体决策支持系统(GDSS)、在线分析处理(OLAP)系统、计算机支持协同工作(CSCW)等。
7.应用和服务。应用范围包括电子商务、电子政务、在线教育、在线学习、在线保健、在线娱乐、在线金融等。服务范围包括网络接入商(IAP)、网络服务商 (ISP)、网络内容商 (ICP)、应用服务商 (ASP)、网络培训商 (ITP)、系统集成商(SI)、网络咨询等。
8.技术应用。包括技术对情报学发展的影响;信息数字化、全文检索、搜索引擎、多媒体内容检索、自动标引、自动翻译、自动摘要、数据挖掘、文本挖掘、信息提取等信息内容技术;计算机与网络技术支持的知识内容加工和知识吸收、转换等;数字图书馆技术。
9.信息教育与人才培养。包括数字鸿沟、计算机文明、信息技能、专业结构、人才素质、教育制度、在职培训、继续教育、网络教育、网络学习等课题。
四、情报学研究方法
1.社会调查法。情报调查法是指人们在社会情报实践活动中对客观情报情况的调查了解与分析研究方法,是搜索、跟踪、获取和开发利用情报资源的一种基本的、有效的方法。这种方法又可分作直接方法与间接方法两大类,前者主要是用现场观察法,后者又分作访问调查与调查表调查。
2.引文分析法。研究文献的被使用和被引用,也就是研究质量问题。自20世纪60年代初以来,由于“科学引文索引”(SCI)的创办,引文分析法已成为一个有相当深度和广度的情报学分支。对引文这一线索进行研究,可以了解某项发明或技术的应用范围、现状、著作水平、学科发展趋势等。
3.系统科学方法。从系统论、控制论和信息论出发,主要研究科技情报系统的结构、功能和最优设计,以及解决科技情报系统的最佳运行、实现最优服务等问题。
4.文献计量法。文献计量是情报学与数学、统计学等相互交叉和结合而产生的研究方法。在文献计量研究方法中,布拉德福定律、洛特卡定律、齐夫定律、引文规律、文献老化规律、文献增长与冗余等已形成理论体系。文献计量法开始向其它学科输出、扩散、渗透,利用文献计量统计方法,可以描述和解释许多分布机制相似的社会现象,如收入分布、利润分布、人口分布、通信间隔分布等。
5.科学计量法。科学计量法试图通过定量方法寻找科学活动的内在规律和准规律,并为更有效率地开展科研提供指导。20世纪60年代初,D·普赖斯等人倡导并采用定量方法来研究科学自身,E·加菲尔德创建了“SCI”大型数据库,是为科学计量学的肇端。30多年来,许多情报学研究人员在该领域作出了许多重要成果,此外社会学和政策研究人员也投入到这一新领域的研究,使其研究对象不断增加、研究领域不断拓展——科学研究的生产率问题、科研资金投入的最优化、预测学科发展趋势、识别不同学科之间以至科学活动同技术活动之间的联系、科研绩效评估、描述科学活动规律和准规律、研究科技人才和科技教育问题等等,形成蔚为大观之势。
6.信息计量法。1988年,英国情报学家布鲁克斯和他的学生埃格希(L·Egghe)主张用信息计量学代替文献计量学,提出了如下信息计量的发展逻辑过程:书目统计学→文献计量学→科学计量学→信息计量学。信息计量学的提出表明情报学定量化研究已由文献单元深入到文献中的各个信息单元、知识单元;已由文献计量分析发展到信息计量分析,而达到了一个新的高度,最终将真正实现“知识信息的计量必须从语法层次向语义和语用层次发展”的这一飞跃。
7.网络计量法。1997年,Almind和Ingwersen首次提出网络环境下引文分析的概念和“网络计量学”(Webometrics),将传统信息计量方法应用在Web分析上,对诸如语言、单词、词汇、频次、作者特征、作者合作的能力和程度,以及对作者的引文分析,学科或数据库增长的测量,新概念、新定义的增长,信息的测量,检索措施的形式与特征进行了研究。网络计量法可用于研究因特网的知识结构、学科性质、信息组织特征, 研究网络环境下的科学信息交流规律,探讨学科、机构、国家、地区的科学发展趋势,研究网络用户的信息需求和网络查寻行为,指导网络建设和网站管理。
8.基于文献的知识发现法。由于科技文献和知识的爆炸增长,科学分工越来越细,跨学科的信息传递变得更加困难,知识也随之产生分裂,并且随着知识的持续增长,分裂现象将会更加严重。尽管现代每个人懂得的东西越来越多,但是必定有许多未被人们发现的知识点、知识领域之间的相互联系。假设某学科发现医学状况A与症状B相联系,另一个完全不同的学科发现某营养成分缺乏C与症状B相联系,则A与C也发生了关系。但是两个完全不同领域的学科隔行如隔山,A与C的联系则长期蛰伏着,未被发现。1986年,美国芝加哥大学情报学专家K·Swanson博士创立了基于文献的知识发现法,并开发了Arrowsmith系统。
五、情报学前沿领域
情报学将通过与不同学科的碰撞交叉而产生前沿研究领域,不断丰富它的内涵和扩大研究范围。据有关研究,前沿领域有:
1.“数据库知识发现”研究
数据库知识发现(Knowledge Discovery in Databases,缩写KDD)是目前十分活跃的跨学科研究领域,情报学家利用“基于文献的知识发现法”,开发出各种软件系统,揭示数据库中不同领域知识的联系和问题的答案,找到了知识发现的新途径。
2.语义网研究
语义网实际上是一种智能网络技术,能理解人类语言,并能推理,不仅可以理解词和概念的涵义,而且还能理出其间的逻辑关系。语义网技术一夜之间得出的组合方式将比一个人穷尽一辈子心力想得到的还要多,有助于人们提高自身的直觉和分析能力,促进全球范围内不同文化背景的人们之间合作。现在,语义网越来越为世界所关注,它也将是情报学大有作为的领域。这方面的研究项目有:面向自然语言处理的语法、语义计算机模式的研究,潜在的语义索引,复合词的分析模型研究,自动构成多语种词库,存取多语种信息,用户自适应集合分类法研究,知识共生现象研究,网络知识搜寻代理等。
3.3G(Great Global Grid)研究
欧洲各国正在投入大量人力、物力研究3G技术,主要目的是将各种网络信息资源连接起来,像今天的电力网格一样,方便地送到每个用户那里。目前在因特网上,信息资源分散在各个网络站点,将来可以通过网格技术,在世界范围内对用户提供各种一体化的信息服务基础设施,也就是将分布于全世界的计算机、数据、信息、知识等组织成一个逻辑整体,用户可通过网格门户透明地使用整个网格资源。其核心技术包括:信息优化使用技术,网格资源管理技术,网格中的作业调度技术,网格安全技术。
4.信息构建(Information Architecture)
美国建筑师Richard.S.Wurman于1976年在美国建筑师协会年会上首次提出IA的概念。1989年,他在《信息悬念》(Information Anxiety)一书中对IA的定义是:如何组织信息,把复杂的信息变为明晰,以帮助人们有效地实现其信息需求。随着因特网的发展,IA的理念和应用获得了迅速的发展,特别是在情报学界和信息管理学界。IA是把传统图书馆学、情报学同现代科学技术结合,组织信息和构建信息环境,以满足用户信息需求的一门科学和艺术,已引起国际情报学界重视和关注,成为情报学的核心问题,并把它的理念合理地运用到情报学研究领域上来。
5.知识管理研究
知识管理不仅包括对知识本身的管理,还包括对知识有关的各种有形资源和无形资源的管理,涉及知识组织、知识设施、知识资产、知识活动、知识人员等全方位、全过程的管理。目前的研究热点在于:知识组织、知识链、知识发现、自然语言理解、知识管理工具、知识转换模式和4力场(4Ba's)研究、实践社区、最佳实践库、智能代理、知识网络化研究等。
6.数字图书馆研究
数字图书馆正引发一场全球范围内的文化媒介迁移运动。图书馆、博物馆、档案馆等一些文化机构将进入经济开发的中心地带,传统文化资源将被开发成经济资源,导致一个国家的文化生态根本上发生变化。数字图书馆需要跨行业、跨学科、跨地区、跨国界的合作,共同解决技术问题、管理问题、运营问题和法律问题等,不同学科将从不同领域对发展数字图书馆作出贡献。情报学的理论、方法、技术是建设数字图书馆的重要支柱,同时情报学也将吸收数字图书馆集成的各个学科的养分进一步实现现代化。
7.信息技术应用
技术方面前沿课题很多,包括:元数据技术、语料库技术、海量信息存储与压缩技术、信息可视化技术、图像检索技术、语言检索技术、人机界面技术、多语言浏览器、跨语言信息检索、自然语言理解、人工智能、大规模真实文本处理、自动抽词、自动索引、自动分类、自动文摘、概念分类(Ontology)、信息安全和保护技术等。当前要着重内容和知识开发利用的新技术和新应用的研究和探索以及实现这些技术和应用不可或缺的基础研究、基础建设和标准规范的采用。
8.小世界现象
从很大的人口中任意挑出两个人,这两个人彼此认识的概率有多大?任意挑出的两个人当中要达到彼此认识的最短链条是多长?1967年,哈佛大学社会心理学家斯坦利·米尔格拉姆(Stanley Milgram)作了一个实验。他给内布拉斯加州奥马哈市随意选择的300多人发信,要求他们把他的这封信寄到波士顿市一个独一无二的“目标”人,分别由每个人独自联系。米尔格拉姆告诉每个发信人有关目标人的信息,包括姓名、所在地、职业,如果发信人不认识这个目标人,他们把这封信寄给他们认为与目标人比较近的,而且是他们认识的一个人。于是形成了发信人的链条,链上的每个成员都力图把这封信寄给他们的朋友、家庭成员、商业同事或偶然熟人,以便很快到达目标人。米尔格拉姆发现,有60个链条最终到达目标人,链条中平均步骤大约为6,这个结果说成“六度分离”(Six degrees of separation)而广为传播。“六度分离”在学术上称为“小世界现象”或“小世界问题”。近年来,小世界现象引起了数学家、情报学家、物理学家、计算科学家、行为科学家、数理经济学家的广泛兴趣,并对其进行了深入研究,展现出广阔的应用领域。现在,我们生活在一个网络的世界中,互联网上的信息传播是我们情报学的重要研究课题,而且统计表明,尽管互联网上信息数以亿计,但网络的特征路径长度L最多达到19,因此互联网连接具有小世界现象。可以运用小世界网络理论来改善Internet中的信息流。“小世界现象”对于情报工作者如何快捷、准确获取网上信息提供新思路。