目录
关于检索
检索策略
搜索内容的途径
修饰检索词
检索式
检索举例
参考文献
关于检索
使用正确的检索工具,是后续检索成功的一半。
对于大量有用信息的检索限制之一就是权限。权限使自己远离了大量信息。
检索策略
1、五步检索策略:这七个步骤与加州伯克利分校图书馆检索教程上提出的五步检索步骤大致相同,这个五步骤是:分析(分析检索主题);选择(选择合适的网络检索工具);调整(调整检索词或检索式);放弃(放弃没有效果的检索途径);重试(经过多次的调整后重新尝试检索策略)。
2、基于本体的检索策略,即a.首先选择适合的检索工具,全面了解所用检索系统的特点及功能;b.确定检索词的使用;c.构造检索提问表达式;d.对检索结果的排序处理;e.了解所要检索的信息是何种机构所提供的;f.合理利用基于本体的检索策略,充分发挥本体检索的潜能;g.边学习边检索,在检索中学习。
3、从保证查全率和查准率的角度来考虑的话,设计检索策略应该包括选择检索工具、选择检索途径、确定检索词、建立检索式、评估与调整检索结果这五个基本环节。
搜索内容的途径
搜索一个内容的途径至少有几种:从文章主题提取的关键词;从写这文章的人;分类号;出版社或刊登位置,地址,邮编,号码,机构名,基金。
手工搜索,直接询问知道这信息的职能单位。
关键词搜索的局限性:不能找到真正准确的词语以及过多非专业词语的运用。
关键词替代:搜索时应注意是否有同义近义关键词替代或者是否有相关的关键词可供选择。
如何解决关键词不准确现象:在检索口处寻找可供使用的规范化关键词。
除了通过网络搜索外,还可以直接访问信息源提供者,其次充分利用网络进行求助,发个帖子几分钟可以得到满意的结果。或者询问专业者得到更好的搜索途径和方法。再次是利用E-MAIL直接向信息提供者问询。
功在平时:平时多留意一些质量高的网站。或者参加一些如何使用搜索的培训课。
常用的综合性中英文搜索引擎主要有中文雅虎(http//cn yahoo com)、网易(http//www 163 com)、新浪《hEp://www sina corn》、Alta vfs[a(hEp//wwwaItavista com)、Infoseek(http//www infoseek corn)等,适合经济信息的广泛搜索。
如要查找”数据挖掘在企业管理中应用”的课题.可选择”数据挖掘”、”企业管理”作关键词,布尔逻辑检索表达式为:“数据挖掘and企业管理”。要查“网络营销的理论和模式“的文献.布尔逻辑检索表达式为”网络营销and(理论or模式)”。
如要查找一些相关度较大的经济信息。可使用网站目录逐级分类查找。
以经济为例,作者进行的经济方面分类网站有:综合性经济信息网站;地区性经济信息网站;行业性经济信息网站(纺织信息、经贸信息、企业信息、金融咨询)中国价格信息网(http://www cpic:-govcn)、中国纺织经济信息网{http.//www
cteigovcn)、中国经贸信息网(http://wwwchinadatabank comcn)、中国企业信息网(http://www、cen.corn cn)、中国金融咨讯网(http://wwwhomeway cnnet)等行业网站,均系经济领域的重要信息源。
修饰检索词
1、不仅仅是题面的拆分。认真分析出检索题中的检索词。
2、增加隐含概念。比如“垃圾处理”这个题目中,在“处理”这个检索概念上,就要考虑增加“再生”、“回收”、“循环”等字面后隐藏的同义词。因此检索式可依据具体要求作出灵活的调整。
3、排除重复或者不必要的概念,列出检索式。
4、对于有词表的数据库。注意摆正规范词与自由关键词的关系。优先使用规范词,再根据查询情况,适度调整自己掌握的关键词。
5、中英文翻译时不一定都能按字面对译。比如“网络资源”一词,很多人在检索外文数据库时就选择Net Resources。其实,对于网络资源这个概念,Intemet,World Wideweb,Web Resources,Networked Resources,Network— basedR ecources。Virtual Resources,Online Resources等都可以用来检索这个概念。
6、对于有代码的检索途径,一定要使用准确的代码。
7、词相应位置进行截断或省略处理对于英文词尾的规则性变换,或i司形的变化,恰当地用截断检索也是建立检索式时需要充分考虑的策略之一。
检索式:好的检索式不是一步到位的,而是要不断调试的。检索结果不能单以几个关键词搜索结果合成而成。而应该运用逻辑关系合并成一个完整的式子。
评估与调整检索结果:如果检索结果项过多,可能能是选取的主题词的概念范畴太广,需用NOT限制或用下位词;因检索的范围太宽,需要选用进一步限制的概念用逻辑“与”组配后进行检索;除了前文提及的补充一些同义词或近义词外,还可以利用多字段检索,如同时使用题名、关键词和文摘等字段进行检索,然后将它们进行逻辑或(or运算)的组配,这样可以有效地提高查全率。
具体操作为:要求学生从实践环节开始选定一个课题,围绕其选题,检索并下载大量原始文献,经过阅读分析后,撰写专题综述,从掌握的文献信息内容,总结该课题目前的研究现状与发展趋势。同时对综述提出严格的要求,如要求内容3000—4000字,撰写摘要,并提取3—5个关键词;附5篇以上的参考文献,参考文献采用国家标准著录格式,引用的参考文献在综述正文中以上标的形式标出;然后将综述题名、摘要和关键词翻译成英文等;鼓励学生将综述向本学科的专业期刊投稿。《大学图书情报学刊》
检索举例
例题:国内地表水体污染防治方面的研究论文
这是环境保护领域的一个专题研究。希望能了解一下国内到目前为止在地表水体方面所公开的研究论文的情况。于是,用户选用国内的《中文科技期刊全文数据库》,但操作者却未能得到满意的检索结果。尽管多次调整检索词,如在篇名与关键词字段中仅输入“地表水”这一个检索词。不加任何“与”(and)运算,也只能检索到百余篇文章的线索,这与我国这一主题研究的实况,或者说与预期的检索结果相距甚远。
这是一个典型的检索途径的错误。“地表水”是一个在层层隶属的等级体系上的族首概念,是一个族性检索的查找需求,因为在等级体系中的“地表水体”这个上位概念下可以包容除了地下水之外的任何水体,包括任何河流,湖泊或水库这些下位概念,如太湖、巢湖,秦淮河、富春江、十三陵水库等。等级体系只能在分类语言中得到正确的反映。而篇名、关键词、摘要,甚至全文字段提供的都是特性检索的途径,反映的是主题语言的特征。用户在篇名等主题体系的字段中输入检索词“地表水”,只能检索出那些在相应的字段中出现“地表水”的文章,而那些原本在分类体系中处于“地表水”的下位类的任何概念都不能在主题语言的检索字段中被检索出来,除非用户将这些特性检索词,如太湖、巢湖、秦淮河、富春江、十三陵水库等都一一输入到检索要求中,但这却是不胜枚举的,检索者无法穷尽地将这些具体的地表水体名称列举到检索式中去。
解决这一问题,只要选择分类检索途径,如在《中文科技期刊全文数据库》中,可以选择“分类检索”模块,在“环境”大类“X”下,环境——环境污染及其防治——水体污染及其防治——河流,湖泊,水库,于是得到有关地下水污染及其防治的分类号,直接检索得到有关的检索结果5干余篇,其查全与查准同时满足要求。也可利用该数据库的“中图分类号”字段,将有关地表水污染与防治
的分类号X522和X524建立成检索式“X522+X524”(其中符号+是“或”运算的含义)输入到该检索字段,同样可以得到满意的检索结果。
国内的科学研究比较注重从总体出发去讨论问题,因此,在实际的信息收集的工作中,与本题相似的检索要求比比皆是,于是,从族首概念出发,在等级体系的上位类的角度收集文献信息要求的几率就会很高,不容轻视。近年来国内有些大型的数据库在更新升级的过程中反而取消了分类检索的途径,让人不免产生遗憾之感。
除了前文涉及的分类与主题两类不同的检索途径外,普通的检索工具一般还提供一些我们常用的枪索途径,如作者、作者单位、刊名、年代等,可以让检索者通过有关的人物、机构、出版物等角度检索出相关的信息。专门的检索工具如专利、标准、科技报告等,会有专门的号码途径。有时检索工具还提供一些专门的检索途径,如国内一些期刊数据库提供“基金”途径,可以让我们从受资助项目的角度查找到有关的研究成果。国外有些商务信息的数据库提供了从行业分类的角度,从股票代号的角度,从公司代号的角度等来查找有关机构、有关行业的信息,这些专门的途径对于某些特定信息的查全查准有着非常重要的意义。
总的来说,检索途径好比日常生活中的道路,有时可以殊途同归,有时也会“自古华山一条道”,有时有捷径,有时又需要借道迂回,走对了道对到达目的地有着十分重要的作用。
参考文献
[1]. 赵刚, 网络环境下信息检索研究. 内蒙古科技与经济, 2010(12): 第130+132页.
[2]. 吕传宇, 李华与耿虎, 一种适合于专题式元搜索引擎的信息检索策略. 重庆大学学报(自然科学版), 2004(07): 第90-93+130页.
[3]. 王征清与成全, 信息检索策略研究. 情报探索, 2007(04): 第61-64页.
[4]. 华薇娜, 网络信息检索策略的设计与实施的探讨——基于网络数据库信息检索各环节的实例分析. 图书馆论坛, 2008(06): 第111-114+178页.
[5]. 尹怀琼, 浅谈信息检索策略. 贵图学刊, 2000(04): 第28-29页.
[6]. 刘继昌, Internet信息检索策略. 计算机时代, 1998(01): 第31-33页.