检索那些事儿

// 因为是作业之一,所以留个作者
// @Author 龚涛-201731061426
// @School 西南石油大学-计算机科学学院

题外话

最近在线上修习《文献检索与利用》这门课,可能很多小伙伴和我一样,听着名字,感觉含简单,不就教我们是怎么查资料嘛,这年头谁不会百度和google啊(嘿嘿,可能还真有很多没用过Google),自己一开始也是这样浅显的认为:“我们学计算机的,面向搜索引擎编程,天天干些检索的事儿,没几句代码是自己创作的,所以文献检索嘛,应该挺简单的,还用学?”,不知道有多少同学和我一样的感jio。然而事实并非这样,《文献检索与利用》这门课重点就三个keyword:文献、检索、利用。通过前两周的学习,才真正认识了文献的概念、范畴、分类,还了解了文献引用规则、信息素养等知识,真是一门学问,从那后就觉得这门课还真得认真学学,本周学到第二个重点:检索,对于检索这项技术,自己还是小有体会,毕竟平时干了那么多,所以借着同学之间互相交流的机会,和大家一起讨论讨论——检索那些事儿。

检索和检索工具

检索

在我们的脑海中,可能大多数同学都觉得“检索”,其实就是搜索信息,意思虽然大差不差,不过还是真正认识一下什么是检索:

检索:与搜索近义,指从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出相关信息。
基本解释:检查索取所需要的文字或资料

检索工具

很明显,检索工具就是我们在检索过程中需要使用的设备或者工具,检索工具涵盖的范围很广,其按照不同的标准(设备、信息载体形态、收录范围、时间、编制)可以分不同的类别,百科定义:

检索工具是用于报道、存储和查找文献线索的工具和设备的总称。图书馆目录、期刊索引、电子计算机检索用的文献数据库等等都是检索工具。它具有报道文献、存储文献、检索文献三大基本功能。其类型有手工检索工具和机械检索工具两种。手工检索工具指目录、索引、文摘等印刷型的二次文献。机械检索工具是指电子计算机情报检索系统的技术设备而言。

检索分类

百科中对检索进行了分类,可分为:传统文献检索和网络检索。

  • 传统文献检索:传统文献检索经常使用到的工具是索引卡片,即将文献资料的信息记录在索引卡片上。索引卡片上一般会记载文献的题名、作者、主题词、摘要等信息。
    在查找文献资料时,先要去查找索引,找到其馆藏位置,然后索取资料。
  • 网络检索:如今的网络时代,互联网资源丰富,很多资料我们都可以从Internet获取,但这需要是用一定的方式去查询,即检索,在因特网上进行检索主要有两种方式:目录浏览和使用搜索引擎

我们平常接触最多的就是计算机检索工具,使用最多的检索方式就是目录浏览搜索引擎了,接下来谈谈我对这两种检索方式的看法,以及分享一些高级的检索技巧。

目录浏览

目录浏览的方式即雅虎搜索引擎采用的方式,用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强。
可能有的小伙伴说,我没用过雅虎,所以不太了解这个目录浏览,其实很简单,每个同学都用过这种检索方式:
1、平时我们使用电脑的时候,系统的文件系统结构其实就是一个目录结构,我们找文件的时候,其实就是一个目录浏览模式,先找到根目录,然后进入相应的子目录,层层递归,最终可以找到我们想要的文件。
检索那些事儿_第1张图片
2、再来举个完整的例子,包含目录浏览和搜索引擎两种方式并用,以查找我们需要的信息:
假设我们想在互联网上找一个开源项目,并且希望在线阅读开源代码的实现逻辑,我们应该怎么去找?
第一步就是在计算机中使用浏览器打开一个搜索引擎,通过搜索引擎找到我们想要查看的开源项目,这一步我们在后面详述;
假设现在已经在Github上找到了一个项目,结构式这样的:
检索那些事儿_第2张图片
我们可以看到,通过搜索引擎的指点,我们来到了这个页面,看到了project structure,但是并没有看到我们想要的代码呀(最喜欢看代码了),这是我们很显然看到是一个目录结构,我们可以通过目录浏览(索引)进入源代码界面,其实就是/src/main/java/...,找到我们想要的.java结尾的文件就看到了:
检索那些事儿_第3张图片

Ps:用过github的小伙伴可能会有疑惑,为什么我的左侧有导航?哈哈,其实这是一个插件,感兴趣可以去试试哦,我们通过插件就可以建立这种目录浏览式结构,方便切换。也算是一种检索能力噢

搜索引擎

哈哈,搜索引擎大家肯定都很熟悉,QQ群里很多同学都讨论说,百度、谷歌、必应等等,没错,这些都是我们平时经常接触到的,用的最多的就是百度了吧,我自己也是,一个爱写代码的孩子,面向百度编程,大一的时候,不太会用百度(看了后文你可能觉得你现在也不会用噢),一个bug就要百度一上午,效率真是太低了,后来发现因为没有真正了解过搜索引擎,所以还是来学习一下:

所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。

既然搜索引擎用了这么多技术,那她提供的功能不可能那么单纯,如果仅仅是输入一个关键字,然后百度,那不就是个模糊查询嘛,那也太简单了,说到这里,相信很多小伙伴对搜索引擎的使用都仅限于关键字模糊查询,而且还会有一大堆广告,下面分享一下奇妙又好用的搜索引擎检索技巧,以百度为例,其实不止百度,很多搜索引擎也支持,可能语法不同而已,大同小异嘛。

1、首先来个常规搜索:在百度搜索“码之泪殇”:
这样百度会例举出所有的与“码之泪殇”关键字相关的网页
检索那些事儿_第4张图片
2、下面我们想找的网页:要求既包含“码之泪殇”,又包含“csdn”,我们可以用与运算,运算符为空格,即在百度输入“码之泪殇 csdn”:
检索那些事儿_第5张图片
3、举一反三,搜索“码之泪殇”,不含csdn,则:码之泪殇 -csdn:
检索那些事儿_第6张图片
4、指定网站搜索:关键字 site:网址
检索那些事儿_第7张图片
5、intitle,搜索出标题包含这个内容的内容。

intext,搜索出文本里包含这个内容的内容。

inurl,搜索出网址里包含这个内容的内容。
检索那些事儿_第8张图片
6、filetype-专业文档搜索
filetype加上冒号,后面跟上文档格式,可以搜索特定的文档。例如:Java开发 filetype:pdf
检索那些事儿_第9张图片
等等,其实还有很多,有兴趣的小伙伴自行探索,接下来演示刚刚上面那个问题,怎么通过搜索引擎找到感兴趣的开源项目:
1、其实针对开源项目,我们常用的搜索网站就是github了,基本上的全球的开源项目都会在这里有,所以记住一些专门的网站去找想要的东西,远比直接在百度搜索效率更高。我们进入github:https://github.com
2、检索:in:description 失物招领 language:java user:gongsir0630,很显然github也支持这种高级检索:
检索那些事儿_第10张图片
这样我们就找到了刚刚的项目,好了,以上是个人平时掌握的一些搜索技巧,学会这些,改bug的效率提升确实不少,一起学学吧!

常用的文献检索工具

中国知网(CNKI)

采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的"CNKI数字图书馆",并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。

提供以下检索服务:文献检索、数字检索、翻译助手、图形搜索

维普科技期刊

站陆续建立了与谷歌学术搜索频道、百度文库、百度百科的战略合作关系。网站目前遥遥领先数字出版行业发展水平,数次名列中国出版业网站百强,并在中国图书馆业、情报业网站排名中名列前茅。经过多年的商业运营,维普网已经成为全球著名的中文专业信息服务网站,以及中国最大的综合性文献服务网站。

检索服务:分类检索

万方数据库

和中国知网齐名的中国专业的学术数据库。其开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。

检索服务:浏览格式检索、专项信息检索、自由检索

你可能感兴趣的:(工具,搜索引擎,百度)