文献管理与信息分析笔记之十大信息源

文章目录

  • 1 背景
  • 2 信息源分类
    • 2.1 专利
      • 2.1.1 检索方式
        • 2.1.1.1 中国专利检索
        • 2.1.1.2 外国专利检索
    • 2.2 会议文献
      • 2.2.1 检索方式
    • 2.3 期刊
      • 2.3.1 影响因子的计算
      • 2.3.2 国内常用的核心期刊标准
    • 2.4 科技报告
    • 2.5 学位论文
    • 2.6 科技档案
    • 2.7 图书
    • 2.8 产品资料
      • 2.8.1 获取方式
    • 2.9 标准
    • 2.10 政府出版物
  • 3 其他搜索方式
    • 3.1 综合搜索
    • 3.2 引文搜索
  • 4 总结
  • 5 参考

1 背景

在听罗老师的课程之前,让我对新的方向或课题进行调研是一个非常大的挑战。除了去谷歌学术和知网搜索相关的文献外,我不知道还能从哪儿去查到更多的的信息。我很庆幸上个月我在中国大学MOOC平台上看到了罗老师的国家精品课程——《文献管理与信息分析》。罗老师系统的讲述了文献了管理和信息分析的思路和工具,虽然目前学习进度还不到一半,但收获颇多。罗老师的课程中讲述了传统十大信息源,当然还有博客、微博、公众号等更新型方式和传播更迅速的方式。下面我将按照自己的对课程内容的理解讲述这十大信息源,作为课程同容的回顾和整理。

2 信息源分类

罗老师的课程里面讲述了10大信息源。这十大信息源分别是专利、会议文献、期刊、科技报告、学位论文、科技档案、图书、产品资料、标准和政府出版物。下图展示了这10个信息源,信息源从左到右时效性依次递减,其中专利、会议文献的时效性最高,政府出版物的时效性最差。

文献管理与信息分析笔记之十大信息源_第1张图片

为什么专利会议期刊的时间就会比较高呢?这是因为他们的发表周期相较于后面的几种信息源来说的话比较短。虽然专利有那个18个月的专利保护期,但是却可以申请提前公示以尽早拿到专利权。一部分比较水的专利会为么做。如果想法没有很强的实用性,一般会选择发表会议论文,会议论文发表周期相比期刊要短很多,所以说专利和会议文献时效性比较强,有利于了解领域最新的科研方向。期刊对论文的要求比较高,一般需要有一个比较完备系统性整理,发表周期从三个月到两年不等。科技报告内容是多种多样的,几乎会涉及到整个科研领域,部分报告可能都会有一定的保密性,控制范围比较严格。如果科技报告中包含了在期刊发表的工作,通常科技报告会比期刊提前一年左右的时间。当一个方向有比较多的研究的时候,这些方向便会出现在学位论文的选题中,学位论文完成后便会被档案馆收藏。当研究进一步增多时,有人便会对这些研究进行系统性的整理后写成书。一旦有书面市,说明这个方向已趋于成熟,各大公司便会尝试将其进行产品化。随着这个方向的产品越来越多,性能,质量可能会参差不齐,为了规范产品,标准便应运而生。为了进一步支持或是规范行业市场,政府会陆续出台相关的政策。以上便是各类信息源的时效性上大致的区别,下面将介绍这十大信息源的特点和查询方法。

2.1 专利

专利说白了就是公开自己的想法,以寻求法律对自己想法的保护。从国家层面上讲,这样也有利于资源整合,防止资源的浪费。专利的有效期是20年,20年后便变成公众所有,不再被保护。专利具有新颖性、创造性且实用性比较强的特点。一切与专利制度有关的各种专利文件都可以称为专利,具体包括专利说明书、专利局公报、专利文摘、专利分类与检索工具书、申请专利时提交的各种文件、与专利有关的法律文件和诉讼资料等。由于专利制度中存在优先权原则,发明人往往在发明完成的第一时间里提出专利的申请,90%~95%的发明创造会很快地出现在专利文献中。一般80%以上的专利呢不再以其它形式(论文、会议等)发表。

2.1.1 检索方式

2.1.1.1 中国专利检索

  • 国家知识产权局专利检索数据库
  • 中国知识产权网中外专利数据库服务平台: 可以检索多国专利,提供检索结果分析
  • 可检索专利的全文数据库:CNKI、万方
  • 搜索引擎:百度、SooPat

2.1.1.2 外国专利检索

免费的外国专利检索,可以在各国的知识产权网里面进行。通常用到的一些检索网站如下:

  • 美国专利检索
  • 欧洲专利检索
  • 世界知识产权组织(WIPO)专利检索
  • SooPat
  • 商业专利数据库: 德温特专利数据库(同类专利做了整合,能减少专利阅读量)
  • 谷歌专利搜索

2.2 会议文献

各类学术会议上形成的资料和出版物,包括会议论文、会议文件、会议报告、讨论稿等统称为会议文献。会议注重学术交流,具有信息传递及时、内容新颖、实效性和原创性都比较强的特点。大多数的会议都会经过同行评议或者审稿,具有一定的质量,但也要注意筛选出比较水的会议。会议文献的出版形式多样,涉及到的专业内容集中、针对性很强,有利于了解专业领域的最新研究方向。会议文献各阶段的材料如下图所示。

2.2.1 检索方式

  • ACM Digital Library: 美国计算机协会(Association for Computing Machinery)的会议录全文
  • IEEE/IEE Electronic Library(IEL): 美国电气电子工程师学会(IEEE)和英国电气工程师学会(IEE)出版的会议录全文
  • ISI Proceedings: 世界上最新出版的会议录资料,包括专著、丛书、预印本以及来源于期刊的会议论文,提供了综合全面、多学科的会议论文资料。可以看到论文的题录和文章
  • 中国学术会议论文(1998-)万方: 国家级学会、协会、研究会组织召开的全国性学术会议论文全文
  • 中国重要会议论文全文数据库(CPCD):中国期刊网的会议论文全文书收录了1998年以来我国300个一级学会、协会和相当的学术机构或团体主持召开的国际性和全国性会议的会议,论文全文
  • SPIE Digital Library: 国际光学工程学会(SPIE)的所有的会议录全文。

2.3 期刊

期刊是一种以印刷形式或其他形式逐次进行的,并打算无限期连续出版下去的出版物。期刊具有内容新颖、及时、广泛,但不如图书成熟、成系统的特点。相比于图书,期刊出版周期短、速度快,它们出版周期从三个月到两年不等。期刊数量多、发行面广、连续性也很强,通常都会随着相应的学科领域发展和前进。
期刊主要用于学习专业知识,了解某学科的动态。当作学术研究时,用于了解自己课题相关的研究状况和查找必要的参考文献。

2.3.1 影响因子的计算

影响因子是指杂志的影响力,不是某篇文章的。那么影响因子怎么计算呢?

假设某杂志前两年发表的论文数为 p 1 p_{1} p1 p 2 p_{2} p2,这些文章在第三年的总引次数为 q q q, 那么影响因子为 q p 1 + p 2 \frac{q}{p_{1} + p_{2}} p1+p2q
比如: 某杂志2016年发表100篇论文,2017年发表120篇论文,这些论文在2018年共被引用了1760次。
该期刊的影响因子= 1760 100 + 120 = 8 \frac{1760}{100+120} = 8 100+1201760=8
现在说的期刊的影响因子多指Web of Science网站上给出的值

2.3.2 国内常用的核心期刊标准

  • 中国科学引文数据库(CSCD)
  • 中国社会科学引文索引(CSSCI)
  • 北大核心期刊目录: 不在网上公布,需要线上购买
  • 专业核心期刊目录: 各专业不一样, 如计算机专业可参考CCF出的中国计算机学会推荐国际学术会议和期刊目录
  • 科学引文索引(SCI)
  • 工程索引(EI)
  • LetPub查询: 可查询SCI刊物JCR, 中科院分区,影响因子等
  • 中国科学院文献情报中心期刊分区表: 可查询SCI刊物的中科院分区
  • justscience: 可查询SCI刊物JCR分区,中科院分区,影响因子等

2.4 科技报告

科技报告是由科技人员按照有关规定和格式撰写,以积累、传播和交流为目的,能够完整而真实的反映其所从事科研活动的技术内容和经验的特种文献。科技报告反映新的科研成果非常快,以科技报告念科研成果上面发表一般要早一年左右,部分在科学报告中反映的科研成果不会在期刊上发表。科技报告内容多种多样,它几乎涉及到了整个科学领域、技术领域等领域。它可能具有一定的保密性,因为它通常与政府的研究活动、高新技术有关,使用范围控制也比较严格。

科技报告按研究阶段可分为下面几类

  • 研究过程中的报告
    • 现状报告
    • 预备报告
    • 中间报告
    • 进展报告
  • 研究工作结束里的报告
    • 终结报告
    • 试验结果报告
    • 峻工报告

科技报告按文献形式可分为下面几类

  • 报告书: 一种比较正式的文件
  • 札记: 研究中的临时记录或小结
  • 论文: 准备在学术会议上或期刊上发表的报告
  • 备忘录: 供同一专业或同一机构中的少数人沟通信息用的资料
  • 通报: 对外公布的、内容较为成熟的摘要性文件
  • 技术译文

美国是科技报告管理制度最完善的国家,明确规定政府投入超过2.5万美元以上的项目都要提交科技报告。美国政府科技报告包括国防部AD报告、商务部PB报告、航空航天局NASA报告和能源部DE报告四大体系,每年约产生60万份科技报告,其中公开发行6万多份,占全世界科技报告总量的80%以上。

中国1984年启动国防科技报告体系建设,2000年进入规范化管理,至今共收入13万份科技报告。资助项目或已经结题的项目的科技报告可从下面的途径查询

  • 国家科技报告服务系统: 需要注册,对于科研人员免费
  • 查询自然科学基金资助项目情况
    • 科学网: 推荐
    • 国家科学基金共享服务网
    • LetPub
    • 基金委官方网站
    • MedSci梅斯: 需要注册
  • 海研全球科研项目数据库: 收录了全球主要国家资助的项目但分析能力比较弱
    做学术研究是了解自己课题相关的研究状况,查找必要的参考文献,研究尖端科学或某学科的最新课程可以选择科学报告。科学报告有利于系统的了解一个方向,但相较于前面几种信息源来说它的时效性比较差,因为它有一个比较长的保密期。

2.5 学位论文

高等院校科研机构的毕业生为申请学位而撰写和提交的学术论文。一般学士学位论文需要完成一项有意义的工作,硕士学位论文则需对某一课题发表独到的见解,博士学位论文需要有系统的创作性成果。

学术论文写选题先验理论性系统性较强,阐述也比较详细。它记录了人类大量的科研成果,参考文献多全面有助于对相关文献进行追踪检索。学位论文一般不会公开出版,需要图书馆购买,对了解实验室前期工作非常重要。学位论文的收藏机构是档案馆,电子版提交到图书馆,学术不端检测由研究生院完成。一般只有很牛的学位论文才会进行公开发表。

学位论文可以从以下两个数据库进行查找:

  • 万方中国学位论文全文数据库
  • 中国知网: 中国优秀博硕士学位论文全文数据库

2.6 科技档案

科技档案是指在科学技术研究和生产建设部门在相关活动中形成的,有具体事务对象的技术文件,图纸,图表,照片和原始记录等的总称。科技档案一般为内部使用,不会公开发表,部分可能还有密级限制,一般存于各级档案馆。科技档案具有全面性,综合性和系统性的特点,同时又兼具历史查考凭证作用。科技档案质量的核心是完整、准确、系统。它通常是成套的。

科技档案一般需要从各级档案局或者档案馆进行查询。

2.7 图书

由出版社或者出版商出版的,不包括封面和封底在内49页以上的印刷品,具有特定的书名和著者名,编有国际标准书号,有定价并取得版权保护的出版物。图书的内容比较系统全面成熟可靠,但是它的出版周期较长,报道速度相对来说较慢。通过它可以系统的学习某方面的知识,了解某知识领域的概要或者查找某一具体问题的答案。

2.8 产品资料

产品资料一般是厂商为宣传和推销产品而免费赠与消费者的出版物,大多对定型的产品的性能、构造原理、用途、使用方法、操作规程、产品规格,所做的具体说明。因为产品需要考虑各种各样的情况,所以通常情况下来自产品中的方法往往比文献中的方法更加可靠。产品资料具有图文并茂、形象直观的特点,同时,它的内容又比较具体,会包含产品的技术特点、性能、应用范围、使用方法等不易获取的数据资料,但通常不会介绍关键技术。

2.8.1 获取方式

  • 全球产品样本数据库GPD
  • 向对口厂商索引产品样本
  • 向国内收藏产品样本的单位索引
    • 外贸部各进出口公司
    • 中国科技情报研究所
    • 各专业部和各省市科技情报研究所等
  • 向“中国国际贸易促进委员会国外新产品样本、样品介绍中心”索取
  • 展览会或技术座谈上收集产品样本(费时费力)

2.9 标准

标准是指通过标准化活动,按照规定的程序进行协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件。标准按照使用范围,可分为国际标准、工业标准、国家标准、行业标准、地方标准和企业标准。国家标准又分为强制性国家标准和推荐性国家标准。行业标准、地方标准是推荐性标准。强制性标准必须执行,国家鼓励采用推荐性标准。强制性国家标准的代号为GB,推荐性国家标准的代号为GB/T。

标准具有明确的适用范围和用途,它的可靠性和现实性比较强。随着技术的发展,标准编制、修订和复查期限不断缩短,更新速度也不断提高。标准通常有一定的法律效力和约束力。
标准文献主要应用在产品设计、生产、检验;工程设计,施工;进出口贸易;写作、文献著录等场景。

国内标准在以下网站下载:

  • 标准网

2.10 政府出版物

政府出版物又称官方出版物是由各国政府部门及其下属机构出版的文献。政府出中国出版物可分为行政类政府出版物和科学技术类政府出版物。其中科学技术类出版物一般包括科技发展政策文件、科技研究报告、专利文献等等。政府出版物一般都是公开的,公益性质大于经营性质。电子版可以从政府网站、人民网等网站获取。纸质版可以在档案馆、图书馆、政府管理大厅获取。

3 其他搜索方式

3.1 综合搜索

  • 谷歌学术
  • 百度学术
  • 微软学术
  • bing学术
  • Computer Science Bibliography: 可检查计算机科学作者的所有文献资料

3.2 引文搜索

  • connectedpapers: 查看论文的引文和被引统计

4 总结

文献的调研当然不能仅仅局限于以上10种不同的数据源,还有其他的,比如像公众号,微博等等。我们进行文献调研时,需要紧扣检索与目标紧密结合这个原则,然后根据不同的阶段对信息源进行选择。在入门阶段我们要讲究快。这个时候查看图书、科技报告花费时间太长。举个例子,怎么快速的了解导师的研究方向。此时,我们应选择实验室网页、导师在研课题基金申请书、实验室学位论文、发表的会议、期刊论文、跟师兄师姐面对面交流、或者直接跟导师交流。当我们进入到解决具体科研问题阶段时,对文献的检索要求广泛而准确,这个时候主要的信息源是会议、论文、期刊和科技报告。选题阶段需要对领域了解有一定的广度,深度和创新性的要求,主要会选择查阅会议文献、期刊、科技报告等。
撰写此笔记的目的主要有两个,其一是梳理罗老师课上教授的知识点,加深自己的理解和记忆;其二是为以后查询文献提供一个查询复习的渠道。希望本文能够对刚做文献调研的同学提供一定的帮助。最后再安利下参考中罗老师的精品课程。

5 参考

  • 文献管理与信息分析

你可能感兴趣的:(信息分析,深度学习,人工智能,自然语言处理)