论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》

社会网络视角下战略性新兴产业的专利情报研究

一篇课程作业要求精读并展示的论文。
阅读时间:2022.04.02~04.03,04.06

文章目录

  • 社会网络视角下战略性新兴产业的专利情报研究
    • 一、论文背景
      • 1. 背景信息
      • 2. 题录信息
    • 二、论文正文
      • 1. 研究背景和研究对象
      • 2. 社会网络分析方法概述
        • 2.1 基本原理
          • 2.1.1 社会网络的基本结构
          • 2.1.2 网络的测度指标:
        • 2.2 多属性的社会网络分析
        • 2.3 社会网络中的专利网络
        • 2.4 专利技术集群分析
        • 补充1
      • 3. 实证研究
        • 3.1 数据概述
        • 3.2 专利整体申请情况(数量分析)
        • 3.3 出现次数排名靠前的德温特手工代码分布情况(类型数量分析)
        • 3.4 德温特手工代码的中介中心性情况
        • 3.5 “风能”专利技术集群的可视化社会网络
      • 4. 结语
        • 补充2
      • 参考文献
    • 三、论文小结
      • 1. 文章细节
      • 2. 研究综述
      • 3. 数据分析
      • 4. 文章逻辑
      • 5. 参考文献
        • 补充3

一、论文背景

1. 背景信息

作者(按顺序排列)1

  • 车尧:中国科学技术信息研究所副编审、曾任《情报学报》编辑部主任;2011年6月毕业于中国人民大学信息资源管理学院,情报学博士学位;研究方向:信息分析、情报学理论、竞争情报研究、知识管理;
  • 李雪梦:中国有色矿业集团有限公司;
  • 璐羽:中国科技咨询协会副理事长兼秘书长;1984年毕业于中央民族大学物理系,获理学学士学位,1989获得北京师范大学哲学硕士学位。

基金2

  • 国家社科基金青年项目“面向科技型中小企业创新的技术竞争情报方法体系”(12CTQ030)
  • 立项日期:2012-05-14
  • 项目负责人:刘志辉。2010年毕业于中国科学院文献情报中心,获管理学博士学位;曾任中国科学技术信息研究所情报理论与方法研究中心副主任职务、中国科学技术情报学会知识组织专业委员会工作部委员、《情报工程》副主编、《情报学报》《图书情报工作》等多家期刊评审专家、中国科学技术情报学会竞争情报分会会员、美国竞争情报从业者协会(SCIP)会员。

期刊:《情报科学》,2015年 第33卷 第7期 138-144页,“博士论坛”栏目

**收稿日期:**2014年9月11日

2. 题录信息

摘要:

  • 专利情报分析视角引入社会网络分析概念,借鉴社会网络分析的中介中心性理论,将其应用于战略性新兴产业下**“风能”企业的专利情报研究**。
  • 文章通过专利德温特手工代码中心性、专利派系及专利凝聚子群的统计及可视化分析,大体得出了产业内的专利申请情况、专利内容及专利相关性等专利情报,以求帮助企业及时获得主体领域内专利技术的申请情况及专利相关性,为企业及时调整或重新制定技术路线以及实施技术创新战略提供必要的专利情报支持。

关键词:

  • 社会网络;战略性新兴产业;专利情报;风能

二、论文正文

1. 研究背景和研究对象

产业概念:

  • 企业一般是指以盈利为目的,运用各种生产要素(土地、劳动力、资本、技术和企业家才能等),向市场提供商品或服务,实行自主经营、自负盈亏、独立核算的具有法人资格的社会经济组织。
  • 产业是相同类别的企业集合体。

研究原因:

  • 中央高度重视战略性新兴产业的发展(外部讲,产业要创新)

    • 2010年,国务院发布了《国务院关于加快培育和发展战略性新兴产业的决定》;

    • 2013 年11月召开的十八届三中全会的会议精神中,又再次体现了发展重要前瞻性战略性产业、支持科技进步的重大战略部署。

  • 新兴产业的企业技术创新(内部讲,产业也要创新)

    • 企业对于专利情报的获取及分析能力是企业技术研发及技术创新的必要条件之一;
    • 当一个国家或地区的企业有普遍性的创新行为后,产业的创新行为便成为现实,技术、管理要素的产业贡献比例自然也就获得了提升。
    • 情报学学科侧重获取收集市场及企业主体所承载的信息要素,并通过一系列针对这些信息要素的定性和定量研究,将其转化成为能够保持或提高企业竞争力的情报知识。
  • 风能产业发展现状

    • 我国风电机组的总装机容量总体上呈快速上升态势
      • 截止2012年年底,中国(不包括台湾地区)新增安装风电机组7872台,装机容量12960MW,同比下降 26.5%;累计安装风电机组53764台,装机容量75324.2MW,同比增长20.8%。
    • 总体来看,风电能源在整个能源结构中的比重还非常低,化石能源仍占能源供给的绝大多数。
    • 节能减排和结构调整任务仍然十分艰巨。发展风电、太阳能等清洁的可再生新能源,不仅能够丰富能源供给,同时对调整能源结构、保护环境有着重要意义。
  • 专利分析是企业竞争情报中的重要组成部分,专利情报分析是竞争情报分析的一种表现形式(专利体现创新)

    • 据世界知识产权组织(WIPO)统计,全世界每年发明创造成果的90%至95%体现在专利技术中,其中约 70%最早体现在专利申请中;
    • 在科技创新中充分利用专利信息资源,可以缩短60%的研发时间和节约40%的研发资金。可见,专利情报是企业研发环节中最重要的知识储备;
    • 因此要想获得企业技术创新与技术合作方面科学严谨的研究成果,务必要有以专利分析为例的实证研究。
  • 风能的开发和利用需要较高的技术支撑,专利技术情报是企业竞争情报的重要来源之一,因此选取并开展“风能”方面的专利技术分析,对于高新技术企业的技术创新与合作模式研究既有代表性又具备可替换性(风能专利有代表性)

研究对象:

  • 新能源领域是我国战略性新兴产业的重要组成之一;

  • 作为新能源的代表,风能发展受到了政策的大力扶持;

  • 以“风能”产业为研究对象的专利技术情报分析,可以被视为高新技术企业通过竞争情报开展技术创新与合作的典型实证研究。

研究内容:

  • 本文将社会网络分析方法及思想借鉴运用到专利情报分析技术,针对我国战略性新能源下的“风能”产业,剖析了“风能”相关专利的德温特专利手工代码的年度申请情况、内容分布情况、中介中心性情况及专利技术集群的可视化网络,揭示了隐藏在专利情报内部的一些现象及规律。

    德温特手工代码是德温特索引专家针对每个专利所给的一个手工号码,用来指明发明的新技术何在,以及它的应用。

    实际上它相当于一个广义的叙词表,根据专利文献的文摘和全文对发明的应用和发明的重要特点进行独家标引,每一个手工代码表示一个技术术语,从而提高检索的全面性和准确性。其标引的一致性很高,适应于科研人员的习惯和应用。(这段话和官网的描述基本一致)

    例如,要查找录像机上的一种特别装置,该装置可在录像机上根据用户眼睛凝视的方向自动对物体定位(自动聚焦),描述这样检索词相对复杂,关键词为(camera?And video?)or camcorder Focus? Or auto focus? Or view? Or range finder? Eye? Direction? 如果利用德温特手工代码的帮助,查找起来就会容易很多,可以通过 W04-M01D2C(所有与录像机测距和聚焦有关的记录)以及S05-D01C5A(包含非医疗用物体的电子或电气测量)可用于检测依靠飞行员眼睛运动以控制飞机的方面的课题进行检索查询。

    PS:个人理解,它就是一个可以体现出专利所在的领域、专利涉及技术、专利应用场景等信息的代码。

2. 社会网络分析方法概述

近30年来,社会网络分析(Social Net Analysis)逐渐成为了一种流行的社会科学研究方法(如Ucinet、NetDraw、Pajek等软件都是专门处理社会网络分析的),在社会学、人类学、经济学、管理学等领域得到广泛应用。

社会网络分析方法已经比较成熟,可以从多个不同角度进行分析,包括中心性分析、凝聚子群分析、核心-边缘结构分析以及结构对等性分析等。将社会网络分析应用于企业竞争情报的学习实践,是近年来情报学领域中较新的研究方向。

2.1 基本原理

2.1.1 社会网络的基本结构

社会网络由结点和关系构成,如图所示,在社会网络分析的管理学研究中,结点亦可被称之为行动者,关系一般被定义为两个行动者或节点之间特定的接触、连接或联结。用点和线来表达网络,这是社会网络的形式化界定。

在这里插入图片描述

所以可将文的Derwent Innovations Index(DII)专利数据库中申请过“风能”专利的企业视为行动者,将企业的专利申请关联关系

2.1.2 网络的测度指标:
  1. 网络密度:

网络密度是指行动者之间实际联结的数目与它们之间可能存在的最大联结数目的比值。

有向关系网中,如果有n个行动者,那么其中包含的关系总数在理论上的最大值是 n(n-1),如果该网络中包含的实际关系数目为m,则该网络的网络密度为:
ρ = m n ( n − 1 ) ρ = \frac{m}{n(n-1)} ρ=n(n1)m
比值越高,这一网络的联结密度就越大,该网络对其中行动者的态度、行为等产生的影响可能越大。

应该可以理解成:比值越高,点与点之间的关系越多,关系越多点与点的联系就约紧密,因为变动而带来的影响就越大。

  1. 节点的度:

度数中心度是一个较简单的指数,节点 i 的度数中心度可以分为两类:绝对中心度和相对中心度,前者就是与该点直接相连的关系的数目,即:
K i = ∑ 1 ε E δ 1 i K_i = \sum_{1εE}δ_1^i Ki=1εEδ1i
后者为前者的标准化形式。

节点的度反映网络成员个体在网络中的地位。有向关系网中,从某一节点指向其他节点的关系数称为出度;从其他节点指向某节点的关系数称为入度。出度与入度的和为点度中心度。

通常出度用于度量扩张性,入度用于度量影响力,点度中心度用于衡量行动者的中心和潜在能力

  1. 中介中心性:

中介中心性(Betweenness Centrality)是指一个行动者通过在其他行动者之间相连的最短路径上占据中间人的位置,从而为网络中其他行动者充当潜在“中介”角色的程度。在网络中,如果一个行动者处于许多其他两点之间的路径上,可以认为该行动者居于重要地位,它测量的是行动者对资源控制的程度。

中介中心性的计算公式如下:
C B ( n i ) = ∑ j < k g ( n i ) g i k C_B(n_i) = \sum_{jCB(ni)=j<kgikg(ni)
标准化公式(无方向):
C B ‘ ( n i ) = 2 ∑ j < k g ( n i ) g i k ( g − 1 ) ( g − 2 ) = 2 C B ( n i ) ( g − 1 ) ( g − 2 ) C^`_B(n_i) = \frac{2\sum_{jCB(ni)=(g1)(g2)2j<kgikg(ni)=(g1)(g2)2CB(ni)

如果一个德温特手工代码处于其他很多对德温特代码两点间的路径之上,那么就可以说该代码处在重要位置上,对它的测量系数可以反映它对其他代码的控制与影响程度。

德温特手工代码的编制目的就是要详细地反映专利的技术信息,因此通过对德温特手工代码中介中心性的统计分析,可以挖掘中介性质较高的专利技术信息,以及这些技术信息的重要程度。

2.2 多属性的社会网络分析

同时注意到,在本文的多属性分析中,每个点同时还具备了多个属性的信息,而不仅仅是一个单一属性的点。这个对比表现在下图中。
论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》_第1张图片

在图3中,点仅代表单一的专利,用以区别于其他的点(专利),而没有涉及该专利更多的属性信息;在图4中,点除了代表专利外,还多了属性的信息,这使得相比于原来的网络更加复杂,但其能够将问题分析的更加细致、更加深入,同时也有助于将关联规则挖掘更好的用于评价和推荐的研究。

术语在线:关联规则挖掘是从数据库中发现频繁出现的多个相关联数据项的过程。

即:从数据集中发现项与项(item 与 item)之间关系的过程。

2.3 社会网络中的专利网络

网络是由节点和边(连线)组成的。因此节点之间存在共现关系,节点之间就会有联系,这样就有可能形成网络。

在世界权威专利数据库《德温特创新索引》中,如果一项专利涉及到N个技术领域,数据库的技术标引人员则会在技术分类项目中同时标注N个技术领域,这样就意味着这N个技术领域共现了一次,将技术领域视为节点,共现关系产生了边,有了节点和边,技术领域之间就形成了共现网络

如果这里将专利类比成现实中的共同应用,那么领域就是点,那么这就是风能相关技术领域的网络图,按个人理解,应该是可以通过这个发现某个技术领域的突破需要哪些相关技术的支撑,并以此来支撑企业的发展的。但文章并没有这样分析。

2.4 专利技术集群分析

技术集群(Technology Cluster)是指在区域创新过程中,由于群体技术的内在关联性和技术势差的存在,各创新困子在流动中造成连锁、协同效应,并与技术相关的社会各种要素反馈互动,形成以集群为特征的集合

通过对某一行业内的专利技术集群的可视化分析,可以及时发现该行业内的专利技术的研发热点和重点领域。尽管学者曾经利用网络分析方法对技术集群的主体(企业)之间的关系进行过探讨,但我们尚未发现运用社会网络分析方法,探测行业专利技术集群的研究成果。

专利技术集群分析通常由专利凝聚子群分析专利派系分析两部分构成。

当网络中某些行动者之间的关系特别紧密,以至于形成一个次级团体时,这样的团体在社会网络分析中成为凝聚子群。凝聚子群分析就是研究行动者之间关系的紧密程度,如对于我国境内的部分网站进行凝聚子群分析,可以判断出哪些网站之间的关系比较紧密,相互联系紧密的网站之间彼此在网站信息内容上或用户链接倾向上是否具有某些关系等信息。而关于某一个网络中存在着多少这样的子群的分析称之为派系分析。

补充1

觉得原文不光综述拉,方法介绍也拉。所以在这里重新整理了一下:

  1. 社会网络的基本概念
    • 如原文的基本原理所说,点、边。
  2. 网络的测量指标
    • 点:
      • 度:每一个节点连接的所有边的数量
        • 出度:从该节点连出的边的数量
        • 入度:从该节点连入的边的数量
        • 离心度:从一个节点所有可以到达的节点中,找出最长的最短路径。即一个节点所能达到的最大的最短路径(即计算和所有点之间的最短路径,选择最长的那个)
      • 平均度:网络中的平均度等于度除以节点数量
      • 平均加权度:在统计节点度时,也考虑边的权重,加权计算平均度
    • 边:
      • 边的权重:因边所代表的意义而异。如:边代表距离,权重就是距离远近;边代表社区关系,权重就是联系程度。
      • 最短路径:点与点之间经过点数最短的路径
      • 网络直径:一个网络中,所有最短路径的最大值
      • 平均路径:一个网络中,所有最短路径之和的平均值等于这个网络的平均路径长度
      • 网络密度:实际有的边数与最大可能边数之比
    • 中心性:
      • 度中心性(Degree Centrality):单纯的数量来衡量。又叫点度中心度。度越多,就越大
      • 接近中心性(Closeness Centrality):一个节点能到达节点的数量除去所能到达节点的最短路径之和。对于一个节点而言,它距离其它节点越近,那么它的中心度越高
      • 中介中心性(Betweenness Centrality):统计某个节点被其他节点,以最短路径通过的数量与图中最短路径总数之比。一个结点充当“中介”的次数越高,它的中介中心度就越大
      • 特征向量中心性(Eigenvector Centrality):一个节点的重要性既取决于其相邻节点的数量(即该节点的度),也取决于其相邻居节点的重要性。核心思想就是,一个重要的节点不仅与其他许多节点有连接,而且与他相连的节点也是比较重要的节点

3. 实证研究

3.1 数据概述

ISI Derwent Innovations Index专利数据库,标题=(wind energy)AND 专利号=(cn*),时 间 跨 度 设 置 为(from 2001-01-01 to 2012-12-31),检出结果3187条。

利用专利分析工具统计后,抽取关键词(Abstract)3186条、(Abstract Use)3185条、(Abstract Phrase)47678 条、德温特手工代码(Manual Codes)1781条、基本专利国(Basic Patent Country)12条、专利权人(Patent Assignees)2256条。

3.2 专利整体申请情况(数量分析)

论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》_第2张图片

根据图6能看出,2001年前后是“风能”相关专利技术申请的初始阶段,到了2003年申请数量急速骤增,是2002年申请数量的近10倍。

随后2004年至2008年四年间的申请数量由59件增长到501件,年均增幅维持在 76.56%,2009 年至 2011 年是申请数量稳定时期,申请数量保持在 600 至 700 之间。

特别值得关注的是,2012年全年的申请数量急速骤减至 55 件,申请数量仅是 2011 年的 8%,基本缩减至2003年、2004年的水平,笔者判断这是“风电”产量瓶颈性过剩所导致的结果,这一现象和2012年的北京国际风能展的展出情况基本类似。可以说北京国际风能展是国内风电产业发展的晴雨表。

据展会主办方提供的资料显示,自2008年首届展会开始至2011年,参展企业持续增加,2011年达到了破记录的612家,而2012年展会展商则缩至400家。这与风电产业近些年的发展轨迹基本契合。

3.3 出现次数排名靠前的德温特手工代码分布情况(类型数量分析)

笔者利用专利分析工具,针对1781个德温特手工代码进行统计分析,按照申请次数的多少将其进行了排序,结合年度、条目数及手工代码三个维度,排在前10位的专利统计分布情况如图7所示。

选择记录数(即申请次数)Records >100的数据作为分析对象,可以基本反映出数据的整体情况。
论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》_第3张图片

分析可见:

专利X15-B01B(非矿物燃料能源生产系统—风能—电动机—生成器)的申请高峰阶段是2009年至2011年,期间年度申请数量逐年增加, 从2009年的100件左右增至2011年的130件左右;

X15-B01(非矿物燃料能源生产系统—风能—电动机)的申请高峰期同为2009年至2011年间,但是年度申请量却呈小幅下降趋势;

X15-B01A(非矿物燃料能源生产系统—风能—电动机—涡轮机)的申请高峰期为 2008 年至 2011 年,年度申请量基本维持在60件上下并呈前高后低态势,且和U24-H(放大器和低耗能供给—低功率系统)一样同为申请年度最早的专利内容,最早申请年度为2002年 ;

X15-B05(非矿物燃料能源生产系统—风能—控制、监控及测试)的申请峰值年是2008至2011年,为震荡上涨形态;

X15-B06(非矿物燃料能源生产系统—风能—支撑结构)、U24-H 的申请高峰均集中在2007-2011年度,前者呈平稳增长态势,后者呈震荡增长态势;

X15-B01A6(非矿物燃料能源生产系统—风能—电动机—汽轮机—垂直涡扇)的申请高峰持续期最短,仅为2010、2011两个年度;

X11-U01E (发电及高压设备—应用型电机—电能生产—风扇涡轮发电机)的最高申请量出现在2009年,呈前增后降分布;

X12-C01E(动力分配/部件/整流—动力转换器/反应器—线圈核、线圈、焊接—绝缘套管/终端机、工厂—能源配给转换器)集中申请期为2008至2011年,2010年为峰值年申请量在40件上下;

其中X15-B01A(非矿物燃料能源生产系统—风能—电动机—涡轮机)、U24-H(放大器和低耗能供给—低功率系统)的初次申请时间最早,同为2002年。

笔者选择Records >100 的德温特手工代码记录(Manual Codes Records)构建皮尔斯Pearson相关矩阵,图8反映了该矩阵的部分情况(截选记录数位居前35),颜色越深表示横竖两排相对应的代码的相关性越强。

德温特手工代码矩阵

3.4 德温特手工代码的中介中心性情况

通过计算机辅助计算,得出了按专利申请次数排名前100的德文特手工代码的中介中心性的整体情况,如图9所示。
论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》_第4张图片

根据上述计算结果可知,代码为“A12-E08B”、“X15-A”,“X15-B”,“A12-H”以及“A12-W16”的中介中心性系数最高,分列前 5 位,依次是 38.689、38.689、37.109、35.386和28.869;“中介”程度位居后5 位的专利德温特手工代码分别是“X15-A05X”、“X26-D03” 、“V06-M07A” 、“X26-F” 和 “X12-D03H”,其中介中心性系数依次为 0.562、 0.562、0.549、0.161 和 0.000。

通过比较专利的申请次数及该专利德温特手工代码的中介中心度,笔者发现一重要现象,即专利申请次数和专利德温特手工代码的中介中心性并不完全成正比关系,如 “A12-E08B”的申请次数仅排在 61 位,但其中介中心性却高居榜首,“X15-B01”的申请次数位居第 2 位,但其中介中心性排名却仅为 49,又如“X15-A”的申请次数排名第12,中介中心性却高居第2。

3.5 “风能”专利技术集群的可视化社会网络

这里我们将文中“4.1”中所获得的1781条德温特手工代码(Manual Codes)视为上述派系分析和凝聚子群分析中的行动者。

利用专利分析工具,将申请次数大于等于 50 的 Manual Codes 数据进行自相关关系可视化,得到关于Manual Codes的技术集群地图,如图10所示。

图10中蓝色圆圈表示不同的专利派系,每个圆圈旁都显示有该派系中主体专利的Manual Codes标识及其全部申请次数,以及在矩形内所显示的专利凝聚子群。

如最上方的圆圈“A12-H”代表着一个专利派系 ,在这个派系下有着“X15-B01B”、“X15-B01A”、“X15-B01”、“X15-B06”这几个专利凝聚子群 ,且按照各自专利申请范畴同属于“A12-H”派系的有效申请数量降序排列,可以看出在它们全部的专利申请中,同属“A12-H”派系的申请次数依次是14次、12次、11次和10次。

图中两个圆圈间的连线表示这两个派系间的自相关程度,直线越粗表示两个派系之间的自相关性越强。

因此可以分析得出在所有专利派系中,“X12-J05”和 “U24-D05”两个派系的自相关性最强,相关系数超过0.75;相关系数大于0.5的派系有“U24-H”派系和“X12-H01B”派系,“X26-U06”派系与“X26-E01E”派系以及“X21-B04A”派系和“X21-A01F”派系,其它派系的自相关性则较弱。

通过对图中数据的进一步分析,可以发现专利派系中各专利凝聚子群的申请次数并不决定着该专利派系与其它专利派系间的自相关性,如中部最左边的“X15-B01”派系,专 利“X15-B01”总体申请次数高达 400 次,该派系下的专利凝聚子群“X15-B05”、“X15-B06”、“X16-B01”以及“X15-A”的有效申请次数均相对较高,依次为66、48、40、36,但是“X15-B01”派系与其他专利派系的相关性极弱,呈现独立状态,类似情况的专利派系还有“X15-B09”以及“X15-B05”等。

至此,本文相继给出了2001年至2012年“风能”专利的年度申请情况,并总结性概括了专利的总体申请情况特征;列举了出现次数排名靠前的德温特手工代码分布情况,剖析了申请次数最多的专利群体细节,分析得出了德温特手工代码的中介中心性情况;最后得出了“风能”专利技术集群的可视化社会网络,辨析了专利派系间的关系情况及各专利派系下的专利凝聚子群特征。

通过对专利的系统分析可以获得与产品相关的技术信息、产业发展现状信息、技术发展的背景信息、有关技术发明有用的详细信息和关键信息、有关技术领域的状况信息和研究开发及技术产业化的众多信息,这些信息都是企业进行技术创新和技术升级所需要的极具价值的重要情报。

4. 结语

战略性新兴产业能否发展壮大取决于产业的技术创新与政府战略的联动效应。正如国家科学技术部万钢部长所说:战略性新兴产业的培育和发展不仅要受到市场前景、成长潜力、资源条件、产业结构等要素影响,还受到科学技术创新这一关键要素影响。高新技术产业化、自主创新技术的进步、产品的推广应用和自主创新政策的落实是培育和发展战略性新兴产业的前提条件。

绝了,怎么又扯到政府了,前面分析也没有说几几年间政府支持就蓬勃发展啊。

本研究所借助的竞争性专利情报分析方法及研究思路,不仅仅局限于针对风能产业的专利技术分析,亦可应用于其他战略性新兴产业内的技术竞争情报跟踪与技术创新的辅助性研究,向企业提供了专利竞争情报分析工作的参考示范。

补充2

从这里引入第二个补充吧,我也想了解一下,专利情报分析方法究竟是啥。

  1. 论文介绍

    • 《国内外专利情报分析方法研究述评》- 李华锋、袁勤俭、陆佳莹、钱韵洁(南京大学信息管理学院团队)- 情报理论与实践(CSSCI)- 2017.06.08
    • 江苏省高校哲学社会科学研究重点项目“江苏高校哲学社会科学‘走出去’现状与对策研究”的成果,项目编号:2013ZDIXM025
  2. 研究概述

    • 文章梳理了国内外专利情报分析方法,归纳分析方法的应用领域和特,帮助专利情报分析人员厘清研究方法与研究内容的适配关系。研究发现专利情报分析方法集中于"专利情报统计分析法"“专利情报机器学习分析法"以及"专利情报复杂网络分析法"三方面,呈现出"丰富性”“综合性”"智能性"趋势特征。
  3. 方法综述

    • (1)专利情报统计分析法:

      • ① 专利情报描述性统计法:
        • 主要用于对实体单位和技术领域专利数据进行分析。基于该方法从国家层面、机构层面或技术领域层面,利用图形、图表形式对各类指标 ( 专利数量、市场份额、引文数量、专利分类、主要发明者以及授权日期等) 进行时序分析结构分布比较,阐释特定领域技术发展动态特征,揭示产业竞争格局以及特定实体对象所面临的机遇挑战,为国家或企业的专利战略制定与技术创新方向提供指导。
        • 该方法具有分析手段多样和研究结果直观等优势,但同时存在分析不够深入,不能满足复杂专利指标分析需求等劣势,实际使用时应与其他分析方法相结合。
      • ② 专利情报时间序列分析法:
        • 专利情报时间序列分析方法主要应用于技术成长 S 曲线分析和专利产出预测两方面。
        • 技术成长 S 曲线分析:利用反映技术成长的 S 曲线分析专利数据,预测技术成熟度,帮助管理人员了解技术扩散的潜力,是时间序列分析方法在专利分析中的重要应用。(有Logistic 曲线、Gompertz 曲线、Weibull 曲线、Loglet Lab 模型等)。但今后可结合马尔可夫链模型、贝叶斯网络、模糊数学等方法,综合考虑多种因素,提高预测精度。
        • 专利产出时间序列分析:预测专利申请或授权数量也是时间序列分析应用之一,常用的方法有用趋势外推法,相空间重构的时间序列、混沌时间序列 Lyapunov指数,向量自回归模型、动态线性模型等。但为了提高预测精度,需要综合应用多种方法,通过比较平均误差、均方根误差等指标,选择最优方法,或者通过构建计量经济学模型进行比较分析。
      • ③ 专利情报回归分析法:
        • 回归分析法在专利情报分析中运用十分广泛,通过回归模型确定指标变量间相互依赖且复杂的定量关系,具体应用主要体现在以下 3 个方面:专利产出的回归分析、专利引文数量的回归分析、专利引证关系的回归分析。
        • 在专利分析时应综合应用多种模型,根据专利发明人数量、专利族数量以及非专利引用数量等指标,对专利引用次数的影响因素进行实证分析,通过对比分析,从而选择拟合效果最佳的模型。
    • (2)专利情报机器学习分析法:

      • ① 专利情报聚类分析法:

        • 专利情报聚类分析主要用于对专利产出、关键词及引证关系进行分析。
        • 通过对专利产出数量聚类分析,探讨地区或实体单位专利类型特征与分布规律;基于文献关键词对特定技术领域进行聚类划分,探索技术发展趋势,评估未来可能的市场机会;基于专利引用关系相似性的聚类分析常用于分析特定技术发展趋势,识别特定领域的新兴技术,预测新技术集群等方面。
      • ② 专利情报神经网络分析法

        • 人工神经网络是重要的机器学习分析方法,在专利情报分析过程中,相关算法主要应用于以下两方面:专利分类的神经网络分析、专利指标评价预测的神经网络分析。

        • 值得指出的是,今后,专利分类方法应与自然语言处理、本体技术、模糊数学等其他理论与方法结合使用,以提高分类的准确性。

          具体的研究内容就不说了,基本都是在神经网络的算法、或者改进算法的基础上,做分类和回归预测任务。

    • (3)专利情报复杂网络分析法

      • ① 专利情报社会网络分析法
        • 社会网络分析法是进行专利情报分析的主要方法,主要用于对专利网络拓扑属性和专利引文类型分析两方面。
        • 基于网络拓扑属性情报分析:
          • 学者们利用度数中心性表示现实相关技术信息流,接近中心性分析技术影响,中介中心性表示不同时间点的技术中介作用,识别随时间推移核心技术的融合和变化模式;
          • 利用路径长度、聚类系数、中介中心性以及小世界系数,研究专利引文网络中小世界现象的相关性,观察专利引用的增长模式,确定具有高中介性的关键专利;
          • 利用度中心性与结构洞理论,识别与分析核心技术和新兴技术;利用技术共类分析,测量技术融合强度和覆盖范围,预测技术融合趋势;
          • 利用关键节点、核心网、网络拓扑分析方法,分析特定技术领域、机构和国家层面的知识转移过程;
          • 利用主题词共现的共生关联分析和基于余弦相似度的相似性关联分析,就专利主题间、授权人间、授权人所属国家间以及授权人与主题进行关联分析,研究国际技术合作模式。
        • 基于网络引文类型情报分析:基于直接引用、间接引用、耦合和同被引网络进行专利价值评估、识别技术创新机会、揭示领先者与技术群体间的关系等。
      • ② 专利情报 SAO 语义分析法:
        • 大数据背景下,Subject-Action-Object 专利语义分析是识别新兴技术的有效工具,利用自然语言处理技术提取专利文献中主语-动作-对象 ( SAO) 语义结构,通过计算专利 SAO 结构之间的语义相似性来测量专利发明结构的相似性;
        • 基于 SAO 专利语义分析专利技术时间演化,可以识别新兴技术及其应用领域;通过语义分析,根据技术相似性,可评估专利侵权风险,降低技术创新过程中的成本和不确定性。
  4. 结论

    • 专利情报分析方法丰富性:文献计量学方法基础上,专利情报分析方法不断向机器学习、信息经济学、复杂网络等领域拓展;
    • 专利情报分析方法综合性:为了提高专利情报分析结论的科学性与准确性,学者们常综合应用多种分析方法;
    • 专利情报分析方法智能性:在进行专利情报分析时,学者们将人工智能、统计学、信息经济学以及系统工程领域的相关理论与研究方法(如模糊推理系统、自然语言处理技术、遗传算法、数据挖掘、神经网络以及 DEMATEL)引入到专利情报分析过程中来,提高专利情报分析的准确性与高效性。
    • 笔者认为,今后专利情报分析方法研究与应用需关注以下方面:随着本体技术的不断成熟完善,本体语义学在文本挖掘中的应用将成为专利情报语义分析的新趋势;积极吸收信息经济学、人工智能等领域的模型与算法思想,形成新的综合性专利情报分析方法,以提高处理量大、维高、大数据的能力;积极探索互联网+ 、云计算环境下的专利情报大数据研究方法。

参考文献

[1] 国务院关于加快培育和发展战略性新兴产业的决定[EB/OL].国务院办公厅http://www.gov.cn/zwgk/2010-10/18/content_1724848.htm, 2013-11-26.

[2] 胡锦涛强调:推动战略性新兴产业快速健康发展[E/B].新华社[EB/OL].http://www.gov.cn/ldhd/2011-05/31/con-tent_1874294.htm, 2010-10-18.

[3] 百度百科[EB/OL].http://baike.baidu.com/linkurl=h9gzr HVUw Nmqte Ac Yf Ufp Nr1cs BBu21PQWit9t OFi-AWg SH131AY20z Ob-A6ur B2x, 2013-11-26.

[**4]** 江波.论企业与产业创新对工业发展模式转型的作用[J].广东社会科学, 2012, (2) :46-53.

[5] 2012年中国风电装机容量统计[R].北京:中国可再生能源学会风能专业委员会, 2013:1.

[**6]** 韩永奇.2012:风能产业向左还是向右[J].中国经济和信息化, 2012, (3) :93-94.

[**7]** 王晓光.社会网络箍式下的知识管理研究述评[J].图书情报知识.2008, (7) :87-91.

[8] Wasserman S, Faus t K.Social Ne t work Analysis: Methods and Application[M].New York: Cambridge University Press, 1994:5-11.

[**9]** 李亮, 朱庆华.社会网络分析方法在合著分析中的实证研究[J].情报科学, 2008, 26 (4) :549-555.

[**10]** 包昌火, 谢新洲.竞争对手分析[M].北京:华夏出版社, 2003:136-145.

[**11]** 肖冬平.基于社会网络视角的知识网络研究[M].北京:人民出版社, 2011:87-97.

[**12]** 刘军.整体网络分析讲义[M].上海:格致出版社, 上海人民出版社, 2009:98.

[**13]** 李永立, 吴冲, 孙纪舟, 等.基于社会网络分析的多属性关联规则挖掘方法[J].情报学报, 2012, (8) :823-829.

[**14]** 栾春娟.社会网络分析方法在公司技术集群探测中的应用——以波音公司为例[J].科技创新导报, 2010, (25) :253-254.

[15] 岳章.北京风能展遇冷:整机产能过剩率50%[EB/OL].http://finance.ifeng.com/news/industry/20121120/7320306.shtml, 2012-11-20.

[16] [EB/OL].http://Web of knowledge.com/WOK46/help/zh_CN/DII/hcodes_manual.html, 2013-08-25.

[17] Borgatti SP, Everett MG, Freeman LG.Ucinet for Windows: Software for Social Network Analysis[M].Harvard, MA:Ana-lytic Technologies, 2002:392-396.

[**18]** 张世怡.刘春茂.中文网站社会网络分析方法的实证研究[J].情报科学, 2011, 29 (2) :246-252.

[**19]** 万钢.把握全球产业调整机遇, 培育和发展战略性新兴产业[J].求是, 2010, (1) :28-30.

三、论文小结

从小到大吐槽一下本篇论文吧

1. 文章细节

① 错别字:这里应该是创新因子吧
论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》_第5张图片

② 经常出现“笔者分析”、“笔者判断”,特别是在数据分析部分也是这样,代表主观性很强。(放在研究展望,或者讨论部分就很正常)

③ 英文释义:文章第一次出现“德温特手工代码”时,并没有给出英文翻译and解释。第二次出现时说了“德温特手工代码”的英文是“Manual Codes”,之后统计的时候,又翻译一遍“德温特手工代码的记录数”是“Manual Codes Records”,我寻思这也不是一个啥专业名词啊。

2. 研究综述

可以说,完全没有综述。

综述的时候,你要么把相关方向的论文和相似研究的论文梳理一下,要么概述性地把社会网络分析的概念、原理和方法综述一下,最起码你也要把文章涉及到的研究方法都一起说明一下吧,结果啥都没有,还能把一些文章要用到的社会网络分析方法放在后面数据分析的部分讲。

3. 数据分析

① 数据概述部分,说抽取了关键词、摘要、德温特手工代码、基本专利国、专利权人多少多少条,这个有意义吗?一,没有明确说出之后社会网络分析用的到底是什么数据;二,就算这些数据是有用的,那也应该交代清楚具体有什么用。

② 分析不太规范,在“专利整体申请情况”部分,应该不能因为某个企业与整体产业的发展演变情况相似,就说某个企业是这个产业发展的晴雨表吧?
论文精读:车尧-《社会网络视角下战略性新兴产业的专利情报研究》_第6张图片

③ 分析不深入,仅局限在了描述结果,没有分析结果;抓住了异常点也没有进行分析;并且最后没有归纳结论。(当然,本来就没有任何结论,也没东西归纳)

eg1:做出了相关性矩阵,也不描述,也不分析。(而且,我个人也很好奇,为什么各个代码的记录数(申请次数)能反映他们之间的相关性)

eg2:说“发现一重要现象,即专利申请次数和专利德温特手工代码的中介中心性并不完全成正比关系”,也就描述了一下怎么不成正比,也没有分析原因。

只能说,很是搞笑。

④ 图表全都不清晰,每一张图都没有原图,官网甚至都没有2015年的刊。

4. 文章逻辑

① 通篇,没搞明白它具体想研究什么问题。感觉就是,他只是想试试把社会网络分析方法用到风能产业专利分析上,但没有一个具体的研究方向(比如,是分析它的演变趋势、还是主题变化、还是关键技术……),所以在使用方法上也没有任何逻辑,比如,应该要说:使用中介中心性是为了研究风能专利的什么特征?使用专利技术集群分析又是为了研究风能专利的什么特征?

② 关于文章的研究背景,几乎在每一个部分都重复强调了一遍研究的原因和意义。而本人在展示的时候是全都汇总到第一部分了。

5. 参考文献

一共就19篇参考文献,其中引用了6条网页,还有1个是百度百科。

严重怀疑这篇论文的一作只是挂了个名……

补充3

最后,选择阅读了一篇社会网络分析相关的论文,其实原因也是作者在文中说,专利的社会网络分析在工业应用得比较多,所以我就去找了一篇同年发表的工业相关的外文文献。

  1. 论文介绍

    • 《How Do Regions Diversify over Time? Industry Relatedness and the Development of New Growth Paths in Regions》

      • 期刊(ECONOMIC GEOGRAPHY):

        • [Social Sciences Citation Index (SSCI)](https://jcr.clarivate.com/jcr-jp/journal-profile?journal=ECON GEOGR&year=2020&fromPage=%2Fjcr%2Fsearch-results)
        • 11.767 (2020) Impact Factor
        • Q1 (2020) CiteScore Best Quartile
        • 10.2 (2020) CiteScore (Scopus)
        • Q1 (2020) Impact Factor Best Quartile
      • 论文:

        • Erasmus University、Utrecht University和Lund University三个大学的作者合作完成
        • Published online: 22 Oct 2015
        • 200 citations
        • 25 Altmetric
        • 基金:the financial support provided by the Bank of Sweden Tercentenary Foundation, by the Netherlands Organisation for Scientific Research and by the Jan Wallanders och Tom Hedelius Stiftelse. (瑞典银行三百周年纪念基金会、荷兰科学研究组织及简·华兰德和汤姆·赫勒歇斯基金会)
  2. 论文内容
    这篇论文放在另一篇文档里面啦,指路。


  1. 来源中信所官网,但网上能找到的信息确实不多。 ↩︎

  2. 国家社科基金项目数据库 (people.com.cn) ↩︎

你可能感兴趣的:(学习,能源,经验分享)