一篇课程作业要求精读并展示的论文。
阅读时间:2022.04.02~04.03,04.06
作者(按顺序排列)1:
基金2:
期刊:《情报科学》,2015年 第33卷 第7期 138-144页,“博士论坛”栏目
**收稿日期:**2014年9月11日
摘要:
关键词:
产业概念:
研究原因:
中央高度重视战略性新兴产业的发展(外部讲,产业要创新)
2010年,国务院发布了《国务院关于加快培育和发展战略性新兴产业的决定》;
2013 年11月召开的十八届三中全会的会议精神中,又再次体现了发展重要前瞻性战略性产业、支持科技进步的重大战略部署。
新兴产业的企业技术创新(内部讲,产业也要创新)
风能产业发展现状
专利分析是企业竞争情报中的重要组成部分,专利情报分析是竞争情报分析的一种表现形式(专利体现创新)
风能的开发和利用需要较高的技术支撑,专利技术情报是企业竞争情报的重要来源之一,因此选取并开展“风能”方面的专利技术分析,对于高新技术企业的技术创新与合作模式研究既有代表性又具备可替换性(风能专利有代表性)
研究对象:
新能源领域是我国战略性新兴产业的重要组成之一;
作为新能源的代表,风能发展受到了政策的大力扶持;
以“风能”产业为研究对象的专利技术情报分析,可以被视为高新技术企业通过竞争情报开展技术创新与合作的典型实证研究。
研究内容:
本文将社会网络分析方法及思想借鉴运用到专利情报分析技术,针对我国战略性新能源下的“风能”产业,剖析了“风能”相关专利的德温特专利手工代码的年度申请情况、内容分布情况、中介中心性情况及专利技术集群的可视化网络,揭示了隐藏在专利情报内部的一些现象及规律。
德温特手工代码是德温特索引专家针对每个专利所给的一个手工号码,用来指明发明的新技术何在,以及它的应用。
实际上它相当于一个广义的叙词表,根据专利文献的文摘和全文对发明的应用和发明的重要特点进行独家标引,每一个手工代码表示一个技术术语,从而提高检索的全面性和准确性。其标引的一致性很高,适应于科研人员的习惯和应用。(这段话和官网的描述基本一致)
例如,要查找录像机上的一种特别装置,该装置可在录像机上根据用户眼睛凝视的方向自动对物体定位(自动聚焦),描述这样检索词相对复杂,关键词为(camera?And video?)or camcorder Focus? Or auto focus? Or view? Or range finder? Eye? Direction? 如果利用德温特手工代码的帮助,查找起来就会容易很多,可以通过 W04-M01D2C(所有与录像机测距和聚焦有关的记录)以及S05-D01C5A(包含非医疗用物体的电子或电气测量)可用于检测依靠飞行员眼睛运动以控制飞机的方面的课题进行检索查询。
PS:个人理解,它就是一个可以体现出专利所在的领域、专利涉及技术、专利应用场景等信息的代码。
近30年来,社会网络分析(Social Net Analysis)逐渐成为了一种流行的社会科学研究方法(如Ucinet、NetDraw、Pajek等软件都是专门处理社会网络分析的),在社会学、人类学、经济学、管理学等领域得到广泛应用。
社会网络分析方法已经比较成熟,可以从多个不同角度进行分析,包括中心性分析、凝聚子群分析、核心-边缘结构分析以及结构对等性分析等。将社会网络分析应用于企业竞争情报的学习实践,是近年来情报学领域中较新的研究方向。
社会网络由结点和关系构成,如图所示,在社会网络分析的管理学研究中,结点亦可被称之为行动者,关系一般被定义为两个行动者或节点之间特定的接触、连接或联结。用点和线来表达网络,这是社会网络的形式化界定。
所以可将文的Derwent Innovations Index(DII)专利数据库中申请过“风能”专利的企业视为行动者,将企业的专利申请关联为关系。
网络密度是指行动者之间实际联结的数目与它们之间可能存在的最大联结数目的比值。
有向关系网中,如果有n个行动者,那么其中包含的关系总数在理论上的最大值是 n(n-1),如果该网络中包含的实际关系数目为m,则该网络的网络密度为:
ρ = m n ( n − 1 ) ρ = \frac{m}{n(n-1)} ρ=n(n−1)m
比值越高,这一网络的联结密度就越大,该网络对其中行动者的态度、行为等产生的影响可能越大。
应该可以理解成:比值越高,点与点之间的关系越多,关系越多点与点的联系就约紧密,因为变动而带来的影响就越大。
度数中心度是一个较简单的指数,节点 i 的度数中心度可以分为两类:绝对中心度和相对中心度,前者就是与该点直接相连的关系的数目,即:
K i = ∑ 1 ε E δ 1 i K_i = \sum_{1εE}δ_1^i Ki=1εE∑δ1i
后者为前者的标准化形式。
节点的度反映网络成员个体在网络中的地位。有向关系网中,从某一节点指向其他节点的关系数称为出度;从其他节点指向某节点的关系数称为入度。出度与入度的和为点度中心度。
通常出度用于度量扩张性,入度用于度量影响力,点度中心度用于衡量行动者的中心和潜在能力。
中介中心性(Betweenness Centrality)是指一个行动者通过在其他行动者之间相连的最短路径上占据中间人的位置,从而为网络中其他行动者充当潜在“中介”角色的程度。在网络中,如果一个行动者处于许多其他两点之间的路径上,可以认为该行动者居于重要地位,它测量的是行动者对资源控制的程度。
中介中心性的计算公式如下:
C B ( n i ) = ∑ j < k g ( n i ) g i k C_B(n_i) = \sum_{j
标准化公式(无方向):
C B ‘ ( n i ) = 2 ∑ j < k g ( n i ) g i k ( g − 1 ) ( g − 2 ) = 2 C B ( n i ) ( g − 1 ) ( g − 2 ) C^`_B(n_i) = \frac{2\sum_{j
如果一个德温特手工代码处于其他很多对德温特代码两点间的路径之上,那么就可以说该代码处在重要位置上,对它的测量系数可以反映它对其他代码的控制与影响程度。
德温特手工代码的编制目的就是要详细地反映专利的技术信息,因此通过对德温特手工代码中介中心性的统计分析,可以挖掘中介性质较高的专利技术信息,以及这些技术信息的重要程度。
同时注意到,在本文的多属性分析中,每个点同时还具备了多个属性的信息,而不仅仅是一个单一属性的点。这个对比表现在下图中。
在图3中,点仅代表单一的专利,用以区别于其他的点(专利),而没有涉及该专利更多的属性信息;在图4中,点除了代表专利外,还多了属性的信息,这使得相比于原来的网络更加复杂,但其能够将问题分析的更加细致、更加深入,同时也有助于将关联规则挖掘更好的用于评价和推荐的研究。
术语在线:关联规则挖掘是从数据库中发现频繁出现的多个相关联数据项的过程。
即:从数据集中发现项与项(item 与 item)之间关系的过程。
网络是由节点和边(连线)组成的。因此节点之间存在共现关系,节点之间就会有联系,这样就有可能形成网络。
在世界权威专利数据库《德温特创新索引》中,如果一项专利涉及到N个技术领域,数据库的技术标引人员则会在技术分类项目中同时标注N个技术领域,这样就意味着这N个技术领域共现了一次,将技术领域视为节点,共现关系产生了边,有了节点和边,技术领域之间就形成了共现网络。
如果这里将专利类比成现实中的共同应用,那么领域就是点,那么这就是风能相关技术领域的网络图,按个人理解,应该是可以通过这个发现某个技术领域的突破需要哪些相关技术的支撑,并以此来支撑企业的发展的。但文章并没有这样分析。
技术集群(Technology Cluster)是指在区域创新过程中,由于群体技术的内在关联性和技术势差的存在,各创新困子在流动中造成连锁、协同效应,并与技术相关的社会各种要素反馈互动,形成以集群为特征的集合。
通过对某一行业内的专利技术集群的可视化分析,可以及时发现该行业内的专利技术的研发热点和重点领域。尽管学者曾经利用网络分析方法对技术集群的主体(企业)之间的关系进行过探讨,但我们尚未发现运用社会网络分析方法,探测行业专利技术集群的研究成果。
专利技术集群分析通常由专利凝聚子群分析和专利派系分析两部分构成。
当网络中某些行动者之间的关系特别紧密,以至于形成一个次级团体时,这样的团体在社会网络分析中成为凝聚子群。凝聚子群分析就是研究行动者之间关系的紧密程度,如对于我国境内的部分网站进行凝聚子群分析,可以判断出哪些网站之间的关系比较紧密,相互联系紧密的网站之间彼此在网站信息内容上或用户链接倾向上是否具有某些关系等信息。而关于某一个网络中存在着多少这样的子群的分析称之为派系分析。
觉得原文不光综述拉,方法介绍也拉。所以在这里重新整理了一下:
ISI Derwent Innovations Index专利数据库,标题=(wind energy)AND 专利号=(cn*),时 间 跨 度 设 置 为(from 2001-01-01 to 2012-12-31),检出结果3187条。
利用专利分析工具统计后,抽取关键词(Abstract)3186条、(Abstract Use)3185条、(Abstract Phrase)47678 条、德温特手工代码(Manual Codes)1781条、基本专利国(Basic Patent Country)12条、专利权人(Patent Assignees)2256条。
根据图6能看出,2001年前后是“风能”相关专利技术申请的初始阶段,到了2003年申请数量急速骤增,是2002年申请数量的近10倍。
随后2004年至2008年四年间的申请数量由59件增长到501件,年均增幅维持在 76.56%,2009 年至 2011 年是申请数量稳定时期,申请数量保持在 600 至 700 之间。
特别值得关注的是,2012年全年的申请数量急速骤减至 55 件,申请数量仅是 2011 年的 8%,基本缩减至2003年、2004年的水平,笔者判断这是“风电”产量瓶颈性过剩所导致的结果,这一现象和2012年的北京国际风能展的展出情况基本类似。可以说北京国际风能展是国内风电产业发展的晴雨表。
据展会主办方提供的资料显示,自2008年首届展会开始至2011年,参展企业持续增加,2011年达到了破记录的612家,而2012年展会展商则缩至400家。这与风电产业近些年的发展轨迹基本契合。
笔者利用专利分析工具,针对1781个德温特手工代码进行统计分析,按照申请次数的多少将其进行了排序,结合年度、条目数及手工代码三个维度,排在前10位的专利统计分布情况如图7所示。
选择记录数(即申请次数)Records >100的数据作为分析对象,可以基本反映出数据的整体情况。
分析可见:
专利X15-B01B(非矿物燃料能源生产系统—风能—电动机—生成器)的申请高峰阶段是2009年至2011年,期间年度申请数量逐年增加, 从2009年的100件左右增至2011年的130件左右;
X15-B01(非矿物燃料能源生产系统—风能—电动机)的申请高峰期同为2009年至2011年间,但是年度申请量却呈小幅下降趋势;
X15-B01A(非矿物燃料能源生产系统—风能—电动机—涡轮机)的申请高峰期为 2008 年至 2011 年,年度申请量基本维持在60件上下并呈前高后低态势,且和U24-H(放大器和低耗能供给—低功率系统)一样同为申请年度最早的专利内容,最早申请年度为2002年 ;
X15-B05(非矿物燃料能源生产系统—风能—控制、监控及测试)的申请峰值年是2008至2011年,为震荡上涨形态;
X15-B06(非矿物燃料能源生产系统—风能—支撑结构)、U24-H 的申请高峰均集中在2007-2011年度,前者呈平稳增长态势,后者呈震荡增长态势;
X15-B01A6(非矿物燃料能源生产系统—风能—电动机—汽轮机—垂直涡扇)的申请高峰持续期最短,仅为2010、2011两个年度;
X11-U01E (发电及高压设备—应用型电机—电能生产—风扇涡轮发电机)的最高申请量出现在2009年,呈前增后降分布;
X12-C01E(动力分配/部件/整流—动力转换器/反应器—线圈核、线圈、焊接—绝缘套管/终端机、工厂—能源配给转换器)集中申请期为2008至2011年,2010年为峰值年申请量在40件上下;
其中X15-B01A(非矿物燃料能源生产系统—风能—电动机—涡轮机)、U24-H(放大器和低耗能供给—低功率系统)的初次申请时间最早,同为2002年。
笔者选择Records >100 的德温特手工代码记录(Manual Codes Records)构建皮尔斯Pearson相关矩阵,图8反映了该矩阵的部分情况(截选记录数位居前35),颜色越深表示横竖两排相对应的代码的相关性越强。
通过计算机辅助计算,得出了按专利申请次数排名前100的德文特手工代码的中介中心性的整体情况,如图9所示。
根据上述计算结果可知,代码为“A12-E08B”、“X15-A”,“X15-B”,“A12-H”以及“A12-W16”的中介中心性系数最高,分列前 5 位,依次是 38.689、38.689、37.109、35.386和28.869;“中介”程度位居后5 位的专利德温特手工代码分别是“X15-A05X”、“X26-D03” 、“V06-M07A” 、“X26-F” 和 “X12-D03H”,其中介中心性系数依次为 0.562、 0.562、0.549、0.161 和 0.000。
通过比较专利的申请次数及该专利德温特手工代码的中介中心度,笔者发现一重要现象,即专利申请次数和专利德温特手工代码的中介中心性并不完全成正比关系,如 “A12-E08B”的申请次数仅排在 61 位,但其中介中心性却高居榜首,“X15-B01”的申请次数位居第 2 位,但其中介中心性排名却仅为 49,又如“X15-A”的申请次数排名第12,中介中心性却高居第2。
这里我们将文中“4.1”中所获得的1781条德温特手工代码(Manual Codes)视为上述派系分析和凝聚子群分析中的行动者。
利用专利分析工具,将申请次数大于等于 50 的 Manual Codes 数据进行自相关关系可视化,得到关于Manual Codes的技术集群地图,如图10所示。
图10中蓝色圆圈表示不同的专利派系,每个圆圈旁都显示有该派系中主体专利的Manual Codes标识及其全部申请次数,以及在矩形内所显示的专利凝聚子群。
如最上方的圆圈“A12-H”代表着一个专利派系 ,在这个派系下有着“X15-B01B”、“X15-B01A”、“X15-B01”、“X15-B06”这几个专利凝聚子群 ,且按照各自专利申请范畴同属于“A12-H”派系的有效申请数量降序排列,可以看出在它们全部的专利申请中,同属“A12-H”派系的申请次数依次是14次、12次、11次和10次。
图中两个圆圈间的连线表示这两个派系间的自相关程度,直线越粗表示两个派系之间的自相关性越强。
因此可以分析得出在所有专利派系中,“X12-J05”和 “U24-D05”两个派系的自相关性最强,相关系数超过0.75;相关系数大于0.5的派系有“U24-H”派系和“X12-H01B”派系,“X26-U06”派系与“X26-E01E”派系以及“X21-B04A”派系和“X21-A01F”派系,其它派系的自相关性则较弱。
通过对图中数据的进一步分析,可以发现专利派系中各专利凝聚子群的申请次数并不决定着该专利派系与其它专利派系间的自相关性,如中部最左边的“X15-B01”派系,专 利“X15-B01”总体申请次数高达 400 次,该派系下的专利凝聚子群“X15-B05”、“X15-B06”、“X16-B01”以及“X15-A”的有效申请次数均相对较高,依次为66、48、40、36,但是“X15-B01”派系与其他专利派系的相关性极弱,呈现独立状态,类似情况的专利派系还有“X15-B09”以及“X15-B05”等。
至此,本文相继给出了2001年至2012年“风能”专利的年度申请情况,并总结性概括了专利的总体申请情况特征;列举了出现次数排名靠前的德温特手工代码分布情况,剖析了申请次数最多的专利群体细节,分析得出了德温特手工代码的中介中心性情况;最后得出了“风能”专利技术集群的可视化社会网络,辨析了专利派系间的关系情况及各专利派系下的专利凝聚子群特征。
通过对专利的系统分析可以获得与产品相关的技术信息、产业发展现状信息、技术发展的背景信息、有关技术发明有用的详细信息和关键信息、有关技术领域的状况信息和研究开发及技术产业化的众多信息,这些信息都是企业进行技术创新和技术升级所需要的极具价值的重要情报。
战略性新兴产业能否发展壮大取决于产业的技术创新与政府战略的联动效应。正如国家科学技术部万钢部长所说:战略性新兴产业的培育和发展不仅要受到市场前景、成长潜力、资源条件、产业结构等要素影响,还受到科学技术创新这一关键要素影响。高新技术产业化、自主创新技术的进步、产品的推广应用和自主创新政策的落实是培育和发展战略性新兴产业的前提条件。
绝了,怎么又扯到政府了,前面分析也没有说几几年间政府支持就蓬勃发展啊。
本研究所借助的竞争性专利情报分析方法及研究思路,不仅仅局限于针对风能产业的专利技术分析,亦可应用于其他战略性新兴产业内的技术竞争情报跟踪与技术创新的辅助性研究,向企业提供了专利竞争情报分析工作的参考示范。
从这里引入第二个补充吧,我也想了解一下,专利情报分析方法究竟是啥。
论文介绍:
研究概述:
方法综述:
(1)专利情报统计分析法:
(2)专利情报机器学习分析法:
① 专利情报聚类分析法:
② 专利情报神经网络分析法
人工神经网络是重要的机器学习分析方法,在专利情报分析过程中,相关算法主要应用于以下两方面:专利分类的神经网络分析、专利指标评价预测的神经网络分析。
值得指出的是,今后,专利分类方法应与自然语言处理、本体技术、模糊数学等其他理论与方法结合使用,以提高分类的准确性。
具体的研究内容就不说了,基本都是在神经网络的算法、或者改进算法的基础上,做分类和回归预测任务。
(3)专利情报复杂网络分析法
结论:
[1] 国务院关于加快培育和发展战略性新兴产业的决定[EB/OL].国务院办公厅http://www.gov.cn/zwgk/2010-10/18/content_1724848.htm, 2013-11-26.
[2] 胡锦涛强调:推动战略性新兴产业快速健康发展[E/B].新华社[EB/OL].http://www.gov.cn/ldhd/2011-05/31/con-tent_1874294.htm, 2010-10-18.
[3] 百度百科[EB/OL].http://baike.baidu.com/linkurl=h9gzr HVUw Nmqte Ac Yf Ufp Nr1cs BBu21PQWit9t OFi-AWg SH131AY20z Ob-A6ur B2x, 2013-11-26.
[**4]** 江波.论企业与产业创新对工业发展模式转型的作用[J].广东社会科学, 2012, (2) :46-53.
[5] 2012年中国风电装机容量统计[R].北京:中国可再生能源学会风能专业委员会, 2013:1.
[**6]** 韩永奇.2012:风能产业向左还是向右[J].中国经济和信息化, 2012, (3) :93-94.
[**7]** 王晓光.社会网络箍式下的知识管理研究述评[J].图书情报知识.2008, (7) :87-91.
[8] Wasserman S, Faus t K.Social Ne t work Analysis: Methods and Application[M].New York: Cambridge University Press, 1994:5-11.
[**9]** 李亮, 朱庆华.社会网络分析方法在合著分析中的实证研究[J].情报科学, 2008, 26 (4) :549-555.
[**10]** 包昌火, 谢新洲.竞争对手分析[M].北京:华夏出版社, 2003:136-145.
[**11]** 肖冬平.基于社会网络视角的知识网络研究[M].北京:人民出版社, 2011:87-97.
[**12]** 刘军.整体网络分析讲义[M].上海:格致出版社, 上海人民出版社, 2009:98.
[**13]** 李永立, 吴冲, 孙纪舟, 等.基于社会网络分析的多属性关联规则挖掘方法[J].情报学报, 2012, (8) :823-829.
[**14]** 栾春娟.社会网络分析方法在公司技术集群探测中的应用——以波音公司为例[J].科技创新导报, 2010, (25) :253-254.
[15] 岳章.北京风能展遇冷:整机产能过剩率50%[EB/OL].http://finance.ifeng.com/news/industry/20121120/7320306.shtml, 2012-11-20.
[16] [EB/OL].http://Web of knowledge.com/WOK46/help/zh_CN/DII/hcodes_manual.html, 2013-08-25.
[17] Borgatti SP, Everett MG, Freeman LG.Ucinet for Windows: Software for Social Network Analysis[M].Harvard, MA:Ana-lytic Technologies, 2002:392-396.
[**18]** 张世怡.刘春茂.中文网站社会网络分析方法的实证研究[J].情报科学, 2011, 29 (2) :246-252.
[**19]** 万钢.把握全球产业调整机遇, 培育和发展战略性新兴产业[J].求是, 2010, (1) :28-30.
从小到大吐槽一下本篇论文吧
② 经常出现“笔者分析”、“笔者判断”,特别是在数据分析部分也是这样,代表主观性很强。(放在研究展望,或者讨论部分就很正常)
③ 英文释义:文章第一次出现“德温特手工代码”时,并没有给出英文翻译and解释。第二次出现时说了“德温特手工代码”的英文是“Manual Codes”,之后统计的时候,又翻译一遍“德温特手工代码的记录数”是“Manual Codes Records”,我寻思这也不是一个啥专业名词啊。
可以说,完全没有综述。
综述的时候,你要么把相关方向的论文和相似研究的论文梳理一下,要么概述性地把社会网络分析的概念、原理和方法综述一下,最起码你也要把文章涉及到的研究方法都一起说明一下吧,结果啥都没有,还能把一些文章要用到的社会网络分析方法放在后面数据分析的部分讲。
① 数据概述部分,说抽取了关键词、摘要、德温特手工代码、基本专利国、专利权人多少多少条,这个有意义吗?一,没有明确说出之后社会网络分析用的到底是什么数据;二,就算这些数据是有用的,那也应该交代清楚具体有什么用。
② 分析不太规范,在“专利整体申请情况”部分,应该不能因为某个企业与整体产业的发展演变情况相似,就说某个企业是这个产业发展的晴雨表吧?
③ 分析不深入,仅局限在了描述结果,没有分析结果;抓住了异常点也没有进行分析;并且最后没有归纳结论。(当然,本来就没有任何结论,也没东西归纳)
eg1:做出了相关性矩阵,也不描述,也不分析。(而且,我个人也很好奇,为什么各个代码的记录数(申请次数)能反映他们之间的相关性)
eg2:说“发现一重要现象,即专利申请次数和专利德温特手工代码的中介中心性并不完全成正比关系”,也就描述了一下怎么不成正比,也没有分析原因。
只能说,很是搞笑。
④ 图表全都不清晰,每一张图都没有原图,官网甚至都没有2015年的刊。
① 通篇,没搞明白它具体想研究什么问题。感觉就是,他只是想试试把社会网络分析方法用到风能产业专利分析上,但没有一个具体的研究方向(比如,是分析它的演变趋势、还是主题变化、还是关键技术……),所以在使用方法上也没有任何逻辑,比如,应该要说:使用中介中心性是为了研究风能专利的什么特征?使用专利技术集群分析又是为了研究风能专利的什么特征?
② 关于文章的研究背景,几乎在每一个部分都重复强调了一遍研究的原因和意义。而本人在展示的时候是全都汇总到第一部分了。
一共就19篇参考文献,其中引用了6条网页,还有1个是百度百科。
严重怀疑这篇论文的一作只是挂了个名……
最后,选择阅读了一篇社会网络分析相关的论文,其实原因也是作者在文中说,专利的社会网络分析在工业应用得比较多,所以我就去找了一篇同年发表的工业相关的外文文献。
论文介绍:
《How Do Regions Diversify over Time? Industry Relatedness and the Development of New Growth Paths in Regions》
期刊(ECONOMIC GEOGRAPHY):
论文:
论文内容:
这篇论文放在另一篇文档里面啦,指路。
来源中信所官网,但网上能找到的信息确实不多。 ↩︎
国家社科基金项目数据库 (people.com.cn) ↩︎