1
大数据定义及特点
1、大数据的定义:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
2、大数据的特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),即IBM提出的5V特点。
在这里相信有许多想要学习大数据的同学,大家可以+下大数据学习裙:957205962,即可免费领取套系统的大数据学习教程
大数据被美国政府认为是“未来的新石油”,被视为等同于人力资源和物质资源的国家重要战略资源。著名的未来学家阿尔文·托夫勒在《第三次浪潮》中语言,社会经济的发展将由农业经济、工业经济进入信息经济和生物经济时代。
提到大数据,必然要提到云计算,大数据与云计算的关系就像一枚硬币的正反面一样密不可分,大数据依托云计算的分布式处理、分布式数据库、云存储和/或虚拟化技术。
大数据的基础是数据大,有海量数据可以进行挖掘,那么对于生物医药B2B尤其是制造业来说,对海量数据的挖掘会带来怎样的改变?那一定是按需进行点对点的精准匹配。
在互联网诞生之前,无论是企业还是个人,最痛苦的是手头掌握的信息太少、信息来源缺乏、信息处理时间缓慢;在商业决策、人才政策等各方面与产业链的互联缺乏数据及时支撑,信息不对称严重制约产业和企业自身发展。
互联网犹如一股春风,瞬间让我们进入了数据大爆炸的时代,短短十几年,数据已经达到无可想象,毫不夸张地说,我们的世界将在 2025 年被数据淹没,这丝毫不令人惊讶,2025年全球大数据量级将达到 163 ZB,比 2016 年创造出的数据量增加10倍,全球数据量产生的第一大主体将由消费者转移到企业,届时企业产生的数据量将占到全球数据总量的 60%。
注意!注重数据价值的时代已经来临,并逐渐取代了从模拟数据向数字化转变的时期;产生、使用和管理对生活产生重要影响的数据信息,对于消费者、政府和企业的正常生活和运转必不可少。消费者和企业将持续在不同设备和云之间产生、分享和访问数据,增长速度也将超出此前的预期。
你是否有这个困惑:当你想买一种设备、或者检索某种知识盲点,去百度搜索的时候,随便输入一个关键字,弹出来几十万上百万的结果,你会不会陷入选择困难?在这么多信息中,如何找到你最匹配的商品或服务?这真实大海捞针,比没数据时代更烦恼了。
2
大数据的来源
大数据时代,人人都是数据源,每时每刻都在产生数据。比如:早上起来刷个朋友圈、出门吃早饭用移动支付、打开导航开车出门避堵、使用App刷刷时政新闻等等。任何个人和企业的被记录行为,都被主动或被动记录在大数据这个池子里。当你走在路上没有使用任何看似与产生数据有关的行为,但是你的行为有可能被路面的摄像头、行车记录仪等实时记录,你就成了这里面大数据的一份子。
对于企业的大数据来源,我们可以概括为三个方向:
核心:即企业数据中心和企业云的数据;
边缘:核心数据中心外的其它企业系统;
终端:PC、手机、传感器、照相机、智能汽车等;
3
生物医药大数据
在生物医药领域, 各种平台的数字化、企业营销PR、无数的数码传感器,时时刻刻都在产生着大量数据。我们已经进入了具备相当深度和广度的生物医学大数据时代。
生物医药行业数据呈现爆炸性增长,包罗信息多、价值大,但存在碎片化、利用率低的问题。为适应生物医药研究进入数据密集型范式的时代需求,生物医药数据要以“整合、交互与先进IT技术”为导向,进行有效挖掘、实现高层次的汇交共享和分析挖掘,从而使医药行业的每个参与方均从中受益。
供给和需求双轮驱动:供给驱动来自于生物医药电子数据的积累、数据挖掘手段的提升和移动互联的普及。随着电子病历、二代测序、互联网医疗、药品网售、云存储等新技术平台的出现,生物医药大数据的积累正在加速。另外,新技术的出现让数据挖掘、大数据分析的手段日益精进。而生物医药产业链各个环节效率的亟待提高、精准医疗技术和市场的成熟、健康管理和慢病管理等需求也加速着生物医药大数据的推进。
前面我们讲了大数据产生之前和之后的两个场景:
数据少的时候,我们需要更多数据来支撑决策,就想方设法做加法,力求得到更多有用的信息;数据大的时候,我们又陷入决策困难,因为在大数据里面,绝大部分数据是无效的,无效的脏数据让我们非常痛苦,这时候必须要做减法。
那么问题来了,如何能够减掉无用的信息、留下有用的信息呢?那就必须对大数据进行挖掘,提取最精准的数据。
数据没有对错,只有多少之分。当你检索一条信息,不管弹出来的是1条信息,还是100万条信息,他们有一个共同的名字叫答案,你要做的是从这些答案中找到最适合你的那一条信息。大数据的最有效应用场景,未来一定是企业行为分析和决策支撑,是B2B,在制造业B2B尤其突出。企业行为的三大要素:参数、性能指标和价格,因为定量因素多,变量因素小,更容易也更适合进行大数据挖掘。
大数据的本质是量化和模型。通过量化的数据和可建立的模型,挖掘出精准的答案。为什么不是B2C或C2C?因为C端用户消费习惯涉及心理、喜好、环境、收入等等的变化因素太多,需求的变化较大、不确定因素太高,挖掘数据背后的行为很难,这也是为什么C端推送的服务经常被吐槽不精准的原因。
制造业及其产业流通方面的要素固定和要求明确方面比较清晰,一个企业的基本需求一般都比较固定,如对地理位置的要求、对品牌的要求、对技术的要求等。一个企业要买一台设备,乃至一个零件,他所有“逛”的时间其实都是他不愿意浪费的,他希望找到的或者被找到的就是那个最准确的卖家。
我们去比较一下C端平台和B端平台的区别就会发现,C端是以“逛”为主,逛着逛着就找到了喜欢的商品,因此C端平台都会注重视觉设计、注重商品的丰富度;反观B端平台的用户,就是采购提出其明确的需求,平台根据需求的产品参数、性能指标,以及平台上卖家的价格、距离、供货期、历史信誉等进行点对点的精准匹配,不需要“逛”的感觉,一定是精准化,不要浪费他的时间。买家只要有一个输入界面,输入自己的明确要求。然后,平台就会将最具性价比的一家或者几家卖家直接推送给买家,买家从中进行谈判采购就可以了。
4
生物医药大数据精准匹配
买卖双方的需求都清楚之后,我们真正深入去探索一下生物医药大数据的精准匹配是怎么实现的。我们今天谈的是B2B精准匹配,首先要回答一个问题:在生物医药B2B领域,用户是谁,用户在哪,用户要什么?这是一个全流程的事,是贯穿企业赢下全链路的。
企业的营销,大致可以经历三个阶段:从以产品为中心的1.0时代到以顾客为中心的2.0时代,再到以人文精神为中心、客户参与创新的3.0时代。在3.0时代,客户参与产品、营销的全流程创新,源源不断为企业的研发、生产和流通提供创新idea,只有实现供需的及时有效互动,企业的营销才会永葆竞争力。
营销的本质会回归到数据,数据的核心是用户,企业需要研究的是用户需求,并聚焦用户需求,深层洞察消费者。用户数据不仅包括用户是谁,还有产品销售数据、售后服务数据、官方网站数据、社交媒体数据等。将和企业用户有关的一个个数据孤岛连接成一个大数据平台,并进行清洗、融合、识别,为每个用户生成360度用户画像。
对这些数据有两个核心用处:第一,用数据挖掘的办法,看看这些用户什么时候又要买企业的产品,这就是精准营销。第二,看看这些用户中间,哪些用户很活跃,与他们进行交互,满足他们的需求,这就是交互创新。
用户与用户之间不是孤立的,大数据的核心是连接。数据经过连接才能变成信息。以用户数据为核心,全流程连接企业运营数据,全方位连接社交行为数据,特别是连接网络交互数据、网器行为数据。将企业全链路上的销售数据、售后数据、会员注册数据,进行数据融合,生成360度用户画像,精准洞察用户。
优秀的企业满足需求,伟大的企业创造需求。建立全流程数据连接之后,数据最核心的价值就出来了,那就是预测。预测用户接下来会发生什么样的行为,会有什么样的需求,或者对已有的产品、方案有什么更新的需求。经过数据融合、用户识别,生成数据标签,建立数据模型,并用量化分值定义用户潜在需求的高低。
人有灵魂,数据亦然,数据的灵魂是应用。数据采集和挖掘的最终目的是要用数据,用对数据、用好数据。企业要分析业务部门在什么时候、开展什么业务、可能遇到什么问题,在解决这个问题时需要用到哪些办法,这些办法中间哪些可以用数据挖掘的路径来达到目的。进而指导企业在何时、以何种方式该有何种决策。
精准营销,表面看是企业为产品找用户,本质上是为用户找产品,是交互创新,是对企业传统营销方式的颠覆。
生物医药制造企业一般有两大问题需要解决:一是销售线索和品牌客户太少,如何获得更多更好的线索和体验。二是潜在的客户太多线索太多,从哪个先开始,怎么优化现有的线索,怎么排序和提高现有线索的效率。
我们可以从两方面来对症下药:
一是通过预测性线索挖掘,构建销售通路,帮客户寻找新的销售线索;二是预测评分方法,帮客户把现有的销售线索进行排序。
具体来讲,我们搭建一套生物医药细分领域的创新服务平台,通过海量数据体系,构建了企业洞察指标体系。我们帮助产业构建资源库、用户库、产品库,同时又构建产业链必需的知识库如专利、人才、技术、知识产权、政策法规等,通过这些数据库的建设,进行数据建模,构建知识图谱,通过机器学习,人工智能的方式帮助企业智能推荐其发展必需的服务要素。
举个例子:台州是全球原料药之都,其原料药在全球具有举足轻重的分量,但台州的原料药企业竞争也非常大,某家原料药生产企业需要勉强全球拓展市场,创新服务平台怎么进行赋能呢?
产业互联网是网络协同和数据智能双螺旋赋能的时代。首先,我们帮助这家原料药企业进行数字化。企业将标准化产品、非标准化产品及服务上云,在创新服务平台上,这家企业就有了众多个性化的标签,当企业原来的客户在平台上登录后,就天然进行了智能匹配,原来你也在这里;而当原本没有建立连接的潜在客户登录创新服务平台之后,平台就会对双方的供需和标签等进行一系列匹配,并对匹配度进行细分。
当然,对于潜在客户来讲,他收到的信息会是来自多个供应方的,最终由企业决策者决定选择最适合自己的产品或服务。
通过大数据尤其是产业大数据精细化分析,给生物医药制造企业带来了很多战略战术多层面的好处,通过多维度的数据分析、预测,数据已经成为引领生物医药制造业成长的指南针。
众所周知,生物医药产业有很强的技术壁垒,在各个细分市场都有众多专业企业从事专业服务,目前最大的痛点是信息不对称,从产品、服务的供需,陌生主体之间的交易是否存在欺诈,以及价值是否符合双方预期等都存在很大的鸿沟。如何破局?且看大数据如何解决这个问题。
我们从基本的供需信息不对称说起,假设A公司需要一项包材相容性研究服务,然后他会做什么?可能他会从原来的合作伙伴中选择一家,也可能找熟悉的朋友咨询,还有可能去百度,再就是他们也许会在相应的社群进行询问,最后的结果也许能选到合适的服务商,也许会无功而返,但是效率就不敢恭维了。
那么大数据可以做什么?它可以让万企互联,然后根据各自的需求和提供的服务进行精准匹配,哪怕彼此之间从来没有听说过对方,至少这条连接先建立起来,而且最重要的是非常精准。
信息不对称解决了,那如何解决价值认知不对称问题?还是A公司,他已经找到了精准提供包材相容性研究服务的公司,但是双方的价值认知存在很大偏差,A公司心理预期价格假设是10万,而提供这项服务的B公司(服务非常适合A公司的需求)认为这项服务必须要100万,否则免谈,结果很有可能是前面花了时间和精力谈的合作就崩了。那么大数据可以做什么?它可以做价值仲裁。在我们的数据库里面,有海量曾经类似的合作数据,他会给这项服务提供一个参考成交价格,数据会说话,它告诉A、B双方,有95%的同类合作服务价格在50万,双方都可以参考,且参考意义很大。(请忽略数字,数字是随便编的非真实数据~~)
好了,有人会说,大数据有这么厉害我信了,能做价值仲裁我也信了,可是我怎么相信我从来没有合作过的陌生客户?别急!大数据还有更深层次的挖掘,那就是企业信用。任何有经营行为的企业都存在信用维度,我们可以通过多种维度对企业的信用建立模型,计算得出一个分值,这很好理解,芝麻信用大家不陌生吧,企业信用也是一样的道理。
数据和信息给生产制造企业带来价值,而数据的分析和挖掘又可以产生许多有价值的信息。大数据真是其乐无穷。
采购数据的应用:制造企业也需要原料、需要大量的源头合作伙伴,通过商品流通大数据可以告诉企业哪个合作伙伴的原材料生产的产品更受欢迎,同时预测销售,提前采购原料安排生产,简直是诸葛亮啊。
产品数据的应用:制造企业的产品生产经过策划、设计、制造、销售和售后等环节,通过回流的数据对企业的研发、设计、制造服务。
互联网、大数据和人工智能,能够对海量的需求进行精准匹配。“互联网+制造业” 使得制造商和消费者之间能够形成双向的链接与互动,是对制造业价值链的重塑与优化。制造商和消费者之间形成双向连接和互动。创新服务平台为制造商提供信息(用户需求)、原材料(“全球买”)、销售(在线化)、物流(贯穿生产和销售环节)的全链条服务,这实际上也是制造业价值链的重塑与优化,从而获得比实物制造更广泛的利润与发展空间。
当企业进入到创新服务平台,平台就像一个医术高明的神医,通过大数据分析,告诉该企业当前经营状况是怎样的,在行业中的水平是怎样的,往哪个方向提升会更有利,该提前采购什么原材料,有哪些风险需要注意,企业需要增加什么样的人才,这些人才在哪里,在知识产权方面有什么需求,如何获得这些信息,企业资金运转情况怎样,潜在的资本在哪里,该如何对接……一切都是量身打造。