2016全球大数据战略版图剖析(2)

本文为数盟原创文章,转载时请注明出处为“数盟社区”。

http://dataunion.org/wp-content/uploads/2016/02/2016BigDataLandScape.png

上图是2016大数据版图英文完整版。

为了更好的使大家了解行业现状,我们整理出了对应公司的中文介绍,以飨读者。

本次介绍的公司为如图所示的部分公司,请悉知:

7.图数据库

Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。

Neo4j因其嵌入式、高性能、轻量级等优势,越来越受到关注。

 

Apache Giraph是一个可伸缩的分布式迭代图处理系统,灵感来自BSP(bulk synchronous parallel)和Google的Pregel,与它们 区别于则是是开源、基于 Hadoop 的架构等。

Giraph处理平台适用于运行大规模的逻辑计算,比如页面排行、共享链接、基于个性化排行等。Giraph专注于社交图计算,被Facebook作为其Open Graph工具的核心,几分钟内处理数万亿次用户及其行为之间的连接。

 

OrientDB是兼具文挡数据库的灵活性和图形数据库管理链接能力的可深层次扩展的文档-图形数据库管理系统。可选无模式、全模式或混合模式下。支持许多高级特性,诸如ACID事务、快速索引,原生和SQL查询功能。可以JSON格式导入、导出文档。若不执行昂贵的JOIN操作的话,如同关系数据库可在几毫秒内可检索数以百记的链接文档图。

 

InfiniteGraph 是一款由Objectivity公司推出的图形类数据库,该公司还推出过一款同名的对象类数据库。免费许可版本只能支持最高100万节点及边线总数。InfiniteGraph需要作为服务项目加以安装,这与以MySQL为代表的传统数据库颇为相似。InfiniteGraph借鉴了Objectivity/DB中的面向对象概念,因此其中的每一个节点及边线都算作一个对象。尤其是所有节点类都将扩展BaseVertex基本类、所有边线类都将扩展BaseEdge基本类。

InfiniteGraph企业分布式图形数据库具有可伸缩性,它还能够在大量多地存储的复杂数据中,为大型企业执行实时搜索。通过使用图算法,它为分析应用程序添加了新的价值,以发现和存储新的连接和关系。

 

8.MPP数据库

Teradata天睿公司(纽交所代码:TDC),是美国前十大上市软件公司之一。经过逾30 年的发展,Teradata天睿公司已经成为全球最大的专注于大数据分析、数据仓库和整合营销管理解决方案的供应商。产品范围包括:Teradata 数据库、Teradata数据仓库软件、企业数据仓库、动态企业数据仓库、数据仓库专用平台、Teradata Aster大数据探索解决方案、Aprimo整合营销解决方案等。

Teradata天睿公司的主要产品和解决方案包括:企业级数据仓库;动态数据仓库和动态企业智能™。主要的软硬件产品包括:Teradata 数据库软件;Teradata 专用平台系列;Teradata逻辑数据模型和Teradata 分析应用程序和服务。主要的服务包括,Teradata 专业顾问服务;Teradata 客户支持服务和培训服务。

 

HP Vertica 基于列存储,相比传统面向行存储的数据库具有巨大的优势。同时 Vertica 支持 MPP(massively parallel processing)等技术,查询数据时 Vertica 只需取得需要的列,而不是被选择行的所有数据,其平均性能可提高 50x-1000x 倍。(查询性能高速度快) Vertica 的设计者多次表示他们的产品围绕着高性能和高可用性设计。由于对 MPP 技术的支持,可提供对粒度,可伸缩性和可用性的优势。每个节点完全独立运作,完全无共享架构,降低对共享资源的系统竞争。在此架构下,添加更多的节点可增加更多的容量和性能。当一个节点出现故障时,不会对整个系统产生影响。其他节点会完成故障节点的任务。  Vertica 的数据库使用标准的 SQL 查询,同时 Vertica 的架构非常适合云计算,包括虚拟化,分布式多节点运行等,并且可以和 Hadoop/MapReduce 进行集成。

Vertica 的优势在于更加精确、灵活,且维护成本要便宜很多。虽然是商业软件,但是有社区版本可以免费下载使用。

 

Netezza是专门的数据仓库数据库。Netezza 将存储、处理、数据库和分析融入到一个高性能数据仓库设备中,该设备专为使大数据高级分析更简单、更迅捷和更易用而设计。

目前,IBM Netezza 设备是 IBM PureSystems 专家集成系统的一部分,IBM PureSystems 具备预置的专家能力、为集成而设计、简化用户体验等优势。作为 PureData 系列产品的一部分,Netezza 设备现在称为 PureData System for Analytics。它与 Netezza 设备一样,以简易性、速度、可扩展性和分析能力为设计原则。

 

Actian是一种比同类产品性能更高、速度快50倍以上的列式数据库,提供快速和选择性查询。其产品ParAccel SMP/MMP能为商业智能工具以及其他应用程序利用大多数非结构化数据进行高速分析。

新一代大数据管理领域的领导商、分析数据库Actian宣布推出具有先进Hadoop集成功能的SMP分析数据库。此款升级版产品为商业智能工具以及其他应用程序利用大多数非结构化数据进行高速分析和大规模信息生产打开了广阔的空间。

Actian是最高性能的列式数据,可构架在现有数据中心之上进行更高性能的大数据分析,用于电信金融政府企业:金融风险分析、通讯运营分析、商业预测分析、预测犯罪行为、预测监控计划等。

 

Kognitio是一家本身不生产硬件产品的数据库厂商,它看到了客户对快速部署的广泛兴趣和市场需求,推出了在惠普、IBM硬件产品上预配置有WX2数据库的Lakes、Rivers和Rapids解决方案。1989年交付了第一个内存分析平台,现在Kognitio能提供三倍速度和虚拟多维数据集。

2011年, Kognitio新增了一个虚拟化OLAP风格的Pablo分析引擎。它提供了灵活的、为企业用户进行分析的解决方案。用户可升级选用WX2构建一个虚拟多维数据集。因此,WX2数据库中任何一个维度的数据都可在内存中用于快速分析。这种分析的前端接口是我们常见的Microsoft Excel。

Kognitio优势包括它是dbSaaS商业模式中的先锋;持续在内存计算方面的投资,客户报告查询和装载的速度很棒。2011年发布了Pablo内存OLAP产品,将热数据放在内存中,冷数据放在磁盘上,由DBMS自动管理。

 

exasol是一个分析数据库管理软件的公司。其产品被称为exasolution,一个柱型的关系型数据库管理系统。exasolution是一种并行的关系数据库管理系统,它运行在一个标准的硬件服务器集群上。在SPMD模型中,每个节点上的相同的代码同时执行。数据通过柱导向方式存储并且使用专有的内存压缩的方法。exasol实施了所谓的集群操作系统(exacluster OS)。它是基于标准的Linux提供了并行程序的功能。它可以与虚拟化相比,但不是一个单一的服务器硬件虚拟化,虚拟化集群中的节点的一个。集群管理算法一样提供故障转移机制或自动群集安装。

 

Dremio

Dremio,由开发了Apache钻开源项目的两个前MAPR员工创立,只经过两个月的运行后已获得了超过1000万的运营资金。Dremio正在建设的包括一个可以使用NoSQL数据库SQL查询引擎,Hadoop的文件系统和云存储服务的工作系统。

 

9.云数据仓库

Zmazon web services

Google Cloud platform

Microsoft Azure

Pivotal

Snowflake Twitter在把存储系统从MySQL迁移到Cassandra的过程中由于Cassandra没有顺序ID生成机制,于是自己开发了一套全局唯一ID生成服务:Snowflake。1 41位的时间序列(精确到毫秒,41位的长度可以使用69年) 2 10位的机器标识(10位的长度最多支持部署1024个节点) 3 12位的计数顺序号(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号) 最高位是符号位,始终为0。优点:高性能,低延迟;独立的应用;按时间有序。 缺点:需要独立的开发和部署。

Snowflake Computing推出了基于云的数据仓储服务,其服务定位是成为复杂、昂贵本地数据仓库系统的替代者,旨在实现灵活和易于管理等特性。

 

Waterline data不像手动创建元数据、对原始数据的搜索或探索一个文件,Waterline Data在规模技术的发现、业务的合规性元数据上实现了自动化。

Waterline Data自动创建和管理一个库存数据资产的基层授权数据架构师,提供的所有数据业务需要通过安全的自助服务。加速了数据准备、大数据分析和数据科学,使数据工程师、数据科学家和分析师便于发现,理解和诠释数据编码。数据治理的政策是坚持通过数据管理员审核数据血统,保护敏感数据,并确定合规问题。

它已关闭了1600万美元的B系列融资回合。这是该公司的第二轮融资,使总资本提高到2300万美元。

 

infoworks(英孚沃克)是中国领先的项目管理系统和解决方案提供商。infoworks致力于为各种以项目运作形式的企业提供业务专用软件。infoworks的解决方案使企业更加努力进取并能快速适应市场的变化。infoworks正在成为企业所期望的努力进取的项目管理软件供应商。

 

10.数据转换

Alteryx成立于2010年,是一家一站式数据分析平台的初创公司,旨在同一个平台上完成数据输入、建模以及数据图形化等操作,为企业用户提供商业分析。2015年Alteryx宣布获得8500万美元C轮融资。

Alteryx的产品主要有Alteryx Designer和Alteryx Server。具体来说,Alteryx Designer能帮助分析人员缩短动辄数周的传统流程,在数小时内即可以直观拖拉方式完成数据融合及分析,使用者不需要IT程式设计的背景也能使用;Alteryx Server是一个全方位的商业分析方案,让分析团队与决策主管之间有效分享所挖掘的资讯,构建一个简易、互动式的分享。

 

Talend是一家专业的开源集成软件公司,为企业提供开源的中间件解决方案,从而让企业能够在他们的应用,系统以及数据库中赢取更大的价值。Talend 凭借其提供的企业级开源技术,同时满足了大中小企业的数据集成与应用集成需求,击碎了传统的闭源模式,为集成市场带来了为普通用户服务的气息。

Talend 推出的一体化集成平台可以实现数据集成,ETL,数据质量,主数据管理(MDM),应用集成等各种项目。Talend的解决方案性能稳定,使用便利,扩展简易,强大灵活,因而已成为世界上应用与部署最为广泛的集成解决方案。

 

Trifacta是一种提供数据分析服务的平台,最近获得了风险投资以推动其能使数据分析师更容易地做数据整理的工作。它的目标是能够比目前更快、更容易地收集、清理和转换数据。Trifacta以用户为中心的角度而不是以程序员的角度去解决问题。业务分析师和数据科学家将能使用可视化的方式去清洗数据集。基于伯克利分校和斯坦福大学的研究,该平台的目的是使员工和机器一起合作,以从数据集中提取数据。

 

Tamr公司的软件通过机器学习技术为数据源提供单一视角,同时为企业提供一个完整的数据资产库存并寻找分布数据集之间的联系。该公司的技术最早来自MIT的计算机与人工智能实验室。

2013年,数据库专家Michael Stonebraker、行业资深专家Andy Palmer和Ihab Ilyas共同创建了Tamr,今年5月,公司正式运行。同时,这家基于剑桥和麻省的公司筹集了1600万美元的风险投资。

 

Paxata成立于2012年,其联合创始人兼CEO是Prakash Nanduri。在数据服务领域,存储和提供数据来源的数据管理系统(如Hadoop)和利用数据的分析应用之间普遍存在的一道鸿沟,即分析应用在对数据分析之前需要抽取、处理和整合多个来源的数据才能进行分析。这个数据准备的过程以往大都需要人工处理,耗时费力,Paxata的目的就是要填补这道鸿沟。

帮助数据科学家干脏活累活的云数据服务初创企业Paxata刚刚获得由 Accel Partners 领投的 800 万美元融资。

 

StreamSets公司成立于2014年,为下一代的大数据应用提供连续摄取技术。其企业级架构通过带来前所未有的透明度和加工数据来加速分析时间。StreamSets获取了12,500,000美元的A轮融资。StreamSets将利用其系列A的资金建立一个繁荣的开源社区,推进了公司的产品路线图,并逐步投资于伙伴关系和其他走向的市场活动。

 

Alation是一个使个体能够从组织中更容易获得数据的平台。Alation始建于2012,是谷歌、苹果的设计者和甲骨文执行信息检索的工程师联手创建,使人们方便地访问他们需要的数据。客户包括一些世界上最大的机构,拥有数千名员工、PB中的数据和数以千计的数据库。

 

11.数据集成

Informatica(纳斯达克代码:INFA)是全球领先的独立企业数据集成软件提供商。世界各地的组织机构依赖Informatica为其重要业务提供及时、相关和可信的数据,从而赢得竞争优势。目前,全球众多知名企业依靠Informatica使用及管理其在本地的、云中的和社交网络上的信息资产,以实现他们的信息潜能,并推动卓越的业务目标。

 

MuleSoft是提供连接SaaS和企业应用程序云端解决方案的整合平台。MuleSoft的 Anypoint技术是按需连接的,省去了自定义的P2P代码并支持使用自底而上的方法来实现SOA管理理念。现在,该公司的业务已经不局限于中间件和消息转换,更提供类似PaaS的平台,专注于帮助企业管理与集成API生态系统。MuleSoft的主要产品有:Anypoint技术、CloudHub、Mule iON与Mule ESB等。使用了Mule的公司主要有:沃尔玛、惠普、索尼、荷兰银行、花旗银行。

 

SnapLogic宣布获得3750万美元融资。该公司的技术能帮助旧版应用程序介入云端或内部数据库。迄今为止,SnapLogic融资总额已达到9630万美元。SnapLogic将业务延伸至新的合作伙伴生态系统,包括Amazon Redshift、ServiceNow、Splunk和Zuora。企业内部对云应用的采纳,以及对解决两大使用实例的需求的增加是该公司增长势头的助推因素,这两大实例分别为:实时应用集成,包括云对云和云对场内服务;以及对商业智能的更高需求,因为各种规模的组织机构已由传统方式转向数据仓库,并采用更现代的分析学和海量数据战略。

 

Bedrock Data是集成和数据管理平台,它可以让用户创建自己的业务系统,但价格合理。提供多方位的同步和有用的功能,如跨系统的工作流程。Bedrock Data是建立在现代技术,速度和性能优化的基础上。

专注领域包括:数据集成,CRM集成,数据管理,API集成,SaaS的集成,数据库集成,销售一体化,金融一体化,工作流,数据自动处理,主数据管理。

 

Xplenty成立于2011年4月,是一家来自于以色列的云数据服务商, 主要基于大数据技术提供简单易用的商业分析工具。 Xplenty日前完成300万美元A轮融资,投资者为Waarde Capital、Magma Venture Partners。

Xplenty基于谷歌云服务Google Cloud Platform推出云端简易版Hadoop,主要用于处理数据建模前的ETL数据清洗任务,以月租99美元的价格向谷歌用户提供Hadoop云服务,同时还免费提供数小时的专家在线培训。(Google近日也推出了面向物联网大数据的流处理服务Google Dataflow,但目前尚不可用)

Xplenty的用户可以在运行Hadoop任务处理存储在谷歌BigQuery存储服务中的数据。Xplenty的傻瓜版Hadoop还能运行于亚马逊AWS、IBM SoftLayer以及Rackspace等多个云服务平台,价格也略有不同。

 

12.管理/监控

New Relic是一款针对iOS与Android平台的实时监测工具。New Relic作为一个“软件即服务(SaaS)”,为Rails提供性能监视和分析服务。

New Relic工具有两种运行模式:(1)Production 模式:当您的工程以生产模式运行时,您可以在rpm.newrelic.com 网站上实时对它进行监督。 (2)Developer模式:当您的工程以开发模式运行时,您可以在本地localhost:3000/newrelic网页上查看到性能分析数据。

 

AppDynamics是基于SaaS服务模式的互联网App实时管理服务提供商,不但专注于SaaS平台和 App性能管理业务,同时也是美国性能监测领域的先驱者。AppDynamics的特点是通过监控了解用户的移动应用程序的性能和稳定性,从而保护开发者用户App的收入和获得良好的用户使用口碑。AppDynamics移动终端用户体验管理产品模块可以为上市公司全球移动应用程序的性能提供实时分析。

 

Actifio的主要使命是为大中小型企业、托管服务以及云服务提供商提供数据管理解决方案。Actifio公司的复制数据存储平台允许客户使用虚拟化技术储存与管理数据,也就是可以让客户创造出产品数据的单一副本,同时能维持原本的变更。这一平台可以帮助企业更好的保护数据,并尽可能降低储存成本,此外,它还能够减少90%的存储费用并可以大幅度缩短数据还原时间。数据存储服务Actifio获得融资1亿美金,估值已达11亿美金。

 

Numerify云分析平台初创企业Numerify 刚刚在B轮融资中获得1500万美元。 Numerify成立于2012年,创始人Gaurav Rewari和Srikant Gokulnatha是Oracle的前高管,也都在商业分析供应商MicroStrategy担任过产品管理职务。Numerify开发了自己的云分析平台,可以通过不同的API与多种数据来源进行连接,从而帮助客户方便地整合多来源的数据,进而开展分析。目前Numerify已经拥有Incomm、Netflix、Spansion及旧金山大学等客户。

 

Splunk 是机器数据的引擎。使用 Splunk 可收集、索引和利用所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动型计算机数据 。从一个位置搜索并分析所有实时和历史数据。 使用 Splunking 处理计算机数据,可让您在几分钟内(而不是几个小时或几天)解决问题和调查安全事件。监视您的端对端基础结构,避免服务性能降低或中断。以较低成本满足合规性要求。关联并分析跨越多个系统的复杂事件。获取新层次的运营可见性以及 IT 和业务智能。

 

Datadog是一家位于纽约的初创企业,主要业务是帮助其它公司监视云端服务的部署与运行情况。公司宣布其刚刚完成数额3100万美元的C轮融资。至此,这家公司已成功融资5300万美元。Datadog拥有一个支持多种主流云服务的控制台,该控制台能够帮助开发人员检测云端应用的运行情况,同时还能对云服务进行一站式管理。目前,该公司正在为Netflix、声破天、美国艺电公司、Mercadolibre等上千家知名企业提供服务。

 

rocana的使命是构建数据产品,业务运营,客户可以依赖于其业务运行的每一天每一分钟。我们有意专注于交付使用现代技术来解决谁经营企业的人的问题完整的应用程序。

我们的下一代监控软件消除了分析和跨整个基础设施可视化日志、可扩展性和性能的极限。

 

Driven

Anodot是一家提供实时分析和异常检测的大数据创业公司,通过实时在大量的数据中发现异常的数据并把他们转为有价值的商业信息,以消除商业观察中的延迟,支持快速的商业决策,目前主要应用在广告技术、电子商务和物联网行业。Anodot日前在 A 轮系列融资中获得 300 万美元,投资方为 Disrupt-ive,融资总额已达 450 万美元。

 

13.安全

 

Tanium是由Orion Hindawi父子开创的初创企业,成立于2007年,负责为企业网络提供安全保护和系统管理。2015年3月,为企业网络提供安全保护和系统管理的初创企业Tanium,以17亿5000万美元的估值,获得了硅谷著名风投A16Z(Andreessen Horowitz)5200万美元投资。Tanium 的解决方案是让客户机直接与服务器沟通。其组网利用了 P2P 技术,除了客户端与服务器的直接连接以外,客户端之间也有沟通。而用户则可通过浏览器管理网络上的设备并保证安全。根据网站介绍,利用 Tanium 的解决方案,网络管理员数秒内即可掌握数十万台设备的情况,并可在同样的时间内做出变更。所有网络节点均可查询、管理、更新、保护,而且在浏览器上近乎实时(15 秒左右)进行。

 

Illumio 是一家云计算安全技术创业公司,主要为企业私有云、公有云、用户数据和云端数据等端之间的数据提供安全保障工作——可以把它理解为云计算能力之间的权限管理工具。它能够确保正确的数据通过正确的云计算模块进行处理,传输到正确的地方,不论是公有云、私有云还是本地存储。

Illumio 此前在 2013 年 1 月完成了一轮 800 万美元的 A 轮融资,投资方为 A16Z;当年 9 月完成了一轮 3450 万美元的 B 轮融资。

 

Code 42成立于2007年,最初以个人数据保护和备份软件起家,随后便逐渐拓展到了企业备份领域。目前该公司在全球管理并保护着超过100pb的数据。而且公司所有的数据备份和存储解决方案都是跨平台的。Code42公司位于美国明尼亚波利斯,通过自己的数据中心和软件帮助企业管理他们的信息。该公司可以应对智能手机和平板电脑等不断普及的设备产生的大量数据。在线数据备份公司Code 42 Software在最近一轮融资中筹得5250万美元,投资方包括Accel Partners和Split Rock Partners。

 

DataGravity是一家数据情报收集技术开发商,2012年在新罕布什尔州的纳修阿市创立,DataGravity公司的任务是在不使用复杂的软件包的情况下将存储的数据转化为情报。DataGravity将大数据技术嵌入存储系统,令中型公司也能买得起这家公司的产品。DataGravity宣布在其B轮融资中获得了3000万美元的投资,本融资是由风投公司Andreessen Horowitz领导的,加上DataGravity在2012年4月获得的1200万美元投资,现在公司获得的总投资额达到了4200万美元。

 

CipherCloud公司是由Pravin Kothari创立的,他曾经创立过ArcSight安全公司,在经营的第一年,CipherCloud就已经搞定了约40个大客户,其中包括两个世界顶级银行。Andreessen Horowitz上个月向CipherCloud投资3000万美元,现在CipherCloud融资总额已达3140万美元。

CipherCloud将企业的数据从防火墙中迁移到云端,并且CipherCloud会在你的数据到达你的云应用之前对数据本身进行加密。通过对数据进行加密这样一种方式,使得你的云应用程序可以使用的数据的同时,避免了数据的泄漏。另外,CipherCloud允许用户根据自己公司的需求来更改加密级别。

 

Vectra公司是澳大利亚最大和最受尊敬的信息技术公司,为澳大利亚、东南亚及次大陆的私有、公共和政府机构提供信息安全和网络相关的解决方案。其解决方案是通过三个不同的业务集团提供,包括安全和法规遵从服务,技术和管理服务和技术解决方案。

 

Sqrrl为检测、调查和可视化的网络安全威胁提供了大数据分析工具。Sqrrl是大数据分析的公司,使企业能够精确定位,并在他们的数据中自动发现隐藏的连接异常活动并做出反应。 Sqrrl链接的数据分析平台提供了分析师的方式直观地调查这些连接,使它们迅速了解他们的周围环境,并采取行动。随着Sqrrl的网络安全解决方案,用户可以检测并与网络间谍活动相关的先进的数据泄露,内部威胁,和其他类型的难以检测攻击作出回应。Sqrrl架构的核心是各种大数据技术,包括Hadoop,链接分析,机器学习,数据中心的安全性,以及先进的可视化。

 

BlueTalon开发了数据中心的安全技术,可用于Hadoop,SQL等大数据环境。在Strata + Hadoop大会上,该公司推出全新的带有新细粒度数据访问控制功能的BlueTalon策略引擎,该公司表示这可以直接在Hadoop分布式文件系统(HDFS)上提供滤波和动态屏蔽功能。

该厂商表示,新功能为Hadoop提供了一个”包罗万象的安全毯”,绕过安全控制的模块用户可以直接访问HDFS数据,同时也消除了在特定应用种,孤岛式的安全策略所带来的风险。

 

14.存储

 

Zmazon web services

Google Cloud platform

Microsoft Azure

Panasas ActiveScale存储集群以其智能灵巧的存储,加速了Linux集群计算速度。将并行文件系统与基于对象的存储相结合,Panasas存储集群极大 地提高了Linux集群环境的可管理性和性能。系统具有如下特点:将集群的操作一体化,最大限度地减少了管理时间;提高了应用的数据吞吐率,使昂贵的集群 资源得到最大回报;能无缝地集成到现有的数据中心基础设施中去,最大限度地保护了现有投资。Panasas的并行存储集群,结合高性价比的智能硬件部件(Panasas ActiveStor高性能部件),从根本上提高了 I/O 性能和加强了易管理性,其吞吐量和 I/O 两种性能都打破记录,为计算集群、服务器组和单一客户端计算环境提供最优化的存储解决方案。

 

Nimble Storage是一家新兴的存储解决方案供应商,其创始人分别来自业内大名鼎鼎的NetApp和Data Domain,所以其了解传统存储解决方案的不足,并与广泛的企业IT管理者进行沟通,了解他们在数据存储和备份方面的需求,从而开发了创新的主存储系统和在线数据压缩技术,并将以SSD与HDD技术融入到同一个存储阵列之中,开创了混合存储的新时代。据Nimble透露,在全球范围内,其拥有1300多家用户,目前Nimble拥有400名员工,遥遥领先于其他新兴的专业存储厂商。

 

Coho Date是一家总部位于加州的初创公司,之前一直默默无闻,直到推出一个软件定义存储平台,融合英特尔PCIe闪存卡和亚马逊EC2风格的云技术的商品硬件。据该公司称,该存储架构性价比优势是全闪存阵列的2倍,同时还能提供公共云存储的性能。扩展存储厂商Coho Data近日称其将要进行的软件升级将支持客户直接在主存储内运行持久、便携式的存储容器。

 

Qumulo是一家总部位于美国西雅图的企业数据存储公司,专注于开发简单灵活、可扩展和高效的企业数据智能存储系统。这家公司今年3月刚刚成立,如今尚未公布任何具体的产品信息,却获得了2450万美元巨额A轮融资。 Qumulo的官方网站和相关媒体报道中都没有透露任何具体的产品信息,只是相当笼统地表示Qumulo致力于“融合企业IT的三大趋势——消费化、SSD技术和商品化”来解决“价值高达350亿美元的企业数据存储市场所存在的管理、升级和效率难题”,并将“在未来五年中走在这一领域的变革前沿”。

 

15.应用开发

Apigee是一家针对小企业推出免费自助API的平台。Apigee是在2010年 9月由Sonoa Network更名后组成。它主要的工作是为企业以及开放商提供API产品和技术,帮助其开发基于API的应用程序。它在之前的融资中Apigee凭借在该行业快速发展取得了很好的成绩。在2012年7月的新一轮的融资中又成功获得了由new investor Focus Ventures领投的2000万美元的风险投资。

 

cask是一个Emacs的项目管理工具,帮助自动化软件包开发周期,发展,依赖,测试,建筑,包装等。cask也可以被用来管理依赖于本地的Emacs配置。cask数据应用平台(CDAP)集成和抽象了底层基础架构并为您的数据和应用程序提供容器。CDAP让你花更多的时间交付应用程序和见解。

 

Keen IO定制化分析 API 提供商 Keen IO 近日完成 1130万美元 A 轮融资,成立自 2011年12月,Keen IO 目前已累计拿到 1450 万美元融资。Keen IO 可帮助客户收集任何来源的数据,然后存储起来,并对这些数据以客户希望的方式进行可视化。客户除了可以上传历史数据、实时访问新数据以外,还可以将该服务贴牌(白标)向自己的客户再兜售。

 

TypeSafe作为一个创建不久的软件公司,TypeSafe发展迅速。据美国媒体报道,该公司今天获得Shasta风投公司和Juniper网络公司为首的共计1400万的风投资金,Shasta风投公司总经理Jason Pressman已加入了Typesafe董事会。

Typesafe提供了一个现代软件平台:Typesafe Stack。使Twitter、Foursquare、LinkedIn和思科这样面对客户的开发者能够建立和配置极具规模的基于云的应用和多核硬件系统。

Typesafe于2011年由Scala程序语言创始人Martin Odersky和Akka公司创始人Jonas Bonér共同创办。Typesafe 将Play 网站构架和大量的开发工具紧密整合在一起,可100%运行在Java基础架构中。

 

Driven

16.众包

Amazon Mechanical Turk亚马逊土耳其机器人是一个Web服务应用程序接口(API),开发商通过它可以将人的智能整合到远程过程调用(RPC)。亚马逊土耳其机器人利用人的网络来执行不适合计算机执行的任务。亚马逊调用那些计算机很难完成但“人工的人工智能”却能很容易执行的任务。执行人工智能任务(HIT)的人可能会被要求写产品描述,对移动语音搜索查询作出回应或选择某一主题的最佳照片等等。

 

crowdflower美国大型公司,为世界各地的客户提供商业数据分析,情感喜好分析,分类服务,提供关键词的搜索排名,图片优化等任务服务。目前crowdflower的客户有The Economist, Forbes, Inc等美国大型企业。

本轮融资是由Canvas Venture Fund发起,参与投资的Bessemer Venture Partners和Trinity Ventures均为已有的投资者。这一次的投资将该公司融资总额提升至2800万美元,将用于帮助公司提高服务质量以及扩大客户群。

 

WorkFusion是一家总部设在纽约的新创公司,成立于2010年,公司为大型企业提供一个智能软件平台,该平台通过将众包模式与自动化结合,几乎能完全管理和执行曾经高度劳动密集的项目。它为白领工作自动化对企业产生的巨大影响给出了一个特别生动的例子。

WorkFusion软件最初先分析项目,确定哪些任务可以直接自动化,哪些可以众包,还有哪些必须由内部的专业人员完成。然后,它可以在如eLance或Craigslist这样的网站上自动发布招聘公告,并负责对符合条件的自由职业者进行招聘和选拔。

你可能感兴趣的:(2016全球大数据战略版图剖析(2))