20个顶级大数据软件应用程序

 如今,大数据技术对企业来说不再是一种尝试和体验,它已成为企业开展业务的一个重要组成部分。根据调研机构IDC公司的调查,2017年全球大数据和业务分析(BDA)的市场收入将达到1508亿美元,和2016年相比增长12.4%。到2020年,其收入将超过2100亿美元。

  这些大部分来自硬件和服务。对于大数据软件而言,在某些情况下,每家公司的需求都是基于垂直行业的独特需求。即使在同一行业,如零售行业或制造行业,每个公司的需求也会有所不同,因此开发一种套装软件很难为所有行业的潜在客户提供服务。

  对于大数据软件而言,成功的关键是为企业提供基础应用程序和工具来构建自定义应用程序。人们可以了解什么是真正的大数据应用软件。这些提供应用程序的公司有很多是行业知名厂商,然而,也有一些令人关注的初创公司的产品也包括在内。

对大数据以及人工智能概念都是模糊不清的,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。从java和linux入手,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相关知识一一分享!


  以下是20家专门从事大数据构建或相关业务的企业所提供的应用程序。这个清单并没有什么特别的顺序。

  (1)Domo

  Omniture公司前首席执行官Josh James于2010年创立了Domo公司,为企业提供了一种方法,可以从不同来源、不同的孤岛中查看数据。它自动从电子表格、社交媒体、内部存储、数据库,基于云的应用程序,以及数据仓库中提取数据,并在可定制仪表板上显示信息。它以其易用性以及几乎任何人都可以建立和使用它而闻名,而不仅仅是数据科学家采用。它配备了许多预加载的图表和数据源设计,可以快速移动。

  (2)Teradata Database

  从Teradata Database 15开始,该公司增加了Teradata统一数据架构等新的大数据功能,使企业能够跨多个系统访问和处理分析查询,其中包括从Hadoop导入和导出双向数据。它还添加了地理空间数据的3D显示和处理,以及增强的工作负载管理和系统可用性。支持AWS和Azure的基于云计算的版本称为Teradata Everywhere,它在基于公共云的数据和本地部署的数据之间提供了大规模的并行处理分析。

  (3)Hitachi Vantara

  Hitachi Vantara的大数据产品是建立一些流行的开源工具基础上。Hitachi Vantara成立于2017年,是日立数据系统公司的存储和数据中心基础设施业务部门,是由Hitachi Insight集团物联网业务和日立Pentaho大数据业务组合成的一家合资公司。 Pentaho基于Apache Spark内存计算框架和Apache Kafka消息系统。Pentaho 8.0还增加了对Apache Knox Gateway的支持,以对用户进行身份验证,并强制访问大数据存储库的访问规则。它还增加了对通过Docker容器构建分析应用程序的支持。

  (4)TIBCO公司的Statistica

  TIBCO公司的Statistica是针对各种规模企业的预测分析软件,使用Hadoop技术对结构化和非结构化数据执行数据挖掘,解决物联网数据,能够在全球任何地方的设备和网关上部署分析,并支持数据库内分析来自Apache Hive、MySQL、Oracle、Teradata等平台的功能。它使用模板来设计完整的分析,因此只有较少的技术用户可以进行自己的分析,并且可以将模型从电脑导出到其他设备。

  (5)Panoply

  Panoply公司通过使用人工智能来销售所谓的智能云数据仓库,以消除转换、集成和管理数据所需的开发和编码。该公司声称,其智能云数据仓库实质上提供了数据管理即服务,能够在无需任何干预的情况下消费和处理高达1PB的数据。其机器学习算法可以检查来自任何数据源的数据,并对该数据执行查询和可视化。

  (6)IBM Watson Analytics

  Watson Analytics是IBM公司的基于云计算的分析服务。当用户将数据上传到Watson时,它会根据数据分析向用户提供可帮助回答的问题,并立即提供关键数据可视化。它还可以进行简单分析、预测分析、智能数据发现,并提供各种自助服务仪表板。IBM公司还有另一种分析产品SPSS,可用于从数据中发现模式,并查找数据点之间的关联。

  (7)SAS Visual Analytics

  Statistical Analysis System (SAS)创建于1976年,比大数据的创建还要早,就是为了处理大量数据。它可以从各种来源中挖掘、更改、管理和检索数据,并对所述数据执行统计分析,然后将其呈现在一系列方法中,如统计数据、图表等,或将数据写入其他文件。它支持所有类型的数据预测和分析要点,并附带预测工具来分析和预测流程。

  (8)Sisense商业智能软件

  Sisense公司声称其提供了唯一的商业智能软件,使用户可以通过从商品服务器硬件上的多个源进行来准备、分析和可视化复杂数据。Sisense的片上高性能数据引擎可以在一秒钟内完成对TB级数据的查询,并且为不同行业提供了一批模板。

  (9)Talend的大数据工作室

  Talend一直专注于为Hadoop生成干净的原生代码,无需手动编写所有代码。它为各种大数据存储库提供接口,如Cloudera,MapR,Hortonworks和Amazon EMR。它最近添加了一个数据准备应用程序,可以让客户创建一个通用字典,并使用机器学习,自动执行数据清理过程,以便在更短的时间内为数据处理准备好数据。

  (10)Cloudera

  Apache Hadoop公司是最受欢迎的提供商和支持者,它与戴尔、英特尔、甲骨文、SAS、德勤和凯捷等公司都有合作关系。它由五个主要应用程序组成:核心数据管理平台Cloudera Essentials,数据管理平台Cloudera Enterprise Data Hub,用于商业智能和基于SQL的分析的Cloudera Analytic DB; 高度可扩展的NoSQL数据库Cloudera Operational DB,以及Cloudera Data Science and Engineering,在Core Essentials平台上运行的数据处理、数据科学和机器学习。

  (11)MongoDB

  MongoDB已成为各行业大数据项目的首选数据库。它的NoSQL支持适合大数据经常使用的非结构化数据。其灵活性、对JSON和JavaScript的支持、灵活的框架、丰富的查询语言,以及广泛的行业支持使其成为数据库的标准。

  (12)Vertica Analytics Platform

  大数据的数据库传统上是非结构化的,意味着可以在其中存储任何类型的数据。Micro Focus的Vertica分析平台采用传统的面向列的关系数据库格式,但专门设计用于处理来自Hadoop集群的现代分析工作负载。该平台使用集群方式存储数据,并全面支持SQL、JDBC和ODBC。它使用列式存储而不是行式存储,因为访问列可以更轻松地分组数据。

  (13)SAP Vora

  SAP HANA本身并不适用于大数据。这是一个内存中的RDBMS系统。但是当用户添加HANA Vora这个大数据接口时,它变得更加可行。Vora允许HANA连接到Hadoop存储库,并扩展Apache Spark执行框架,以实现企业和Hadoop数据的交互式分析。所以数据科学家可以通过支持大数据存储来获得HANA的力量。

  (14)Oracle Big Data suite

  Oracle公司这个数据库巨头拥有全套大数据集成产品,如支持实时数据流、批量数据处理、企业数据质量和数据治理功能的数据集成平台云、流分析、物联网支持,以及通过Oracle Event Hub云服务支持Apache Kafka。

  (15)Apache Cassandra

  虽然MongoDB是领先的数据库,但Cassandra在可扩展性方面具有优势。这是由Facebook公司前员工所编写,它跨越了大量的商品服务器,确保没有故障点和高级容错能力。

  (16)Plotly

  Plotly或Plot.ly专注于数据可视化,而不需要编程或数据科学技能。它的GUI设计用于导入和分析数据,并为其所有图形使用D3.js JavaScript库。它的仪表板可以实时生成,也可以从现有数据池生成,并支持导出到各种可视化工具,其中包括Excel,SQL数据库,Python,R和MATLAB。

  (17)Wolfram Alpha

  想要计算或了解有关事物的新内容?Wolfram Alpha是一款用于查找关于所有内容的信息非常棒的工具。Proessaywriting公司的Doug Smith表示,他的公司使用这个平台进行金融、历史、社交和其他专业领域的高级研究。例如,如果输入“Microsoft”,就会收到输入解释、基本面和财务信息、最新交易、价格历史记录、绩效比较、数据回报分析、相关矩阵,以及许多其他信息。

  (18)Tibco Spotfire

  Spotfire是一款内存分析平台,升级后包含对大数据存储库的支持并执行预测分析。它为Apache Hadoop提供了一个连接器,它可以让用户在大数据上执行数据混搭,数据发现和分析任务,就像他们对Oracle,SAP和其他传统数据源所做的那样。它还支持实时数据驱动的事件可视化,并具有人工智能驱动的推荐引擎,可缩短数据发现时间。

  (19)AnswerRocket

  AnswerRocket专注于自然语言搜索数据发现,使其成为商业用户的工具,而不是数据科学家的神秘工具。它可以在几分钟内提供答案,而不是等待几天才能形成查询。

  AnswerRocket用户可以使用日常语言提问,并在几秒钟内获得可视化效果,然后他们可以在特定的图表或图表上进行深入查看以获得进一步的洞察。

  (20)Tableau

  Tableau专门从多个数据孤岛中进行绘图,并将其集成到一个仪表板中,只需点击几下鼠标,即可使用自定义过滤器和拖动和连接来创建交互式灵活的仪表板。Tableau还使用自然语言查询,因此用户可以询问业务问题,而不是技术问题。

你可能感兴趣的:(大数据书籍,大数据经验,大数据技术,大数据资讯,大数据应用,大数据人生,大数据教程)