人工智能分析工具的深度对比

美林TempoAI  VS  第四范式先知AutoML

人工智能是当今关注度极高的一门新兴技术,人工智能已连续两年(2017/

2018)列入我国政府工作报告,成为国家战略性新兴产业发展规划的重点之一。Gartner预测,到2020年,超过40%的数据科学任务将实现自动化,人人都是数据科学家。业务人员和决策者可以运用人工智能工具自动化、智能化地实现数据价值发现,提高企业的生产力和竞争力。

人工智能分析工具的自动化、智能化将是未来十年的大趋势。市场上的AI分析工具种类繁多,各有所长。最为大家所熟识的就是:SAS,RapidMiner,Alteryx,IBM,Anaconda,DataRobot等。但这都是国外的,我们来看看中国市场,商用AI分析工具有:第四范式,星环,阿里等,但近几年明显感受到身边有越来越多的同行在用美林数据的AI分析工具,TempoAI就像一匹黑马,在众多AI分析工具中杀出来。

国内的AI分析工具在自动化、智能化上做的比较好的,就是第四范式和美林数据这两家厂商。所以,本文就两款工具人工智能分析工具美林数据TempoAI(下文简称TempoAI)和第四范式先知AutoML(下文简称AutoML)做详细对比,让大家更多了解这个低调的工具。如果你正在寻找一款合适的人工智能分析工具,希望我的文章能给您的选型带来帮助。

一、产品介绍

Tempo是一款集数据接入、数据处理、数据挖掘、数据可视化、数据应用于一体的软件产品。它秉持“智能、互动、增值”的设计理念,面向企业级用户提供自助式数据探索与深度分析能力,帮助用户快速发现数据价值,助力企业商业成功!Tempo包括BI、AI两大产品线,BI与AI可拆分可联合。TempoAI分为建模、洞察、部署三大模块。


Tempo大数据分析工具

AutoML是一个大规模分布式人工智能应用开发的全流程平台。基于覆盖机器学习全流程闭环系统,从原始数据到模型训练,从模型训练到模型应用,再到模型自学习。AutoML是单独的AI分析工具。分为学习圈、监控面板、计划任务三个模块。

二、 技术架构

TempoAI与Hadoop大数据体系无缝链接,与包括但不限于CDH、HDP、华为FI、中兴DAP、H3C

DataEngine、星环等,通过简单配置即可支持Kerberos认证,安全连接大数据平台。

AutoML兼容主流的Hadoop商业发行版,实现大数据框架下的分布式存储、资源管理、分布式计算。支持公有云、私有云、私有部署等多种安装部署方式。

三、企业级应用能力

TempoAI和AutoML这两款分析工具的定位都是面向企业级应用。基于企业级应用的诉求,两家都各有自己的策咯。

TempoAI在数据权限、角色权限、成果权限、协同开发、模型复用、系统集成等方面做了大量的针对性设计,更符合企业级用户对分析工具从安全、协同、共享、融合等方面的需要。

AutoML提供用户权限、用量额度管理、模型版本管理与运维等企业级功能,满足IT管理与数据安全的需求。

四、数据源接入能力

TempoAI支持本地上传文件、HDFS、mpala,Sparksql,Hive,Presto等大数据引擎、GP,GBase等MPP 数据库、Csv,Excel,Json三种非结构数据、接口数据、Oracle,SQL Server,MySQL,Teradata关系数据库、Kafka流式数据、ES等20余种类型数据源接入。


AutoML支持本地文件上传、HDFS、FTP,Teradata、Oracle、MySQL等关系数据库,Hive,GP。其中支持上传的数据源包括CSV、TXT、TSV、parquet、orc5种。共支持13种数据源接入。

目前来看TempoAI的数据源接入能力是优于AutoML的。

五、算法丰富度

在算法丰富度上,TempoAI明显优于AutoML。本人使用了这两种工具进行挖掘模型训练,例如我训练一个分类模型,Tempo可供选择的单算法有18种此外还有集成算法和自动化算法可供选择。

但是用AutoML的通用方案探索,只能选择三种算法。


TempoAI支持数据预处理、特征工程、统计分析、分类、回归、聚类、关联规则、推荐、时间序列、综合评价、文本分析、深度学习、集成学习等13种分析类型,共计120多种算法;其中分类算法共18种、回归算法共12种、聚类算法共8种、时间序列算法共7种。

AutoML支持数据处理、特征工程、分类、聚类、自定义脚本等6种分析类型,共计18种算法;如常见的分类算法共10种、聚类算法共1种、特征工程算法3共种。

六、可扩展性

TempoAI支持SQL、R、Python、JAVA、Scala的扩展编程节点;支持企业将自研算法集成到平台进行节点化管理和应用;支持单机和集群部署;支持Windows和Linux平台;支持主流Hadoop大数据平台部署。

AutoML不支持用户自己编程补充自动建模,建模过程完全交给后台,用户的自主扩展控制性比较差;支持Hadoop大数据平台部署。

七、自动化智能化水平

从两家厂商的宣传来看,貌似AutoML的自动化水平更高一些,只需4步:上传行为数据、上传反馈数据、模型训练、模型利用,就可以完成AI模型从构建到应用的全过程。且模型训练的过程几乎不用人为干预。但是通过实际使用发现,没有人为干预很难训练出有效的模型,到最后还是需要人工去调整一些特征提取规则、算法和参数。很多同行反馈,还是TempoAI这种自动化建模的方式更符合企业级AI分析的需求。

如下图,AutoML运行了7小时57分钟,最终还是失败了,而在TempoAI中,这种情况运行十几秒就会提示有问题,通过及时调整,3分钟就能成功构建一个效果还不错的模型出来。

八、模型部署应用

TempoAI全面支撑模型的部署与应用,应用模式包括:调度、异步服务、同步服务(支持本地服务)、流服务四种,满足工程化的不同诉求。并且模型结果与TempoBI的无缝融合,实现挖掘结果的快速可视化与内部共享。

AutoML的模型应用包括两种:在线模型预估和批量模型预估。其中在线模型预估对应于TempoAI的同步服务,批量模型预估对应与TempoAI的异步服务。

TempoAI在模型部署应用的灵活性这方面强于AutoML。

九、统一监控功能

AutoML提供监控面板功能,能够对平台业务指标模型指标及监控指标进行统一监控及管理。

TempAI目前的调度及服务管理在监控功能相对比较薄弱,只实现了部分监控管理功能。

十、自研专利算法

AutoML提供了自主研发的算法供用户使用,如HE-TreeNet、线性分型分类器等,这些算法弥补了LR以及GBDT的局限性,使模型能更达到更好的预测效果。

TempoAI提供了自主研发的视觉聚类、L1/2稀疏迭代分类、L1/2稀疏迭代回归算法、信息抽取、稀疏时间序列等算法,实现大数据高级分析,准确性和响应速度等性能明显优于同类经典算法,能更快速、更直观的洞悉数据特征,发现企业业务和流程中潜在、隐藏的规律和价值。

十一、定制开发

TempoAI能够根据用户需求进行定制化开发,打造更符合行业/企业用户特色的大数据分析产品。

AutoML倾向于做通用产品,定制开发需要看客户的等级。

十二、学习资料

两个工具都有比较丰富的基础的学习文档和教学视频资料,毕竟都是中国的厂商,所以在资料这方面还是很方便的。此外,美林TempoAI还有免费为其用户开放微课堂视频课程,介绍一些算法和分析方案,还是很不错的!

另外,这两个工具都是可以免费申请试用的,但AutoML只能免费试用14天且试用功能很有限。TempoAI试用期有30天,且试用过程种有任何问题都会有专人负责解答,服务体验还是很好的。

最后,适合自己企业需求的工具才是最好的工具。大家不妨尝试试用一下!一定会有收获的哦!试用链接

你可能感兴趣的:(人工智能分析工具的深度对比)