kdy

可视化数据挖掘开源软件的比较分析

近年来，随着人脸识别、语音识别等技术的突破性进展，隐藏在它们背后的底层技术也引起工程和研究人员的高度重视，譬如机器学习。然而，机器学习是一个入门门槛相对比较高的技术领域，大部分的工程技术人员和业务人员都聚焦在业务领域的特征提取，算法选择，参数调优和模型验证上，因此一个方便高效的可视化工具，对于降低用户的机器学习学习曲线、提升工作效率显得尤为重要。

本报告主要从开源和商业领域选取了WEKA、RapidMiner、KNIME、明略、东软RealRec五款具有行业代表性的可视化机器学习工具，首先对它们进行功能性分析，剖析并总结各工具的核心特点，然后从工具支持机器学习算法程度、可视化能力、不同用户群学习难易度、对主流大数据平台支持程度以及软件成熟度和使用成本六个维度进行比较，通过对比发现它们各自的优缺点和适用范围，为使用者在今后机器学习工作中提供技术选型建议。

一、引言

近年来，随着人脸识别、语音识别等技术的突破性进展，隐藏在他们背后的底层技术也引起工程和研究人员的高度重视，譬如机器学习。机器学习是人工智能领域的一个核心研究方向,它是一个多学科交叉的产物，在很多应用领域发挥了重要的实用价值，特别是在数据挖掘、语音识别、图像识别、机器人、信息安全等领域取得了瞩目的成果。然而，机器学习也是一个入门门槛相对比较高的技术领域，大部分的技术人员都聚焦在特征提取，算法选择和参数调优上，而非算法实现和优化，因此一个方便高效的工具，便是十分重要。

目前机器学习领域大量的工具都是编程性的机器学习库，譬如R、Python以及深度学习库caffe、tensorflow等，这些机器学习工具都具有一定的门槛，学习曲线比较高，不适合一般的业务和数据分析人员。因此市场上也出现了一系列的可视化机器学习工具，用于降低相关技术人员的学习曲线，提升工作效率。譬如，在国外市场，RapidMiner和KNIME长期处于Gartner高级分析平台魔力象限领导者位置；在国内，明略DataInsight是领域的新锐，并行算法优化多，获得2016年大数据龙头企业奖；东软RealRec已在几个行业中得到应用；而在纯开源领域WEKA绝对是可视化机器学习的佼佼者。

鉴于RapidMiner、KNIME、DataInsight、东软RealRec以及WEKA在可视化领域的代表性和开放性,本文选取了上述这四种可视化机器学习工具，对它们进行概述和分析，总结其各自的特点，并通过对比发现它们各自的优缺点和适用范围，为使用者在今后的选择过程中提供帮助。

二、机器学习工具功能特点分析

由于数据挖掘领域使用了大量的机器学习算法，因此，机器学习工具软件一般隶属于数据挖掘工具，是数据挖掘工具的子集。

（一）WEKA

1. 概况

WEKA是一款免费开源的机器学习和数据挖掘可视化工具软件，其操作简便，运行速度快，尤其适合小规模的机器学习建模，是机器学习入门的不二选择。

图1：WEKA建模示意图

2. 特点

WEKA Knowledge Flow 具有以下功能特点：

(1) 可移植性。WEKA基于Java 编程语言进行操作，从而几乎任何现代计算平台都可以运行。

(2) 支持标准的机器学习任务，包括数据预处理、聚类、分类、回归以及特征选择。各方面任务特点如下：

ü 数据预处理任务从数据库、CSV 文件等输入数据，并使用过滤算法对数据进行预处理。这些过滤器可用于转换数据（例如连续型数值属性变成离散型），从而根据具体的标准删除实例和属性。

ü 关联分析任务提供了不同的关联规则学习算法，譬如Apriori或FP-growth等，方便找出数据属性之间所有重要的关联关系。

ü 分类任务提供了贝叶斯、决策树、随机森林等不同的分类器进行数据分类学习，此外，使用户应用分类和回归算法的结果数据集，去评估预测模型产生结果的准确性，并可视化错误预测、ROC 曲线和模型本身(如果模型是适合可视化的，如贝叶斯)。

ü 聚类面板给WEKA提供了聚类技术，如简单的K-Means算法，也可以用期望最大化算法进行混合正态分布的学习。

ü 特征选择属性任务提供了数据集中大多数预测属性的识别算法。

(3) WEKA KnowledgeFlow的所有技术是建立在数据可作为一个单一的平面文件或关系这个假设前提上的，其中每个数据点被设计成一个固定数量的属性（通常是数字或名义的属性，但一些其它的属性类型也被支持）。因此WEKA Knowledge Flow 不能进行多位关系数据挖掘，但有独立的软件可以将连接的数据库表转换成一个单一的表，使其可以使用WEKA 进行处理。

（二）RapidMiner

1. 概况

RapidMiner是集数据挖掘，机器学习，预测分析和商业智能为一体的可视化工具软件，包括文本挖掘、多媒体挖掘、功能设计、数据流挖掘、集成开发方法和分布式数据分析等。本文主要对RapidMiner 7.1 进行比较研究。

图2：RapidMiner建模示意图

2. 特点

RapidMiner（以RapidMiner V7为例）具有以下特点：

(1) 包含完全集成的机器学习库WEKA，提供关于数据集成、转换和建模方法的最全面的机器学习解决方案。

(2) 免费提供大量的数据抽取功能。包括Oracle、IBM DB2、MS SQL Server、 MySQL、Ingres、Postgres、Teradata 等所有常见的数据库。支持Excel、SPSS、CSV、Dbase、Arff、 DasyLab等多种格式的数据源，以及ASCII,、PDF、HTML 和XML 格式的文本文档和和网页、时间序列数据等。

(3) 具有强大直观的图形用户界面设计分析过程。通过许多尖端的高维数据实现可视化建模和数据探索功能，形成在线的1D、2D、3D 图，以及Andrews、平行、偏差和SOM 视图等。

(4) 具有模块化系统，使分析过程具有极大的灵活性和扩展性。RapidMiner 拥有超过500 个数据集成和转化，分析和评估的模块工具。其中数据集成和分类工具包括支持向量机（SVM）、规则学习者、决策树、贝叶斯、高斯过程、神经网络、优化评估、boosting 算法、Apriority、FPGrowth 以及聚类等。评估工具包括交叉检验、leave-one-out、滑动时间窗、回溯测试、显着性检验以及ROC等。

(5) 模块化的运行概念奠定了机器学习模型创建的设计流程。元运算允许这些过程自动优化，因此使用者不需要手动去适应每个步骤和参数。优化运算包括自动参数优化、自动属性设置优化、循环、控制结构、宏、断点调试以及更多。

(6) 模型的快速成型和超越。从第一次探索分析到现成解决方案只需几步。快速成型允许机器学习模型过程中的关键决策可以尽可能早的实现。使用RapidMiner 可以使你在短时间内设计好一个原型，从这些原型中，优化这些过程引导你得到解决方案。

(7) 使用Java 代码，可通过GUI 模式或Java API 进行操作，也可以用简单脚本语言自动进行大规模进程操作。并且内部XML保证了标准化的格式来表示建模过程。

(8) RapidMiner与市面上主流的大数据分析平台支持非常友好，譬如不同版本的CDH集成，包括同一平台的不同版本的支持，不需要应对复杂的配置文件，因此能够方便应对大规模分布式机器学习应用场景。

(9) RapidMiner有成熟的社区和扩展交易市场（marketplace），用户可以根据自己的需要，快速获取很多定制化的功能。

（三）KNIME

1. 概况

KNIME是一个集数据集成、处理、分析和开发于一体的开源数据分析平台，对常用的机器学习算法也提供了友好的支持，并在严格的软件工程实践中进行开发和利用。本文主要对KNIME 3.1 进行比较研究。

图3：KNIME建模示意图

2. 特点

KNIME（以KNIME 3.1为例）具有以下特点：

(1) 可视化的工作平台集成了数据访问、数据转换、数据探索和预测分析等常用的机器学习功能。

(2) 集成了数百个处理结点来进行数据输入与输出﹑预处理和清洗﹑建模﹑分析﹑数据挖掘以及制作各种互动的视图（如散点图﹑平行坐标和其他视图）。

(3) 可集成所有的分析模版到众所周知的WEKA 数据挖掘环境中，并有额外的插件模块允许R-脚本运行，还提供了广大统计例程库接口。

(4) 基于Eclipse 平台开发，并且通过其模块化的API 可轻松进行扩展。因为KNIME在后台可进行智能自动的数据缓存，同时最大限度地提高吞吐量性能，所以这种模块化和可扩展性允许KNIME 在商业的生产环境以及教学和研究原型设置工作中得到应用。

(5) 提供超过1000 个数据分析例程，无论是在本地或通过R和 WEKA都可以进行，如单元和多元统计、数据挖掘、时间系列、图像处理、Web 分析、文本挖掘以及社会化媒体分析等。

(6) 机器学习建模工作流程不仅可以通过交互式用户界面运行而且执行批处理模式，使数据分析过程可以很容易地定期集成到本地工作运行的管理中去。

(7) KNIME提供了大量的行业应用模板和定制化化的算子，便于特定应用行业的数据分析，譬如生物医药行业。

(8)具有 HiLite 功能，允许用户在节点结果中标记感兴趣的记录，并进一步展开后续探索。

（四）明略

1. 概况

明略可视化机器学习平台DataInsight本质是一种MLAAS平台，用户无须在客户端安装平台工具，通过浏览器即可进行拖拽，交互式数据探索，完成机器学习模型的训练、部署和应用。DataInsight不仅集成了Spark MLlib分布式机器学习能力，还定制了高效的分布式机器学习算法。

图4：明略DataInsight建模示意图

2. 特点

明略DataInsight平台基于BS架构，DataInsight通过提供一体化、并行化的高效模型应用平台，能帮助企业有效降低机器学习的应用曲线和落地成本。具有如下特点：

(1) 扩展性强。明略DataInsight平台基于Hadoop和Spark的并行化平台，计算能力随着大数据平台计算能力的扩展而扩展。其提供了多种数据预处理的并行化算法，以及大量并行运行于Spark之上的数据挖掘和机器学习算法。

(2) 模型工作流。使用工作流的概念表示整个建模过程，每个建模步骤看作一个算子，使得整个建模过程形成一幅有向无环图，建模过程将原始的输入通过一系列算子组合得到最终的业务结果。

(3) 交互式探索。明略DataInsight提供了交互式数据探索工具供用户对数据进行实验性的探索工作，帮助用户实时的对数据进行探索和实验。同时，明略DataInsight通过可视化的方法，提供了常用的数据统计和分析的图表，供用户能够直观的从图形中发掘数据背后的意义。

(4) 模型应用管理。提供模型应用的版本管理，能够方便的进行模型的维护和更新，提升工作效率。并且对模型的应用管理提供了用户和角色的支持，方便权限控制。

(5) 模型即服务。DataInsight平台通过Restful API向企业其他生产系统提供服务，外部系统可以通过Restful API实现模型的运行和更新等操作。

（五）东软RealRec

1. 概况

东软数据科学平台定位于企业级数据科学平台，通过简化复杂机器学习算法的使用成本，提高企业构建智能应用的能力和效率，帮助企业实现数据驱动的商业模式。产品组成如下：

图5：东软RealRec建模示意图

2. 特点

东软RealRec主要通过在机器学习算法和模型方面的能力建设，使企业能够快速构建智能应用，开展创新数据服务和业务。

主要具备如下特点：

(1) 特征分析实现了多维分析和分布统计，通过对数据进行过滤、去重、拆分、合并，实现数据可视化展现，并实现了数据的特征抽取、管理和复用；

(2) 模型训练实现了自动化的模型选择，模型的交叉验证和可视化展现，并提供全流程的引导, 训练数据可以是实时数据、批量数据或文件；

(3) 在模型最终部署应用时提供跨平台REST接口、POJO导出/UDF导出，并实现了模型管理复用和任务调度管理；

(4) 机器学习通过提取原始数据的特征，选择合适的算法，最终实现模型的自动化选择和导出。

三、机器学习工具比较分析

本部分主要从不同维度对上述机器学习工具进行比较，譬如从算法支持程度、可视化功能、面向不同用户群学习难易度、对主流大数据平台支持能力以及软件成熟度等维度进行比较。

（一）机器学习算法的比较

上述可视化机器学习工具对常用的机器学习算法都提供了支持，但具体对某一算法的支持程度则有所不同，譬如以支持向量机算法为例：KNIME仅支持LibSVM，SparkLinear SVM，Rapid Miner可以支持LibSVM，Linear SVM，Evolutionary SVM以及PSO SVM，以及Spark SVM，明略支持Spark SVM和LibSVM，而WEKA仅支持LibSVM。

各算法支持功能强弱可参考下表：

机器学习算法	WEKA	RapidMiner	KNIME	明略	东软RealRec
支持向量机	中等	强	较强	中等	下一版本支持
决策树	中等	强	强	中等	强
贝叶斯	中等	强	较强	中等	强
回归	中等	强	较强	中等	强
神经网络	弱	较强	较强	弱	强
深度学习	不支持	很弱	很弱	不支持	强
K-Means	中等	较强	中等	弱	强

说明：

ü 目前RAPID MINER正在集成JAVA深度学习开源项目DeepLearning4J，可以支持深度学习建模，但是目前尚不成熟。

ü 目前WEKA不支持分布式机器学习算法，其他工具均支持分布式的机器学习算法。其中RAPIDMINER和KNIME均通过软件扩展集成Spark，通过Spark MLLIB的算法支持分布式机器学习算法。明略DataInsight目标即是面向大数据的分析和建模。

（二）可视化功能的比较

软件产品的使用容易程度至关重要，一款好的可视化工具应能够实现训练数据的可视化探索、模型的可视化、模型训练的可视化、模型验证及应用的可视化，能够自带多行业的模板和样例，便于数据分析人员的快速上手，提升模型建立和训练的效率。具体表现在数据的导入/处理、模型的构建、模型的易理解性等方面。

比较项目	WEKA	RapidMiner	KNIME	明略	东软RealRec
数据抽取	只能通过数据文件、URL地址以及数据库抽取收取，不支持其他数据源数据抽取，功能单一。	支持各种格式文件、数据源的抽取，图形化的抽取算子，并进行数据的交互式探索	也具备常用文件格式和数据源的抽取，但数据的交互式探索功能不方便	能够支持多个文件格式、数据库抽取，对大数据平台数据抽取能力强	支持文件上传、HBase数据、HDFS数据、关系型数据库数据，可对接大数据平台
数据转换	提供常用的数据过滤、归一化等功能	数据的归一化、降维和格式化等	各种数据格式化功能，数据融合、数据过滤等	提供常用的数据过滤、归一化等功能	提供常用的数据过滤、归一化、切分等功能
数据建模	提供简洁的拖拽等可视化建模能力。	类似工作流的可视化建模，支持嵌套。	也提供工作流的可视化建模，但是设置选型多，比较复杂	也提供工作流的可视化建模，但功能还不完善，正在改善。	提供notebook(记事本)式的数据建模，以命令行的方式运行模型
模型验证及评测结果展示	支持常用的图表展示，但是图表美观性差	各种图形的可视化展示，切换容易	各种常见图形的展示	支持的图表有限，目前正在改善。	支持常用的图表展示，但是图表美观性一般

（三）不同用户群学习及使用难易度的比较

不同机器学习工具具有不同功能特点，有的灵活性强，有的功能简洁，这些都会影响不同用户群的学习曲线以及工具使用的难易程度。我们根据不用用户群知识结构特点以及上述工具产品的功能特点综合分析比较，不同用户群掌握工具难易程度如下：

比较项目	WEKA	RapidMiner	KNIME	明略	东软RealRec
开发人员	操作界面比较简洁和直观；工具是轻量级的，对系统资源消耗少，运行快捷；对于开发人员入门简单，使用便捷	对运行的硬件资源要求比较高，运行速度不是很快；界面设计比较清晰直观；对于开发人员入门也非常容易	工具操作界面基于eclipse开发，对于熟悉eclipse开发工具的研发人员比较简单；由于选项多、灵活性大，掌握难度大	完全基于WEB的操作界面，界面风格简洁直观，对于开发人员入门简单；由于WEB版，运行于浏览器，对硬件资源需求小，操作便利	完全基于WEB的操作界面，对开发人员入门简单
专业数据分析人员	对于熟悉数据分析专业知识人员，工具使用简单，操作便利	由于界面比较直观，对于专业数据分析人员比较简单，门槛低	由于界面灵活，配置也相对复杂，使用相对复杂，需要摸索	WEB操作界面比较简单直观，功能比较单一，用户入门门槛不高	WEB操作界面比较简单直观，功能比较单一，用户入门门槛不高
一般业务分析人员	界面描述均是专业术语，一般分析人员无法轻松使用，学习周期长	界面虽然比较直观，但还具有一定的专业性，需要专业指导	由于功能提供了较多专业的配置项，用户需要花费时间学习配置，学习周期比较长	界面虽然比较直观，但还具有一定的专业性，需要专业指导	界面虽然比较直观，但平台定位于计算引擎，一般业务分析人员需要专业指导

（四）主流大数据平台支持能力的比较

为了提升机器学习的效率以及数据分析的规模，当前主流的机器学习工具均提供了与大数据分析平台的集成，但在兼容性方面存在比较大的差异，具体比较如下：

比较项目	WEKA	RapidMiner	KNIME	明略	东软RealRec
大数据平台的兼容性	目前不提供与大数据平台的集成	支持主流的大数据平台Clouddera和Hortonworks以及MapR， CDH 4.x和5.x， HDP 1.x和2.x， MapR 4.1， Hadoop 1.x和2.x等	支持主流的大数据平台Clouddera和Hortonworks以及MapR，支持 CDH 5.x， HDP 2.1 和 2.2， MapR 4.1， Hadoop 2.4.0等	兼容性较差，主推自己的大数据平台，目前也支持其他的大数据平台，但需要验证。	支持大数据平台Clouddera，支持Spark 1.6，自行定制的Tachyon 0.8
与大数据平台集成难易度	目前不提供与大数据平台的集成	集成快捷，提供配置模板，对已有大数据环境无侵入	配置相对复杂，对已有大数据环境无侵入	需要在已有大数据环境安装相应软件套件，有侵入性	配置相对复杂，对已有大数据环境无侵入

（五）软件工具自身成熟度比较

本节主要从软件自身的稳定性、文档的完整性、用户群、社区生态系统以及开源协议支持等五个方面对WEKA、RapidMiner、KNIME以及明略DataInsight进行对比，综合评定各软件总体成熟度。

比较项目	WEKA	RapidMiner	KNIME	明略	东软RealRec
软件稳定性	将近二十年的发展和优化历史；功能稳定、扩展性强但	超过十五年的发展历史，功能稳定并且全面、扩展性强。目前正在研发纯WEB版的分析平台	超过十年发展历史，功能稳定全面、扩展性强，缺少WEB版的分析平台	发展历史比较短，功能不够全面，产品还处于发展中，不够稳定	发展历史比较短，定位于底层支撑平台，产品还处于发展中
文档完备性	是缺乏规范的文档列表	文档规范并且齐全	文档规范并且齐全	文档不够规范，用户应用不方便	文档规范，但不太齐全
用户群及应用领域分布	在高校和研究机构，有着广泛的用户群体，用户基数大。	产品有比较广泛的用户群体，成功应用于汽车、金融、保险等领域	国内用户群比较窄，用户群主要分布在生命科学、政府、金融等领域	目前用户群体基数小，用户主要分布在电商和金融行业	目前用户群体基数小，用户主要分布在客服和金融行业
社区生态系统	由于用户群基数大，社区发展比较成熟，文档和手册指南比较成熟，容易获取社区帮助	社区发展比较成熟，扩展多，可以获取很多免费的视频等学习资料，存在专业的论坛提供帮助和交流	社区规模比较丰富和规范，扩展多可以获取很多免费的视频等学习资料，也有专门的论坛提供交流和指导	由于是纯商业软件，目前没有形成成熟的社区，难以获取社区帮助，需要依赖厂商	由于是纯商业软件，需要依赖厂商
开源协议	GPL，协议灵活，代码完全开放	单机版支持协议AGPL-3.0，协议灵活，代码完全开放	单机版支持协议GPL-V3，协议灵活，代码完全开放	商业软件	商业软件

总上，RapidMiner发展历史久，功能稳定完备，用户群分布广、社区生态成熟，因此产品成熟度也最高。

（六）工具使用成本比较

WEKA是完全免费的开源软件，无须支付任何软件费用，使用成本低；RapidMiner和KNIME单机版完全开源，无需支付费用，但是分布式模型训练和处理组件以及面向特定应用领域的扩展组件均是商业版本，需要收费，license主要按照用户数和使用期限收费，费用不菲；明略DataInsight和东软RealRec是纯商业软件,成本比较昂贵。

基于上述六个层面的比较分析，我们可以看出RapidMiner在机器学习领域应是一个全面综合的软件工具，在算法和可视化效果方面都很突出，特别适用于不同数据的多方面分析和研究，适用于数据和业务分析人员。WEKA适合小规模的机器学习能力，譬如科研探索和机器学习入门人员等。KNIME比较接近RapidMiner，但由于界面比较复杂，因此比较适合开发人员，尤其是具备Eclipse开发经验的人员。明略DataInsight具有较强的任务管理和模型管理能力，并提供角色管理，适用于工程领域的研发人员。东软RealRec算法非常全面，适合复杂场景的分析和训练，但是可视化建模能力弱，使用复杂，不建议一般业务人员使用。

四、总结

经过上述的对比和分析，我们发现这几款工具具有类似的机器学习算法、可视化功能等，但从每一个比较标准来看，各软件之间又存在着较大差别。综合上述的分析和比较结果，一款优秀的可视化机器学习工具应具备如下功能：

1. 首先，具备良好的可视化能力，包括可视化数据探索、可视化数据预处理、可视化建模、可视化验证、可视化评估、可视化结果展示等。

2. 操作界面简洁直观，对分析组件进行模块化，有效降低组件之间的数据格式的兼容性，让数据分析变得敏捷化。

3. 对常用的机器学习算法都提供了友好支持，不仅具备算法支持的深度，还可以扩展支持同一种算法的不同实现，以应对不同分析领域。

4. 尽可能面向更广的用户群，譬如能够覆盖一般业务分析人员、专业的数据分析人员或者技术开发人员，用户学习成本均比较低或仅需简单培训。

5. 具备完善的社区生态系统，提供软件工具使用过程中所需帮助信息，此外，社区还能够提供特定领域分析的扩展或插件。

6. 能够和企业自身大数据分析环境无缝连接，对不同大数据系统及版本均提供了友好的支持，易于部署和管理。

7. 工具训练的模型能够轻松的向生产环境迁移，且便于模型的运营和升级维护。

8. 最后，一款好的可视化机器学习工具还需在主流行业中得到相对广泛的应用，具有较大的用户群，经历过实践检验。

你可能感兴趣的:(可视化数据挖掘开源软件的比较分析)

开源的APP+小程序商城源码推荐，可支持二次开发。 yuhuidog 开源APP商城源码小程序商城源码来客电商 saas新功能
今天我给大家介绍一款基于PHP开发的电商平台框架，可快速二次开发！用户体验还可以~全网比较shao见的Saas移动电商平台源码。系统特点：1、VueCLI框架，完全实现前后端分离，完善的API文档2、标准接口3、支持队列4、长链接5、无缝事件机制6、支持分布式部署7、基于SAAS源码服务8、N多插件扩展：拼团+分销+多店+会员电商+线下核销+拍卖+砍价等9、支持支付宝小程序+微信小程序+andro
机器人动力学模型及其线性化阻抗控制模型
机器人动力学模型机器人动力学模型描述了机器人的运动与所受力和力矩之间的关系。这个模型考虑了机器人的质量、惯性、关节摩擦、重力等多种因素，用于预测和解释机器人在给定输入下的动态行为。动力学模型是设计机器人控制器的基础，它可以帮助我们理解机器人如何响应控制指令，并优化机器人的运动性能。具体来说，机器人动力学模型通常由一组微分方程组成，这些方程描述了机器人各关节的加速度、速度和位置与施加在关节上的力和力
day7反转链表&反转链表II替换空格&反转字符串里的单词&左旋转字符串彬彬小码农代码随想录链表数据结构 java
Java中有很多对字符串封装的操作，本次解题中不调用方法。1.力扣344利用双指针即可解决反转链表，定义一个left指针指向0，right指向nums.length-1，交换后向中间移动，直至left>=right结束解题步骤：定义两个指针，left和right，分别初始化为0和nums.length-1nums【left】和nums【right】交换值，并让左右指针分别向中间移动一步重复循环，直
JSONLines和JSON数据格式使用教程 Cachel wood 现代程序设计技术 json jsonlines 贪心算法算法 spark ajax 大数据
文章目录一、核心区别二、JSONLines的优势三、Python中使用JSONLines1.写入JSONLines文件2.读取JSONLines文件3.处理大文件示例四、常见工具支持1.命令行工具2.编程语言库五、适用场景选择六、注意事项总结JSONLines（简称jsonl或jl）和传统JSON都是用于存储结构化数据的格式，但它们的设计目标和使用场景有所不同。以下是详细对比和使用指南：一、核心区
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
单片机物联网应用中的 Pogopin、串口与外围模组通信技术解析麦德泽特单片机物联网嵌入式硬件人工智能系统安全
引言在物联网蓬勃发展的当下，单片机作为关键的嵌入式设备核心，承担着数据采集、处理与控制的重任。而在单片机构建的物联网系统中，高效可靠的通信至关重要。Pogopin接口、串口通信以及各类外围模组的协同工作，为单片机与外部设备、网络之间搭建起了信息交互的桥梁。深入了解和掌握这些技术，对于优化物联网应用、提升系统性能具有重要意义。Pogopin接口：实现便捷连接1.1Pogopin原理与结构Pogopi
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
drawRect 触发时机
在iOS开发中，**UIView**的**drawRect:**方法（或其底层**CALayer**的绘制）的触发时机是由系统控制的，开发者不能直接调用这些方法。以下是触发视图绘制的完整机制：一、核心触发时机1.视图首次显示当视图被添加到视图层级时：[self.viewaddSubview:customView];//触发首次绘制2.显式标记需要重绘调用以下方法强制重绘：//标记整个视图需要重绘[
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
内核必须懂(七): Linux四级页表(x64) weixin_34310127 操作系统
目录前言Intel四级页表实操寻址获取cr3获取PGD获取PUD获取PMD获取PTE获取内容最后前言Linux四级页表的作用主要就是地址映射,将逻辑地址映射到物理地址.很多时候,有些地方想不明白就可以查看实际物理地址进行分析.Intel四级页表其实很多设计的根源或者说原因都来自于CPU的设计,OS很多时候都是辅助CPU.Linux的四级页表就是依据CPU的四级页表来设计的.这里主要说的就是Inte
GNhao，美国手机卡办理攻略轻松解决通讯！
GNhao，美国手机卡办理攻略轻松解决通讯！无论是留学、工作还是旅游，选择合适的GNhao，美国手机卡办理服务，能保证通信畅通无阻。GNhao，美国手机卡办理不仅方便快捷，还能节省大量国际漫游费用，是提升美国行体验的关键。GNhao，美国手机卡办理的优势解析GNhao，美国手机卡办理流程简单，申请便捷，适合各种用户需求。其次，办理资费合理，提供多种套餐选择，满足不同通信需求。此外，GNhao，美国
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
ShaderGraph节点解析(136):矩形节点（Rectangle Node）详解小李也疯狂 #Unity ShaderGraph Rectangle
目录一、节点功能概述二、端口详解三、控制选项四、技术原理解析4.1数学原理（距离场计算）4.2生成代码解析4.3视觉特性五、应用场景与实战案例5.1UI元素（矩形按钮/面板）场景：在UI中生成无纹理的矩形按钮或面板，支持动态调整大小和圆角（配合其他节点）5.2材质纹理（网格/条纹）场景：为材质添加矩形网格或条纹纹理（如布料格子、屏幕像素感）5.3粒子形状（矩形粒子/条纹）场景：控制粒子的形状为矩形
ShaderGraph节点解析(124):绕轴旋转节点（Rotate About Axis Node）详解小李也疯狂 #unity ShaderGraph Unity
目录一、节点功能概述二、端口详解控制选项三、技术原理解析3.1数学基础：罗德里格斯旋转公式3.2旋转矩阵构造3.3生成代码解析1.弧度模式（Radians）2.度模式（Degrees）3.4旋转方向：右手定则四、应用场景与实战案例4.1角色骨骼旋转（动画驱动）场景：实现角色手臂绕肱骨（上臂骨）旋转，模拟弯曲动作4.2相机环绕效果（第三人称视角）场景：让相机绕目标物体（如角色）的Y轴旋转，实现环绕观
Unity 内置着色器的使用与性能优化【Usage and Performance of Built-in Shaders】小李也疯狂 #Shader：Built-in shaders unity 着色器性能优化 shader
Unity中的着色器通过材质（Material）应用，材质将着色器代码与纹理、颜色等参数结合。理解着色器与材质的关系及性能影响因素，对优化项目渲染效率至关重要。以下是内置着色器的使用指南与性能分析：一、着色器与材质的关系核心概念着色器（Shader）：定义渲染逻辑（如光照计算、纹理混合），决定材质的属性和外观。材质（Material）：着色器的实例，存储具体参数（如纹理、颜色值），同一着色器可创建
北上广深编程语言生态与薪资全景分析（2024-2025）小李也疯狂其他 python 开发语言
目录前言一、用户数量与地域分布1.1开发者基数与城市能级1.2编程语言流行度对比二、薪资水平与行业关联2.1城市薪资梯度2.2语言薪资排名2.3行业薪资溢价三、技术趋势与影响因素3.1行业需求驱动3.2新兴技术冲击3.3政策与人才流动四、职业发展指导意见4.1开发者能力图谱4.2地域选择策略4.3企业技术选型建议结语前言在数字经济时代，编程语言的选择不仅决定技术路径，更直接影响职业发展。作为中国科
RTX 30、40、50 系列显卡全面对比：谁才是你的最佳选择？小李也疯狂其他人工智能显卡
目录前言一、架构设计：不断进化的核心驱动力1.1RTX30系列（Ampere架构）1.2RTX40系列（AdaLovelace架构）1.3RTX50系列（Blackwell架构，假设信息，实际可能不同）二、性能表现：数字背后的实力较量2.1游戏性能1080P分辨率2K分辨率4K分辨率2.2创作性能视频编辑3D建模与渲染三、功能特性：前沿科技的魅力呈现3.1DLSS技术对比3.2光线追踪性能3.3编
error -- unsupported GNU version gcc later than 10 are not supported；（gcc、g++）众人（某音、某书同名）服务器 linux 运维
服务器跑dit时编译flash-atten以及pytorch的cuda版本检查出错，分别报错题目以及如下：想了下是系统找不到编译器subprocess.CalledProcessError:Command'['which','c++']'returnednon-zeroexitstatus1.备案，以后有人要用12我还得换回来方案一：更改gcc和gcc+的版本没有合适的版本的话需要root权限指定
【华为od刷题（C++）】HJ33 整数与IP地址间的转换 m0_64866459 华为od c++链表
我的代码：#include//这个头文件提供了输入输出流的功能，使得我们能够使用cin和cout来进行输入输出usingnamespacestd;//可以直接使用标准命名空间std中的功能//比如cout和cin，而不需要每次都写出std::intmain(){longlonginta,b,c,d;//a,b,c,d：这四个变量用来存储IP地址的四个部分//分别代表IP地址中的四个字节longlo
Simscape入门教程微小冷机器人 Matlab simulink simscape 弹簧阻尼 multibody
文章目录物理网络连接到Simulink运行本文是官方教程构造物理模型的基本步骤的学习笔记，旨在建立一个带有控制器的质量-弹簧-阻尼系统。物理网络在命令行中输入sscnew，即可弹出Simscape模板，基于此模板即可组建其相应的物理网络。通过添加新模块、删除无关模块，连接其物理网络如下所有模块均在Simscape->FoundationLibrary->Mechanical中，具体包括需要的模块包
网络安全相关专业总结（非常详细）零基础入门到精通，收藏这一篇就够了网络安全工程师教学兼职副业黑客技术网络安全 web安全安全人工智能网络运维
一、网络工程专业专业内涵网络工程是指按计划进行的以工程化的思想、方式、方法，设计、研发和解决网络系统问题的工程，一般指计算机网络系统的开发与构建。该专业培养具备计算机科学与技术学科理论基础，掌握网络技术领域专业知识和基本技能，在计算机、网络及人工智能领域的工程实践和应用方面受到良好训练，具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。学生可在计算机软硬件系统、互联网、移动互联网及新一代
自学黑客（网络安全），一般人我劝你还是算了吧网络安全工程师教学兼职副业网络安全黑客技术 web安全安全网络人工智能学习
我是一名8年半的网安工程师“老司机”，要给准备入坑的同学泼盆冷水了，网络安全真的不是一般人能学的。有人会问“你一个8年的网安老司机，为什么还给大家泼冷水”？好多人说：网安基础很简单，是个人稍微认真点都能懂，给网安打上了简单、易懂的标签。然后上来就是一波言论浮夸的输出，把一些很基础很浅显的技术点拆解出来，让小白快速上手，误导新手，让他们以为网络安全就这么回事儿，可一到真正实操，哦豁，啥也不会。这导致
UIView和CALayer是啥关系有没有人告诉你
1.首先UIView可以响应事件，Layer不可以.UIKit使用UIResponder作为响应对象，来响应系统传递过来的事件并进行处理。在UIResponder中定义了处理各种事件和事件传递的接口。UIApplication、UIViewController、UIView、和所有从UIView派生出来的UIKit类（包括UIWindow）都直接或间接地继承自UIResponder类。CALaye
Esim：简化业务复杂度的Golang业务框架周琰策Scott
Esim：简化业务复杂度的Golang业务框架esim微服务应用框架项目地址:https://gitcode.com/gh_mirrors/esi/esim项目介绍Esim是一款专注于解决业务复杂度、测试、代码组织和扩展等问题的Golang业务框架。它不提供微服务整套技术体系，如服务治理、服务注册、服务发现等，而是将这些交给了ServiceMesh。Esim默认集成了gin和grpc两个技术框架，
Linux内存管理和寻址详解 *烟雨 linux 驱动开发网络
1.概念内存管理模式段式：内存分为了多段，每段都是连续的内存，不同的段对应不用的用途。每个段的大小都不是统一的，会导致内存碎片和内存交换效率低的问题。页式：内存划分为多个内存页进行管理，如在Linux系统中，每一页的大小为4KB。由于分了页后，就不会产生细小的内存碎片。但是仍然也存在内存碎片问题。段页式：段式和页式结合。地址类型划分逻辑地址：程序所使用的地址，通常是没被段式内存管理映射的地址，称为
动态链接库：技术赋能，打通“最后一公里”的商业模式超级晒盐人经验分享学习方法人工智能教育电商程序员创富
序言-飞跃大山的故事阿登是一位热爱骑行的冒险者，他计划骑行穿越一片壮丽的山脉，去探索那片未知的风景。然而，当他查看路线图时，他发现其中有一座几乎不可能翻越的高峰。这座山峰不仅陡峭无比，还充满了危险的地形，即使是经验最丰富的骑行者也望而却步。阿登知道，仅凭自己的力量，很难完成这次骑行计划。于是，他开始寻找解决方案。在一次偶然的机会中，他听说了一位名叫阿飞的飞行员，他提供一种独特的服务——用直升机帮助
徐家骏:我在华为工作十年的感悟（转）
徐是华为数据中心的头,技术超级牛人,一级部门总监,华为副总裁,年收入过千万,数据中心是用火山岩建的深入地下的一个大型建筑.防辐射,可防卫星的电子,雷达等手段的侦察.里面有象卫星发射中心那种超大屏幕,机房里满是三米的大型服务器和大型计算机.连接整个华为全球的每一台终端,整个华为每天三十多万封邮件,海外和全球的同步研发,内部的信息管理,内部流程,华为的国内国际IP电话都是通过出去.上周,我正式提交了离
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

可视化数据挖掘开源软件的比较分析

一、引言

二、机器学习工具功能特点分析

（一）WEKA

1. 概况

2. 特点

（二）RapidMiner

1. 概况

2. 特点

（三）KNIME

1. 概况

2. 特点

（四）明略

1. 概况

2. 特点

（五） 东软RealRec

1. 概况

2. 特点

三、机器学习工具比较分析

（一）机器学习算法的比较

（二）可视化功能的比较

（三）不同用户群学习及使用难易度的比较

（四）主流大数据平台支持能力的比较

（五）软件工具自身成熟度比较

（六）工具使用成本比较

四、总结

你可能感兴趣的:(可视化数据挖掘开源软件的比较分析)

（五）东软RealRec