祝威廉

MLSQL：融合 Spark+Ray，让企业低成本落地 Data+AI

近日由 Kyligence 主办的 Data & Cloud Summit 2021 行业峰会在上海成功举办，此次峰会特设「开源有道」分论坛，邀请了来自 Apache Kylin，Apache Spark，Alluxio，Linkis，Ray 以及 MLSQL 等开源社区的技术大佬，分享了目前开源社区关于大数据、机器学习等多个热门话题的前沿技术和最佳实践。Kyligence 技术合伙人兼资深架构师祝海林分享了一站式大数据和 AI 平台——MLSQL 是如何融合 Spark + Ray，助力企业低成本 Data + AI，引起了现场观众的热烈讨论。

以下为祝海林在大会演讲实录

大家好，我是祝海林，今天很高兴给大家介绍一站式大数据和 AI 平台——MLSQL。在座各位基本都是做大数据相关的工作，无论您所在公司是否已经在使用 AI，我们都知道，目前落地 AI 其实只是时间问题了，因为大数据和 AI 两者存在非常强的延续关系。而 MLSQL 做的事情其实非常简单——就是让大家低成本落地 Data 和 AI，今天简单介绍以下四点：

当前落地 Data+AI 所面临的痛点
MLSQL 到底是什么
如何使用 MLSQL 低成本落地 Data + AI
MLSQL 典型案例

当前落地 Data + AI 所面临的痛点

当前痛点主要分为两部分，第一是企业面临的痛点；第二是一线人员，也就是落地 AI 的人员面临的痛点。

大家一起看看中小企业开发一个算法的典型流程：

第一步是进行数据提取，企业数据往往分布在各个地方。如果企业数据仓库做得比较好的，可能将数据放在 HDFS 上，并且搭了 HUE，会在 HUE 上写 SQL 进行数据的提取和预处理。但是 SQL 的功能毕竟有限，大家会发现很多复杂功能的处理 SQL 是无法实现的。

这个时候，有一些企业就会引入 PySpark，用 Python 来处理。在 PySpark 把这些数据处理完之后，大家可能还需要机器学习库，比如 TensorFlow 等，如果是分布式的话，大家可能还需要把 TensorFlow 放到专有的 Cluster 集群去跑。当然，企业也可以把它放到 PySpark 去跑，但是大家会发现通过 PySpark 把数据“喂”给机器学习库是一件很难的事。

举个例子，如果算法是单机版的，而 Pyspark 是分布式的，大家最终要把数据 Collect 到 Driver 端给 TensorFlow，或者是在某个 worker 节点去进行 Repartition 后再把数据给到 TensorFlow。在 Collect 数据到 Driver 端的过程中就很可能会挂掉，因为这里可能有几千万甚至上亿的数据，如果是 Repartition 到一个分区，你会发现进行了一次很大的 Shuffle，这个性能也可能会导致 Spark 挂掉，这就是为什么 PySpark 现在处理不好这个问题。

完成上述步骤之后，大家还需要把这个模型部署出去，大多是部署成 API 服务，一般是以下三点：

部署到批处理里去，预测一些已有数据；
部署到流处理里去，预测一些实时数据；
部署成 API 服务，供第三方去调用。

上述就是一个模型训练好之后，通常要应用的三点。

在完成数据预处理、PySpark 处理数据、使用机器学习库进行训练以及复杂的模型部署等，企业接下来还需要进行持续的迭代。大家都知道模型都会随着数据变化而变化的，如果不持续迭代的话，辛辛苦苦训练出来的模型可能一个月之后就是一堆垃圾了，数据已经发生了改变，人员使用数据的习惯也已经发生了改变，模型如果不持续更新迭代就是没有用的。

大家会发现，需要维护的组件越来越多，为了让整个任务跑起来，大家又会去使用调度任务把它调度起来。比如，你在 HUE 里面跑一个任务，因为它们都分属于不同的系统，很难做到资源的弹性分配和充分利用，你会发现问题越来越多。

对于数据科学家而言，为了去落地一个算法，需要学这么多框架，而这些框架和本职工作相关性并不高，数据科学家又不是超人，这就会导致落地一个算法的门槛就会变得非常高。

一线人员的痛点

一线人员包括研发、数据科学家，还涉及到管理人员，你会发现在这个过程中，部署和维护成本都非常高。数据会在各个组件流转，这就可能带来数据安全问题。数据要多次落盘，格式、形态都不一致，还会产生大量临时文件，而这些文件很可能就在某一个没有管控的目录里，就可能会导致数据的泄露。大家往往也会“选择性忽视”这些文件，尤其是做研发的朋友们，大家在用的时候很开心，但过常常会忘记清理。

在这个过程中，当然也存在资源浪费的问题，各个组件都会占用资源，你没有办法让系统弹性协调资源。其次，存在使用门槛高的问题。举个例子，数据科学家想要落地一个算法，需要学 Python 以及上文提及的各个系统和框架。

通过上述描述，大家会发现落地一个算法在中小型企业可能是以周计的，需要投入一个算法工程师以及多个研发，最终可能需要一周、两周甚至是一个月才能落地一个算法。

企业落地 Data + AI 的痛点

企业现在是怎么利用 AI 的？理想情况是：通过一个算法提升了 1% 的效率，减少了大量成本，公司多挣了1个亿，但这种场景其实是很少的，一般只有在大型企业，提升 1% 的效率才能带来这么大的收益。但大部分中小企业以及互联网企业其实是由非常多的场景构成的，每个场景可能都需要一个或者多个算法，而这些算法往往体现在流程优化、用户体验改进等。

正如上文提到的，乐观来看，落地一个算法就需要一周，而现在普通中小企业，往往有几百个场景，需要落地成百上千个算法，还需要持续迭代，大家都可以想到这个成本有多高。同时，对于企业来说，这些耗费大量人力物力的算法带来的收益是很难量化的。难点在于，这些场景是人工没有办法解决的，又只能通过 AI。

我经常举的一个例子就是「在线问诊」，在线问诊过程中有一个分诊环节，当用户描述自己症状的时候，需要把他分到具体的科室里去，对于背后的企业而言，成千上万的用户同时在问，这种情况下没有办法通过人工去做，只能通过算法。如果借助机器能完成 98% 分诊，大部分用户的体验就会得到大幅提升。但对于企业而言，带来的价值仅仅是让自己产品的一个小环节获得了不错的体验而已。

痛点一：算法落地成本高于收益

对于企业，往往有两大痛点，企业会发现落地一个算法，到具体某个场景的时候，成本是远远高于收益的。正如我们刚刚提到的，这个算法可能仅仅带来了一点点体验的提升，但是企业投入了好几个算法工程师，花了几周甚至一个月才将其落地。对于企业来说，算法工程师和研发工程师资源比较珍贵，硬件成本也比较高的。

痛点二：人才资源不足，时间成本高

第二个痛点在于，有的企业特别有远见，他们不在乎资金的投入，目的就是要让产品领先于其他企业，哪怕前期亏钱也是可以的。尽管投入这样的资金，企业也不一定能成功落地 Data + AI。首先企业要招大量的研发、数据科学家等，就算投入大量资金可能也是很难的。尤其是对于一些非技术企业，比如传统制造业等，更是难上加难。即使企业招到了人，基于以前的平台体系去构建难度还是非常高，可能要花半年到一年的时间来构建和落地，时间成本是非常高的。

上述两个痛点都给大多数企业落地 Data + AI 带来了重重挑战。

MLSQL 到底是什么

对于想要落地 Data + AI 的广大企业而言，不妨考虑一下 MLSQL。首先大家来看一下 MLSQL 究竟是什么，之后再来了解一下为什么它能够解决上述问题。我们将 MLSQL 定义是一门语言，语言一般包含两部分，一是语言的规范和语法，第二是语言的执行。语言只有规范没有用，写出来的语言需要有引擎去执行才行。

为了更好的拥抱 AI 生态，我们其实用到了两个引擎，一个是 Spark，一个是 Ray。在座很多人应该都是做大数据相关的，大家应该对 Spark 不陌生，使用过 Spark 的话，一般都会用到 UDF。不知道大家有没有想过解决这样一个问题：我用 Python 训练了一个 Tensorflow 的模型，有没有可能把这个模型做成 UDF 直接放到 SQL 里去使用？这样就可以做批处理、流处理，甚至可以暴露成 API 对外提供服务。传统做法，我们可能得上JNI了，因为 Spark 是用 Java 或者 Scala 开发的，而 AI 大部分模型都是基于 Python/C++ 开发的，这个过程就会比较麻烦。

MLSQL 做了一些工作，可以把 Spark 的 UDF 跑在 Ray 上，用户本身是无感知的，正常注册自己的 UDF 就好了。这个工作我们目前已经取得了初步的成果，我们用 96 行代码，就能把任意需要的模型预测功能（基于 Python 开发的模型）封装成一个 Spark UDF 模型。这在以前是比较困难的，因为 UDF 之前是一个无状态的，而模型预测是有状态的，就需要事先加载一个模型，之后再去提供一个 UDF 预测能力。我们通过融合 Spark + Ray，很好的解决了这个问题，所以，他们两者的融合，是可以带来很大想象力的。

MLSQL 核心引擎是 Spark，Ray 是可插拔的，两者都是分布式的，衔接上也是分布式的，所以我们说 MLSQL 天然就是一个分布式引擎。对于企业而言，如果只有语言和执行引擎，没有第三方开箱即用的库，什么东西都要自己开发，其实是没有什么价值的。为了帮助企业去更好地落地 Data+AI，MLSQL 提供许多功能的支持：

对数据湖的支持，在 MLSQL 里面，大家把引擎用起来，进行一个配置，指定一个目录，就可以向数据湖里面更新数据、写数据。
对 CDC 的支持，大家比较熟悉的应该是 Flink，那 Spark 去做 CDC 呢？MLSQL 直接内置两行代码就可以实时同步到数据湖里面去，还包括各种内置的算法。

下文我会展示一个 Demo，在 Demo 中，用户完全不需要用到 Python，只通过 SQL 就能完成一个复杂的机器学习流程：从提取数据、处理数据、训练数据、调参，到最后部署成 API 服务和 UDF。

当然 MLSQL 也支持 Python，在 MLSQL 里 Python 是一段文本脚本，你可以在 Python 中分布式处理 Spark 中的数据或者进行模型训练，结果重新返回给 Spark，中间可以不落地，性能还好。因为Python 部分也是分布式的，而且灵活，这得益于我们对 Ray 的支持。另外我们也能实现一些非常酷炫的效果，比如之前提到的使用 Ray 作为 Spark UDF 的执行引擎，完成 Python 模型转化为 UDF 的操作。

传统的 SQL是需要默认指定一个数据源的，比如 Hive 是数据源，你写 select 的时候，系统知道到哪去取，但是实际上数据联邦查询才是未来，之前主会场的大佬也提到，未来数据一定是从 collect 到 connect，为什么？现在法律法规对数据隐私要求越来越严格了，各个地方的数据不能随意地传输，而你需要进行统一分析的话，一定要采用联邦式的，数仓未来一定只是作为数据源之一而已，未来你会有非常多的数据仓库，物理上是割裂的，上层视角可能还是一个数仓的概念。

MLSQL 就提供了非常好的便利，比如上面这个例子，MLSQL 可以 Load Hive 数据、JDBC 数据以及 HDFS 数据，Load 完之后的表，后面就可以直接使用了。MLSQL 对 SQL做了比较好的改造，select 之后马上就可以得到一个视图名，比如下文图中的 as joined，最后我们可以得到一个 final 表，从 final 表里面取出一个 output 的结果，你会发现我们完全把 SQL 脚本化了，变得非常简单，不需要写非常复杂的嵌套 SQL，因为 SQL 的复杂度来源于两方面：

子查询会导致嵌套复杂，嵌套一定是不符合人类思维的，顺序结构才符合人类思维。
Join 查询和窗口，有时候一条 SQL 有成百上千行，原因只是大量使用了子查询，Join 了无数张表，在这里 MLSQL 完全可以把它打平，select 完之后就会得到一张表去使用，非常简单。

此外，MLSQL 还提供了分支语法的支持，模块的支持，让 SQL 越来越强，越来越便利。

MLSQL 原理

上图右边是一张原理图，MLSQL 主要做了三个部分：第一是语法解析，第二是代码翻译器，第三是执行引擎。其中比较重要的是语法解析引擎，MLSQL 做了 include 处理，支持模块化等。虽然大家看到的是 SQL，但你现在已经可以直接使用 MLSQL 去开发一个模块了，最后通过 include 语法把它引入进来。

之前我们已经使用 MLSQL 开发了一个叫 lib-core 的标准库，用户可以直接 include 进来去完成一些特定的功能，还包括语法检查、执行编译时的权限检查，以及一些命令行的预处理，然后是一些内置组件相关的初始化。

解析完之后的话，MLSQL 会把它翻译成 RDD data frame 或者 Python 的代码。以前大家写 UDF 的时候比较痛苦的是你需要开发一个 jar 包，部署时还需要去重启 Hive Server。在 MLSQL 你可以使用 register 语法去动态注册 UDF，在里面写一段 Scala 的代码，就可以直接在后续的 SQL 中去使用它了。这得益于 MLSQL 有一个 Scala 和 Java 的动态编译组件，里面嵌了一段 Python 代码，它是由 Pyjava 互通组件去完成的，最终是支持在 Java 里面去执行 Python 代码，从而在 SQL 里实现 Python，并且实现数据的互通。

MLSQL 架构

接下来介绍 MLSQL 的架构，它非常简单。作为一个引擎，前面会有一个 Load Balance，加 JDBC/Rest API，最后会有一个控制台界面供你去使用。MLSQL 可以跑在 Yarn/k8s/Standalone 和 Local 模式。MLSQL Engine 是一个典型的 master-slave 结构。因为我们支持 Python 脚本，这意味着我们需要在 Java 里面执行 Python 代码，于是我们重新实现了一套 Python Deamon 和 Python Worker，这个是作为 Client 的，然后在 Ray 里执行 Client 的代码，这大概等价于在 PC 机上写一段 python 代码，最终会连接到 Ray 的 Cluster 上去执行。

传统的 PySpark 会有一个很大的毛病，大家可能也遇到过，Python Worker 和 Java 的 Executor 是在一起的。这种混部的架构会有一个问题，如果你跑一个很大的查询，Python Worker 占用的内存会非常大，或是把你的 CPU 跑满了，而且你是没有办法做资源隔离的。当跑满的时候，HDFS 也跑在上面，一不小心把节点跑挂了，可能还会遇到数据安全的问题，而且 Python Worker 节点也是互不相通的。所以这种混合的架构其实是有问题的，MLSQL 其实是把它减轻了，真正的 Python 处理逻辑是自动发送到 Ray Cluster 上去执行了，多环境再也不是问题了。以前 Python worker 可能需要 TensorFlow A 版本，另外一个用户说我要 TensorFlow B 版本，在这种情况下，我们可以起多个 Ray Cluster，用户直接决定连哪个 Ray Cluster，这个事情就迎刃而解了。

综上，MLSQL 架构其实有以下三个特点：

不管是 SQL 引擎还是 Python 引擎，几乎每个步骤都是分布式引擎；
MLSQL 支持 Python，拥抱了 AI 生态，解决了数据连接问题；
支持多环境，因为真正的机器学习里面，大家会发现环境是最难搞定的问题。

MLSQL 其实面对的受众是非常广泛的，它是一个很简单的语言，可以只用 SQL；但也可以复杂，允许你写一些高阶的 Python 代码来和 SQL 协作；同时作为研发工程师，你可以开发 UDF 函数或者说是写一些插件模块来增强 MLSQL 语言和引擎。MLSQL 是一个插件化的内核，它可以应对数据科学家、大数据工程师、产品和运营等，还面向于服务，这些会在后文的案例场景中简单介绍一下。

如何使用 MLSQL 低成本落地 Data + AI

MLSQL 怎么做到这一点的呢？我认为是 开源、统一、简单和安全 这四点让企业可以真正实现低成本落地 Data + AI。

开源

首先 MLSQL 是开源的，云上云下皆可部署，开源社区有保障，我们未来也会有商业版的支持，大家可以选择开源，也可以选择商业版。

我们不仅仅开源了引擎，还开源了开箱即用的 MLSQL Console，是一个 Web IDE。MLSQL 还可以让单引擎支持多租户，Web IDE 支持 Script/Notebook 的开发模式。我们还提供了一个非常高阶的分析工坊，可以实现自助化分析。MLSQL 可以做到，你写出来的任意复杂度的 SQL 都可以在分析工坊用「点点点」的方式来完成。这点以前很难做到，因为你要把复杂的操作转化成一条 SQL，其实没有工程师可以做得到，但是在 MLSQL 里，用户的任何一个操作都可以转换成一个语句，最后形成几千行的 MLSQL 代码，只需要一个前端工程师就可以完成。

最后一起来看看 Console 和 Zepplin，HUE 的对比。

统一

其次，MLSQL 做到的是统一，对于用户来说，不再需要那么多组件才能完成大量工作，语言层面和交互层统一了，引擎层就是一个引擎，你把它解压进行部署，整个工作就都完成了。

MLSQL 相对其他语言，比如标准的 SQL 或者 PySpark 等语言的优缺点，我们在下图进行了简单的对比。

统一的价值就是带来了更低的成本，无论是面向维护者，还是使用者，大家都告别了一堆的系统和组件。

简单

MLSQL 的另一个价值是简单。

我们实测过，如果你懂 SQL 的话几天就能入门，可以做一些流批、数据分析的工作。如果标准数据科学家，可以在里面完成一整个 Pipeline，支持你去写 Python，然后最主要的是可以实现代码易于自动化生成，去做一些高阶的产品。比如我们前面提到的无代码的分析工坊，和其他技术相比，你用 MLSQL 做同一件事，会发现完全不是一个量级的工作。「简单」的价值就在于降低了用户操作的门槛，一线人员效率提升了，之前用 Python 才能实现的工作现在用 SQL 就可以了。

安全

MLSQL 带来的还有安全价值。以前大家会通过 Ranger 或者一些其他的组件，这些组件你会发现一个最大的问题，它们都会侵入到底层的数据存储。一个典型的例子，我用 Pyspark 去访问 MySQL 数据库，如果有 1000 个人去访问的话，数据库工作人员需要给 1000 个人去配 JDBC 的权限连接，这显然是做不到的。

而 MLSQL 是自主开发的一个语言，我们在设计这个语言的时候就考虑到了数据访问安全控制的问题。所以 MLSQL 可以做到语言层面统一做权限，可以控制用户能否加载某个数据，粒度是表级别还是到行列级别。这些都可以在 MLSQL 引擎层面做，根本不侵入各个存储层。你能不能访问 Hive 不是 Hive 去授权，而是在语言交互层面就已经授权了。

相对于其他语言，MLSQL 还有一个很大的优势，它不仅可以控制数据的存取，还能在语言层面，对某一个语法去授权。比如在 Python 里面，你用哪个语法肯定是控制不了的，除非自己重新实现一遍。但在 MLSQL 里，你能否用自定义 UDF、能否使用 Python、以及能否使用某个模块等，都可以做非常精细化的权限控制。

还有刚刚提的隐私计算，数据现在是不允许搬家的。举个例子，A 公司和 B 公司进行合作，两者的数据是不能搬家的，以前为什么要搬家呢？以前没有好的途径把这个数据暴露出来，原因是什么？以前如果暴露出来的 SQL，根本不能满足用户分析的需求，但如果暴露出是 Python 这种 API，又太灵活、没有安全性可言了。

正如我们前面提到的，MLSQL 不仅可以控制数据安全，还能控制语法元素，非常灵活。这就意味着大家完全可以提供一套 MLSQL 引擎接口出去，可以在这里随意地“玩耍”，生成一个算法模型，这个模型经过 A 公司的授权就可以下载到 B 公司，不存在授权安全性的问题。

MLSQL 典型案例

接下来，我们看几个 MLSQL 的典型案例。

案例一

首先看一下场景一，这是一家消费金融公司，他们已经跟进 MLSQL 3年了，累计运行了700多万任务，数据规模 TB 级别，全公司有 200 多个人，200 人里有 35% 注册了 MLSQL 的使用账号，也就是大概有 70 多个人注册了账号。其中日活达到了 71%，这意味着注册的 70 个人每天几乎都有 50 多个人去使用。

通过这个案例，大家可以发现，使用 MLSQL 去玩转数据的门槛非常低，人人都可以去用。更夸张的是，整个大数据平台支撑团队只用了 2 个人，不需要复杂的组件，就可以完成很多事情。这个又告诉我们什么呢？这意味着维护这套平台成本非常低。

案例二

还有一个典型场景是厦门的一家信息公司，这家公司提供面向政府部门的服务。PPT 里说的模型，举个例子，发现卡口处是不是有汽车套牌的情况，也就是数据过来之后我要计算是否在异地出现。这些模型，他们以前是用 Kettle 做的，会发现客户的一个模型 2 周都搞不定，这个时候还不能加人，因为加人也没有用。后来实在受不了了，而且随着他们的数据来源也越来越多，还没有办法做异构数据的的联合查询，于是他们就引入了 MLSQL。

引入 MLSQL 后，给他们的开发效率带来了 15 倍的提升，怎么算出来的呢？他们举了个例子，通过 MLSQL 对客户提供支持后，客户 30 个模型、500 个任务，4 个人用了 1 个月就实施掉了，客户现场只提供 1 个人就可以了，每天就只需要看看日志和异常，无论开发效率还是运维效率，都有一个非常明显的提升。而且他们以前的流程都是在本地开发好，再到客户现场去调试，有问题又要回到“大本营”里去，现在 MLSQL 本身就是一个脚本，可以在直接在客户那里调试，MLSQL 成本非常低，本身的语法是可以扩展的，还可以用插件的方式去实现更复杂的处理逻辑。

这里放一个简单的 demo????

大家可以看到 Demo 里，我们部署成 API 服务的时候，你会发现他进行预测的时候也是写 SQL，但是数据不再是一张表，而是你传过来的 Json 数据，我们可以把这条 SQL 应用于你传过来的数据进行计算。不用做任何开发，组合一些函数，就可以完成一个端到端的预测，而传统的预测必须提供向量才能预测出来。

我们刚才看的 register 到可以跑到服务上，就是一个标准的函数。包括前面我们的案例，和 demo 演示因为都是内置模型，就可以很容易做到这一点。现在通过结合 Ray，MLSQL 也可以把 Python 的模型变成一个 UDF 函数进行使用。

大家看到，一个算法的开发和发布变成一件非常简单的事情，从数据的加载、处理到训练模型、调参、发布成 API 服务，都在 Notebook 里就可以完成整个流程了，根本不需要研发“爸爸”，搞完就可以发给第三方去玩了。

想领取演讲视频及 PPT 资料快扫描下方二维码吧

关于 Kyligence

Kyligence 由 Apache Kylin 创始团队创建，致力于打造下一代智能数据云平台，为企业实现自动化的数据服务和管理。基于机器学习和 AI 技术，Kyligence 从多云的数据存储中识别和管理最有价值数据，并提供高性能、高并发的数据服务以支撑各种数据分析与应用，同时不断降低 TCO。Kyligence 已服务中国、美国及亚太的多个银行、保险、制造、零售等客户，包括建设银行、浦发银行、招商银行、平安银行、宁波银行、太平洋保险、中国银联、上汽、一汽、安踏、YUM、Costa、UBS、Metlife、AppZen 等全球知名企业和行业领导者。公司已通过 ISO9001，ISO27001 及 SOC2 Type1 等各项认证及审计，并在全球范围内拥有众多生态合作伙伴。

点击“阅读原文”访问 MLSQL 官网

↓↓↓

你可能感兴趣的:(算法,大数据,编程语言,hadoop,数据库)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb