spacewalkman

zeppelin源码分析(0)——zeppelin要解决什么问题

通过我其他的zeppelin分析文章，大家可以从中了解zeppelin是什么样的。本篇试着阐述问题的另外一面，zeppelin为什么是这样的？本文从需求出发，探寻zeppelin的架构设计、技术选型、代码的模块划分和依赖关系最初的“出发点”。
zeppelin的核心功能用一句话总结就是：支持多语言混合的REPL(Read-Evaluation-Print-Loop)。这个核心功能的价值体现在：
站在使用者的角度，意味着：
1. 可以在一个Note中混合使用多种语言。用户可以根据需要完成的任务的类型，选择最合适的语言来实现，不再受限于单个语言的特性。例如：MarkDown能做出漂亮的文档，python和R有大量的科学计算、机器学习和可视化包，scala与Spark有天然的血缘关系，Shell处理本地文件非常方便……，可以想象一下将这些语言的优点都结合起来，会产生多么强大的生产力。
2. 数据分析和机器学习，从来都不是一个“一蹴而就”的过程。分析过程和机器学习算法一样，本质是不断迭代和试错的过程。数据科学家和算法工程师对数据分析平台最看中的能力是“有丰富的组件”和“可调试”（至少在我接触到的数据科学家和算法工程师来看是这样的），前者表达了对平台功能全面的需求，后者表达了如何对采用这些功能“平顺”地开展实际业务分析的需求，二者相辅相成。REPL相对于“拖拽式”的数据分析平台，虽然不能像传统IDE一样，设置断点和查看中间变量，但是相对于“纯黑盒”的拖拽式数据分析工具，能在很大程度上实现“调试”功能。

站在管理者的角度，意味着：
1. 使得统一工具环境成为可能。一个数据分析团队中，各成员由于擅长的语言不同，可能需要同时维护多种环境，如R、Python远程桌面开发环境，R和Python都是通过第三方扩展包进行扩展的，成员熟练使用的包，也有所不同，给运维造成了较大压力。实现一个集中式的分析工具，在服务端集中于一处，统一配置R、Python、Spark、Hadoop、Hive等开发环境，显著降低运维成本。
2. 使得进行统一安全控制成为可能。B/S系统，方便进行集中式用户权限控制，并且由于该平台”看到”的是各种语言的源码，可以对恶意代码进行监测和过滤，避免有意或者无意地对系统造成的损害。此外，可以限制所有过程都在线操作，不存在跨机器传递数据的问题，可限制导出数据，保障数据安全。

现在，让我们抛开对zeppelin的已有认知，假设让我们重新设计一个平台，实现上述核心功能，会面临哪些问题，这些问题都有哪些解决方案，各种方案又孰优孰劣，在此过程中，探寻zeppelin的设计动因和它要解决的问题。

首先看一下该平台要应对的典型场景：

平台要解决的是：在服务端资源一定的情况下，如何尽可能正确和高效地执行多个用户混合了多种语言的Notes问题。
由于我们要实现IPython Notebook式的B/S架构的共享式的分析工具，所以至少需要一台Web服务器。一般zeppelin典型的使用方式是与spark一起使用，而spark on Yarn又是常见的spark部署方式，因此，上图就是生产环境下，zeppelin部署时的最小配置。确定了部署方式，软件设计问题会接踵而至，每种问题的解决都影响的该平台技术的选型和架构的设计：

各种语言的代码在哪里执行？
代码的执行是会消耗服务器资源的，资源是共享的，有限的，合理的分配代码的执行环境，对平台的扩展能力至关重要。在有web服务器的前提下，显然不会每个用户直接连接spark集群，提交任务（否则，就退化成了每个用户在本地启动一个spark-shell了，这也就是失去了集中共享式数据分析平台建设的意义），web服务器自然成了spark集群唯一的客户端，所有用户的任务都间接通过web服务器向spark集群提交。但是，并不是所有语言写的代码都需要提交的spark集群上执行，各种不同的语言的代码“理想”的执行位置如下：

语言	单机/集群	代码在哪里执行
R	单机	web服务器
R(SparkR)	集群	Spark集群
Python	单机	web服务器
Python(PySpark)	集群	Spark集群
MarkDown	单机	web服务器
SQL(SparkSQL)	集群	Spark集群
SQL(其他SQL)	单机	web服务器
Shell	单机	web服务器

通过上表可以看出：
1. Spark集群有自己独立的资源管理器Yarn。任务的调度和资源的分配都有该资源管理器接管，这里不讨论。
2. 还有大量的语言代码，是在Web服务器本地执行的。一台Web服务器的资源是有限的，会成为限制该平台横向扩展的瓶颈。这就有必要在web服务器端，对用户执行代码的频率进行限制，如进行排队。或者将代码的执行环境从web服务器端抽取出来，额外建立一个集群（这个集群与Spark集群不同），该集群的目的很单一，就是执行web服务器发过来的各种语言的代码。它可以是“无中心”节点的方式，各自向Web服务器报告，或者是类似Yarn集群的方式，只不过获取到的container专门用来执行一段代码。

multi-tenancy支持问题
多用户系统，每个用户创建的note，每个note执行的结果，都应该是属于该用户的。其他用户未经授权不能访问。
repl解释器应该至少实现各个用户之间隔离，因为repl解释器是执行过程中会保存context，即：之前定义的变量或者routine等，能够直接检视和使用，但是一般情况下，repl解释器不应该被共享，否则，就会出现两个用户相互影响的情况。那么问题来了，同一个用户不同的note，含有相同语言的代码，可以共享同一个repl解释器吗？这个问题抽象出来，就是repl解释器粒度问题，是per-user还是per-note的问题，2者各有优劣：

per-user模式，节省资源，同一个用户不同note之间的相同语言的代码都可以发送到同一个解释器，节省服务器资源。由于解释器同时保留多个代码段执行的上下文，这种模式可以实现跨note交换数据。同时，由于多个note共用一个repl解释器，解释器比较繁忙，用户的响应时间变长。

per-note模式，耗费服务器资源，但是代码执行速度块，用户体验好。

平台应该将选择权交给用户，提供灵活的配置功能。

Note中paragraph执行的顺序问题
并发还是顺序执行？其实答案不是个0/1问题，而是要视代码是否具有上下文相关性而定。

上图是Note内部构成逻辑图，一个Note由一系列paragraph(代码段）组成，代码段有序的。每个代码段只能使用一种语言，但是不同paragrah的语言可以各不相同。理想情况下，所有的代码都并行执行，以期望获得最高的执行效率，但是实际上由于大部分语言的前后代码之间存在上下文相关性，一般情况下是不能并行的。各语言代码段之间能否并行如下表所示：

语言	是否能并行	解释&示例
R	否	存在执行顺序相关性，如：前面定义的变量后面才能使用
Python	否	同上
Spark	否	同上
Shell	否	同上，如：只有目录存在了，才能往里面放文件
SQL	否	存在执行顺序相关性，DDL、DML语句会相互影响，如必须先create table才能insert数据
MarkDown	是	上下文无关，一段MarkDown可以独立与其他MarkDown代码独立渲染

可以看出，除了MarkDown之外，其他代码都是不能并发执行的。当然，不存在上下文相关性的时候，是可以并行的。例如SQL语句，在table和数据都已经存在的前提下，2条select语句是可以并发执行的。
需要提供每个repl解释器级别的并发设置，在分析师人工检查代码后，能够确定并发执行的代码，能够显式启用该设置，以提高速度。

相同的repl解释器不同的runtime依赖的问题
一个典型的场景是支持同一个产品的不同版本。只要该产品的public API不改变，通过配置修改该repl解释器的运行时依赖，就可以实现代码不变，支持多个版本的能力。
另一个典型的场景是JDBC repl解释器，使用的都是SQL语句，但是后台配置不同的连接就访问不同的库，可以是RDBMS也可以是NoSQL，每次解释器启动的时候，都要根据需要加载不同的runtime依赖，以完成Driver的加载、connection的获取以及SQL语句的执行。这要求repl解释器具有运行时动态查找、下载并加载依赖的能力。当前maven基于GAV(Group、Artifact、Version）坐标和公共repo的方式唯一定位依赖，并自动下载的方式，已经成为事实上的标准，故平台需要具有动态加载maven格式依赖包的能力。该问题也引出了下面的问题。
repl解释器进程管理问题
由于同一个JVM(这里不讨论为什么采用JVM-Based语言的问题）class加载是根据classpath定义的顺序决定的，一旦找到就终止查找。这决定了要支持不同的runtime依赖和同一个产品的不同的版本，需要启动单独的JVM，以实现依赖的隔离。但是这样，问题又来了，repl解释器需要受到平台的控制。我们常用的在操作系统中启动一个R或者Python的repl进程，该进程的生命周期是只受操作系统控制的。而本平台要实现的repl解释器进程需要”受控“，即：其启动、停止、解释执行代码、输出反馈等过程都要在平台的控制下进程，以实现自动化repl进程控制，同时避免资源泄露。
再者，不同语言的repl进程，如何与JVM-Based的平台的进程进行跨语言通信，也是需要考虑的问题。常见的IPC(Inter-Process-Communication)机制，Shared-Memory、Pipe、Socket，这三种中，考虑到未来支持repl解释器集群化部署，基于Socket的实现方式是适应性最好的。平台需要确定一种IPC通信协议，规定repl解释器集成和平台之间的数据交换的格式和时序。
此外，尽可能复用多种语言的repl进程的生命周期控制逻辑，实现通用的控制，避免增加repl解释器扩展开发的工作量。

上述需求，是zeppelin的核心需求，zeppelin都给出了相应的解决方案：

需求	zeppelin的解决方案
代码在哪里执行	单机版的R和Python，在Web服务器上执行，SparkR和PySpark在spark集群上执行。在zeppelinServer端进行进行调度和排队，对代码解释任务进行限流。远程启动repl进程到另外的节点上，zeppelinServer端可直接基于Socket连接到该repl解释器进程上，一定程度上解决在web服务器成为横向扩展瓶颈的问题。
multi-tenancy支持	Shiro-Based Authentication,Per-User/Per-Note两种mode的repl解释器进程共享方式，生命周期受控的多repl解释器进程。
Note中paragraph执行的顺序	在repl解释器级别，可配置是否运允许并行执行。某些特殊的repl解释器还支持配置并发数，如JDBC。
“相同的repl解释器不同的runtime依赖的问题”&“repl解释器进程管理问题”	多JVM隔离runtime依赖。Thrift-Based跨语言IPC机制。抽象出repl解释器生命周期管理接口，各repl解释器受zeppelinServer端控制。

围绕着上述核心功能，zeppelin还需要提供如下“外围功能”：

方便扩展的解释器接口设计
显然，一个大数据分析工具，只有建立起良好的生态圈，才能保证长久的生命力。zeppelin显然不想只支持有限的几种语言的repl解释器。提供定义良好接口，支持二次开发，是必备项。
一种将后台解释器进程的输出格式化到前端UI的能力
前面提到了python和R有大量可视化包，将这些后端输出，发送到前端，前后端一致，就跟用户在自己本机打开R和python repl进程一样，也是一必备项。当然，还提供格式化普通文本为表格的能力。
配置化能力
将编译时常量变为运行时常量，抽取出来，配置文件化，可以显著提高的系统的可移植性。Hadoop生态系统大部分产品，都有xxx-default.xml和xxx-site.xml这样灵活的配置系统，zeppelin也具备这种能力。
前端实时反馈能力
大数据分析，最痛苦的事情莫过于“代码跑了很长时间，最后程序挂了”。在大数据处理过程中，实时地反馈执行结果，显示进度和日志，允许用户中止正在执行的任务，是易用性的很重要的方面。
持久化能力
系统所有的配置项目，所有的note代码和执行结果、权限等，系统重启之后，都需要恢复，因此需要持久化。
版本控制
算法无论以什么语言表达，都是代码，是代码就避免不了版本演化问题。zeppelin对note的持久化方式，决定了进行版本控制的难易程度，纯文本方式，则便于版本控制实现；二进制方式，则版本控制中高级特性，如版本比对，merge以及冲突解决，会很困难。
Note共享平台
zeppelin自身是个工具，使用该工具做出来的面向各个行业的Note，才会产生外在价值。zeppelin官方推出的zeppelinhub代码分享平台，将广大zeppelin用户分享的note进行分门别类的整理，试图构建一个从工具到行业应用，不断反馈、改进、推广的良性的生态圈。

一些zeppelin不具备的能力（并不是完全没有，有些实现起来比较蹩脚）。

集群化部署
interperter Process已经成为制约zeppelin横向扩展的瓶颈问题。如何优雅地在多个节点上动态分布interpreter进程，并且保持zeppelin与这些进程之间的通信，是一个亟待解决的问题。目前有一些蹩脚的实现的方式，勉强实现了zeppelin的集群化部署，但却不”优雅“。
安全性问题
这里是除了用户权限以外的安全问题：包括系统安全和数据安全。可以写代码，对分析师来讲是最灵活的方式，但是对系统开发者来讲，要执行用户输入的各种代码，保证系统的稳定，却是“噩梦”一般。几行简单的代码，就可以让操作系统资源耗尽。本来可以很“优雅”地表达的代码，却被写地很低效、bug频出，占用大量的后端资源，使得repl进程迟迟没有响应。数据是资产，已经成为行业共识，作为一个共享式的大数据分析工具，所有的数据操作必须是在线的，数据资产不能导出。此外，数据的加密和脱敏问题，也属于此范畴的问题。

Go 语言源码分析——map SSSTing_ golang golang
哈希表用于存储键值对的映射关系，具有O(1)的读写性能。通过哈希函数可以将不同的键映射到不同索引上，当不同的键映射到同一个索引上时，会产生哈希冲突，可通过开放寻址法、链表法来解决哈希冲突，其中Go使用的是链表法。一、数据结构map将键值对存放在桶数组中，每个桶只保存8个键值对，通过键的低8位选择桶，通过键的高8位选择放在桶的哪个位置。如果有超过8个键值对映射到同一个桶，则会放到溢出桶typehma
Go 语言 map源码分析及图解（一）（查找、写入、删除K/V值） Mr.禾 Go golang 数据结构源码分析图解
文章目录map基本结构hash值定位K/V值map创建计算桶的数量申请buckets内存空间tophash标记位介绍查找K/V值（mapaccess1）写入K/V值（mapassign）删除K/V值（mapdelete）map扩容的源码分析见下一节map基本结构hmap是map的核心数据结构：typehmapstruct{countint//当前的元素个数flagsuint8Buint8//桶的数
defer 源码分析线程A 软件随想 go
在Go语言中多个defer形成一个链表.defer语句会首先调用一个deferproc函数,new一个对应的结构体挂载到对应的G上面调用new之前会从G所绑定的P的deferpool里面取,没有取到会从全局的deferpool里取,实在没有的话才新建一个。这是Goruntime里非常常见的操作，即设置多级缓存，提升运行效率在执行RET指令之前（注意不是return之前），调用deferreturn
DynamicDatasource动态数据源实现及使用 m0_74825074 java
文章目录动态数据源DynamicDatasource简介源码分析ThreadLocal和AbstractRoutingDataSourceDynamicRoutingDataSourceDynamicDatasource快速开始项目结构Maven依赖application.yml配置文件sql脚本动态加载数据源动态切换数据源手动实现核心类`DataSourceContextHolder`核心类`D
【Lua源码分析系列】1. 概述 lua源码分析编译原理虚拟机
如题，这是一系列关于Lua的源码分析的文章。分析的重点在编译原理和虚拟机的部分，而不是相关的库的实现部分。写这系列文章，最初是因为想要设计一门编程语言以及它的虚拟机，为此参考现有的优秀的实现。为何选择Lua？其实本人更加想分析Javascript的v8引擎和Chakra引擎的，只是感觉能力还不太够。而Lua的实现相当小巧，只有几万行C代码，与C/C++的互操作相当方便，并且实现的质量也是工业级别的
Golang map实现原理及源码分析 Aeiu Golang golang 源码后端
本文涉及到的源码版本为GoSDK1.16.11、map的基本结构map是Golang中的一种常用数据结构，其本质上是一种哈希表，类似于java的HashMap以及Python的字典(dict)，是一种存储键值对(Key-Value)的数据结构。一般的Map会包含两个主要结构：数组：数组里的值指向一个链表链表：目的解决hash冲突的问题，并存放键值而在Golang中，解决hash冲突的不是链表，而是
QML音视频实时通信 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++音视频
QML音视频实时通信使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与音视频实时通信概述1.1QML音视频技术发展背景1.1.1QML音视频技
QML Web云应用开发 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QMLWeb云应用开发使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与Web技术概述1.1QML与Web技术简介1.1.1QML与Web技术
QT硬件接口设计 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QT硬件接口设计使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT硬件接口设计概述1.1QT硬件接口设计简介1.1.1QT硬件接口设计简介QT硬件
【QT教程】QML音视频效果实现 QT音视频 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QML音视频效果实现使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与音视频效果1.1QML简介1.1.1QML简介QML简介QML简介QML
MediaCrawler 小红书爬虫源码分析
前言MediaCrawler是最近冲上Github热搜的开源多社交平台爬虫。虽然现在已删库，但还好我眼疾手快，有幸还Fork了一份，乘着周末，简单分析了下小红书平台的相关代码。爬虫难点一般写爬虫，都需要面对以下几个问题如果app/网页需要登录，如何获取登录态（cookie/jwt）大部分app/网页都会对请求参数进行sign，如果有，如何获取sign逻辑绕过其它遇到的反爬措施我将带着这三个问题，阅
Spark 源码分析(一) SparkRpc中序列化与反序列化Serializer的抽象类解读（正在更新中~）别人能写出来的，你也能行！多学习别人的思路，形成自己的思路，高薪工作奔你而来！小白的大数据历程 Spark源码解析开发语言 spark 大数据分布式 scala
后一篇链接在这接上一章请先看解读序列化抽象类第一部分（这是一个链接）目录接上一章请先看解读序列化抽象类第一部分2.Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1：序列化(2)JavaDeserializationStream代码实际例子2：反序列化Spark源码下类图在学习过程中，抓住主要问题，请思考问题为什么Kryo序列化更加
Spark 源码分析(一) SparkRpc中序列化与反序列化Serializer的抽象类解读（java序列化部分完结，正在更新RpcEnv部分~）小白的大数据历程 Spark源码解析 spark java python
目录(3)JavaSerializerInstance定义了一个Java序列化实例(1)构造方法参数(2)方法1：serializeStream(3)方法2：deserializeStreamdefaultClassLoader(4)方法3：deserializeStreamloader(5)方法4：serialize(6)方法5：deserializeloader(7)方法6：deseriali
【Bluedroid】HFP连接流程源码分析（一） byte轻骑兵解读 Android java C++Android
Bluedroid蓝牙HFP（HFP,Hands-FreeProfile）连接流程涵盖多个环节，从前期准备到连接建立、状态管理以及维护与断开，各环节紧密相扣，确保蓝牙免提连接稳定可靠。一、概述1.1.连接前准备用户操作：用户需在Android设备上开启蓝牙功能。同时，目标蓝牙设备（如车载蓝牙）要进入配对模式，Android设备通过搜索发现目标设备并完成配对，此过程可能需用户输入PIN码或确认配对请
百万架构师第二十二课：源码分析：Spring 源码分析：Spring经典面试答疑｜JavaGuide 后端
Spring面试解答上半节：面试中需要注意的细节动脑子，面试是一种交流面试的时候，要用心去感受当时面试场景了解自己，自己的长处、自己的短处（巧妙地扬长避短）了解1.公司的业务场景2.你是去面试什么岗位的？Java高级工程师实际工作经验是1年（如实填写）1、请描述SpringIOC的工作原理答：定位加载注册BeanFactoryBeanDefintion...1-3年1+ApplicationCon
Rabbitmq源码分析，重复消费问题的redis或数据库代码实现 xweiran rabbitmq 分布式 java 架构 jvm 数据结构后端
目录底层源码解析自定义唯一id算法MessageProperties类的相关实现自定义消息ID生成器配置和使用Rabbitmq是怎么判断是不是重复消息的呢？通过Redis的幂等性处理消息消费者实现分布式锁实现的重复检测完整的消息处理流程基于数据库实现Mapper接口消息处理服务RabbitMQ消息消费者底层源码解析RabbitMQ判断重复消息主要通过消息的唯一标识（MessageId）和幂等性处理
装饰器模式详解（附代码案例和源码分析） xweiran 装饰器模式 java io流代码案例
目录装饰器模式的本质装饰器模式和继承结构的对比源码中IO流的继承结构具体装饰器类装饰器的组合应用装饰器链的特点代码案例定义coffee类型coffee的实现类装饰器抽象类装饰器-季节限定装饰器——加牛奶装饰器——加糖生成咖啡的简单工厂咖啡制作服务（动态加功能）装饰器模式的优点装饰器模式的缺点装饰器模式的本质装饰器模式允许向一个现有的对象添加新的功能，同时又不改变其结构。它是一种用于代替继承的技术，
spring-mvc源码分析v3.3.0 想花 spring mvc java
分析下springboot内嵌tomcat启动流程，即springboot-mvcorg.springframework.bootspring-boot-starter-web3.3.0环境信息Java22SpringBootv3.3.0ApacheTomcat/10.1.24spring-boot-starter-web3.3.0测试项目主要文件结构：@RestControllerpublicc
RK3399 PCIe 中断处理与映射分析（INTx中断机制源码分析）憧憬一下嵌入式驱动开发 #PCI/PCIe子系统嵌入式 linux驱动开发 arm开发嵌入式硬件 PCI/PCIe
往期内容本文章相关专栏往期内容，PCI/PCIe子系统专栏：嵌入式系统的内存访问和总线通信机制解析、PCI/PCIe引入深入解析非桥PCI设备的访问和配置方法PCI桥设备的访问方法、软件角度讲解PCIe设备的硬件结构深入解析PCIe设备事务层与配置过程PCIe的三种路由方式PCI驱动与AXI总线框架解析（RK3399）深入解析PCIe地址空间与寄存器机制：从地址映射到TLP生成的完整流程PCIe_
Linux驱动学习--DRM框架介绍及基于DRM框架的HDMI开发文艺小少年 linux android hdmi 驱动程序 drm
目录一、引言二、DRM框架介绍三、DRM框架的使用四、源码分析一、引言Android4开始，hdmi等视频输出框架开始由framebuffer想DRM迁移，今天我们就来简单分析下DRM框架二、DRM框架介绍DRM是一个内核级的设备驱动，具体的说是显卡驱动的一种架构源码位置因为Linuxkernel内部接口和数据结构可能随时发生变化，所以DRI模块要针对特定的内核版本进行编译。kernel2.6.2
百万架构师第十三课：源码分析：Spring 源码分析：Spring核心IOC容器及依赖注入原理｜JavaGuide 后端
20180415-Spring核心IOC容器及依赖注入原理ClassPathXmlApplicationContext//存储注册信息的BeanDefinition//传说已久的IOC容器privatefinalMapbeanDefinitionMap=newConcurrentHashMapTdoGetBean(finalStringname,@NullablefinalClassrequire
百万架构师第二十课：源码分析：Spring 源码分析：手写定制自己的ORM框架｜JavaGuide 后端
基于Spring5实现ORM初衷：单表查询不写一句SQL，自动生成查询的结果自动映射为Java对象1、我要传一个复杂的查询条件，怎么传？想到了用对象来传，但是有问题a)、跨表联查的条件b)、无法携带判断逻辑的运算符c)、or或者and无法区分2、自动映射类型判断麻烦，用rs.getObject()方法//各自的厂商实现自己的链接//MySQL为例,以下类型Java语言中是不存在的//bigint，
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
Golang Channel PandaSkr golang
Channel解析1.Channel源码分析1.1Channel数据结构typehchanstruct{qcountuint//channel的元素数量dataqsizuint//channel循环队列长度bufunsafe.Pointer//指向循环队列的指针elemsizeuint16//元素大小closeduint32//channel是否关闭0-未关闭elemtype*_type//元素类
Java集合类框架源码分析之 RoleList源码解析【6】 yunzhonghefei Java集合类源码分析 RoleList源码解析
该类继承于ArrayList，针对Role进行了一些扩展。其他方法和ArrayList中基本相同，源码不做针对性分析：看一下类简介：/***代表了一个roles的列表，作为方法setRoles()的参数，去创建一个关联关系，并且尝试在同一个关系中设置多个角色。*ARoleListrepresentsalistofroles(Roleobjects).Itisusedas*parameterwhen
【鸿蒙OH-v5.0源码分析之 Linux Kernel 部分】004 - Kernel 启动引导代码head.S 源码逐行分析 "小夜猫&小懒虫&小财迷"的男人鸿蒙OH-v5.0源码分析之 Uboot+Kernel 部分 harmonyos linux 华为
【鸿蒙OH-v5.0源码分析之LinuxKernel部分】004-Kernel启动引导代码head.S源码逐行分析系列文章汇总：《鸿蒙OH-v5.0源码分析之Uboot+Kernel部分】000-文章链接汇总》本文链接：《【鸿蒙OH-v5.0源码分析之LinuxKernel部分】004-Kernel启动引导代码head.S源码逐行分析》head.S主要工作如下：保存内核启动参数,无效化处理器缓存(
Java高并发编程详解系列-深入理解Thread构造 nihui123 高并发 Java高并发 Java 高并发
上篇分享中主要是对线程的基本概念和基本操作做了一个分享，同时提出了两种常用的创建多线程的方法，当然在后期的分享中也会提及到更多的创建线程的方式，到后期的分享的时候再说。这次主要是深入的理解一下Thread的构造函数，通过构造函数对于Thread有一个更加深入的了解。这里首先提供一个JDK1.6的ThreadAPI截图线程命名规范从源码分析可以看到在Thread类中默认提供了线程的命名方式，这个
【QT教程】QT6硬件图形界面编程 QT硬件编程 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6硬件图形界面编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6硬件图形界面编程概述1.1QT6硬件图形界面编程简介1.1.1QT6硬件
Jetpack LiveData源码分析 xiangxiongfly915 #Android Jetpack系列 Jetpack LiveData 源码分析
文章目录JetpackLiveData源码分析前提源码分析注册订阅流程LiveData#observe()LifecycleRegistry#addObserver()ObserverWithState#dispatchEvent()LiveData#removeObserver()LiveData$LifecycleBoundObserver类LifecycleBoundObserver#sho
ExoPlayer架构详解与源码分析（17）——TrackSelector 山雨楼 ExoPlayer 架构 android 音视频 ExoPlayer Media3 源码
系列文章目录ExoPlayer架构详解与源码分析（1）——前言ExoPlayer架构详解与源码分析（2）——PlayerExoPlayer架构详解与源码分析（3）——TimelineExoPlayer架构详解与源码分析（4）——整体架构ExoPlayer架构详解与源码分析（5）——MediaSourceExoPlayer架构详解与源码分析（6）——MediaPeriodExoPlayer架构详解与
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

zeppelin源码分析(0)——zeppelin要解决什么问题

你可能感兴趣的:(zeppelin,zeppelin源码分析)