斑马！

大数据--spark生态2--spark架构和rdd总结

目录

一：Spark特点

二：Spark Core

三：Spark基本概念

四.Spark架构设计

4.1 整体架构

4.2 Executor

4.3 master & worker

五：Spark基本运行流程

六：RDD概念

七：RDD支持的数据运算/算子

八：宽窄依赖以及阶段划分

九：rdd任务划分

十：rdd持久化

10.1 rdd cache

10.2 rddcheckPoint检查点

十一：累加器

十二：广播变量

一：Spark特点

运行速度快：Spark使用先进的有向无环图（DAG）执行引擎，以支持循环数据流与内存计算。
容易使用：Spark支持Scala, Java, Python, R语言进行编程。
通用性：Spark提供强大的而完整的技术栈。
运行模式多样：Spark可以运行于独立的集群模式中，或者运行于Hadoop中。

二：Spark Core

Spark Core 包含Spark最基础最核心的功能，如内存计算，任务调度，部署模式，故障恢复，存储管理，主要面向批处理数据。Spark Core建立在同一的抽象RDD之上，使其可以以基本一致的方式来应对不同的大数据处理场景。Spark Core通常被简称为Spark.

三：Spark基本概念

RDD: 弹性分布式数据集，是分布式内存的一个抽象概念，提供了一种高度受限的共享内存模型。
DAG：有向无环图，反映RDD之间的依赖关系
Executor：是运行在工作节点（Worker Node）上的一个进程，负责运行任务，并为应用程序存储数据。
应用Application:用户编写的spark应用程序。
任务（Task）:是运行在Executor上的工作单元。
作业（Job）:一个作业包含多个RDD及作用于相应RDD上的各种操作。
阶段（Stage）:是作业的基本调度单位，一个作业会分为多组任务，每组任务被称为阶段。

四.Spark架构设计

4.1 整体架构

理解：

一个应用由一个Driver和若干个作业构成，一个作业由多个阶段构成，一个阶段由多个没有Shuffle关系的任务组成。
当执行一个应用时，Driver会像集群管理器申请资源，启动Executor，并向Executor发送应用程序代码和文件，然后在Executor上执行任务，运行结束后，执行结果会返回给Driver，或者写到HDFS或者其他数据库中。

4.2 Executor

是集群中工作节点（worker）中的一个进jvm进程，负责在spark作业中运行具体任务（task），任务彼此之间相互独立。spark应用启动时，executor节点被同时启动，并且始终伴随着整个spark应用的生命周期而存在。executor有两个核心功能：

负责运行组成spark应用程序的任务，并将结果返回给驱动器进程
通过自身的快管理器（block manager）为用户程序中要求缓存的rdd提供内存式存储。

4.3 master & worker

spark集群的独立部署环境中，不需要依赖其他的资源调度框架。自身就实现了资源调度的功能，所以环境中还有其他两个核心组件：master和worker。

master：是一个进程，注意负责资源的调度和分配，并进行集群的监控等职责，类似于yarn环境中的resourcemanager。
worker：也是一个进程，一个worker运行在集群中的一台服务器上，由master分配资源对数据进行并行的处理和计算，类似于yarn中的nodemanager

五：Spark基本运行流程

首先为应用构建起基本的运行环境，即由Driver创建一个SparkContext,进行资源的申请，任务的分配和监控
资源管理器为Executor分配资源，并且启动Executor进程
SparkContext根据RDD的依赖关系构建DAG图，DAG图提交给DAGScheduler解析成Stage,然后把一个个TaskSet提交给底层调度器TaskScheduler处理；Executor向SparkContext申请Task,Task Scheduler将Task发放给Executor运行，并提供给Executor运行，并提供给应用程序代码。
Task在Executor上运行，把执行结果反馈给TaskScheduler, 然后反馈给DAGScheduler，运行完毕后写入数据并释放所有资源。

六：RDD概念

RDD提供了一个抽象的数据结构，我们不必担心底层数据的分布式特性，只需要将具体的应用逻辑表达为一系列转换处理，不同RDD之间的转换操作形成依赖关系，可以实现管道化，避免中间数据存储。
一个RDD就是一个分布式对象集合，本质上是一个只读的分区记录集合，每个RDD可以分成多个分区，每个分区就是一个数据集片段，并且一个RDD的不同分区可以被保存到集群中的不同的节点上，从而可以在集群的不同节点上进行并行计算。
RDD提供了一种高度受限的共享内存模型，即RDD是只读的记录分区的集合，不能直接修改，只能基于稳定的物理存储中的数据集创建RDD，或者通过在其它RDD上执行确定的转换操作而创建得到新的rdd。

七：RDD支持的数据运算/算子

转换：map, flatmap, groupBy, filter, distinct, sortBy, GroupByKey, join
行动：reduce, collect, count, take, foreach

[补充]：rdd 算子的具体使用见另外一篇博客：大数据--spark生态3--RDD算子_数据挖掘+大数据研发+算法学习-CSDN博客目录一：rdd转换算子1.1 value类型1.2 key-value类型二：rdd行动算子一：rdd转换算子1.1 value类型map将处理的数据进行映射转换，这里的转换可以是类型的转换，也可以是值的转换。mappartitions将待处理的数据以分区为单位发送到计算节点进行处理，这里的处理是指可以进行任意的处理。flatMap将处理的数据进行扁平化后再进行映射处理，所以算子也称扁平映射。glom将同一个分区的数据直接转换为相同类型的内存数组进行处https://blog.csdn.net/yezonghui/article/details/123364785

RDD的执行过程：

RDD读入外部数据源进行创建
RDD经过一系列的转换操作，每一次都会产生不同的RDD，供给下一个转换操作
最后一个RDD经过动作操作进行转换，并输出到外部数据源

这一系列处理称为一个Lineage(血缘关系)，即DAG拓扑排序的结果。

八：宽窄依赖以及阶段划分

窄依赖：存在一个父RDD的分区对应一个子RDD的分区或者多个父RDD的分区对应于一个子RDD的分区。
宽依赖：存在一个父RDD的一个分区对应一个子RDD的多个分区。
阶段划分：Spark根据DAG图中的RDD依赖关系，把一个作业分成多个阶段。阶段划分的依据就是宽依赖和窄依赖。只有窄依赖可以实现流水线优化，宽依赖包含Shuffle过程，无法实现流水线。
具体划分方法：在DAG图中进行反向解析，遇到宽依赖就断开；遇到窄依赖就把当前RDD加入到Stage中。尽量将窄依赖划分到同一个Stage中，可以实现流水线计算。

九：rdd任务划分

rdd任务分为：application, job, stage, task.

application:初始化一个sparkcontext即生成一个application
job：一个action算子就会生成一个job
stage：等于宽依赖数量的个数加1
task：一个stage阶段中，最后一个rdd的分区个数就是task的个数。
注意：application->job->stage->task每一层都是1对n的关系。

十：rdd持久化

10.1 rdd cache

通过cache或者persist方法将前面的计算结果缓存，默认情况下会把数据缓存在jvm堆内存中，但是这两个方法被调用时并不是立即缓存，而是触发后面gaction算子时候，该rdd将会被缓存在计算节点的内存中，并提供给后面使用。

10.2 rddcheckPoint检查点

所谓的检查点其实就是将rdd中间结果写入磁盘中，由于血缘依赖过长会造成成本过高，这样就不如在中间阶段做检查点容错，如果检查点之后节点出现问题，可以从检查点开始重做血缘，减少了开销。

十一：累加器

累加器用来把executor端变量信息聚合到driver端，在drive程序中定义的变量，在executor端的每个task都会得到这个变量的一份新的副本，每个task更新这些副本的值后，传回driver端进行merge。

十二：广播变量

广播变量用来实现高效分发较大的对象，向所有对象发送一个较大的只读值，以供一个或者多个spark操作使用

你可能感兴趣的:(大数据,#,spark生态,flink生态,大数据)

Flink Standalone 方案中解决挂机问题星尘幻宇科技 flink 大数据
Standalone中可以配置HighAvailability（HA）部署和配置首先了解Flink实际运行时包括两类进程：JobManager（又称为JobMaster）：协调Task的分布式执行，包括调度Task、协调创Checkpoint以及当Jobfailover时协调各个Task从Checkpoint恢复等。TaskManager（又称为Worker）：执行Dataflow中的Tasks，
大数据学习(37)- Flink运行时架构 viperrrrrrr 学习 flink 大数据
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦1）作业管理器（JobManager）JobManager是一个Flink集群中任务管理和调度的核心，是控制应用执行的主进程。也就是说，每个应用都应该被唯一的JobManager所控制执行。JobManger又包含3个不同的组件。（1）JobMasterJobM
Spring 核心技术解析【纯干货版】- VIII：Spring 数据访问模块 Spring-Tx 模块精讲 m0_74824517 面试学习路线阿里巴巴 spring 数据库 java
在企业级开发中，事务管理是保障数据一致性和完整性的重要手段。Spring作为Java生态中广泛使用的框架，其事务管理模块（Spring-Tx）不仅提供了强大的功能，还极大地简化了开发者在不同技术栈中的事务处理工作。无论是编程式事务，还是声明式事务，Spring都以其灵活性和易用性满足了各种场景需求。本篇文章将从理论到实践，深入解析Spring-Tx模块的核心技术与使用方式，并通过代码示例帮助您更高
Elixir语言的软件工程十二日后包罗万象 golang 开发语言后端
Elixir语言的软件工程引言在当今的软件工程领域，选择编程语言和技术栈是一个至关重要的决策。随着分布式系统、实时应用和高并发场景的需求日益增加，Elixir语言应运而生。Elixir是一种基于Erlang虚拟机（BEAM）的编程语言，兼具了Erlang的并发特性和灵活性，同时增加了现代编程语言的一些优雅和简洁的特性。本文将深入探讨Elixir语言在软件工程中的应用，包括其核心特性、生态系统、最佳
Flink CDC MySQL同步MySQL错误记录 lingllllove flink mysql 大数据
FlinkCDC简介FlinkCDC（ChangeDataCapture）是一种高效的数据同步工具，利用Flink强大的实时流处理能力，从MySQL等数据库捕获数据变更，并将这些变更实时同步到目标数据库。本文将详细介绍FlinkCDCMySQL同步到MySQL时常见的错误记录及其解决方法。常见错误及解决方法1.连接错误错误信息：FailedtoconnecttoMySQLserver.可能原因：
DolphinScheduler × Jiron：打造高效智能的数据调度新生态 jiron开源平台开发 flink 大数据 hadoop hive sqoop spring cloud sentinel
JironGitHub地址https://github.com/642933588/jiron-cloudhttps://gitee.com/642933588/jiron-cloudDolphinScheduler×Jiron：打造高效智能的数据调度新生态DolphinScheduler是一个开源的分布式任务调度平台，专为大数据场景下的工作流调度和数据治理而设计。将DolphinSchedule
hadoop常用命令我要用代码向我喜欢的女孩表白 hadoop npm 大数据
Yarn查看提交到资源调度器的任务（任何用yarn资源的都可以看，比如spark、tez、mapreduce）看正在运行的yarn任务yarnapplication-list杀死对应的yarn任务yarnapplication-kill{application_Id}（id可以通过-list看到）hdfs查看hdfs目录hdfsdfs-ls/（查看本集群的目录）hdfsdfs-lshdfs://i
Kubernetes架构原则和对象设计（二） grahamzhu 云原生学习专栏 kubernetes 架构容器集群搭建 API设计云计算 kubelet
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes常见问题解答本文从云计算架构发展入手，详细分析了kubernetes的生态系统、设计理念、分层架构、API设计原则、架构设计原则等，并介绍了使用kubelet+staticPod拉起集群的过程1.云计算的传统分类云计算出现之前，对于任何企业，想要搭建自己的服务，需要
一种时序数据模式演化的跟踪与查询方法米朵儿技术屋智能科学与技术专栏分类学习数据挖掘
摘要在物联网与大数据应用蓬勃发展的背景下，各类感知设备产生海量的时序数据，设备管理软件版本的快速迭代导致时序数据的模式演化问题日益凸显.模式演化要求对数据模式进行版本管理，使数据进行模式变更时不产生信息损失，且支持对数据跨模式版本进行读写操作.结合流行的时序数据库管理系统，调研总结了各类数据库管理系统对模式演化的支持情况，对时序数据及其模式进行了形式化表述，对其模式演化的过程进行了分析，设计了一种
FPGA在高速数据采集系统中的应用！！！ FPGA资料库 fpga开发 fpga verilog 物联网 stm32
FPGA（现场可编程门阵列）在高速数据采集系统中的应用非常广泛，主要得益于其并行处理能力、可编程性和高速接口特性。以下是FPGA在高速数据采集系统中的详细应用，以及一些具体例子：1.应用背景高速数据采集系统通常用于需要高采样率和大数据量处理的场合，如雷达信号处理、医疗成像、高速通信等。FPGA因其独特的硬件架构，能够有效处理高速数据流，因此在这些系统中扮演着关键角色。2.应用内容2.1数据采集接口
Python气象数据分析：风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等小艳加油大气科学 python 人工智能气象机器学习
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和实操专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Py
ChatGPT Canvas：开启AI编程新纪元——你的AI代码生成器来了！前端
OpenAI近日宣布ChatGPTCanvas全面开放，并带来了两项重磅更新：直接运行Python代码和整合GPTs生态系统。这意味着，即使你不是专业的程序员，也能轻松体验编程的乐趣，并利用AI的力量创造出更多可能性。这对于想要学习编程或提高工作效率的用户来说，无疑是一个巨大的福音。这篇文章将深入探讨这两项更新，并展望ChatGPTCanvas的未来发展。直接运行Python代码：降低编程门槛，释
Mysql数据库和Sql语句 Jessica小戴数据库 mysql sql
数据库管理：sql语句：数据库用来增删改查的语句（重要）备份：数据库的数据进行备份主从复制、读写分离、高可用（重要）Mysql数据库和Sql语句一、Mysql数据库1、数据库：组织、存储、管理数据的仓库2、数据库的管理系统（DBMS）：实现对数据有效组织、管理和存取的系统软件3、数据库软件：mysql、oracle（大数据系统一般使用、大企业使用）、sql-server、MariaDB也是mysq
. 如何在 Vue 3 中使用组合式 API 进行代码的逻辑复用？ JJCTO袁龙 Vue vue.js javascript 前端
如何在Vue3中使用组合式API进行代码的逻辑复用？在Vue3的生态中，组合式API（CompositionAPI）引入了全新的方式来构建组件，使得逻辑复用变得更加简单和灵活。在传统的选项API中，逻辑复用通常依赖于混入（mixins）和高阶组件（HOCs），并且这两者在某种程度上可能导致代码的复杂性及可读性问题。而组合式API通过函数的方式，使得逻辑复用变得更加明确且易于管理。本文将通过示例，带
小红书成立应用算法部：平衡生态与变现的战略之举前端
小红书近期将商业化、社区、电商算法部门整合，成立了全新的“应用算法部”，这一举动引发了业界广泛关注。这不仅体现了小红书对算法驱动增长的高度重视，也标志着其在平衡内容生态和商业变现之间迈出了关键一步。本文将深入探讨小红书成立应用算法部的战略意义及其对未来发展的影响，并分析其扁平化管理模式在其中的作用。作为一款以内容创作和分享为核心的平台，小红书对高效的AI写代码工具的需求日益增长，而算法的优化则成为
BOE（京东方）"向新2025”年终媒体智享会落地深圳 "屏”实力赋能产业创新发展数据库
12月27日，BOE（京东方）“向新2025”年终媒体智享会的收官之站在创新之都深圳圆满举行，为这场为期两周、横跨三地的年度科技盛会画上了完美句号。活动期间，全面回顾了BOE（京东方）2024年在多个关键领域取得的卓越成绩，深入剖析其在六大维度构建的“向新”发展格局，精彩呈现了以“屏”为核心搭建起的技术引领、伙伴赋能以及绿色发展等平台，全方位赋能全球生态合作伙伴，充分彰显BOE（京东方）作为全球领
洞见数据未来，StarRocks Summit Asia 2024 即将启幕！人工智能data
在AI时代，我们需要怎样的数据基础软件？数据量和数据类型的需求飞速上涨，我们不仅需要将历史上各种基础设施中的数据进行分析使用，还要关注性能、灵活性、性价比，以及确保单一可信数据源。这一切构成了当前大数据领域的核心难题。今年12月，StarRocksSummitAsia重磅启动！作为年度数据盛会，我们将从用户、平台方、业务领袖和技术极客等不同视角展开交流，携手共建未来的数据解决方案。本届峰会，我们将
Pinterest联盟营销综合指南好运来__ 大数据网络人工智能服务器 ip
Pinterest不仅是社交媒体平台，还是一个优质的视觉搜索引擎，独特的交互方式和平台生态使得Pinterest依然很受欢迎，因此它也成为最适合进行联盟营销的平台之一。一、为什么要使用Pinterest联盟营销1.活跃用户多Pinterest活跃用户数超过5亿，庞大的用户基础在一定程度上意味着更高的购买潜力。2.用户质量高根据PAConsulting和Pinterest的数据，奢侈品牌最关注的消费
你喜欢用什么编辑器? dami_king 随笔编辑器
电脑工作者和程序员所使用的文本编辑器通常需要具备高效率、易用性以及对代码友好等特点，包括语法高亮、自动完成、多文件同时编辑、查找替换、版本控制集成等功能。以下是几个广受开发者欢迎且实用性较强的文本编辑器：VisualStudioCode（VSCode）：开源、免费，由微软开发，拥有强大的扩展生态系统，支持多种编程语言和框架，内建Git集成，实时错误检查和调试工具，非常适合现代Web和云端开发。Su
国产海光CPU平台兼容性指南-基础软件分册-20231013（附各系统下载链接）技术瘾君子1573 服务器&存储服务器兼容列表海光 CPU 云计算大数据操作系统
目录声明一、操作系统二、虚拟化和云2.1虚拟化和云2.2虚拟机上的操作系统2.2.1VMwarevSphere上的虚拟机操作系统2.2.2KVM上的虚拟机操作系统2.2.3WindowsHyper-V上的虚拟机操作系统2.2.4VirtualBox上的虚拟机操作系统三、分布式存储四、数据库五、中间件六、大数据七、平台组件7.1云平台7.2大数据平台7.3人工智能平台7.4科学与工程计算平台八、其它
Docker Image 详细讲解陈辰学长 docker 容器运维
DockerImage详细讲解DockerImage是Docker生态系统中的核心概念之一，它作为容器运行的基础，封装了应用运行所需的环境和依赖。本文将详细讲解DockerImage的定义、构建、存储、管理以及使用，帮助读者全面理解DockerImage。一、DockerImage概述DockerImage是一个轻量级、可执行的独立软件包，包含了运行某个软件所需要的所有内容，包括代码、运行时、库、
Pinterest联盟营销综合指南纯干苹果派人工智能网络物联网大数据服务器 ip
Pinterest不仅是社交媒体平台，还是一个优质的视觉搜索引擎，独特的交互方式和平台生态使得Pinterest依然很受欢迎，因此它也成为最适合进行联盟营销的平台之一。一、为什么要使用Pinterest联盟营销1.活跃用户多Pinterest活跃用户数超过5亿，庞大的用户基础在一定程度上意味着更高的购买潜力。2.用户质量高根据PAConsulting和Pinterest的数据，奢侈品牌最关注的消费
厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）（踩坑记录）吃西红柿的鸡蛋大数据 hadoop spark python
厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）（踩坑记录）项目地址http://dblab.xmu.edu.cn/blog/2307/踩坑:Spark分析文件rent_analyse.py改变Spark读取csv文件的写法sparkContext=SparkContext("local","rent_analyse")sqlContext=SQLCon
数据驱动销售预测的未来：ScriptEcho赋能高效决策前端
在瞬息万变的商业环境中，准确的销售预测是企业制定有效销售策略、实现业绩增长的基石。传统的销售预测方法往往依赖于人工分析和复杂的电子表格，效率低下，难以应对市场变化的快速冲击。然而，随着大数据的兴起和人工智能技术的飞速发展，数据驱动决策正成为现代企业提升竞争力的关键。本文将探讨销售预测面临的挑战与机遇，并重点介绍ScriptEcho如何通过AI赋能，提升销售预测的准确性和效率，助力企业实现数据驱动增
Ruby语言的数据库编程 Quantum&Coder 包罗万象 golang 开发语言后端
Ruby语言的数据库编程引言在现代软件开发中，数据库几乎是每个应用程序的重要组成部分。无论是简单的Web应用还是复杂的企业系统，数据存储和管理都是不可或缺的环节。Ruby是一种动态、面向对象的编程语言，因其优雅的语法和丰富的库支持而受到广泛欢迎。在Ruby的生态系统中，ActiveRecord是最常用的数据库编程工具，它源自RubyonRails框架，为开发者提供了简单而强大的数据库交互能力。本文
共筑BMC技术生态，OurBMC受邀参加第二届融通生态大会程序员
12月11-12日，第二届国家新一代自主安全计算系统产业集群融通生态大会（以下简称“融通生态大会”）在长沙成功召开。本次大会以“聚力自主安全领跑先进计算”为主题，邀请了众多政府领导、行业专家和精英学者参与，共话产业发展新路径，共绘集群融通新蓝图。OurBMC社区受邀参会，社区技术委员会主席李煜受邀在开源技术研讨分论坛发表主题演讲，多方面展示社区在BMC技术创新和产业发展方面的成果，共同推进BMC领
洛谷P1127 词链怀念无所不能的你洛谷图论算法 dfs 图论 c++数据结构
题目链接：P1127词链-洛谷|计算机科学教育新生态题目描述：如果单词XX的末字母与单词Y的首字母相同，则X与Y可以相连成X.Y。（注意：X、Y之间英文的句号.）。例如，单词dog与单词gopher，则dog与gopher可以相连成dog.gopher。另外还有一些例子：dog.gophergopher.ratrat.tigeraloha.alohaarachnid.dog连接成的词可以与其他单词
REITs运营与资金流动关系图数据可视化
使用图形天下提供的关系数据可视化工具。我们清晰地看到REITs（房地产投资信托）如何与投资者、房地产资产、物业管理公司及租户紧密相连。REITs作为资金池，投资于房地产，通过物业管理公司维护运营，产生租金收入并分配给投资者。图形天下的可视化技术，让这一复杂的关系数据变得直观易懂，展现了REITs生态的全貌。 REITs运作机制概览图 REITs通过集合投资者
生态系统中磷循环的关系图数据可视化
关系图通过图形天下展示了磷循环的关键过程，清晰地呈现了磷在岩石、土壤、水体及生物体之间的流动。利用关系数据可视化技术，详细描绘了磷通过风化、吸收、摄取、排泄、分解等环节在不同环境介质中的转化，揭示了生态系统中磷元素动态平衡的重要性。这一可视化工具使复杂的磷循环变得直观易懂。磷循环关系图磷循环展示了磷在岩石、土壤、水体及生物体之间的流动过程，反映了生态系统
JavaWeb 开发入门：从基础到应用大梦百万秋知识学爆 java
JavaWeb是基于Java技术构建的Web应用开发体系。得益于Java的跨平台性和强大的生态系统，JavaWeb长期以来一直是企业级开发的首选方案之一。本篇博客将从JavaWeb的基本概念、核心技术到实际项目开发，带你全面了解如何利用JavaWeb构建一个动态网站。什么是JavaWeb？JavaWeb是使用Java技术开发Web应用程序的总称，通常包括动态网页、交互式功能和后端逻辑。它支持开发以
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他