逃出你的肖生克

大数据学习之路

转载他人博客，原文地址：http://www.cnblogs.com/xing901022/p/6195422.html

大数据学习之路（持续更新中…）

在16年8月份至今，一直在努力学习大数据大数据相关的技术，很想了解众多老司机的学习历程。因为大数据涉及的技术很广需要了解的东西也很多，会让很多新手望而却步。所以，我就在自己学习的过程中总结一下学到的内容以及踩到的一些坑，希望得到老司机的指点和新手的借鉴。

前言

在学习大数据之前，先要了解他解决了什么问题，能给我们带来什么价值。一方面，以前IT行业发展没有那么快，系统的应用也不完善，数据库足够支撑业务系统。但是随着行业的发展，系统运行的时间越来越长，搜集到的数据也越来越多，传统的数据库已经不能支撑全量数据的存储工作；另一方面，数据越来越多，单机的计算已经成为瓶颈。因此，基于分布式的大数据系统崭露头角。那么大数据系统里面都有什么东西呢？可以参考下面的图

在存储上，hdfs的分布式存储可以任意水平扩展，可以解决数据存储的难题。在计算上，从最初的MapReduce，把任务水平拆分，多台机器并行计算，再汇总结果；到基于Spark的内存计算，改造Mapreduce每次数据落盘以及编程方式的痛点。

有了存储和计算框架，周边就衍生出了很多管理、缓存相关的技术，比如：

yarn解决多租户资源调度的难题，
flume解决数据传输的难题，
sqoop解决分布式存储数据与传统DB数据之间的转换，
oozie解决了大数据计算任务的调度，
kafka提供了发布订阅机制的消息队列，
zookeeper可以帮助用户完成主备的选举，
hive在hdfs的基础上提供了数仓的功能，
hbase则基于hdfs实现列式数据库….

上面都是hadoop生态的，由于hadoop中计算模型普遍是mapreduce，但是它的编程风格和计算机制让很多人使用不便。因此后来spark逐渐代替了mapr成为主流的计算框架。Spark也有它自己的生态，但是由于hadoop更多更早的被应用到企业，所以spark也可以无缝的集成hadoop生态中的产品。spark更多只是扮演一个计算的框架，在这个框架上，提供了基本的计算模块core，基于sql的计算引擎spark sql，对接实时数据的流式计算spark streaming，算法相关的mlib以及图计算相关的graphx。

这些框架都在这个大数据生态中扮演了自己重要的角色，他们协同工作就可以帮助我们解决很多难题。由于我也是接触不久，所以就按照自己学习和工作涉及的内容，在下面按照各个章节进行介绍，后续也会持续的更新。希望对所有对大数据感兴趣的

学习必备

在学习大数据的过程中，需要具备的能力或者知识，在这里简单的罗列一下：

语言基础：需要会使用shell脚本、java和scala(这俩语言主要是用于日常代码和阅读源代码)
工具：IDE如eclipse或者idea，虚拟机和secureCRT连接工具
书籍：《Hadoop权威指南》《Hadoop YARN权威指南》《Spark快速大数据分析》《从Paxos到zookeeper分布式一致性原理与实践》《Hive编程指南》其他的书籍阅读后再推荐吧
博客：董的博客
进阶：阅读官方文档（帮你了解它都能做什么）、源代码（帮你了解它是怎么做的）

hdfs

hdfs是大数据系统的基础，它提供了基本的存储功能，由于底层数据的分布式存储，上层任务也可以利用数据的本地性进行分布式计算。hdfs思想上很简单，就是namenode负责数据存储位置的记录，datanode负责数据的存储。使用者client会先访问namenode询问数据存在哪，然后去datanode存储；写流程也基本类似，会先在namenode上询问写到哪，然后把数据存储到对应的datanode上。所以namenode作为整个系统的灵魂，一旦它挂掉了，整个系统也就无法使用了。在运维中，针对namenode的高可用变得十分关键。

2016-07-28 单节点部署Hadoop教程
2016-07-28 Hadoop HDFS 用户指南

mapreduce

hive

hive基于hdfs构建了数据仓库系统，它以hdfs作为存储，依赖于数据库(嵌入式的数据库derby或者独立的数据mysql或oracle)存储表schema信息，并完成基于sql自动解析创建mapreduce任务(由于mapreduce计算效率比较差，目前官方推荐的是底层计算模型采用tez或者spark)。所以hive可以理解为：hdfs原始存储+DB Schema信息存储+SQL解析引擎+底层计算框架组成的数据仓库。

官方文档

2016-08-13 Hive初识
2016-08-16 Hive部署入门教程
2016-08-23 《Hive编程指南》—— 读后总结
2016-08-23 Hive数据的导入导出
2016-08-24 Hive连接JOIN用例详解
2016-08-30 循序渐进，了解Hive是什么！
2016-08-31 手把手教你搭建Hive Web环境

spark

spark是现在大数据中应用最多的计算模型，它与java8的stream编程有相同的风格。封装了很多的计算方法和模型，以延迟执行的方式，在真正需要执行的时候才进行运算。既可以有效的做计算过程的容错，也可以改善我们的编程模型。

官方文档

2016-08-05 《Spark大数据处理》—— 读后总结
2016-09-03 《Spark快速大数据分析》—— 第三章 RDD编程
2016-09-05 《Spark快速大数据分析》—— 第五章数据读取和保存
2016-09-06 《Spark快速大数据分析》—— 第六章 Spark编程进阶
2016-09-13 《Spark快速大数据分析》—— 第七章在集群上运行Spark
2016-09-21 [大数据之Spark]——快速入门
2016-10-09 [大数据之Spark]——Transformations转换入门经典实例
2016-10-10 [大数据之Spark]——Actions算子操作入门实例
2017-02-18 Spark源码分析之Spark Shell（上）
2017-02-19 Spark源码分析之Spark Shell（下）
2017-02-21 Spark源码分析之Spark-submit和Spark-class
2017-02-23 Spark SQL 用户自定义函数UDF、用户自定义聚合函数UDAF 教程
2017-02-26 基于Spark UI性能优化与调试——初级篇
2017-04-06 Spark Stage切分源码剖析——DAGScheduler
2017-04-16 Spark源码分析之分区器的作用

oozie

oozie提供了大数据场景下各种任务的调度，比如shell脚本、spark任务、mapreduce任务、sqoop任务、hive查询以及普通的java程序等等。它的编译是生态圈里面最复杂的，由于以来的各个版本不同，需要指定特定的版本，因此没有成型的一键部署包。

官方文档

2016-09-22 oozie快速入门
2016-11-17 Oozie分布式任务的工作流——邮件篇
2016-11-19 Oozie分布式任务的工作流——脚本篇
2016-11-21 Oozie调度报错——ORA-00918：未明确定义列
2016-11-22 Oozie分布式任务的工作流——Sqoop篇
2016-12-11 大数据之Oozie——源码分析（一）程序入口
2016-12-23 Oozie分布式任务的工作流——Spark篇
2017-02-28 图文并茂 —— 基于Oozie调度Sqoop
2017-03-01 Oozie分布式工作流——流控制
2017-03-02 Oozie分布式工作流——Action节点
2017-03-04 Oozie分布式工作流——从理论和实践分析使用节点间的参数传递
2017-03-07 Oozie分布式工作流——EL表达式

sqoop

sqoop支持基于sql或者表名把数据库中的数据存储到分布式环境中，数据库支持oracle\mysql等等，分布式环境可以是hdfs,hive,hbase等等，数据的导入时双向的，比如你可以把oracle中的数据读取存储到hdfs，也可以把hdfs的数据导入到oracle.

官方文档

2016-09-12 sqoop初探?
2016-09-29 什么是sqoop?
2016-11-23 sqoop切分任务原理

hbase

2017-06-09 Hbase常用命令
2017-07-03 Hbase多版本的读写（Shell&Java API版）

yarn

在企业中，大数据的基础平台往往是多个用户共用的，那么如何管理资源的分配，就需要yarn来处理了。Yarn默认提供了三种资源分配的策略：

FIFO：先进先出，即按照用户提交任务的时间分配资源
Capacity：按照队列设置队列的大小
Fair Share：也是基于队列，只不过资源的粒度更小。

常见可以用于分配的资源可以是节点的数量，内存的大小，也可以是CPU核数。

官方文档

2016-12-06 yarn资源调度浅学
2016-12-13 大数据之Yarn——Capacity调度器概念以及配置

最后

上面是我学习hadoop和spark的分享，更重要的是学习历程的记录，希望有兴趣学习大数据的朋友可以通过我之前的学习路线获得一些思考和借鉴。后续也会逐步的完善，等到对整体有了比较全面的了解后，会专门针对安装部署、使用实践、原理解析进行介绍。

你可能感兴趣的:(大数据学习)

大数据学习｜理解和对比 Apache Hive 和 Apache Iceberg 进击的小白菜数据库大数据大数据学习 apache
文章目录数据模型与存储事务支持性能优化使用场景总结数据模型与存储Hive:Hive使用的是传统的关系型数据模型，数据存储在Hadoop分布式文件系统(HDFS)中，通常是以文本格式（如CSV或TSV）或者二进制格式（如Parquet或ORC）。Hive的表定义和元数据存储在一个外部的关系数据库中，如MySQL，用于跟踪表结构、分区和其他元数据信息。Iceberg:Iceberg设计为一个现代的表格
Python大数据学习day01——大数据开发概论笨小孩124 python 学习总结大数据学习 python
目录大数据概念大数据特点大数据应用场景大数据分析业务步骤大数据职业规划大数据学习路线1.大数据解决问题海量数据存储——海量数据运算——海量数据迁移2.大数据特点（大、多、值、快、信）数据体量大种类和来源多源化实现低价值密度速度快数据的质量准确可信3.大数据应用4.大数据分析步骤明确分析目的思路——数据收集——数据处理（ETL）——数据分析——数据展现——撰写报告5.大数据职业规划6.大数据学习路线
大数据学习路线基础指南‌ 一马什么梅一大数据学习
随着信息技术的迅猛发展，‌大数据已成为当今社会的热门话题。‌无论是企业决策、‌市场分析还是科学研究，‌大数据都扮演着举足轻重的角色。‌对于想要投身这一领域的学习者来说，‌制定一份清晰、‌系统的大数据学习路线是至关重要的。‌提供一份从零基础到精通的大数据学习指南希望对大家有所帮助一、‌基础阶段：‌掌握核心概念与技能1.‌了解大数据基础‌学习大数据的定义、‌特点、‌价值以及应用领域。‌理解大数据与传统
学习大数据开发，需要满足哪些条件？学历，性别，专业有限制吗？ yoku酱
给大家介绍一下关于零基础学习大数据需要哪些条件？首先我们在平时的工作中，经常有小白同学问学习大数据有学历限制吗？我是大专学历可以学习大数据技术吗？我没有计算机基础，可以学习大数据吗？大数据学习是不是很难，零基础能学会吗？我是女生，可以学习大数据技术吗？下面我们针对这些问题来一一作答！首先对于零基础的童鞋想参加大数据开发学习，需要：1、一些数学常识，尤其是想从事数据分析这一块，至少要了解常用计算模型
001kafka源码项目gradle报错UnsupportedClassVersionError-kafka-报错-大数据学习 gaog2zh 大数据 kafka 大数据
1报错提示java.lang.UnsupportedClassVersionError:org/eclipse/jgit/lib/AnyObjectIdhasbeencompiledbyamorerecentversionoftheJavaRuntime(classfileversion55.0),thisversionoftheJavaRuntimeonlyrecognizesclassfile
python+大数据学习打卡day1 岁月不静好456 big data 学习
【大数据从0-1打卡-day1】1、简单了解一些关于大数据的概念数据：数据就是对客观事件进行记录并可以鉴别的符号。他不仅仅是指数字，还可以是有一定意义的字母、文字、符号、语音、文字、图画、视频或者这些元素的结合等。企业数据分析方向：现状分析：离线分析原因分析：实时分析预测分析：机器学习数据分析基本流程：采集、处理、分析、应用大数据：大数据(bigdata)，指的是所涉及的资料量规模巨大到无法透过主
大数据基础必备，大数据是什么？大数据05
随着互联网时代的到来，颠覆了传统行业的盈利模式，大家都把注意力集中在了互联网上。前几年大数据时代的来临，为各行各业提供了更加开阔的数据用作分析。大数据学习群：199427210百科对于大数据是这样解释的：麦肯锡全球研究所给出的定义是：一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据
自学大数据：大数据学习线路及各阶段学习书籍 yoku酱
大数据学习路线及各阶段学习书籍推荐！阶段一、大数据基础——java语言基础方面（1）Java语言基础Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类（2）HTML、CSS与JavaScriptPC端网站布局、HTML5+CSS3基础、WebApp页面布局、原生
学习大数据需要掌握哪些知识？大数据学习01
大数据已经成为时代发展的趋势，很多人纷纷选择学习大数据，想要进入大数据行业。大数据技术体系庞大，包括的知识较多，系统的学习大数据可以让你全面掌握大数据技能。学习大数据需要掌握哪些知识？1、学习大数据首先要学习Java基础怎样进行大数据学习的快速入门？学大数据课程之前要先学习一种计算机编程语言。Java是大数据学习需要的编程语言基础，因为大数据的开发基于常用的高级语言。而且不论是学习hadoop，还
大数据学习入门级书籍推荐，零基础小伙伴们关注一下吧 kuntoria
1.《大数据分析：点“数”成金》大数据学习入门级书籍推荐你现在正坐在一座金矿之上，这些金子或被深埋于备份、存档数据之中，或正藏在你眼前的数据集里，它们是提升公司效益、拓展新的商业关系、制订更直观决策的秘诀所在，足以使你的企业更上一层楼。你将明白如何利用、分析和驾驭数据来获得丰厚回报。作者FrankOhlhorst“厚积”数十年的技术经验而“薄发”于此书，他将向读者介绍怎样将大数据分析应用于各行各业
2021-11-07大数据学习日志——MySQL进阶——报表项目王络不稳定 mysql 数据库 database
01_数据表介绍学习目标了解项目使用的数据表结构及表关系课程使用微软的Northwind数据集,零售业务，包含了客户，供应商和订单数据。原始数据集可以在微软GitHub仓库下载。为了满足课程需求，数据库数据在原始数据基础上做了微调。基于此份数据，我们将通过SQL来创建数据报表，满足业务需求。1.1数据表整体概览1.2员工表(employees)保存员工基本信息，包含如下字段：employee_id
大数据学习之Redis，十大数据类型的具体应用（五）十二点的泡面 redis 学习 redis 数据库
目录3.9Redis地理空间（GEO）简介原理Redis在3.2版本以后增加了地理位置的处理哦命令命令实操如何获得某个地址的经纬度3.9Redis地理空间（GEO）简介移动互联网时代LBS应用越来越多，交友软件中附近的小姐姐、外卖软件中附近的美食店铺、高德地图附近的核酸检査点等等，那这种附近各种形形色色的XXX地址位置选择是如何实现的?地球上的地理位置是使用二维的经纬度表示，经度范围(-180,1
量化学习：大数据时代的学习方式 weixin_44387107 大数据大数据人工智能机器学习数据挖掘数据分析
摘要：未来人工智能、大数据、学习分析等技术被广泛应用于教育教学中，量化学习将成为新的研究热点。本研究首先对量化学习的内涵、特征、工具和方法进行概述，然后阐述了量化学习的价值意义和应用案例，进而分析了量化学习发展趋势与其面临的挑战。关键词：量化学习；大数据；《地平线报告》（高等教育版）在这里相信有许多想要学习大数据的同学，大家可以+下大数据学习裙：740041381，即可免费领取套系统的大数据学习教
大数据是什么？华为云学院带你探索大数据之旅舒意从生
大数据是什么？华为云学院带你探索大数据之旅我们首先从大数据是什么开始讲起，！下面由我来带领大家！展开我们本次的大数据学习之旅！大数据是什么，内容将包括大数据的产生，发展大数据的基本概念。首先我们来追溯一下大数据的产生与发展，大数据的产生和发展主要经历了三个阶段。第一个阶段，我们称为是萌芽期！自上世纪九十年代至本世纪初，随着数据挖掘理论和数据库技术的逐步成熟，一批商业智能工具和知识的管理技术也开始得
大数据学习(32)hive优化方法总结 viperrrrrrr 大数据学习 hive
&&大数据学习&&系列专栏：哲学语录:承认自己的无知，乃是开启智慧的大门如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦Hive优化主要从以下几个方面考虑：数据倾斜：对于数据倾斜问题，可以尝试进行数据重分布，将倾斜的数据进行重新整理。也可以通过多线程处理和数据分箱等技术进行优化。减少job数：对于大量的小任务，可以尝试进行任务的合并，减少任务的启动次数，从而提高效率。合理设置ma
大数据学习之Redis，十大数据类型的具体应用（四）十二点的泡面学习 redis 数据库
3.8Redis基数统计（HyperLogLog）需求统计某个网站的UV、统计某个文章的UV什么是UVuniqueVisitor，独立访客，一般理解为客户端IP大规模的防止作弊，需要去重复统计独立访客比如IP同样就认为是同一个客户需要去重考虑用户搜索网站的关键词的数量统计用户每天搜索不同词条个数是什么？去重复统计功能的基数估计算法-就是HyperLogLogRedisHyperLogLog是用来做
大数据学习之Redis，十大数据类型的具体应用（一）十二点的泡面 redis 学习 redis 数据库
目录3.数据类型命令及落地应用3.1备注3.2Redis字符串（String）单值单value多值操作获取指定区间范围内的值数值增减获取字符串长度和内容追加分布式锁getset(先get后set)3.3Redis列表（List）简单说明单key多value3.4Redis哈希（Hash）KV模式不变，但是V是一个键值对3.数据类型命令及落地应用3.1备注命令不区分大小写，而key是区分大小写的永远
大数据学习之Redis，十大数据类型的具体应用（三）十二点的泡面学习 redis 数据库
目录3.7Redis位图（bitmap）概念需求是什么说明能干嘛?基本命令3.7Redis位图（bitmap）概念由0和1状态表现的二进制位的bit数组需求用户是否登陆过？Y/N广告是否被点击过？钉钉打卡上下班，签到统计是什么说明用String类型作为底层数据结构实现的一种统计二值状态的数据类型位图本质是数组，它是基丁String数据类型的按位的操作。该数组由多个二进制位组成，每个二进制位都对应一
大数据学习之Redis，十大数据类型的具体应用（二）十二点的泡面 redis 学习 redis 数据库
目录3.5Redis集合（Set）单值多value，且无重复sadd/smembers/sismember/srem/scardsrandmember/spopsmove集合运算应用场景3.6Redis有序集合Zset（sortedset）有序有重复zadd/zrange/zrevrangezrangebyscorezscore/zcard/zremzincrby/zcount/zmpopzran
从术语到Spark，10篇必读大数据学习资源大数据的时代
本文给想进入大数据领域的朋友提供了一系列的资源，由浅入深，比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个必须要参加的大数据会议”等有趣的话题。相信各种背景的朋友都会在这篇文章中有所收获。之前，我们已就数据可视化进行了深入探讨。这次，我们将从更基本的概念讲起，以便在涉足更复杂的数据科学和商业智能之前能够真正理解大数据。文中会引领大家阅读介绍大数据的相关文章，研究网络上流
大数据学习之Redis、从零基础到入门（三）十二点的泡面 redis bootstrap 前端 html
目录三、redis10大数据类型1.哪十个？1.1redis字符串（String）1.2redis列表（List）1.3redis哈希表（Hash）1.4redis集合（Set）1.5redis有序集合（ZSet）1.6redis地理空间（GEO）1.7redis基数统计（HyperLongLog）1.8redis位图（bitmap）编辑1.9redis位域（bitfiled）1.10redis流
大数据学习之Redis、从零基础到入门（一）十二点的泡面 redis 大数据学习 redis
目录一、Redis入门概述1.是什么？官方解释：2.能干嘛？2.1主流功能与应用2.1.1分布式缓存2.1.2内存存储和持久化(RDB+AOF)2.1.3高可用架构搭建2.1.4缓存穿透、击穿、雪崩2.1.5分布式锁2.1.6队列2.2总体功能概括2.3优势3.去哪下？官网地址：英文：中文：中文文档：下载安装包：其他文档资料：Redis源码地址：Redis在线测试：Redis命令参考：4.怎么玩？
大数据学习之Redis、从零基础到入门（二）十二点的泡面 redis 大数据学习 redis
二、Redis安装配置1.VMWare本地虚拟机VMWare准备的为64位查看自己的VMWare是32位还是64位getconfLONG_BIT2.Redis的安装2.1系统选择选择Linux系统2.2Linux版安装2.2.1Linux环境安装Redis必须先具备gcc编译环境①什么是gccgcc是linux下的一个编译程序，是C程序的编译工具GCC(GNUCompilerCollection)
大数据运维到底是什么又需要做些什么科技资讯快报
疫情期间，大数据的广泛应用发挥了巨大的作用，作为新兴的IT领域技术，大数据行业受到越来越多的人关注，于是想要入行的、转行的纷纷选择大数据学习，那么大数据运维到底是什么？又需要做些什么?直白的解释大数据运维，就是有一些数据需要进行维护,运维的意思在这里就是维护。作为一名合格的大数据运维，需要承担的责任繁琐而严谨，今天就来了解其中的一部分，首先大数据运维需要承担团队的日常管理，组织制定中心基础设施的保
大数据学习之路金光闪闪耶
一、为什么要学习大数据？在我第一份实习的时候，忘记在什么场景下我leader突然说了一句：「干Java不就是增删改查嘛」，而恰好那时候知乎都是「干了3年Java，还是只会增删改查，迷茫」等问题，我听完leader那句话就心里一颤。因为这句话，我又一次的陷入迷茫，我不清楚自己是不是应该继续的Java，所以那段时间我干过爬虫，也撸了一阵子的西瓜书和统计学什么的。在知乎上所有相关的问题和答案我都看了，也
大数据学习之Flink算子、了解（Source）源算子（基础篇二）十二点的泡面 Flink 算子大数据学习 flink
Source源算子（基础篇二）目录Source源算子（基础篇二）二、源算子（source）1.准备工作2.从集合中读取数据可以使用代码中的fromCollection()方法直接读取列表也可以使用代码中的fromElements()方法直接列出数据获取3.从文件中读取数据说明：4.从Socket读取数据（1）编写StreamWordCount（2）在Linux环境的主机bigdata1上，执行下列
大数据学习之Flink算子、了解（Transformation）转换算子（基础篇三）十二点的泡面算子 Flink 大数据学习 flink
Transformation转换算子（基础篇三）目录Transformation转换算子（基础篇三）三、转换算子（Transformation）1.基本转换算子1.1映射（Map）1.2过滤（filter）1.3扁平映射（flatmap）1.4基本转换算子的例子2.聚合算子（Aggregation）2.1按键分区（keyBy）2.2简单聚合2.3归约聚合（reduce）3.用户自定义函数（UDF）
大数据学习之Flink算子、了解DataStream API（基础篇一）十二点的泡面 Flink 算子大数据学习 flink
DataStreamAPI（基础篇）注：本文只涉及DataStream原因：随着大数据和流式计算需求的增长，处理实时数据流变得越来越重要。因此，DataStream由于其处理实时数据流的特性和能力，逐渐替代了DataSet成为了主流的数据处理方式。目录DataStreamAPI（基础篇）前摘：一、执行环境1.创建执行环境2.执行模式3.触发程序执行二、源算子（source）三、转换算子（Trans
大数据学习之Flink、比较不同框架的容错机制十二点的泡面大数据 Flink 大数据学习 flink
第一章、Flink的容错机制第二章、Flink核心组件和工作原理第三章、Flink的恢复策略第四章、Flink容错机制的注意事项第五章、Flink的容错机制与其他框架的容错机制相比较目录第五章、Flink的容错机制与其他框架的容错机制相比较Ⅰ、Flink的容错机制与其他框架的容错机制相比较相同点：1.容错机制的目的：2.持久化存储：不同点：1.适用场景：2.容错机制的细节：3.数据一致性：综上所述
大数据学习之Flink、Flink容错机制的注意事项十二点的泡面大数据 Flink 大数据学习 flink
第一章、Flink的容错机制第二章、Flink核心组件和工作原理第三章、Flink的恢复策略第四章、Flink容错机制的注意事项第五章、Flink的容错机制与其他框架的容错机制相比较目录第四章、Flink容错机制的注意事项Ⅰ、注意事项1.Checkpoint的稳定性：2.状态一致性：3.失败的Checkpoint或Savepoint处理：4.资源管理：5.版本控制：6.监控和日志分析：第四章、Fl
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他