weixin_34004750

【Spark深入学习-11】Spark基本概念和运行模式

----本节内容-------

1.大数据基础

1.1大数据平台基本框架

1.2学习大数据的基础

1.3学习Spark的Hadoop基础

2.Hadoop生态基本介绍

2.1Hadoop生态组件介绍

2.2Hadoop计算框架介绍

3.Spark概述

3.1 Spark出现的技术背景

3.2 Spark核心概念介绍

4.Spark运行模式

4.1.Spark程序组成

4.2.Spark运行模式

5.参考资料

---------------------

1.大数据基础

1.1 大数据平台基本框架

从全局了解一下大数据技术的基本框架，在宏观上有个认识，不至于盲人摸象。董先生贴出来的这个图，可以说是非常通用且普遍的一张图，不管你是哪个行业，框架用这个套，准没错。通用就是大而全的东西，不会考虑细节了。在实际生产中，每一个细节都不是省油的灯。当然全局的整体把握，对spark理解非常重要，它在整个体系中扮演什么角色，这个很基础。

整体架构分为6个层面

1）数据收集

数据采集，是汇聚的一个过程，如淘宝，商家，用户，用户行为，买其他公司数据，数据集市等，要收集数据过来，使用的技术组件有Flume、kafka、Ftp、Sqoop、DataX等等。一些自己走的坑，主要有：a.稳定和安全，生产中首要是确保生产，不能把对端系统给搞瘫了，很多时候，对端系统已经弱不禁风了，达到了各种瓶颈，如网络带宽，内存和CPU硬件限制等，汇聚数据稍加马力，就要出事（曾经sqoop抽oralce生产库，不知道对端oralce那么脆弱，上来就猛一抽，完蛋）；b.网络复杂，跨网段的数据汇聚，很头疼，做过几次汇聚，网络有N多种，公安网、视频专网、政务网、互联网，经过各种跳转机和网闸等等，各种网络限制，很可能别人鼓吹的神器，因为网络问题，都是浮云，c.数据质量垃圾，不敢恭维，数据能拿过来了，但是数据质量真的都不敢恭维，ETL工作做起来，杀人的心都有，d.跨部门沟通和协调问题，人的问题永远比技术问题还要难解决，是你主动过去取，还是让人家送过来,是你去协调别人，还是别人来找你要做数据汇聚，这是一个问题；沟通是一门艺术，coding则是一门技术。

2）存储数据

传统关系型数据库，很难存海量数据，采用分布式的架构，其实分布式存储数据并不是传统数据库不能解决的问题，oralce也能做到集群，mysql也没问题，关键的关键还是如何将存起来的数据用起来，除非你真的只想做个网盘。

3）资源管理

一般公司都不仅仅是做网盘，还有挖掘，分析，产生价值，管理cpu，内存等资源，资源管理系统来管理，上百台，千台，分布式集群的资源管理很讲究。

4）计算层

分布式程序作分析和挖掘，分三类：批处理，交互式分析，流处理。

批处理：10T的数据如何处理，分布式的程序进行处理，讲究高吞吐率，对时间要求不严格，分钟或者消失级别

交互式分析：很多数据，通过语言表达查询意图，马上反馈结果，支持sql，速度足够快， 2~3秒，交互的，时间长就不是交互了，秒级；

流式处理：对时间要求很高，毫秒级处理完数据，不想批处理那样，数据来了就处理

spark可以解决这三类问题。

5）数据分析层

偏向平台，比较通用，银行，电商，都可以用这些引擎来分析问题，改成和应用相关

6）数据可视化

很重要，很多创业公司在做这个，并且根据行业细分，做的都非常不错。

spark在第四层，不做收集，资源管理，数据存储，可视化，仅仅是一个计算框架，可以解决很多实际问题，不是大数据的全部，是数据分析技术

问题1：为什么不采用oralce技术来实现大数据？

oralce不能解决所有的问题，l虽然oralce有load加载数据，oralce也能做做存储，不需要做资源管理，一个节点而已，能做sql做分析，但是数据小可以，没问题；数据大了，收集，存储，都要拿出来做独立模块，各种模块和场景都很复杂，oralce打包一起做不了。

问题2：如何实现大数据平台？

可以自己玩，在生产中可以使用ambari或者CM这样的部署工具来搭建大数据平台，自己搭建和运维；也可以用别人搞好的服务，，如用阿里云，付钱，每个环节都实现了，也可以google、亚马逊，数据放在他们那里，不安全。在国内，属于劳动力密集型的地方，很多企业都愿意自己搭建运维，各种坑自己一个个的趟过去；而在国外，如欧洲，人力成本贵的要命，宁愿花钱买别人的服务，而且他们相信专业的人干专业的事情。

1.2 基本技能素养

大数据之所以有点学习的门槛，其实不是因为它有多难，而是要有一颗耐的主寂寞的心，有些人看到这幅图可能就要打退堂鼓了。这些技术栈不见得非要精通，至少得用到知道怎么百度和google，能迅速上手，基于我自己对大数据技术的理解做如下阐述，

linux基础：linux得入门啊，最基本的命令得会，这个没有入门的，推荐一下老男孩的linux运维系列视频课程

编程语言：java,scala,python

开发工具： (1) intellij开发工具，scala程序推荐该工具，eclipse对scala支持的比较差，高亮，自动提示等都比较若，(2)maven项目构建工具，好好学习一下，如何打包测试，发布；（3）代码管理工具git，使用git来下载和管理代码

hadoop生态组件：hdfs、yarn、pig、hive和zookeeper等

不求样样精通，你不是神，根据职业角色划分，有所侧重。角色划分我的有限理解，通常有做Hadop平台运维、大数据ETL开发、数据建模分析、大数据可视化等等，每一个工种角色都不一样，掌握技能侧重点也不一样。

1.3 Hadoop生态系统基础

Hadoop生态组件是Spark的学习基础，Spark建立在HDFS之上，是Mapreduce的改良，使用Yarn做资源调度，通过Zookeeper做主节点的HA，所以学习Spark至少也有点Hadoop的基础。另外对于Spark有几个言论误解，主要有:(1)spark会取代hadoop，其实不然，他们不是不是一个量级的东西，是一个生态系统，Spark就是一个小小的组件，只是逐步替代Mapreduce编程；（2）Spark诸如强Hadoop百倍，也不全然，只能说个别场景如此，谣言止于智者。

2.Hadoop生态基本介绍

2.1Hadoop生态组件介绍

2.Hadoop生态基本介绍

2.1Hadoop生态组件介绍

1）HDFS和Hbase

· HDFS

分布式文件系统，它是一个高度容错的系统，能检测和应对硬件故障，用于在低成本的通用硬件上运行。HDFS简化了文件的一致性模型，通过流式数据访问，提供高吞吐量应用程序数据访问功能，适合带有大型数据集的应用程序。

必须要有HDFS的基础，明白HDFS的基本架构，基本的文件管理，如block、文件、目录等，熟悉基本的HDFS shell操作。1G数据，默认是几个block，5个节点，这些数据会存在哪几个节点.来自一篇论文，有13年时间了，GFS，很经典，hdfs是gfs的克隆版，google没有开源、容错性好，互联网公司抠门，常常是购买x86的机器，经常挂掉，所以要容错好；节点，机器，都是一台服务器，【同通常配置是24个cpu，128G内存，磁盘12*3T】，2万左右的RMB，挂掉数据不会丢，一个文件切分成多个文件，存放在不同的节点上，一个文件多份，为并行化提供存储的基础，切成几块，并行都就是多少，【16个并行读，16个block】

基本原理：将文件且纷成等大的数据块block，默认是128M，存储在多台机器上；将数据切分、容错、负载均衡等功能透明化；可将HDFS看成是一个容量巨大的、具有高容错性的磁盘。

应用场景：海量数据的可靠性存储、数据归档

基本架构：主从架构，主节点会做HA，数据存放在datanode。

Hbase

HBase是一个针对结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库。和传统关系数据库不同，HBase采用了BigTable的数据模型：增强的稀疏排序映射表（Key/Value），其中，键由行关键字、列关键字和时间戳构成。HBase提供了对大规模数据的随机、实时读写访问，同时，HBase中保存的数据可以使用MapReduce来处理，它将数据存储和并行计算完美地结合在一起。数据模型：Schema-->Table-->Column Family-->Column-->RowKey-->TimeStamp-->Value

2)YARN

群的资管管理和调度，在yarn上跑各种程序，spark不一定泡在yarn上，也可以mesos，甚至裸集群上，有很多分布式特点，扩展，容错，并行

是什么？ Hadoop2.0新增的资源管理系统，负责集群的资源管理和调度，使得多个计算框架可以运行在一个集群上。

啥特点？良好的扩展性、高可用性，对多种类型的应用程序进行统一管理和调度，自带多种用户调度器，适合共享集群环境。

要熟悉YARN的基本架构，各个角色的功能和交互流程，资源管理的基本方法等。

执行流程：

a.nodemanager管理资源，将资源，有cpu，内存等汇报给resourceManager，统一管理

b.客户client要执行任务

client查找rm->rm找nodemanager->rm找到nodemanager资源后，将资源分给client->client就直接去找nodemanager->nodemanager执行任务

3)MapReduce和Spark

Mapreduce

源自goole开源的mapreduce论文，发表于2004年12月，是google Mapreduce的克隆版MapReduce是一种计算模型，用以进行大数据量的计算。其中Map对数据集上的独立元素进行指定的操作，生成键-值对形式中间结果。Reduce则对中间结果中相同“键”的所有“值”进行规约，以得到最终结果。要掌握MapReeduce的基本编程模型，WordCount的执行流程。Spark经常和mr对比，经典的最好是了解，不要一无所知，只能说你太虚伪了。

特点：良好的扩展性、高容错性、适合PB级以上海量数据的离线处理；分布式错误是一个正常现象，常态。转为2个阶段，map和reduce，就是计算机里面的汇编语言，难用

Spark：UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点,支持整个目录读取支持通配符读取支持压缩文件读取，基于gz的压缩不带分片参数，会将每个block创建一个分片，每个分片上运行一个task支持读取目录中的小文件, 支持整个目录读取支持通配符读取支持压缩文件读取，基于gz的压缩不带分片参数，会将每个block创建一个分片，每个分片上运行一个task支持读取目录中的小文件

4）Hive和Pig

Hive：由facebook开源，最初用于解决海量结构化的日志数据统计问题。Hive定义了一种类似SQL的查询语言(HQL),将SQL转化为MapReduce任务在Hadoop上执行。

通常用于离线分析。

Pig:由yahoo!开源，设计动机是提供一种基于MapReduce的ad-hoc(计算在query时发生)数据分析工具定义了一种数据流语言—Pig Latin，将脚本转换为MapReduce任务在Hadoop上执行。

通常用于进行离线分析。

5）Oozie和Zookeeper

Zookeeper:源自Google的Chubby论文，发表于2006年11月，Zookeeper是Chubby克隆版解决分布式环境下的数据管理问题：统一命名，状态同步，集群管理，配置同步等。

6）Flume和sqoop

Sqoop是SQL-to-Hadoop的缩写，主要用于传统数据库和Hadoop之前传输数据。数据的导入和导出本质上是Mapreduce程序，充分利用了MR的并行化和容错性。

Flume:Cloudera开源的日志收集系统，具有分布式、高可靠、高容错、易于定制和扩展的特点。

它将数据从产生、传输、处理并最终写入目标的路径的过程抽象为数据流，在具体的数据流中，数据源支持在Flume中定制数据发送方，从而支持收集各种不同协议数据。同时，Flume数据流提供对日志数据进行简单处理的能力，如过滤、格式转换等。此外，Flume还具有能够将日志写往各种数据目标（可定制）的能力。总的来说，Flume是一个可扩展、适合复杂环境的海量日志收集系统。

7)Ambari

由hortworks开源，是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。1000个机器，如何部署，拷贝数据都考死人，自动化安装工具ambari，点击鼠标自动安装，修改配置，启动服务。

目前来说，只有可视化功能，hadoop生态系统没有提供，

2.2 Hadoop计算框架介绍

通常来说，计算引擎的分类，

1）批处理：对时间没有严格要求，离线分析，不关系时间，关注吞吐率

2）交互式：支持sql，对数据进行快速分析，人机交互，时间要求高

3）流式处理：流水一样流入系统，实时分析，来一条处理一条。对每一条数据时间要求高，吞吐率要求不高

4）迭代式与DAG计算：机器学习算法，离线分析

当然有些公司也有自己的划分方法，比如hortworks（已经上市了的大数据公司），划分方式：

用时间来划分0~5秒实时分析，和其他公司划分就不一样，比如在线查询有些公司要求毫秒，作为参考而已

hortworks将计算框架也划分了几类

简单批处理：MapReduce和hive

DAG与迭代式： tez逐步替代hive，Spark替代shark，简单批处理和DAG迭代式都是离线分析

交互式框架：Impala，Presto

流/实时计算：Stoam，Samz，Spark Streaming

涵盖三类应用场景，如果spark能解决的就用spark把,Spark架构如下

1）计算框架

分布式，基于内存，弹性

2）数据存储

在hadoop生态系统，如hdfs，hbase，分布式存储引擎

3）资源管理

由yarn管理，或者mesos等，有一个内核，spark core，在这之上，构建了很多计算引擎，方便用户编写

4）spark sql

写sql，将sql转为spark程序

5）spark streaming

6）graphx：图计算

7）MLLib：机器学习，通用的机器学习算法，聚类，分类，避免重复造轮子

8）Spark R：用r语言写spark程序

Spark不是一门孤立的技术，社区很活跃，支持linux和windows；微软怕被淘汰，给大数据社区贡献了一些windows运行的patch，但依然很少有人用，spark不断在发展过程中，版本的升级都是内核变动，api层很少变动，一般不会该使用和优化为主，

3.Spark概述

3.1 Spark出现的技术背景

1）Mapreduce的局限性

mapreduce框架的局限性主要表现在

· 仅仅支持map和reduce两种操作

· 处理效率低（中间结果写磁盘，多个mr之间通过hdfs交换数据；任务调度和启动开销大；无法充分利用内存，不管什么操作map和reduce都要排序），为什么写磁盘，因为当时磁盘便宜，内存贵，现在内存很便宜。

· 不适合做复杂的计算，如迭代计算，如机器学习图计算、交互处理和流计算。

· 编程不灵活，基本就是分布式编程界的汇编语言。

2）各种计算框架多样化

spark之前，很多，各种框架部署和管理都比较乱，spark可以同时解决这三种场景，学习一类解决三类问题，写程序和管理都很简单。现有的各种计算框架各自为战，批处理mapreduce、Hive、Tez，流式计算storm，交互式计算Impala，Spark同时处理批处理、流计算、交互式计算等。

3）Spark特点

· 高效：快10~100倍，取决于逻辑和具体的计算，内存计算引擎，提供驾驭内存的机制，灵活利用内存，DAG的计算杨引擎，减少开销，使用多线程，减少启动开销，shuffle减少不必要的开销和磁盘IO。

· 易用，非常丰富的API，支持JAVA，scala，pyhon，R四种语言，spark之前，scala很小众

spark带动scala的销量，scala代码少2~5倍，更短，出错更少，

·与hadoop集成的很好，和yarn很好的集成

给人更多的选择，你不喜欢可以使用mr，我比mr更快，你自己看着办，如下面的sql语句， mapreduce程序启动就会有4个mr，并且读写hdfs非常频繁，效率很低；而使用Spark，DAG模式大大节省磁盘IO。

在一个统一的框架下，进行批处理、流计算、交互式计算

3.2 Spark核心概念介绍

1.RDD弹性分布式数据集

· 数据集的抽象，以前学过很多数据集，array，list，map数据集等，抽象成不同的数据结构，

分布式：数据被分解成很多块放到不同节点

弹性：相对于存储介质而言，可以放在磁盘，可以放在内存，这就是弹性的意思

· 分布在集群上，只读

一个RDD被分解成很多块partition，这些partition分布在不同的机器上。多个partion组成，hdfs的block有什么关系，2套术语，都叫块不可以，2个团队2个社区的人，命名方式不同了。

· 可以在内存或者磁盘上

· 可以并行的构造，一个或者2个可以产生新的

· 失效后，自动重构

2.基本操作Transfoation和Action

rdd是数据，有数据，就有计算操作，基本操作分成2类（为什么分成2类），

1）transformation：一类算子的简称，完成转换功能，函数和算子一个意思，看成一个大的数组，里面有元素，被切分放到各个节点上。

2）action：把rdd变换成一个或者一组值，这些是单机的，前面transformation都是分布式的值，

3）Spark提供了大量的函数

transformation：参数也是函数，输入T类型rdd，输出U类型也是RDD，

aciton：输入rdd，输出不是rdd了，可能是基本类型或者数组等，都是单机的类型

4）惰性执行

transformation只会记录RDD的转化关系，并不会触发计算

action是触发程序执行（分布式）的算子

3.缓存cache和persist

spark非常好的能力，能控制内存的使用量，就是通过cache和persist实现，称为控制语句

可以让rdd cache到内存或磁盘上。

问题： cache和persist 区别（面试会经常被问到），回答以下知识点

（1）cache和persist都是用于将一个RDD进行缓存的，这样在之后使用的过程中就不需要重新计算了，可以大大节省程序运行时间，

（2） cache只有一个默认的缓存级别MEMORY_ONLY ，cache调用了persist，而persist可以根据情况设置其它的缓存级别。

（3）executor执行的时候，默认60%做cache，40%做task操作，persist最根本的函数，最底层的函数

storagelever每个等级有5个参数

·是不是用磁盘

·是不是不内存

·是不是用tacyon

·是不是反序列化

·缓存保存多少份

序列化器，使用序列化节省内存但是消耗cpu，拿出来的时候要进行反序列化，缺省的，用自带的，但是性能很差，根据自己的需求是否进行序列化，不要用自带的序列化器

4.Spark运行模式

4.1.Spark程序组成

1）程序执行

· spark-shell，读取文件->RDD转换-> RDD触发执行->保存结果

· spark-submit，很多参数，注意下参数：--master，指定程序运行的模式，可以本地，yarn，别的集群上

2）Spark程序架构

2个组件组成，application = driver（1个）+ executor（多个）

· driver:main函数，2g内存1个cpu，运行指定将相应的jar包和文件传给work node

· application：driver+executor，spark应用程序，2个应用程序是没有任何关联，如果共享数据只能hdfs或者tacyon. executor运行是指定，可以同时跑几个task,一个application转为多个task（driver转化），task扔给exe执行，

4.2.Spark程运行模式

1）本地模式

不一定非要跑在hadoop集群，可以在本地，起多个线程的方式来指定。将Spark应用以多线程的方式直接运行在本地，一般都是为了方便调试，本地模式分三类

· local：只启动一个executor

· local[k]:启动k个executor

· local[*]：启动跟cpu数目相同的 executor

2）独立模式

搭建一个集群跑，分布式环境中执行spark程序，资源管理和任务监控是Spark自己控制。

3）集群模式

driver运行在本地，没有容错，但是调试方便

driver运行在集群里面，yarn从slave里面选择一个跑driver，有个好处就是当driver挂掉了，resourceManager可以重新启动一个driver，实现容错，生产环境使用的模式。

5.参考资料

1.http://blog.csdn.net/woshiwanxin102213/article/details/19688393 Hadoop生态系统介绍

2.董西成ppt

你可能感兴趣的:(【Spark深入学习-11】Spark基本概念和运行模式)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
开心蒋泳频
从无比抗拒来上课到接受，感动，收获～看着波哥成长，晶晶幸福笑容满面。感觉自己做的事情很有意义，很开心！还有3个感召目标就是还有三个有缘人，哈哈。明天感召去明日计划：8：30-11：00小公益11：00-21点上班，感召图片发自App图片发自App图片发自App
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。