StevenIsSnail

big data相关的技术文章

Spark分布式计算平台

来自于：大数据技术作者：hzguoding 2014-08-13 14:24

Spark简介

UC伯克利 AMP实验室(2011)

当前版本0.8.1，加入Apache孵化项目

Lighting-Fast Cluster Computing

http://spark.incubator.apache.org/

Spark部署

Cluster Mode Overview

SparkContext是用户执行任务的核心控制句柄

Cluster Manager是集群的控制载体

目前支持的三种集群载体模式：

1 Standalone

2 Apache Mesos

3 Hadoop YARN

Standalone部署(Master-Slave)

1 下载，编译

2 编辑配置文件

3 执行启动脚本

Spark编码

Spark基于Scala开发

编程接口支持Scala, Java, Python

Fast Programming

RDD(Resilient Distributed Datasets)

RDD是全局抽象的分布式存储句柄；

Map-Reduce的job执行过程中，输入输出需要用指定hdfs的路径并做记录；

RDD对象的创建三种方式：

1 基于内存存储的容器对象

2 基于文本文件

3 基于Hadoop输入格式

RDD(Resilient Distributed Datasets)

基于内存容器：

List list = new ArrayList

JavaRDD rdds = sc.parallelize(list);

基于文本文件：

JavaRDD rdds = sc.textFile(“hdfs://xxx/user/files/wordcount.txt”);

基于hadoop输入文件：

JavaPairRDD rdds = sc. hadoopFile(“hdfs://xxx/user/files/wordcount.txt”, TextInputFormat.class, LongWritable.class, Text.class);

RDD Operation

RDD可支持的操作包括: map, reduce, filter, flatMap, sample, union, distinct, groupByKey, reduceByKey, join, cogroup, cartesian, count, foreach, saveAsTextFile, saveAsSequenceFile等等。

RDD Persistence

不同的持久化级别：MEMORY_ONLY(cache), MEMORY_AND_DISK, DISK_ONLY。

rdds.cache(), rdds.persist(storage_level)

内存计算的优势

编码简单，数据句柄操作可视化。

系统稳定性远不如Hadoop。

回归类迭代计算，内存足够大，划算。

================================================================================

Storm基础

来自于：大数据技术作者：李刚锐 2014-08-13 11:06

本文分别介绍Storm和Storm Trident的一些基础知识，适合初学者快速理解掌握Storm。其中一些基本概念都简单提一下，主要介绍中间一些比较重要的东西。

一、 Storm

Storm的工作任务称为一个Topology，类似于MapReduce中的Job。

Storm集群中包含两类节点：主节点（Master Node）和工作节点（Work Node）。其分别对应的角色如下：

主节点（Master Node）上运行一个被称为Nimbus的后台程序，它负责在Storm集群内分发代码，分配任务给工作机器，并且负责监控集群运行状态。Nimbus的作用类似于Hadoop中JobTracker的角色。

工作节点（Work Node）上运行一个被称为Supervisor的后台程序。Supervisor负责监听从Nimbus分配给它执行的任务，据此启动或停止执行任务的工作进程。每一个工作进程执行一个Topology的子集；一个运行中的Topology由分布在不同工作节点上的多个工作进程组成。

二、 Topology

一个Topology由很多个功能节点组成，各个节点组成一个有向图，每两个节点之间可以传递数据。

节点分为2种：Spout和Bolt。Spout是数据源，即整个Topology执行的起始点；Bolt为中间的各个计算节点。

数据在各个节点之间是以tuple来传输的，tuple是最小的传输单元。

从拓扑结构上来看，每2个节点之间有一个连接，而实际上是有多个并发的。

对并发的理解：

一个topology内有若干个Worker Process；

一个Worker Process里边有多个线程，每个线程是一个executor，对应一个Bolt或者Spout；

每个executor内有多个task；

每个task执行一个实际的数据处理.

在代码中，以下内容是用来设置并发的：

ParallelismHint，指定某个bolt初始的executor数量，即线程数；

Bolt.setNumTasks：设置task；

Config.setNumWorkers：设置worker
而由于并发，上一个节点执行完以后实际上有很多个后续节点，那么它应该把tuple发送给哪个后续节点继续计算呢？

在Storm中，把这个过程称为Stream Grouping，而分发的方式有以下几种：
1.Shuffle Grouping：将Tuple随机分配到下游的Bolt
2.Fields Grouping：保证相同Fields值的tuple会被发送到同一个Bolt
3.All Grouping：广播，每个tuple所有的Bolt都会收到
4.Global Grouping：所有的Stream都流向task id最低的那个task。
5.Non Grouping：与Shuffle一样的效果，区别在于会把这个Bolt放到与订阅Bolt同一个线程中执行。。
6.Direct Grouping：这是一种比较复杂的分组方法。。。它规定了tuple的producer来管理由哪个consumer的task来接受这个tuple。。这个比较复杂。
7.Local or shuffle Grouping：这是一种为了提高效率的随机Grouping方法，当一个Bolt的多个Task都在同一个Worker process中的时候，tuple会随机分配到这些正在运行的task中，否则就是普通的Shuffle Grouping
数据在节点之间传输，代码是通过 collector.emit(new Values(tuple)) 来实现的。每个Tuple都是一个Value类型的变量，即一个Object列表，它可以包含很多数据，比如 new Values(123, "String", new Date()， 123L, 12.3F, null)等。
在接受的节点，可以强制转换，即通过 tuple.getValueByField(_sourceName); 获得的Value，可以直接cast为上一个节点传递的object
（TODO：只测试过基本类型，包括List，类不知道可否直接cast）。
而数据在传输的时候，一个一个tuple传输的效率有时比较低，Storm后来有了一种批传输的方式。即将多个tuple在一个batch中传输。
但这样有时效率也不高，后来又有了Batch Transaction的方式，即将一个Batch内的多个tuple先合并运算，这样传输的数量就会减少。这个过程分为2个阶段：
1.Processing Phase：该阶段将一个Batch内的数据进行计算。这个过程可以并行执行，提高效率。
2.Commit Phase：将batch的结果按照严格顺序提交，保证Transaction。
另外，在Storm中，Spout和Bolt都是可序列化(implements Serializable)的。
关于序列化的理解：

对于spout、bolt来讲，他们中的成员变量需要是serializable的，是因为worker挂掉的时候，supervisor会将这些worker的数据序列化以后保存起来。然后supervisor在重新启动新的worker的时候，会把这些数据加载进去。在重新加载的时候，不会调用构造函数，而是从之前supervisor保存的数据中加载，并调用open方法。
因此，在这些Spout、Bolt的构造函数中用到的所有类成员变量都必须是Serializable的。其他的成员变量，如果不在构造函数中使用，可以不是Serializable的，例如在open中初始化这些变量，会在worker启动的时候调用open来重新调用。

三、 Storm Trident

Storm Trident是对Storm的一层封装，并且封装的代码都是很高效的。这使得我们可以更快捷的进行开发。

Trident将功能封装成一个个的原语，有链接、聚合、分组、用户自定义功能和过滤等。以最简单的单词统计为例进行说明：

TridentTopology topology = new TridentTopology();

TridentState wordCounts =

topology.newStream("spout1", spout)

.each(new Fields("sentence"), new Split(), new Fields("word"))

.groupBy(new Fields("word"))

.persistentAggregate(new MemoryMapState.Factory(), new Count(), new Fields("count"))

.parallelismHint(6);

topology.newDRPCStream("words")

.stateQuery(wordCounts, new Fields("args"), new MapGet(), new Fields("count"));

首先建立一个Spout源FixedBatchSpout，不断的发送数据出来------调用emitBatch发送数据！！发出来的是一个个的句子。

然后创建一个TridentTopology，并建立TridentState对Spout进行监听，并通过each、groupBy等进行处理进行统计。然后将统计结果保存在叫做TridentState的状态中，上述代码中该state变量叫做wordCounts。
然后创建一个DRPCStream，用于外部调用的去查询上文的TridentState的状态。
外部调用的时候，执行
new DRPCClient("server", port).execute("words", "cat the dog jumped") 调用的时候，就是一次远程调用，去统计之前统计的所有数量中cat the dog jumped这几个词的数量。

四、关于聚合操作：

做聚合操作，类似于SQL语句中的select count(*), sum(count) 之类的。按照严格标准的SQL语法，有聚合的时候，未聚合的列都要group by。
在Trident中，做类似操作通常是利用aggregate、partitionAggregate、aggregatePersist 结合 groupBy方法来做。

若想对一批数据做多种聚合：
利用chainedAgg和chainEnd配合起来用于对组同时进行多种聚合操作，如下所示：
.chainedAgg()
.partitionAggregate(new Fields("url"), new Count(), new Fields("url_cnt"))
.partitionAggregate(new Fields("byte"), new Sum(), new Fields("bytes_sum"))
.chainEnd()
注意：
chainEnd会对Fields进行过滤，输入的Fields将不再保留。而partitionAggregate不会对Fields过滤的。
如本例中，输出的Fields中只包含url_cnt和bytes_sum，不再包含url和byte。但是其他的列（未经partitionAggregate处理的列）不会影响。。。
通常，partitionAggregate是和groupBy一起用的，过滤后的列只剩下groupBy和partitionAgg生成的列。

<<<<
前边提过，计算的中间过程可以保存在state中。
state有3种：non-transactional，repeat-transactional，opaque-transactional

对State有两种操作------
QueryFunction：查询操作
StateUpdater：更新操作
QueryFunction
QueryFunction的执行过程：将输入传递给batchRetrieve函数，进行相应的处理，返回一个List。
例如：stateQuery(locations, new Fields("userid"), new QueryLocation(), new Fields("location"))
作用是根据用户id查询位置信息，输入的是用户id的list(new Fields("userid"))，输出就是用户位置信息的List(new Fields("location"))。

public class QueryLocation extends BaseQueryFunction {

public List batchRetrieve(LocationDB state, List inputs) {

List ret = new ArrayList();

for(TridentTuple input: inputs)

{

ret.add(state.getLocation(input.getLong(0)));

}

return ret;

}

public void execute(TridentTuple tuple, String location, TridentCollector collector)

{

collector.emit(new Values(location));

}

在QueryFunction里有2个函数------
List batchRetrieve(S state, List input)：根据输入的List，从State中查询或者其他操作，返回一个List
void execute：提交
StateUpdater
在updateState函数中进行更新操作
例如：.partitionPersist(new LocationDBFactory(), new Fields("userid", "location"), new LocationUpdater())

public class LocationUpdater extends BaseStateUpdater {

public void updateState(LocationDB state, List tuples, TridentCollector collector) {

List ids = new ArrayList();

List locations = new ArrayList();

for(TridentTuple t: tuples)

{

ids.add(t.getLong(0)); locations.add(t.getString(1));

}

state.setLocationsBulk(ids, locations);

}

上边的partitionPersist函数是执行更新操作的

五、其他注意事项：

partitionPersist前必须要用partitionBy。

可以调用TridentUtils.fieldsUnion对各个fields求交集。(fieldsUnion与fieldsConcat的区别是，前者去除掉相同的fields)。

================================================================================

Storm中访问HDFS

来自于：大数据技术作者：李刚锐 2014-08-13 11:32

一、 Hadoop客户端配置

hadoop jar打入storm的package或加入storm的lib目录

把core-site.xml, mapred-site.xml, hdfs-site.xml, 从而在storm可以初始化hadoop的configuration

二、 Security验证

把keytab文件传入，转为可以序列化的字节数组，使得可以在spout，bolt之间传递。

BufferedInputStream in = new BufferedInputStream(new FileInputStream(keytabFile));

ByteArrayOutputStream out = new ByteArrayOutputStream(1024);

byte[] temp = new byte[1024];

int size = 0;

while ((size = in.read(temp)) != -1) {

out.write(temp, 0, size);

}

in.close();

this.priniciple = principle;

this.keytabContent = out.toByteArray();

在验证时使用byte数组创建临时文件，验证kerberos

Configuration hadoopConf = new Configuration();

//hadoopConf.set(FS_DEFAULT_NAME_KEY, this.fsName);

hadoopConf.set("hadoop.security.authentication", "kerberos");

UserGroupInformation.setConfiguration(hadoopConf);

//UserGroupInformation.loginUserFromKeytab(principle, keytab);

InputStream keytabFile = new ByteArrayInputStream(this.keytabContent);

File temp = File.createTempFile("stream_sql", "keytab");

temp.deleteOnExit();

IOUtils.copyBytes(keytabFile, new FileOutputStream(temp), 1024, true);

UserGroupInformation.loginUserFromKeytab(this.priniciple, temp.getAbsolutePath());

//remove the temp file

temp.delete();

三、 LZO编码问题

在storm的package中加入hadoop-lzo或者把hadoop-lzo加入storm的lib目录。

设置LD_LIBRARY_PATH（加入HADOOP_HOME/lib/native/Linux-amd64-64)使得可以加载native gpl library。

在storm配置中设置java.library.path,把lzo的路径加入到java.library.path

四、多节点同时读取一个文件多个block

使用和map/reduce相同的方法（InputSplit)

使得InputSplit可以被序列化，使用Wrapper重载readObject和writeObect。

private void writeObject(ObjectOutputStream s) throws IOException {

s.defaultWriteObject();

new ObjectWritable(this.writable).write(s);

}

private void readObject(ObjectInputStream ois) throws Exception {

ois.defaultReadObject();

ObjectWritable obj = new ObjectWritable();

obj.setConf(new JobConf());

obj.readFields(ois);

this.writable = (T) obj.get();

}

public T get() {

return this.writable;

}

创建InputSplit数组

String path = tuple.getString(0);

Configuration hConf = new Configuration();

JobConf jobConf = new JobConf(hConf);

//read the file path

FileInputFormat.addInputPath(jobConf, new Path(path));

jobConf.setInputFormat(TextInputFormat.class);

TextInputFormat input = new TextInputFormat();

input.configure(jobConf);

InputSplit[] splits = input.getSplits(jobConf, 2);

if (splits != null) {

for (InputSplit split: splits) {

collector.emit(new Values(new SerializeWritable(split)));

}

并发处理Split消息

SerializeWritable split = (SerializeWritable)tuple.get(0);

if (split == null) {

return;

}

TextInputFormat input = new TextInputFormat();

JobConf jobConf = new JobConf();

input.configure(jobConf);

try {

RecordReader r = input.getRecordReader(split.get(), jobConf, Reporter.NULL);

LongWritable key = new LongWritable();

Text val = new Text();

while(r.next(key, val)) {

collector.emit(new Values(val.toString()));

}

r.close();

} catch (IOException e) {

e.printStackTrace();

}

================================================================================

读经营十二条第十七天格雷_Jacky张
宁波市北仑格雷塑料制品有限公司读书会张镇第二章经营者必备的三种力量第一种“他力”：得力的副手及全体员工的力量今天在学习的本小节中，稻盛先生告诉我们，经营者除了能够实践“经营十二条”的自力，还必须要具备两种他力。第一种就是“得力的副手及全体员工的力量”。这里首先提到的就是得力的副手。经营如果只是依靠经营者一个人的力量（自力），是有限的，需要有得力的搭档或者副手来分解经营的压力。没有一个人是“完人”，
冬冬书单｜《理财就是理生活》读书笔记整理咨询师冬冬
每月学复盘，一起水滴石穿，日日精进。最近在看艾玛老师的书籍-《理财就是理生活》穷爸爸常说，”我可付不起”这种消极被动的陈述句，而富爸爸则会说，”我怎么才能付得起？”如果要改变月光的状态，坚定必须改变的决心是第一步，对形成正向现金流保持有强烈的愿望，并且相信自己能够改变，这样才能够打破习惯的禁锢。只要你真心想改，没有什么是改不了的。方法如下:一、降低频率平时我们购买生活必需品以外，其他的每一项享受都
觉察日记174：转悦尘ceeport
1.【今日情绪觉察】：今日主要情绪议题及指标：早上出站后，到公司期间，收到了150多条验证短信，手机闪个不停，一直推未读短信，我还以为中病毒了，然后同事告诉我还是那个同事被诈骗的搞出来的事情，把自己的通讯录曝光，所以我们都会逐一被骚扰，打开她的朋友圈，连着几条都是在公开道歉。我看到了信息的不安全。01探究自己为什么内心会起情绪（本来昨天知道这件事觉得就是信息被泄露，没想到后果来的这么快，这种被莫名
url scheme 实现跳转到小程序页面 stand_forever 小程序
获取小程序scheme码，适用于短信、邮件、外部网页等拉起小程序的业务场景。通过该接口，可以选择生成到期失效和永久有效的小程序码参考文档:https://developers.weixin.qq.com/miniprogram/dev/api-backend/open-api/url-scheme/urlscheme.generate.html/***获取urlscheme接口*/publicfu
2024年10大返利App排行榜，全网佣金超高的返利平台推荐直返APP京东优惠券
在数字化时代，返利平台成为了消费者省钱购物的好帮手。本文为您推荐2024年10大返利App，让您在享受购物乐趣的同时，还能获得丰厚的佣金回报。一、直返直返的口号是“返利就用直返”，它强调没有上级赚差价，直接为用户提供商家和消费者之间的综合优惠券返利平台。用户可以在直返上获取自己感兴趣的商品，购买后可以获得一定比例的返利。直返的返利速度快、金额高，深受用户喜爱。通过直返APP买没有上级赚差价，领券还
2022-07-14 坡山文和君
《今年的夏天》今年的夏天地球的空间热气腾腾火红的太阳光彩夺目似乎要把宇宙万物放进烤炉做成美味可口的料理我这颗燥动不安的小心脏伴随着温度直线飙升的肉体发起烧来张开闭合的嘴巴尽说胡话。
依附自我觉察日记本
为了确保自己不被离弃，我们做出很大的牺牲。我们牺牲了自己。我相信依附的情形早在三岁就开始了，并一直延续到青春期，所以我们可以轻易地了解，这对我们怎么看自己会有很大的影响。想象一下，一个小女孩可能放弃自己的积极和坚决的态度来取悦父亲；放弃自己的性欲以免让父亲感到威胁；放弃自己的智慧，好让自己看起来柔顺没有伤害性，而且必须有比她聪明的人让她依靠；忽视自己的艺术天分，好让父亲知道她很注重实际；改掉自己外
代娇代旭(我的继承者们，都是假的！)全文免费在线阅读_我的继承者们，都是假的！完整版免费在线阅读_代娇代旭《我的继承者们，都是假的！》全本免费在线阅读_(代娇代旭)最新章节在线阅读_代娇代旭《我... 全本全集小说
代娇代旭(我的继承者们，都是假的！)全文免费在线阅读_我的继承者们，都是假的！完整版免费在线阅读_代娇代旭《我的继承者们，都是假的！》全本免费在线阅读_(代娇代旭)最新章节在线阅读_代娇代旭《我的继承者们，都是假的！》全文免费阅读_我的继承者们，都是假的！全集在线阅读主角配角：代娇代旭简介：我又收养了一个女儿只因她一语道破我家那个女儿是假的！带新女儿回家那日，历来温顺的女儿割腕抗议儿子也摔碗以死相
想卖莆田鞋怎么找货源，推荐8个莆田鞋货源放心入手可爱的调皮捣蛋鬼
1.莆田市鞋都商贸城作为福建省莆田市历史悠久的鞋业交易集散地，鞋都商贸城拥有3000家莆田鞋厂家，提供丰富的鞋款、价格和材质等信息。在这里，您可以轻松找到优质的莆田鞋货源。2.莆田市朝阳男鞋批发商贸城朝阳男鞋批发商贸城是莆田市的另一家知名鞋类批发市场，提供各种男女鞋、儿童鞋等款式。官网上的货源信息详细全面，便于您挑选所需产品。3.莆田市鞋都批发市场新兴的鞋都批发市场定位于莆田市鞋业的网上交易，汇聚
2022年3月8日日精进曾经的年华
京心❤️达：樊伟伟2022年3月8日日精进日落地真经严格就是爱，放纵既是害油卡目标：80张、完成20张正能量语录每一颗螺丝都有标准每一颗螺丝都是标准今日体验：做事该斩钉截铁的时候就要当机立断，唯唯诺诺最容易坏事，该狠的时候必须要狠，哪怕不做这件事，也不能拖拖拉拉。
点一盏心灯董晓利腊梅
今天是陪学生们晨读经典第一百一十九天，清代《聊斋志异》的作者蒲松龄的落第之后，并没有因为一次的失败而志气消沉，“有心人，天不负，百二秦关终属楚；有志者，事竟成，三千越甲可吞吴”之后成为了他自勉的对联，告诉自己只要自己坚持下去，总会高中的。我也想把这副对联送给自己和孩子们，希望我们合作共赢，过一个轻松快乐的新年！今天早到即学的同学有：5：21孟家乐，5：25袁怡琳、刘吉祥、张怡菲、宋昌衡，5：28王
Redis事务+Lua脚本一枚老菜鸟～啦啦中间件 #Redis lua redis java
Redis的事务使用multi开启事务，但是redis的事务只是对语法的检查，它的事务是非常弱的事务，无法解决运行时的错误，因此实际使用中不要使用redis的事务（也可以根据自己的实际业务场景选择是否使用事务，当然并不建议使用multi的事务方式）Transactionmulti=jedis.multi();multi.set(RS_TRANS_NS+"test1","a1");multi.set
redis 结合Lua脚本实现秒杀、防止超卖小哇666 #redis redis lua
需求：同1商品单个用户限购1件，库存不会超卖1Lua脚本，因可实现原子性操作，这个文件放到resources目录下localuserId=KEYS[1]--当前秒杀的用户IDlocalgoodsId=KEYS[2]--秒杀的商品ID--订单idlocalorderId=ARGV[1]redis.log(redis.LOG_NOTICE,"秒杀商品ID：‘"..goodsId.."’，当前秒杀用户I
mysql数据库底层逻辑
一、数据加载在MySQL中，数据持久化存储在磁盘上，但为了高效访问，MySQL会智能地将数据加载到内存中。Mysql在内存中构建缓冲池,当查询需要访问数据时，MySQL首先检查缓冲池,若数据不在缓冲池：1.从磁盘读取目标页（16KB单位）2.将页加载到缓冲池的空闲页（FreeList）3.将页添加到LRUList的OldSublist头部(LRU分为两个区域：NewSublist（5/8）：最近频
sentinel授权规则
授权规则可以对调用方的来源做控制，有白名单和黑名单两种方式白名单：来源在白名单内的调用者可以访问黑名单：来源在黑名单的调用者不允许访问例如，我们只允许从网关来的请求访问order-service，那么流控应用就填网关名称sentinel是通过RequestOriginParser这个接口的ParseOrigin来获取请求来源的，我们可以实现这个接口，重写方法，尝试从request中获取一个名为or
方南的余生日记2022-09-08 方南一路向东南西北
今天又加班···加班干啥，加班开会···开什么会，批斗大会。没有胖球比赛和LPL比赛和cba的日子里，我重新开始看起了足球比赛，也是不挑，什么意甲英超德甲，CCTV5转播哪场我就看哪场。比较有趣的事，有时候突然看见一个熟悉球员，会很惊讶：天呐！他尽然还在踢，还没有退役嘛？！但转念一想，伊布都还在踢呢···谁能老的过他啊老当益壮，挺好的。
npm报错npm ERR! A complete log of this run can be found in leese233 1024程序员节
网上有很多解决的办法，有的是删除node＿modules从新npminstall.还有的解决办法是删除npm的缓存，但是这个报错还有一种根本性的原因–node版本太低，如果node的版本太低，而项目需求的版本较高，就有可能报这个错误，而且如果版本太低像删除node＿modules从新npminstall也是没有用的，我遇到的就是这种问题，然后将node卸载从新安装高版本npminstall就不会遇
web前端进阶之Javascript设计模式面向对象篇 jia林
前言：在此说明Javascript设计模式所讲内容和知识点来自双越老师（wangEditor富文本开源作者）的视频，内容通俗易懂，受益匪浅，结合自己的学习心得整理成笔记，与大家分享，愿在前端的道路上越走越远.....从“写好代码”到“设计代码”的过程，不仅是技术的提升，更是编程思维的提升，而这其中最关键的就是设计模式，是否理解并掌握设计模式，也是衡量程序员能力的标准之一。学习前提使用过jquery
搜索技巧_野猫学习笔记野猫行天下
自从进入互联网时代，学霸们就越来越霸不了了，因为现在学富五车的人根本干不过会找车的人，你再怎么学富五车，也干不过人家会网络搜索。因此，为了让大家能继续保持学霸的地位，我今天就来跟大家聊聊怎样找车——如何才能利用网络快、准、狠地解决自己的所有问题。01使用专业化、高效的网站什么叫专业化、高效的网站，以了解兰陵王为例，你可以在以下3个网站上搜索，很快就能全方位地了解他（学识力、颜值力、防御力、摧毁力，
关于jvm参数：-XX:SurvivorRatio的坑
关于jvm参数：-XX:SurvivorRatio的坑坑1：-XX:SurvivorRatio表示新生代Eden区域和Survivor区域（From幸存区或To幸存区）的比例，默认为8，表示Eden区域与其中一个Survivor区域的比例为8：1，即Eden区域与From区域与to区域的比例为8：1：1比如设置-Xmn=100m来指定新生代大小的为100M，Eden区域的大小为100M*8/(8+
爆单了！量化北恒私募实盘大赛周一丰不要信！盈利却因为流水不够无法提现，投票助力选号被骗苦不堪言！天权顾问
量化北恒私募实盘大赛周一丰投票项目安全吗?量化北恒私募实盘大赛周一丰积分投票已经亏损被骗了怎么办？警惕!量化北恒私募实盘大赛周一丰十选五项目合法吗——杀猪盘骗局！被骗提不了款!提不了现!出不来金!不要上当!自古有句话讲得好“人善被欺、马善被骑”，现如今也是被骗子利用到了极致，人善就真该被欺骗吗？狡猾的骗子们就利用到了这点，利用同情心、爱心去进行诈骗，宣传公益捐款、爱心慈善打比赛来骗取资金！正常的投
redis秒杀之lua脚本 stand_forever redis redis lua 数据库
Lua脚本核心原理：1.单线程模型：Redis使用单线程处理命令，所有命令按顺序执行。Lua脚本会被视为一个整体任务，执行期间不会被其他命令中断。2.原子性保证：将库存检查、扣减、订单记录等多个操作放在一个脚本中，会连续执行，中间不会有其他客户端操作插入。保证了脚本的原子性。3.无需锁机制：由于Redis的单线程特性，Lua脚本天然避免了并发冲突，无需额外加锁。实现流程：1.首先库存预热：活动开始
BERT 的“池化策略” AI扶我青云志 bert 人工智能深度学习
为什么在BERT的config.json中会出现池化层（pooling）相关的参数。这个问题其实触及了BERT输出与下游任务之间的桥梁设计，也是你理解BERT在实际应用中如何工作的关键环节。首先明确：BERT的原始Transformer模块没有传统的池化层BERT是基于Transformer构建的，Transformer输出的是：sequence_output:Tensorofshape(batc
游戏分析-《第五人格》 M_Yan_9cdd
《第五人格》是网易首款非对称性对抗竞技手游。荒诞哥特画风，悬疑烧脑剧情。刺激的1V4对抗玩法，都将给玩家带来全新的游戏体验。玩家可以选择扮演监管者或求生者，展开激烈的对抗。游戏类型——可玩性竞技类游戏决定了游戏的玩法存在着对立的2方，基本上是建立在平等的对抗关系，并且存在合作的关系。但是《第五人格》是非对称性的，一方很强势但是孤军作战；一方比较缩小，多人合作，这一不对称的关系使玩家以多取胜或者以一
2024京东618什么时候买最划算最便宜省钱(内行人告诉你) 全网优惠分享
随着电子商务的蓬勃发展，京东618购物节已成为消费者们翘首以待的年度盛事。在这场购物狂欢中，如何把握最佳时机，买到最划算的商品，成为了每位消费者都关心的问题。本文将从内行人的角度，为你揭示2024年京东618购物节的最佳购物时机。首先，划重点！今年的淘宝618红包口令是「红包到手66677」，京东的618红包口令是「红包到手599」记得每天去领，因为领的红包大小和你搜索的什么口令有关哦！这两个口令
《佛畏系统》书评：“心流”：最高级的幸福感 9078ffed29c9
你曾经有没有这样的经历？当你在看一部喜欢的书时，可以连续看六七个小时，中间不觉得饿、不觉得累、也不觉得困，反而越看越着迷，被书里的内容深深地吸引着，当你回过神来的时候，发现已经从起床看到了傍晚。或者，当你看一部电影的时候，有那么一刻完全被剧情所吸引，彻底忘了自己，等回过神来才突然发现电影已演完、而自己其实早就很饿或者很想上厕所了。这种美妙又神奇的感觉，用一个概念解释叫作“心流”。那究竟什么是心流呢
完本小说阅读最强巅峰苏柔赵刚_最强巅峰苏柔赵刚网络热门小说六小升
《最强巅峰》主角：苏柔赵刚，简介：结婚七年了……赵刚一边享受，脑子里一边想着鬼主意。待会自己加把劲，肯定能把苏柔拿下！赵刚正胡思乱想间，突然。他愣了一下，皱眉道：“你怎么了？”他不由得看向苏柔，只见苏柔正瞪大美眸，神色慌张地看着厕所的方向。赵刚也下意识地看去，也吓了一跳。林风不知什么时候已经出来了，正站在洗手间门口，悄无声息地看着两人的表演呢！两人顿时停下了动作，苏柔又羞又急，想要推开赵刚。然而赵
自卑与超越：如何正确认识自卑，如何化自卑为动力，不断超越自己枫桥读书
你好，今天为你推荐的书是《自卑与超越》。相信有很多人和我一样，常年深受到自卑情绪影响，痛苦不堪，而无法自拔。由于自卑的影响，有很多机会，都与自己擦肩而过，没有从事自己真心喜欢并感兴趣的工作，也没有跟最爱的人在一起。但看了这本书之后，我对自卑有了新的认识，自卑既是好的，也是不好的。关键在于我们如何看待自卑，以及如何化自卑为动力、不断超越自己。自卑与超越：如何化自卑为动力、不断超越自己？这本书是现代社
逃避雪夜花开
就象在深夜梦要逃避身体就象临渊要逃避坠落的恐惧就象在高空脚下却是空无一物的空虚我要逃避快点逃避若死亡只是个游戏我也要选择死机若逃避也是一种选择我就选择一个自我救赎的开始
感恩日记第199天20190612 屈玉华
早上起来，有点儿流鼻涕，是要感冒的节奏，感恩身体提醒我要好好照顾自己！今天比较热，下午练队形对每个人都是考验，很多人都戴帽子、口罩，而我什么装备也没有，都说我抗晒，是我不喜欢把自己捂起来，至于晒黑，转换角度：难得有晒太阳的机会，补钙了！练了一个多小时，回单位上班，五点半离开办公室，忽然想朋友了，就给她打了个电话，她在加班，六点半才结束，我们就约见面了，想见就约了，不用刻意准备，一切都是那么自然，又
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

big data相关的技术文章

Spark简介

Spark部署

Spark编码

内存计算的优势

一、 Storm

二、 Topology

三、 Storm Trident

四、 关于聚合操作：

五、 其他注意事项：

一、 Hadoop客户端配置

二、 Security验证

三、 LZO编码问题

四、 多节点同时读取一个文件多个block

你可能感兴趣的:(big data相关的技术文章)

四、关于聚合操作：

五、其他注意事项：

四、多节点同时读取一个文件多个block