weixin_30237719

pig基础知识总结

Pig Latin UDF语句

DEFINE 为UDF、流式脚本或命令规范新建别名

Pig Latin命令类型

kill 中止某个MapReduce任务

exec 在一个新的Grunt shell程序中以批处理模式运行一个脚本

run 在当前Grunt外壳程序中运行程序

quit 退出解释器

set 设置Pig选项

模式（Schema）

Pig的一个关系可以有一个关联的模式，模式为关系的字段指定名称和类型。Pig的这种模式声明方式和SQL数据库要求数据加载前必须先声明模式截然不同，Pig设计的目的是用于分析不包含数据类型信息的纯文本输入文件的。但是尽量定义模式，会让程序运行地更高效。

缺点：在查询中声明模式的方式是灵活的，但不利于模式重用。每个查询中维护重复出现的模式会很困难。处理这一问题的办法是写自己的加载函数来封装模式。

SQL数据库在加载数据时，会强制检查表模式中的约束。在pig中，如果一个值无法被强制转换为模式中申明的类型，pig会用空值null代替，显示一个空位。大数据集普遍都有被损坏的值、无效值或意料之外的值，简单的方法是过滤掉无效值：

grunt>good_records = filter recordsby temperature is not null;

另一种技巧是使用SPLIT操作把数据划分成好和坏两个关系，然后在分别进行分析：

grunt> split records intogood_records if temperature is not null,

bad_records if temperature isnull;

grunt> dump good_records;

在Pig中，不用为数据流中的每个新产生的关系声明模式。大多数情况下，Pig能够根据关系操作的输入关系的模式来确定输出结果的模式。有些操作不改变模式，如Limit。而Union会自动生成新的模式。

重新定义一个关系的模式用带as子句的FOREACH…GENERATE操作来定义输入关系的一部分或全部字段的模式

Pig的函数分为计算函数，过滤函数，加载函数和存储函数。

计算函数： AVG, COUNT, CONCAT, COUNTSTAR,DIFF, MAX, MIN, SIZE, SUM, TOKENIZE

过滤函数：IsEmpty

加载/存储函数：PigStorage,BinStorage, BinaryStorage, TextLoader, PigDump

内连接的实现：

COGROUP，inner和flatten组合使用相当于实现了内连接：

G = COGROUP A by $0 innner, B by $1inner;

H = foreach G generate flatten($1),flatten($2)

// H和join A by $0, B by $1相同

foreach…generate…
用于重新生成模式中的数据名和数据类型。默认保持原有名字，但是如果存在表达式，则无数据名，只有数据类型；而两个不兼容类型计算后，生成数据类型unknown，必须在generate 变量后使用as关键词定义别名；

#用于map查找；

.用于tuple（元组）投影；

+对于bag不适用；

下面的语句将执行不了

A= load 'foo'as (x:chararray, y:int, z:int);

B = group A by x; -- produces bag Acontaining all the records for a given value ofx

C = foreach B generate SUM(A.y + A.z);

因为A.y 和 A.z都是bag，符号+对于bag不适用。

正确的做法如下

A= load 'foo'as (x:chararray, y:int, z:int);

A1 = foreach A generate x, y + z as yz;

B = group A1 by x;

C = foreach B generate SUM(A1.yz);

GROUP

Group后返回一个包结构，输出两个字段：key和包含聚集记录的bag。Key的别名为group，bag名为操作表名。

group Table all 是将所有数据归为一组，名为all，{所有数据}

按多个字段group，就是按一个tuple，如group table by（a1,a2）。则返回结构中，key为“group:（a1:int,a2:int）”，而bag名为操作表名。这里key是按a1和a2组合值进行分组，实际存在的组合值，进行归并。不是先按a1,再按a2。

文档a.txt:

a 12 3 4.2 9.8

a 30 5 3.5 2.1

b 79 9 - -

a 79 9 2.6 6.2

a 12 5 7.7 5.9

a 12 3 1.4 0.2

进行pig

A =LOAD'a.txt'AS(col1:chararray, col2:int, col3:int,col4:int, col5:double, col6:double);

B =GROUPA BY(col2, col3, col4);

C =FOREACH B GENERATE group, AVG(A.col5), AVG(A.col6);

DUMPC;

((1,2,3),2.8,5.0)

((1,2,5),7.7,5.9)

((3,0,5),3.5,2.1)

((7,9,9),2.6,6.2)

按照A的第2、3、4列，对A进行分组。pig会找出所有第2、3、4列的组合，并按照升序进行排列，然后将它们与对应的包A整合起来，得到如下的数据结构：

1	B: {group: (col2: int,col3: int,col4: int),A: {col1: chararray,col2: int,col3: int,col4: int,col5: double,col6: double}}

组合（1，2，3）对应了两行数据，组合（7，9，9）也对应了两行数据:

((1,2,3),{(a,1,2,3,4.2,9.8),(a,1,2,3,1.4,0.2)})

((1,2,5),{(a,1,2,5,7.7,5.9)})

((3,0,5),{(a,3,0,5,3.5,2.1)})

((7,9,9),{(b,7,9,9,,),(a,7,9,9,2.6,6.2)})

Group all就是整体分成一个组，bag名为all

--double_distinct.pig

divs = load 'NYSE_dividends'as(exchange:chararray, symbol:chararray);

grpd = group divs all;

uniq = foreach grpd{

exchanges = divs.exchange;

uniq_exchanges = distinct exchanges;

symbols = divs.symbol;

uniq_symbols = distinct symbols;

generate COUNT(uniq_exchanges), COUNT(uniq_symbols);

};

注意：按all打包，作用于包grpd中每一行，是用的divs的去重，统计出一个数，放入包中。因为all包中已经不能用了

所以，要count当前表的列数，就需要，先t2=group table1 all，然后在进行foreach t2generate count(table1.col).注意，此时的table1是bag名字，不是表名。

数列数，要先group新表，然后用用bag名字统计。

cogroup:

按多个关系中的字段进行分组。分别打包成bag，共同组成一个key的group。

按指定的共有列，分别各自组成一个bag，放到一个group组中。C = cogroup A by id, B by id;那么，id的每个值作为group的key，其后是A，B各自的bag，保存对应此key的所有记录,各自的一个bag保存对应key的所有记录，每个记录是一个元组，两个bag作为key的group。

注意：key值为null的数据都被归为同一类，这一点和group相同，和join不同。

假设有以下两个数据文件：

[root@localhost pig]$ cat a.txt

uidk 12 3

hfd 132 99

bbN 463 231

UFD 13 10

[root@localhost pig]$ cat b.txt

908 uidk 888

345 hfd 557

28790 re 00000

现在我们用pig做如下操作及得到的结果为：

grunt> A = LOAD 'a.txt' AS (acol1:chararray, acol2:int, acol3:int);

grunt> B = LOAD 'b.txt' AS (bcol1:int, bcol2:chararray, bcol3:int);

grunt> C = COGROUP A BY acol1, B BY bcol2;

grunt> DUMP C;

(re,{},{(28790,re,0)})

(UFD,{(UFD,13,10)},{})

(bbN,{(bbN,463,231)},{})

(hfd,{(hfd,132,99)},{(345,hfd,557)})

(uidk,{(uidk,12,3)},{(908,uidk,888)})

join

join是等值连接，即自然连接。Pig只支持等值连接，非等值连接用cross。

如

daily = load 'NYSE_daily'as(exchange, symbol, date, open, high, low, close,

volume, adj_close);

divs =load 'NYSE_dividends' as (exchange, symbol, date, dividends);

jnd =join daily by (symbol, date), divs by (symbol, date);

连接后，每个表各自的属性列，用”::”指定，如daily::symbol。非共有属性可省略。

外连接，outer join：

分 left，right，full，共3种。用null补充缺失字段。

左外连接左边的数据全部保留，其他填充null

右外连接右边的数据全部保留，其他填充null。

全外连接Full out join，两边全保留。Full关键字不可省略。

自身和自身join，要加载两次

--leftjoin.pig

daily = load 'NYSE_daily'as(exchange, symbol, date, open, high, low, close,

volume, adj_close);

divs =load 'NYSE_dividends' as (exchange, symbol, date, dividends);

jnd =join daily by (symbol, date) left outer, divs by (symbol, date);

自身加载两次：

--selfjoin.pig

-- For each stock, find all dividends thatincreased between two dates

divs1 = load 'NYSE_dividends' as (exchange:chararray, symbol:chararray,

date:chararray, dividends);

divs2 = load 'NYSE_dividends' as (exchange:chararray, symbol:chararray,

date:chararray, dividends);

jnd = join divs1 by symbol, divs2 by symbol;

increased = filter jnd by divs1::date

divs1::dividends

数据多的表（或叫关系），放右边！！降低内存使用率，调高效率。

JOIN用到的key所对应的记录最多的关系(relation)排在最后，如：

D = JOIN A BY col1, B BY col1, C BY col1;

因为，pig进行join过程：map阶段标记每个记录的map，按key进行shuffle，相同值收集到一起，按map标记排序，左边输入数据先放入缓存，然后右边进来后，每一条去交叉运算，逐条比对。生成一条。

Pig函数使用：

自身udf注册才能用。引用加包名和函数

divs = load 'NYSE_dividends' as (exchange:chararray, symbol:chararray,

date:chararray, dividends:float);

backwards = foreach divsgenerate

org.apache.pig.piggybank.evaluation.string.Reverse(symbol);

define 定义别名，调用方便

--define_constructor_args.pig

define convertcom.acme.financial.CurrencyConverter('dollar', 'euro');

divs = load 'NYSE_dividends' as (exchange:chararray, symbol:chararray,

date:chararray, dividends:float);

backwards = foreach divsgenerate convert(dividends);

调用python的UDF，必须声明using jython(用这个编译)，并给定一个命名空间 as ball。即

调用的时候用ball.fuction(int param1,floatparam2)

这里，jython.jar解释器所在路径，必须提前放到类路径中，设置PIG_CLASSPATH指定。

Java函数调用：

Pig正常调用java函数，也是注册后，define别名调用，同上。如果函数有形参，在define时需要声明，叫构造函数参数，特殊的是define时不近给出形参，还要给出输出类型。多个形参在调查中？

静态java函数，pig用invoker调用。有无参数都可，但pig不支持函数返回值重载，因为每种类型有一个对应调用方法，InvokeForInt、InvokeForLong、InvokeForFloat、InvokeForDouble、InvokeForString

需要两个构造参数，一个完整包名，类名，函数名；另一个是参数。

如

托管java中的静态函数（效率较低）

--invoker.pig

define hexInvokeForString('java.lang.Integer.toHexString', 'int');

divs =load 'NYSE_daily' as (exchange, symbol, date, open, high, low,

close, volume, adj_close);

nonnull = filter divs by volume is not null;

inhex = foreach nonnull generate symbol,hex((int)volume);

如果函数的参数是一个数组，那么传递过去的是一个bag

define stdevInvokeForDouble('com.acme.Stats.stdev', 'double[]');

A = load 'input' as (id: int, dp:double);

B = group A by id;

C = foreach B generate group, stdev(A.dp);

Pig 正则表达式：

A =LOAD'a.txt'AS(col1: int, col2: chararray);

B =FILTER A BYcol2 matches '.*//.*\\.qq\\.com/.*';

DUMPB;

Matches对 col2正则匹配，使用ava格式的正则表达式匹配规则。

. 表示任意字符，* 表示字符出现任意次数；\. 对 . 进行了转义，表示匹配 . 这个字符；/ 就是表示匹配 / 这个字符。

注意，引号中转义字符 \ 需要两个才能表示， \\. 就是正则 \. ，即匹配 . 字符。所以匹配数字应该用这种写法：\d匹配数字，用\\d），B = FILTER A BY (col matches '\\d.*');

Pig中map数量通过设置输入文件大小最小值，来限制

如：set mapred.min.split.size 2147483648; set的参数的单位是字节，所以2G=2*1024*1024*1024=2147483648。小于2G的文件将被作为一个split输入，从而一个小于2G的文件将只有一个map。假设Pig job是一个纯map的job，输出数量会明显减少。

转载于:https://www.cnblogs.com/cl1024cl/p/6205441.html

成为 Web3 开发者：why and how
作者丨Pignard首先介绍一下什么是Web3。2014年，以太坊联合创始人GavinWood首次提出“Web3”的概念，给互联网需要过多信任的问题提供了一种解决方案。不可否认，中心化网络已经帮助数十亿人融入了互联网，并在其上创建了稳定、可靠的基础设施。但与此同时，少数中心化巨头几乎垄断了互联网，甚至可以为所欲为。而Web3通过区块链、加密货币和NFT将权力以所有权的形式归还用户。Web3如今已成
软件工程师（一）玉茗685 笔记经验分享
目录计算机系统知识总结一、计算机系统基础知识（一）中央处理单元（CPU）（二）数据表示（三）海明码程序设计语言基础知识总结一、程序设计语言概述（一）基本概念（二）基本成分二、语言处理程序基础（一）编译过程（二）确定的有限自动机和不确定的有限自动机（三）语法分析方法计算机系统知识总结计算机系统知识是计算机科学的基础，涵盖了从硬件到软件的各个方面。本文将对计算机系统知识的第一章内容进行总结，包括计算机
深入探讨Web应用开发：从前端到后端的全栈实践禁默前端
目录引言1.Web应用开发的基本架构2.前端开发技术HTML、CSS和JavaScript前端框架与库响应式设计与移动优先3.后端开发技术Node.js（JavaScript后端）Python（Flask和Django）RubyonRailsJava（SpringBoot）4.数据库选择与管理关系型数据库（SQL）非关系型数据库（NoSQL）5.API设计与开发RESTfulAPIGraphQL6
微服务网关，如何选择？淡黄的Cherry 闲聊云原生
什么是API网关API网关（APIGateway）是微服务架构中的一个关键组件，它充当了客户端与后端服务之间的中间层。其主要功能包括请求路由、协议转换、负载均衡、安全认证、限流熔断等。通过API网关，客户端无需直接与多个微服务交互，而是通过统一的入口访问后端服务，从而简化了系统的复杂性。API网关的主要功能路由功能：路由是微服务网关的核心能力。通过路由功能微服务网关可以将请求转发到目标微服务。在微
通俗易懂 serverless 架构、微服务架构和云原生架构，并简单代码 Ai君臣架构架构云原生 serverless
文章目录1serverless架构、微服务架构和云原生架构区别1.Serverless架构示例：AWSLambda+APIGateway2.微服务架构示例：Flask微服务3.云原生架构示例：Docker和Kubernetes2Kubernetes中管理多个副本和流量两个关键组件1.Deployment2.Service负载均衡流量管理1serverless架构、微服务架构和云原生架构区别别用代码
KubeSphere 与 Pig 微服务平台的整合与优化：全流程容器化部署实践小盒子_spring 字节与烟火微服务 KubeSphere Pig微服务平台 Jenkins流水线 SonarQube代码审查 Ingress DevOps
一、前言近年来，为了满足越来越复杂的业务需求，我们从传统单体架构系统升级为微服务架构，就是把一个大型应用程序分割成可以独立部署的小型服务，每个服务之间都是松耦合的，通过RPC或者是Rest协议来进行通信，可以按照业务领域来划分成独立的单元。但是微服务系统相对于以往的单体系统更为复杂，当业务增加时，服务也将越来越多，服务的频繁部署、监控将变得复杂起来，尤其在上了k8s以后会更加复杂。那么有没有一款全
第二章：CSS的复合选择器卿言卿语 CSS css 前端 html
目录一、并集选择器二、交集选择器三、后代选择器四、子代选择器五、兄弟选择器六、属性选择器七、伪类选择器1.动态伪类2.结构伪类3.否定伪类4.UI伪类5.目标伪类6.语言伪类八、伪元素选择器九、选择器的优先级十、总结一、并集选择器同时选择多个选择器，并给它们添加相同的样式，使用逗号（,）隔开。.cat,.pig,.cattle,.dog{font-size:80px;background-colo
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
导致格式错误的 Lambda 代理响应的原因以及如何修复它 zqhdz米时空汇编
当人们尝试使用AWSAPIGateway和AWSLambda构建无服务器应用程序时，经常出现的一个问题是_由于配置错误而执行失败：Lambda代理响应格式错误。_没有什么比通用错误消息更糟糕的了，它们不会告诉您解决问题所需的任何内容，对吧？AWS并不是以其错误消息设计而闻名，如果甚至可以这样称呼它的话，更不用说为您提供解决问题的方法了。那么如何修复这个Lambda错误以及是什么原因造成的呢？花椒壳
【第一章】第三节病床上的白布桃小多
“我总在每一个黑夜想你，嘲笑自己傻得可以---没懂得珍惜，那么轻易丢了你”——电话铃声响了！诗梦涵看到电话上赫然显示高胜的备注，心情轻松了很多，那是个猪头的头像，上面备注的是GGpig。她拿起手机，放在耳边——“喂？你是猪吗，还没到傍晚呢！你在干嘛？”电话里传来急促的跑步和呼吸声，对方没有说话。“？？？高胜？”诗梦涵感觉越来越不好，脑袋的疑团越来越大，夹杂着她愈发无法自圆其说的好奇心，一秒、两秒…
MFC 得到本机IP和设置本机的IP zq4132
ULONGWINAPIGetAdaptersAddresses( __in ULONGFamily, __in ULONGFlags, __in PVOIDReserved, __inout PIP_ADAPTER_ADDRESSESAdapterAddresses, __inout PULONGSizePointer);第一个参数Family是网络协议族，用户可以指定
备忘录模式（Memento）疯狂的阿吉 c++设计模式设计模式
目录前言一、备忘录模式总结1、模式意图2、参与者3、结构、协作、适用性及效果二、备忘录模式简单示例1、用例描述2、示例代码总结前言本周五参加了Memento（备忘录）模式研讨会，本文的目的是对这个模式的总结和分享，希望对需要学习这个设计模式的同学有所帮助。本文一共分为两个部分，第一个部分是备忘录模式的基础知识总结；第二个部分是分享备忘录模式简单示例。一、备忘录模式总结1、模式意图在不破坏封装性的前
Animal farm（125）云手a
Betweenpigsandhumanbeingstherewasnot，andtheyneednotbe，anyclashofinterestswhatever.Theirstrugglesandtheirdifficultieswereone.Wasnotthelabourproblemthesameeverywhere?Hereisbecameapparent【adj.显然的；表面上的】th
简单聊聊爱彼高仿机械表市场价多少钱广州潮品汇
爱彼（AudemarsPiguet）作为瑞士钟表制造业中的顶级品牌，其精湛的工艺与卓越的品质一直以来都备受钟表爱好者们的瞩目。然而，正因为其昂贵的售价，许多钟表爱好者望而却步。幸运的是，现在有了爱彼高仿机械表，使得更多钟表迷能够拥有这一令人向往的品牌。微信:52226813(下单赠送精美礼品)爱彼高仿机械表市场价多少钱?市场上关于爱彼高仿机械表的价格高低不一，非常的混乱，有卖2000多，3000多
Linux安装R包TwoSampleMR遇见的报错 xbinbzy
最近一位老友在倒腾GWAS的研究，发现R包TwoSampleMR用于pQTL的分析，让我在Linux系统上帮忙安装下，根据网页的安装提示进行操作（https://github.com/MRCIEU/epigraphdb-pqtl/），在操作过程中遇见了一些报错和实践的解决方案，在此文特此记录：library(devtools)install_github("MRCIEU/TwoSampleMR")
Hadoop组件静听山水 Hadoop hadoop
这张图片展示了Hadoop生态系统的一些主要组件。Hadoop是一个开源的大数据处理框架，由Apache基金会维护。以下是每个组件的简短介绍：HBase：一个分布式、面向列的NoSQL数据库，基于GoogleBigTable的设计理念构建。HBase提供了实时读写访问大量结构化和半结构化数据的能力，非常适合大规模数据存储。Pig：一种高级数据流语言和执行引擎，用于编写MapReduce任务。Pig
单细胞转录组和表观组学图谱揭示效应、记忆和耗竭CD8 T细胞在不同细胞命运分化中的共享生物学特征（下篇） Davey1220
文章信息文章题目：Longitudinalsinglecelltranscriptionalandepigeneticmappingofeffector,memory,andexhaustedCD8Tcellsrevealssharedbiologicalcircuitsacrossdistinctcellfates期刊：bioRxiv链接：https://www.biorxiv.org/cont
【NSSCTF】刷题记录——[SWPUCTF 2021 新生赛]系列（CRYPTO篇） SebastianH_ 安全
新手小白，开启CTF刷题之路（持续更新）此处主要在NSSCTF平台（NSSCTF|在线CTF平台）上开展刷题[SWPUCTF2021新生赛]pigpig附件如下：刚好前段时间刷到到过一篇文章讲猪圈密码的，直接对着看就行[CTF]猪圈密码_ctf猪圈密码_神龙云计算的博客-CSDN博客flag是WHENTHEPIGWANTTOEAT[SWPUCTF2021
记录k8s证书过期的证书更新安顾里 kubernetes kubernetes linux 服务器容器微服务
root@master01:~#kubectlgetnodesE082810:29:54.48148947445memcache.go:265]couldn'tgetcurrentserverAPIgrouplist:Get"https://192.168.91.150:6443/api?timeout=32s":tls:failedtoverifycertificate:x509:certifi
【目标检测数据集】家禽家畜检测数据集25234张7类VOC+YOLO格式（鸡鸭鹅牛羊猪狗数据集）熬夜写代码的平头哥∰ 数据集目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：25234标注数量(xml文件个数)：25234标注数量(txt文件个数)：25234标注类别数：7标注类别名称:["cattle","chicken","dog","duck","goat","goose","pig"
VueDraggablePlus的学习与问题解决揽昕学习 vue.js 前端
目录VueDraggablePlus的使用插件APIgroup属性拖拽分组delay响应时间disabled启用禁用scroll是否允许滚动animation过渡效果handle鼠标在指定元素上才允许拖动filter排除步允许拖动的元素chosenClass选中元素的样式ghostClass目标位置占位符的样式clone拷贝实现常用菜单功能dragClass拖拽项类名更多api事件函数move自定
推荐一篇学习SQL 的文章 @Carey java零基础开始 sql 数据库
学习java，当然避不开数据库的知识，个人认为好学好理解的一篇文章，推荐给大家SQL语法基础知识总结|JavaGuide「Java学习+面试指南」一份涵盖大部分Java程序员所需要掌握的核心知识。准备Java面试，首选JavaGuide！https://javaguide.cn/database/sql/sql-syntax-summary.html#sql-%E8%AF%AD%E6%B3%95希
Linux并行gzip压缩工具pigz 冰封飞飞
由于项目原因，经常需要压缩和解压缩大量的数据。10G规模以上，而默认tar打包和系统默认的压缩工具是单线程的。服务器多核CPU完全利用不起来，瓶颈在CPU的处理上面。于是使用了pigz这个可以利用多核的并行压缩工具。效果显著，如果你也需要频繁压缩大量的数据，可以尝试一下这个软件。1.安装centos&redhat系yuminstallpigzdebian&ubuntu系apt-getinstall
【鹅妈妈童谣】13.To market, to market 欣然小时光
日常生活中总少不了带孩子去超市逛逛，今天就为大家介绍一首关于去市场的鹅妈妈童谣《Tomarket,tomarket》。【童谣】Tomarket,tomarket,tobuyafatpig,Homeagain,homeagain,jiggety-jig.Tomarket,tomarket,tobuyafathog,Homeagain,homeagain,jiggety-jog.去市场，去市场，去买一
使用pyGenomeTracks可视化hi-c数据生信修炼手册
欢迎关注”生信修炼手册”!可视化是数据分析中非常重要的一个环节，对于NGS分析数据的可视化，最常用的就是各种基因组浏览器了，既有UCSC,GBrowse等基于web的基因组浏览器，也有igvtools等本地化的图形界面软件。对于Hi-C数据，在前面的文章中也介绍过基于web的WashUEpigenomeBrowser基因组浏览器和本地化的juicebox软件。熟练掌握其中一个软件的用法就可以满足大
Java高级技术day75：Zookeeper与Dubbo 开源oo柒
一、Zookeeper的介绍1.Zookeeper介绍：顾名思义zookeeper就是动物园管理员，他是用来管hadoop（大象）、Hive(蜜蜂)、pig(小猪)的管理员，ApacheHbase和ApacheSolr的分布式集群都用到了zookeeper；Zookeeper:是一个分布式的、开源的程序协调服务，是hadoop项目下的一个子项目。他提供的主要功能包括：配置管理、名字服务、分布式锁、
Google Pigweed 出现在树莓派RP2350 上！上海晶珩EDATEC 树莓派树莓派5 Raspberry Pi Raspberry Pi 5 工业计算机
我们热爱GooglePigweed！Pigweed是谷歌在2020年推出的一个开源项目。我们喜欢它，是因为它可以帮助程序员和开发者团队，为使用微控制器(例如新型的RP2350及其前身RP2040)的嵌入式设备构建出色的软件。我们还对这里有趣的产品名称非常感兴趣：很高兴我们的PicoW在社区中俗称为“派牛。”谷歌基于新的PigweedSDK构建的演示，该演示使用了Pimoroni的Enviro+Pa
Java基础知识总结2 Pikl
PATH环境变量PATH环境变量。作用是指定命令搜索路径，在命令行下面执行命令如javac编译java程序时，它会到PATH变量所指定的路径中查找看是否能找到相应的命令程序。我们需要把jdk安装目录下的bin目录增加到现有的PATH变量中，bin目录中包含经常要用到的可执行文件如javac/java/javadoc等待，设置好PATH变量后，就可以在任何目录下执行javac/java等工具了。4，
美人猪beauty pig 我喜欢花衣裳
娟儿，你到里屋坐着，先别出来，乖啊。她叹叹气，半蹲下来看着眼前这个5岁的孩子，一只手心里握着孩子的小手，一只手抚摸着孩子的头，话说完，便转身掩上门，脚步声越来越轻，等到快听不见的时候，听见哪里的窗"哔咔"一声打开了，大概过了一分多钟以后，轰隆一声，对尚娟的之后的人生造成巨大的影响。当有人提起婚姻这两个字，她不自觉想闭上眼的恐惧，睁开眼仿佛又回到5岁的那天，她听到巨大的响声，打开半掩的门，走到客厅，
方的ScalersTalk第四轮新概念朗读持续力训练Day66 20191015 daisy境界的彼方
练习材料：Mr.JamesScotthasagarageinSilburyandnowhehasjustboughtanothergarageinPinhurst.PinhurstisonlyfivemilesfromSilbury,butMr.Scottcannotgetatelephoneforhisnewgarage,sohehasjustboughttwelvepigeons.Yester
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，