新世界的海贼

使用PIG Latin 进行编程，Pig Latin语言详解

使用PIG Latin 进行编程

在这篇文章中，我们将介绍以下几点：

安装、配置PIG Latin
PIG Latin关键字及数据类型
上载及下载数据至HDFS
载入文本数据
存储数据
排序
逐行排序
过滤
分组
剔除重复项
Cross Join
Join
其他

安装、配置PIG Latin

PIG 并不依赖安装路径，换句话说你可以将 PIG 安装在任意路径。但需要注意一点，正如 Apache 的项目是运行在 Linux/Unix 环境上，PIG 也是需要运行在装有 Linux\Unix 环境的主机上，在你正式安装PIG Latin之前，你需要确保你的设备上已经安装了Java，并正确配置了JAVA_HOME。你可以使用命令

java –version

以及

jps

检测你自己的系统是否已经安装了Java并且配置正确。在我们的示例中，我们使用了包含三个节点的集群，以下是集群各节点的信息。

主机名	IP 地址	任务
ISCASTest 01	192.168.145.100	NameNode, SecondaryNameNode, JobTracker
ISCASTest 02	192.168.145.101	TaskTracker, QuorumPeerMain, DataNode
ISCASTest 03	192.168.145.102	TaskTracker, QuorumPeerMain, DataNode

我们计划将 PIG 安装在 ISCASTest 01 节点上，假如你自己的资源足够多的话，建议将它安装在与 hadoop 无关的节点上，并将该节点加入到 hadoop 集群的网络中。这样做的好处显而易见，因为 namenode 需要承担整个集群的管理，所以应该避免由于自己的误操作而导致整个集群崩溃。另外不建议放置于 DataNode 的原因也是显而易见，如果集群需要不停的运行 Map/Reduce 任务，那么DataNode 就会承担繁重的数据处理任务。

不过在我们的实验环境下，因为资源有限，所以我们将 PIG 安装到了 NameNode 上，也就是 ISCASTest 01 节点上。你需要先从 apache 的官网上下载 PIG 安装包，并且将它解压在合适的位置。

tar pig-0.12.1.tar.gz -C /home/hadoop/

安装好之后，需要配置JAVA环境，因为 PIG 依赖 JVM 环境。所以你可以通过修改 /etc/profile 或者 $PIG_HOME/bin/pig 达到这一目的。如果修改 /etc/profile 你需要在末尾增加一行：

export JAVA_HOME=/usr/java/jdk1.8.0_05/

并使用 source /etc/profile 使设置生效。或者，另一种方法是修改 bin/pig 文件。在这段代码前加入 JAVA_HOME。

# some Java parameters
JAVA_HOME=/usr/java/jdk1.8.0_05/ #添加内容

if [ "$JAVA_HOME" != "" ]; then
    #echo "run java in $JAVA_HOME"
    JAVA_HOME=$JAVA_HOME
fi

if [ "$JAVA_HOME" = "" ]; then
    echo "Error: JAVA_HOME is not set."
    exit 1
fi

JAVA=$JAVA_HOME/bin/java
JAVA_HEAP_MAX=-Xmx1000m

如果在本地运行PIG，可以使用如下命令启动伪分布式模式：

pig -x local

如果在集群上运行PIG，可以使用如下命令启动分布式模式：

pig -x mapreduce

当你启动了集群模式，很有可能会收到类似的错误消息：

which: no hadoop in (/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/usr/java/jdk1.8.0_05//bin/:/usr/java/jdk1.8.0_05//jre//bin/:/home/hadoop/bin)
2014-05-30 14:21:33,863 [main] INFO  org.apache.pig.Main - Apache Pig version 0.12.1 (r1585011) compiled Apr 05 2014, 01:41:34
2014-05-30 14:21:33,864 [main] INFO  org.apache.pig.Main - Logging error messages to: /home/hadoop/pig-0.12.1/bin/pig_1401430893858.log
2014-05-30 14:21:33,897 [main] INFO  org.apache.pig.impl.util.Utils - Default bootup file /home/hadoop/.pigbootup not found
2014-05-30 14:21:34,024 [main] ERROR org.apache.pig.Main - ERROR 4010: Cannot find hadoop configurations in classpath (neither hadoop-site.xml nor core-site.xml was found in the classpath). If you plan to use local mode, please put -x local option in command line
Details at logfile: /home/hadoop/pig-0.12.1/bin/pig_1401430893858.log

通常出现这样消息的原因，是因为PIG Latin没有找到Hadoop的位置。所以你需要在环境中增加Hadoop的目录

HADOOP_HOME=/home/hadoop/hadoop/
HADOOP_BIN=${HADOOP_HOME}/bin/

export PATH=${PATH}:${JAVA_BIN}:${JRE_BIN}:${HADOOP_BIN}

为了方便，你还可以把PIG Latin的目录也加入至PATH中

PIG_HOME=/home/hadoop/pig/
PIG_BIN=${PIG_HOME}/bin

export PATH=${PIG_BIN}

并使用source命令，更新环境，如你将这些配置写入在.bashrc中

source .bashrc

之后再次启动，就应该不会出现这样的报错了。当你启动 PIG 后，就会进入到 PIG 脚本模式，类似于使用 python 进入 python 脚本命令模式，而退出 PIG 脚本模式的方法是使用 quit 命令。不过为了确认 pig 是否运行在 MapReduce 模式下，可以使用命令确认集群的状况。

hadoop dfsadmin -report

如果没有意外，你应该能收到这样的信息：

Configured Capacity: 75117592576 (69.96 GB)
Present Capacity: 56736980992 (52.84 GB)
DFS Remaining: 55587463168 (51.77 GB)
DFS Used: 1149517824 (1.07 GB)
DFS Used%: 2.03%
Under replicated blocks: 20
Blocks with corrupt replicas: 0
Missing blocks: 0

-------------------------------------------------
Datanodes available: 2 (2 total, 0 dead)

Name: 192.168.145.102:50010
Decommission Status : Normal
Configured Capacity: 37558796288 (34.98 GB)
DFS Used: 574758912 (548.13 MB)
Non DFS Used: 9190391808 (8.56 GB)
DFS Remaining: 27793645568(25.88 GB)
DFS Used%: 1.53%
DFS Remaining%: 74%
Last contact: Wed Jun 04 16:39:49 CST 2014


Name: 192.168.145.101:50010
Decommission Status : Normal
Configured Capacity: 37558796288 (34.98 GB)
DFS Used: 574758912 (548.13 MB)
Non DFS Used: 9190219776 (8.56 GB)
DFS Remaining: 27793817600(25.89 GB)
DFS Used%: 1.53%
DFS Remaining%: 74%
Last contact: Wed Jun 04 16:39:49 CST 2014

接下来，你需要准备测试所需的数据。这里的例程都是从 Alan Gates 的书中《Programming Pig》中获得的，你可以直接下载数据和代码，亦或者这本书的电子版。

当你把数据从网上下载之后，你需要将这些数据再次上传到 Hadoop 集群上，使用命令：

hadoop fs -put NYSE_dividends /NYSE_dividends

该命令表示将当前目录下的文件（$example/data/NYSE_dividends）上传至 HDFS 文件系统下的根目录中。上传成功后，你可以使用该命令查看

hadoop fs -ls /

输出的结果中应该有你已经上传的文件名字

-rw-r--r--   3 hadoop  supergroup      17697 2014-06-04 16:21 /NYSE_dividends

接下来我们进入到 PIG 的脚本命令模式：

pig -x mapreduce

执行如下的命令

-- 从文件中读取数据, 并且声明该文件中包含4列数据
dividends = load '/NYSE_dividends' as (exchange, symbol, date, dividend);
-- 将列按照 symbol 进行分组
grouped = group dividends by symbol;
-- 计算每一组的平均数
avg = foreach grouped generate group, AVG(dividends.dividend);
-- 输出结果，并将数据存入 average_dividend 中
store avg into '/average_dividend';

计算完毕后，你可以在PIG的脚本模式下使用命令 ls / 查看生成了什么

hdfs://ISCASTest01:8020/NYSE_dividends     17697
hdfs://ISCASTest01:8020/average_dividend

再 cd 进入到 /average_dividend 目录下，并使用 ls 命令可以查看生成的文件

hdfs://ISCASTest01:8020/average_dividend/_SUCCESS  0
hdfs://ISCASTest01:8020/average_dividend/_logs  
hdfs://ISCASTest01:8020/average_dividend/part-r-00000      1863

之后使用 cat ./part-r-00000 可以查看数据的计算结果，能看到如下内容

CA      0.04
CB      0.35
CE      0.04
CF      0.1
CI      0.04
CL      0.43
CM      0.7779999999999999
CP      0.22125
CR      0.2
CS      0.096
CV      0.23
CW      0.08
CAE     0.02675
CAG     0.1925
CAH     2.083
CAS     0.06
CAT     0.42
CBC     0.05
CBD     0.15733333333333333
CBE     0.25
CBK     0.06
CBL     0.145
CBS     0.05
CBT     0.18
CBU     0.22

当看见这些数据后，恭喜你，你已经运行了你的第一个 PIG 程序。

PIG Latin关键字及数据类型

PIG Latin 包含以下关键字，除了UDF以外，其余部分是大小写不敏感。

Order	Keywords
A	and, any, all, arrange, as, asc, AVG
B	bag, BinStorage, by, bytearray
C	cache, cat, cd, chararray, cogroup, CONCAT, copyFromLocal, copyToLocal, COUNT, cp, cross
D	%declare, %default, define, desc, describe, DIFF, distinct, double, du, dump
E	e, E, eval, exec, explain
F	f, F, filter, flatten, float, foreach, full
G	generate, group
H	help
I	if, illustrate, inner, input, int, into, is
J	join
K	kill
L	l, L, left, limit, load, long, ls
M	map, matches, MAX, MIN, mkdir, mv
N	not, null
O	or, order, outer, output
P	parallel, pig, PigDump, PigStorage, pwd
Q	quit
R	register, right, rm, rmf, run
S	sample, set, ship, SIZE, split, stderr, stdin, stdout, store, stream, SUM
T	TextLoader, TOKENIZE, through, tuple
U	union, using
V, W, X, Y, Z

此外，PIG Latin还有自己的计算符。

操作符	说明	示例
+	加法运算符	addition = FOREACH tables GENERATE dataItem+1;
-	减法运算符	substruction = FOREACH tables GENERATE dataItem-1;
	乘法运算符	multiplication = FOREACH tables GENERATE dataItem10;
/	除法运算符	division = FOREACH tables GENERATE dataItem/10;
%	求模运算	modulo = FOREACH tables GENERATE dataItem%10;
?:	条件运算符	X = FOREACH A GENERATE f2, (f2==1?1:0);
AND	布尔运算符	PIG Latin不支持布尔类型，但支持布尔运算。
OR	布尔运算符	在条件选择中，可以使用这些运算符。
NOT	布尔运算符	X = FILTER A BY (f1==8) OR (NOT (f2+f3 > f1));
==	对比运算符	X = FILTER A BY (f1 == 8); X = FILTER A BY (f2 == ‘apache’);
!=	对比运算符	X = FILTER A BY (f1 != 8);
<	对比运算符	X = FILTER A BY (f1 < 8);
>	对比运算符	X = FILTER A BY (f1 > 8);
<=	对比运算符	X = FILTER A BY (f1 <= 8);
>=	对比运算符	X = FILTER A BY (f1 >= 8);
MATCHES	正则表达式	X = FILTER A BY (f1 MATCHES ‘.apache.‘);
IS NULL	Null Operators	X = FILTER A BY f1 is null;
IS NOT NULL	Null Operators	X = FILTER A BY f1 is not null;
+	正负符号	A = LOAD ‘data’ as (x, y, z);
-	正负符号	B = FOREACH A GENERATE -x, y;

并且也支持正则表达式

glob	comment
?	Matches any single character.
*	Matches zero or more characters.
[abc]	Matches a single character from character set (a,b,c).
[a-z]	Matches a single character from the character range (a..z), inclusive. The first character must be lexicographically less than or equal to the second character.
[^abc]	Matches a single character that is not in the character set (a, b, c). The ^ character must occur immediately to the right of the opening bracket.
[^a-z]	Matches a single character that is not from the character range (a..z) inclusive. The ^ character must occur immediately to the right of the opening bracket.
\c	Removes (escapes) any special meaning of character c.
{ab,cd}	Matches a string from the string set {ab, cd}

此外，PIG Latin还有自己的数据类型

数据类型	说明	声明方式
int	整数	as(a:int)
long	长整数	as(a:long)
float	浮点数	as(a:float)
double	双精度浮点数	as(a:double)
chararray	字符串数组，支持格式为UTF8	as(a:chararray)
bytearray	字节数组，用于二进制数据	as(a:bytearray)

以及复合数据类型

数据类型	说明	示例
tuple	代表特定序列和数目的资料结构	(“Jos Stam”, “Stable Fluids”, 1999)
map	代表关系映射的资料结构	[“name”#”Jos Stam”, “paper”#”Stable Fluids”, “year”#1999]
bag	无序的tuple集合	{(‘bob’, 55), (‘sally’, 52), (‘john’, 25)}

需要注意的是示例中的括号（圆括号、中括号、花括号）是不能省略的，并且 Map 中，表示关系和数据之间映射关系的 # 符号是不能遗忘的。

在某些特定情况下，你可能只希望引用数据表中某些列，而不希望为了使用这些列写过多的代码。因此，PIG Latin 提供了像其他语言那样对这些列数据的直接访问。

类型	符号	说明
tuple	tuple.id 或者 tuple.(id, …)	当需要引用tuple中某列或某些列的数据，可以使用tuple.id或者tuple.(id0, id1)，也可以使用 $0。
bag	bag.id 或者 bag.(id, …)	当需要引用tuple中某列或某些列的数据，可以使用bag.id或者bag.(id0, id1)，也可以使用 $0。
map	map#’key’	需要访问map中的某些数据，只能通过$0#’key’或者field_name#’key’访问。

另外，在Grunt模式下，可以像Linux Console里一样，对文件进行操作。

命令	示例	说明
mv	mv filename1 filename2	修改或者移动文件
cd	cd directory	切换当前的工作路径
mkdir	mkdir directory	创建新的目录
rm	rm directory	移除文件，或者目录
ls	ls /Data/	显示目录下的文件
quit		退出 Grunt Shell
cat	cat finename	显示文件的内容
copyFromLocal	copyFromLocal localfile hdfsfile	将本地文件上载至HDFS中
copyToLocal	copyToLocal hdfsfile localfile	将HDFS文件下载至本地磁盘
run	run xxx.pig	在Grunt中执行脚本

上载及下载数据至HDFS

为了处理大量的数据，比如日志文件。首先需要将待处理的数据上传至 hadoop 集群，因此你可以使用

hadoop fs -put localFileLocation hdfsFileLocation

或者使用 Pig Latin 的命令

copyFromLocal localFileLocation hdfsFileLocation

如果在HDFS上有数据需要下载至本地磁盘中，你可以使用如下命令

copyToLocal hdfsFileLocation localFileLocation

Load 载入文本数据

在我们的例子中，我们将从 Alan Gates 那儿获得的，以及自己想要处理的数据都放置在了 HDFS 上的 /Sample/ 文件目录下。现在，我们希望对 /Sample/NYSE_dividends 这个数据进行处理，希望得到每一支股票的平均股息。而现在，我们暂时不考虑时间，于是我们有了这样的一段代码。

dividends = load '/Sample/NYSE_dividends' as (exchange, symbol, date, dividend);
grouped = group dividends by symbol;
avg = foreach grouped generate group, AVG(dividends.dividend);
store avg into '/Results';

你可以在 Grunt 命令行模式下，将这些代码一行一行的贴在命令行里执行，并查看输出结果，也可以像执行其他脚本语言一样，将代码写在文件里，将文件作为 Pig Latin 的输入，如：

pig -x mapreduce xxx.pig

接下来分析一下这段代码。首先，与某些语言相似，Pig Latin 对关键字的大小写并不敏感，而只对变量名敏感。因此，你可以看见不同的人使用不同的风格编写 Pig Latin。我们这里建议，当你使用 PIG Latin 的关键字时，请使用大写形式，而对变量的命名以及使用这些变量时，请使用小写形式。

dividends = LOAD '/Sample/NYSE_dividends' AS (exchange, symbol, date, dividend);
grouped   = GROUP dividends BY symbol;
avg       = FOREACH grouped GENERATE group, AVG(dividends.dividend);
STORE avg INTO '/Results';

处理数据前需要先载入数据，因此可以使用 LOAD 命令，LOAD 与 AS 进行搭配，可以指定每一列数据的标识，默认数据之间的分隔符是’\t’。因此，当你的分隔符是其他的标识，那么可以使用 USING 命令，并使用内置的 UDF（自定义函数） PigStorage。

一般形式：

data = LOAD '/Sample/NYSE_dividends'

指定映射关系：

data = LOAD '/Sample/NYSE_dividends' AS (exchange, symbol, date, dividend);

指定映射关系，并指定分隔符形式

data = LOAD '/Sample/data' USING  PigStorage('\t') AS (exchange, symbol, date, dividend);

Store & Dump 存储数据结果

Hadoop 并不支持对数据的删改，因此当你使用PIG Latin计算出新的结果后，需要将这些数据存入Hadoop中。如果数据需要写入到文件中，那么这样的命令是：

STORE processed INTO '/Results';

或者将数据写入HBase中：

STORE processed INTO 'processed' using HBaseStorage();

又或者使用PigStorage，为列指定特殊的分隔符号：

STORE processed INTO 'processed' using PigStorage(',');

除此之外，还可以使用 DUMP 命令，直接将数据打印至控制台。

DUMP processed;

Order 对数据进行排序

与SQL语句中Order by相似，PIG Latin也提供了排列数据顺序的命令ORDERED。默认的排序是升序排列。

--OrderCarHead10.pig 
tables = LOAD 'subdata' USING PigStorage(',') AS (carno, date, addno);
ordered = ORDER tables BY carno, date;
subtables = LIMIT ordered 10;
DUMP subtables;

那如果需要降序排列时，可以使用命令DESC。

--DescOrderCarHead10.pig 
tables = LOAD 'subdata' USING PigStorage(',') AS (carno, date, addno);
ordered = ORDER tables BY carno, date DESC;
subtables = LIMIT ordered 10;
DUMP subtables;

Foreach 逐行处理

对数据表进行逐行处理是十分重要的功能，因此PIG Latin提供了FOREACH命令。通过一组表达式对数据流中的每一行进行运算，产生的结果就是用于下一个算子的数据集。下面的语句加载整个数据，但最终结果B中只保留其中的user和id字段：

A = LOAD 'input' AS (user:chararray, id:long, address:chararray, phone:chararray, preferences:map[]);
B = FOREACH A GENERATE user, id;

在foreach中可以使用$+数字代表某个位置的列。下面语句中gain与gain2的值一样：

prices = LOAD 'NYSE_daily' AS (exchange, symbol, date, open, high, low, close,volume, adj_close);
gain = FOREACH prices GENERATE close - open;
gain2 = FOREACH prices GENERATE $6 - $3;

表达式中可以使用“*”代表全部列，还可以使用“..”表示范围内的列，这对简化命令文本很有用：

prices = LOAD 'NYSE_daily' AS (exchange, symbol, date, open,high, low, close, volume, adj_close);
beginning = FOREACH prices GENERATE ..open; -- exchange, symbol, date, open
middle = FOREACH prices GENERATE open..close; -- open, high, low, close
end = FOREACH prices GENERATE volume..; -- volume, adj_close

Filter 过滤

使用FILTER可以对数据表中的数据进行过滤工作。该关键字经常与 BY 一起联用，对表中对应的特征值进行过滤，例如：

original = LOAD 'data' AS (name, number, ino);
flitered_data = FILTER original BY number > 1000;

比如，某一段时间的股票交易数据，我们只对平均股息在0.5以上的股票感兴趣，那么就可以加入这样一段代码：

dividends = LOAD '/Sample/NYSE_dividends' USING  PigStorage('\t') AS (exchange, symbol, date, dividend);
grouped   = GROUP dividends BY symbol;
avg       = FOREACH grouped GENERATE group, AVG(dividends.dividend);
filtered  = FILTER avg by $1 > 0.5;
STORE filtered INTO '/Results/filtered';

观察以上的代码，其中 $1 > 0.5 标识表中第二列的数据大于0.5，该值为真时，将作为一行数据写入 filtered。PIG Latin中，列的下标，与其他编程语言相似，可以通过$符号进行访问，第一列下标从0开始。

与过滤相似的另一个功能，是只显示数据表中某些列。

--DisplaySomeRaws.pig
tables = LOAD 'subdata' USING PigStorage(',') AS (carno, date, addno);
raws = FOREACH tables GENERATE carno, addno;
DUMP raws;

Group 分组

按照键值相同的规则归并数据。在SQL中，group操作必然与聚集函数组合使用，而在pig中，group操作将产生与键值有关的bag。

daily = LOAD 'NYSE_daily' AS (exchange, stock);
grpd  = GROUP daily BY stock;
cnt   = FOREACH grpd GENERATE group, COUNT(daily);

这里的group是默认的变量，表示使用GROUP聚合后得到的数据组，再通过 FOREACH 对每一组数据进行单独处理。

daily = LOAD 'NYSE_daily' AS (exchange, stock);
grpd  = GROUP daily by stock;
STORE grpd INTO 'by_group';

另外，也可以将聚合后得到的数据组存储起来，用于下次处理。此外，还可以针对多个字段进行分组。

daily = LOAD 'NYSE_daily' AS (exchange, stock, date, dividends);
grpd  = GROUP daily BY (exchange, stock);
avg   = FOREACH grpd GENERATE group, AVG(daily.dividends);

甚至可以针对全字段进行分组。

daily = LOAD 'NYSE_daily' AS (exchange, stock);
grpd  = GROUP daily ALL;
cnt   = FOREACH grpd GENERATE COUNT(daily);

Distinct 剔除重复项

数据表中若存在重复项，并且需要剔除这些数据，那么可以使用DISTINCT命令，剔除数据表中重复项，该方法与SQL中的用法一致。

daily = LOAD 'NYSE_daily' AS (exchange:chararray, symbol:chararray);
uniq = DISTINCT daily;

Union 联合

Union 的作用与 SQL 中的 Union 相似，使用该操作符，可以将不同的数据表，组合成同一的数据表。假设我们有数据表A和表B，都记录了行车数据：

A = LOAD 'table1' USING PigStorage(',') as (carno:int,date:chararray,addno:long);
B = LOAD 'table2' USING PigStorage(',') as (carno:int,date:chararray,addno:long);
X = UNION A, B;
DUMP X;

Cross 计算笛卡尔积

将多个数据集中的数据按照字段名进行同值组合，形成笛卡尔积

daily   = load 'NYSE_daily' as (exchange:chararray, symbol:chararray, date:chararray, open:float, high:float, low:float, close:float, volume:int, adj_close:float);
divs    = load 'NYSE_dividends' as (exchange:chararray, symbol:chararray, date:chararray, dividends:float);
crossed = cross daily, divs;
tjnd    = filter crossed by daily::date < divs::date;

Join 链接

连接一组key：

jnd = JOIN daily BY symbol, divs BY symbol;

连接两组key：

jnd = JOIN daily BY (symbol, date), divs BY (symbol, date);

外连接：

jnd = JOIN daily BY (symbol, date) left outer, divs BY (symbol, date);

多表连接：

A = LOAD 'input1' AS (x, y);
B = LOAD 'input2' AS (u, v);
C = LOAD 'input3' AS (e, f);
alpha = JOIN A BY x, B BY u, C BY e;

其他

limit

用于限制行数（类似MySQL的LIMIT）。

divs = LOAD 'NYSE_dividends';
first10 = LIMIT divs 10;

sample

随机抽取指定比例（0到1）的数据。

some = SAMPLE divs 0.1;

parallel

用于实现指定数量的多节点并行运算。

daily = LOAD 'NYSE_daily' AS (exchange, symbol, date, open, high, low, close, volume, adj_close);
bysymbl = GROUP daily BY symbol PARALLEL 10;

可以使用default_parallel来指定默认的并行度选项：

SET default_parallel 10;
daily = LOAD 'NYSE_daily' AS (exchange, symbol, date, open, high, low, close, volume, adj_close);
bysymbl = GROUP daily BY symbol;
average = FOREACH bysymbl GENERATE group, AVG(daily.close) AS avg;
sorted = ORDER average BY avg desc;

自定义函数（UDFS）

REGISTER 'your_path_to_piggybank/piggybank.jar';
DEFINE reverse org.apache.pig.piggybank.evaluation.string.Reverse();
divs = LOAD 'NYSE_dividends' as (exchange:chararray, symbol:chararray, date:chararray, dividends:float);
backwards = FOREACH divs GENERATE reverse(symbol);

flatten

将数据内部的包或元组扁平化（展开为底层字段——以笛卡尔积的方式扩展）。
players = LOAD ‘baseball’ AS (name:chararray, team:chararray, position:bag{t:(p:chararray)}, bat:map[]);
pos = foreach players generate name, flatten(position) as position;
bypos = group pos by position;

上面的players中的数据应该是这样的(已用逗号取代TAB便于查看):

Jorge Posada,New York Yankees,{(Catcher),(Designated_hitter)},...

一旦经过了flatten语句，它将变成两个数据：

Jorge Posada,Catcher
Jorge Posada,Designated_hitter

cogroup

基于一个key，记录多个输入。

A = load 'input1' as (id:int, val:float);
B = load 'input2' as (id:int, val2:int);
C = cogroup A by id, B by id;
describe C;
C: {group: int,A: {id: int,val: float},B: {id: int,val2: int}}

用它可以达到全外连接的效果：

--semijoin.pig
daily = load 'NYSE_daily' as (exchange:chararray, symbol:chararray,
date:chararray, open:float, high:float, low:float,
close:float, volume:int, adj_close:float);
divs = load 'NYSE_dividends' as (exchange:chararray, symbol:chararray,
date:chararray, dividends:float);
grpd = cogroup daily by (exchange, symbol), divs by (exchange, symbol);
sjnd = filter grpd by not IsEmpty(divs);
final = foreach sjnd generate flatten(daily);

非线性数据流(split)

wlogs = load 'weblogs' as (pageid, url, timestamp);
split wlogs into
apr03 if timestamp < '20110404',
apr02 if timestamp < '20110403' and timestamp > '20110401',
apr01 if timestamp < '20110402' and timestamp > '20110331';
store apr03 into '20110403';
store apr02 into '20110402';
store apr01 into '20110401';

上面的split等价于：

apr03 = filter wlogs by timestamp < '20110404';
apr02 = filter wlogs by timestamp < '20110403' and timestamp > '20110401';
apr01 = filter wlogs by timestamp < '20110402' and timestamp > '20110331';

参考资料

Alan Gates, Programming Pig, O’Reilly Media, Inc, 2011
Pig Latin Basics， http://pig.apache.org/docs/r0.9.1/basic.html

本文转载自：http://blog.csdn.net/poisonchry/article/details/31486315

你可能感兴趣的:(pig,hadoop,pig,脚本语言,pig,pig,latin)

PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
导致格式错误的 Lambda 代理响应的原因以及如何修复它 zqhdz米时空汇编
当人们尝试使用AWSAPIGateway和AWSLambda构建无服务器应用程序时，经常出现的一个问题是_由于配置错误而执行失败：Lambda代理响应格式错误。_没有什么比通用错误消息更糟糕的了，它们不会告诉您解决问题所需的任何内容，对吧？AWS并不是以其错误消息设计而闻名，如果甚至可以这样称呼它的话，更不用说为您提供解决问题的方法了。那么如何修复这个Lambda错误以及是什么原因造成的呢？花椒壳
python中文版下载官网-Python下载 v3.8.3 官方中文版 weixin_37988176
Python中文版是一款非常专业的通用型计算机程序设计语言安装包，Python具有比其他语言更有特色语法结构，而且在设计上坚持了清晰划一的风格，使得它成为一门易读、易维护并且被大量用户所欢迎的、用途广泛的语言，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的开发。Python中文版软件介绍Python中文版是一门跨平台的脚本语言，Python规定了一个Python语法规则，实
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Lua 与 C#交互 z2014z lua c#开发语言
Lua与C#交互前提Lua是一种嵌入式脚本语言，Lua的解释器是用C编写的，因此可以方便的与C/C++进行相互调用。轻量级Lua语言的官方版本只包括一个精简的核心和最基本的库，这使得Lua体积小、启动速度快，也适合嵌入在别的程序里。交互过程C#调用Lua:由C#文件调用Lua解析器底层dll库（由C语言编写），再由dll文件执行相应的Lua文件。Lua调用C#：1、Wrap方式：首先生成C#源文件
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
EcmaScript和JavaScript的区别每天吃八顿前端 ecmascript
ECMAScript和JavaScript是经常被混淆的两个术语，但实际上它们之间存在一些区别：ECMAScript：ECMAScript（通常缩写为ES，并且有版本号如ES5,ES6和ES7等）是由ECMA国际（EuropeanComputerManufacturersAssociation）制定的一种脚本语言的规范。这个规范定义了语法、命令、数据类型等基本元素。ECMAScript是一种规范，
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【第一章】第三节病床上的白布桃小多
“我总在每一个黑夜想你，嘲笑自己傻得可以---没懂得珍惜，那么轻易丢了你”——电话铃声响了！诗梦涵看到电话上赫然显示高胜的备注，心情轻松了很多，那是个猪头的头像，上面备注的是GGpig。她拿起手机，放在耳边——“喂？你是猪吗，还没到傍晚呢！你在干嘛？”电话里传来急促的跑步和呼吸声，对方没有说话。“？？？高胜？”诗梦涵感觉越来越不好，脑袋的疑团越来越大，夹杂着她愈发无法自圆其说的好奇心，一秒、两秒…
什么是 PHP? 为什么用 PHP? 谁在用 PHP? m0_37438181 永远学习 php 开发语言
一、什么是PHP？PHP（HypertextPreprocessor，超文本预处理器）是一种广泛应用于Web开发的通用开源脚本语言。PHP主要用于服务器端编程，可以嵌入HTML中，与数据库进行交互，生成动态网页内容。它具有以下特点：简单易学：语法相对简单，容易上手，对于初学者来说是一个不错的选择。跨平台性：可以在多种操作系统上运行，如Windows、Linux、Unix等。丰富的函数库：提供了大量
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
前端入门：JavaScript基础介绍虞锦雯
一、JavaScript介绍Netscape在最初将其脚本语言命名为LiveScript，后来Netscape在与Sun合作之后将其改名为JavaScript。JavaScript最初受Java启发而开始设计的，目的之一就是“看上去像Java”，因此语法上有类似之处，一些名称和命名规范也借自Java。JavaScript与Java名称上的近似，是当时Netscape为了营销考虑与Sun微系统达成协
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
Java中的大数据处理框架对比分析省赚客app开发者 java 开发语言
Java中的大数据处理框架对比分析大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！今天，我们将深入探讨Java中常用的大数据处理框架，并对它们进行对比分析。大数据处理框架是现代数据驱动应用的核心，它们帮助企业处理和分析海量数据，以提取有价值的信息。本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的
TypeScript 快速入门 echozzi 1024程序员节
一、TypeScript是什么TypeScript是一种由微软开发的自由和开源的编程语言。于2012年推出。TypeScript是JavaScript的一个超集。为JavaScript添加了类型系统。TypeScript与JavaScript的区别TypeScriptJavaScriptJavaScript的超集用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页可以在编译期间发现并纠正错误
Hadoop windows intelij 跑 MR WordCount piziyang12138
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9Hadoop分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven工程。(如果只跑MapReduce创建java工程即可，不用勾选Creatfromarchetype，如果想创建web工程或者使用骨架可以勾选)image.png设置GroupId和Artif
Hadoop学习第三课（HDFS架构--读、写流程）小小程序员呀~ 数据库 hadoop 架构 big data
1.块概念举例1：一桶水1000ml，瓶子的规格100ml=>需要10个瓶子装完一桶水1010ml，瓶子的规格100ml=>需要11个瓶子装完一桶水1010ml，瓶子的规格200ml=>需要6个瓶子装完块的大小规格，只要是需要存储，哪怕一点点，也是要占用一个块的块大小的参数：dfs.blocksize官方默认的大小为128M官网：https://hadoop.apache.org/docs/r3.
hadoop启动HDFS命令 m0_67401228 java 搜索引擎 linux 后端
启动命令：/hadoop/sbin/start-dfs.sh停止命令：/hadoop/sbin/stop-dfs.sh
Python和java的区别周作业一些杂七杂八
更多decorator的内容，请参考https://wiki.python.org/moin/PythonDecorators来源：my.oschina.net/taogang/blog/264351基本概念Python和Javascript都是脚本语言，所以它们有很多共同的特性，都需要解释器来运行，都是动态类型，都支持自动内存管理,都可以调用eval（）来执行脚本等等脚本语言所共有的特性。然而它
MFC 得到本机IP和设置本机的IP zq4132
ULONGWINAPIGetAdaptersAddresses( __in ULONGFamily, __in ULONGFlags, __in PVOIDReserved, __inout PIP_ADAPTER_ADDRESSESAdapterAddresses, __inout PULONGSizePointer);第一个参数Family是网络协议族，用户可以指定
【计算机毕设-大数据方向】基于Hadoop的电商交易数据分析可视化系统的设计与实现程序员-石头山大数据实战案例大数据 hadoop 毕业设计毕设
博主介绍：✌全平台粉丝5W+,高级大厂开发程序员，博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来，同学门有不懂的毕设选题，项目以及论文编写等相关问题都可以和学长沟通，希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展，电商平台积累了海量的数据资源，这些数据不仅包括用户的基本信息、购物记录，还包括用户的浏览行为、评价反馈等多
分布式离线计算—Spark—基础介绍测试开发abbey 人工智能—大数据
原文作者：饥渴的小苹果原文地址：【Spark】Spark基础教程目录Spark特点Spark相对于Hadoop的优势Spark生态系统Spark基本概念Spark结构设计Spark各种概念之间的关系Executor的优点Spark运行基本流程Spark运行架构的特点Spark的部署模式Spark三种部署方式Hadoop和Spark的统一部署摘要：Spark是基于内存计算的大数据并行计算框架Spar
spark常用命令我是浣熊的微笑 spark
查看报错日志：yarnlogsapplicationIDspark2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$SPARK_HOME目录，输入bin/spark-submit--help可以得到该命令的使用帮助。hadoop@wyy:/app/hadoop/spark100$bin/spark-submit--
spark启动命令学不会又听不懂 spark 大数据分布式
hadoop启动：cd/root/toolssstart-dfs.sh，只需在hadoop01上启动stop-dfs.sh日志查看：cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动：cd/root/toolss/zookeeperbin/zkServer.shstart，三台都要启动bin/zkServ
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置