kyrieguard

文本三剑客之awk命令--截取

一.正则表达式

1.1正则表达式简介

1.2 通配符和元字符

1.3 正则：

1.4 其他

二.awk命令

2.1 awk命令简介

2.2 举例

2.3 分隔符

2.4NF和NR

2.5awk的格式

2.6练习

2.7 awk传参问题

2.8 流控

2.9 数组

一.正则表达式

awk支持正则表达式，并且在匹配的过程中多次使用到正则，所以学习awk之前，我们先了解shell中正则的一些简单使用（其实python中使用正则跟Linux中使用正则的规则都差不多，想详细了解正则表达式，可以查看我之前一篇专门写正则的博客）https://blog.csdn.net/weixin_43880061/article/details/125265593?spm=1001.2014.3001.5502

1.1正则表达式简介

regular expression --》re 正则表达式，简称正则

正则定义（用在哪里）：使用一些特殊符号+字母和数字按照某个正确的规则组成一个公式用来表示某个意思，这就叫正则表达式

有什么用：用来查找，根据正则表达式表达出来的意思，去海量的文本里查找符合这个意思的内容

在哪里用：很多的命令都有查找的功能，有查找功能的命令都能使用正则，vim，sed，awk，grep

简单的正则例子：^wangshuai{3}[0-9]+ 意思是以wagnshuai开头，i出现3次，数字出现1次以上

1.2 通配符和元字符

通配符：在shell里的叫法

* 代表任意个字符

？代表一个任意字符串（就是只占一位）

元字符（meta character）：在正则表达式里的叫法，用来描述其他字符的字符

* 前面的字符出现0次或多次

？前面的字符出现0次或1次

+ 前面的字符出现1次或多次

^ 表示以什么开头

$ 表示以什么结尾

. 占位符表示一个除\n之外的任意字符

{n,m} 匹配前一项n到m次

| 或

1.3 正则：

1.基本正则：元字符比较少，^,$,*,? grep

2.扩展正则：+，{}，｜ egrep == grep -E

1.4 其他

grep，匹配模式在行里查找，然后输出，输出匹配模式的行

模式是什么？模式是grep里包含了正则表达式的一个表达式，按照某个模型根据正则表达式去构成一个公式

写正则表达式，就是找共性的特点，找规律

xargs命令：使一列转为一行，还可以将前面命令的输出作为参数传给后面的命令


[root@xieshan 0707]# cat mail.txt

  [email protected] fdffaf1212

  [email protected] 8989

  [email protected] fjdkfj

[root@xieshan 0707]# egrep -o "[0-Z_]+@[0-Z]+.[a-Z]+" mail.txt

[email protected]

[email protected]

[email protected]

[root@xieshan 0707]# egrep -o "[0-Z_]+@[0-Z]+.[a-Z]+" mail.txt |xargs

[email protected] [email protected] [email protected]

二.awk命令

2.1 awk命令简介

awk是一种编程及数据操纵语言，名称来源于创始人的名字缩写

Gawk is the GNU Project's implementation of the AWK programming language.

GNU是什么？

GNU is not unix

GNU 是一个项目，它的宗旨是构建一个不是unix的操作系统

有什么作用？过滤、截取、统计

用在哪里：文本处理（截取和统计）

awk命令工作原理：

与sed一样, 均是一行一行的读取、处理

sed作用于一整行的处理，而awk将一行分成数个字段来处理

awk是依次对每一行进行处理，然后输出

2.2 举例

统计每个用户一共充值了多少钱？--》求和，分类统计
[root@master 77]# cat bill.txt
feng    100
feng    200
feng    350
li    200
ma   100000
li    239
li    890
zhang  100
zhang   350
ma   1000
[root@master 77]# awk '{name[$1]+=$2}END{for (i in name) print i,name[i]}' bill.txt
li 1329
feng 650
zhang 450
ma 101000
[root@master 77]#

name[$1]+=$2 拿$1字段做key，让$2做value，如果数组里有key，就累加，如果没有，初始值是0+value

END{for (i in name) print i,name[i]} END是文件里所有的行都处理完了，最后去执行END部分里的命令

for 循环取遍历name数组里的元素（item），i取name数组里的key，输出key和对应的value

字段 field -->一段长文字被分隔符隔开，形成很多段比较短的文字

列 --》column 字段

一列就是一个字段

行 row line 记录 record

一行就是一条记录

2.3 分隔符

awk截取文本时，会按照指定的分隔符去分隔，默认的分隔符是空格，使用- F可以指定分隔符

1.输入分隔符

默认是空白（包括空格和tab键）

-F ":" FS 输入分隔符变量 The input field separator, a space by default. See Fields,above.

2.输出分隔符

默认是空格

OFS="#" out field separater 输出分隔符变量 The output field separator, a space by default.

举例说明：

[root@xieshan 0707]# awk -F ':' '{print $1$3$7}' /etc/passwd|head -5	#没有, 就会紧挨着输出
root0/bin/bash
bin1/sbin/nologin
daemon2/sbin/nologin
adm3/sbin/nologin
lp4/sbin/nologin

[root@xieshan 0707]# awk -F ':' 'OFS="#"{print $1,$3,$7}' /etc/passwd |head -5 #使用 , 就是调用输出分隔符，默认是空格
root#0#/bin/bash
bin#1#/sbin/nologin
daemon#2#/sbin/nologin
adm#3#/sbin/nologin
lp#4#/sbin/nologin
[root@xieshan 0707]# awk -F ':' 'OFS="#"{print $1$3$7}' /etc/passwd |head -5    #如果指定了输出分隔符，但是print后面的变量没有用逗号隔开，那么OFS也不会生效，还是会紧挨着输出
root0/bin/bash
bin1/sbin/nologin
daemon2/sbin/nologin
adm3/sbin/nologin
lp4/sbin/nologin

2.4NF和NR

awk的四个内置变量分别是：FS、OFS、NF、NR

NF The number of fields in the current input record. 表示最后一个字段，$(NF -1) 倒数第2个字段

NR The total number of input records seen so far. 表示行号

FS # 保存或设置字段分隔符，如FS=”:”

OFS # 输出字段分隔符，默认也是空格，可以改为制表符等

$n # 指定分隔的第n个字段，如$1、$3分别表示第1、第3列

$0 # 当前读入的整行文本内容

~ 匹配，与==相比不是精确比较，模糊匹配

!~ 不匹配，不精确比较

== 等于，必须全部相等，精确比较

!= 不等于，精确比较

&&　逻辑与

|| 逻辑或

+ 匹配时表示1个或1个以上

/[0-9][0-9]+/ 两个或两个以上数字

/[0-9][0-9]*/ 一个或一个以上数字

[root@xieshan 0707]# awk -F ':' 'OFS="#"{print $1,$3,$7,$NF}' /etc/passwd|head -5
root#0#/bin/bash#/bin/bash
bin#1#/sbin/nologin#/sbin/nologin
daemon#2#/sbin/nologin#/sbin/nologin
adm#3#/sbin/nologin#/sbin/nologin
lp#4#/sbin/nologin#/sbin/nologin

[root@xieshan 0707]# awk -F ':' 'OFS="#"{print NR,$1,$3,$7}' /etc/passwd|head -5
1#root#0#/bin/bash
2#bin#1#/sbin/nologin
3#daemon#2#/sbin/nologin
4#adm#3#/sbin/nologin
5#lp#4#/sbin/nologin

2.5awk的格式

# 格式1
前置命令 | awk [选项] '条件{编辑指令}'

# 格式2
awk [-F|-f|-v] 'BEGIN{} //{command1; command2} END{}' 文件

[-F|-f|-v]   大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=value
' '           引用代码块
BEGIN    初始化代码块，在对每一行进行处理之前，初始化代码，主要是引用全局变量，设置FS分隔符
//           匹配代码块，可以是字符串或正则表达式
{} 命令代码块，包含一条或多条命令
; 多条命令使用分号分隔
END 结尾代码块，在对每一行进行处理之后再执行的代码块，主要是进行最终计算或输出结尾摘要信息

# 编辑指令如果包含多条语句时，可以用分号分隔，处理文本时，若未指定分隔符，则默认将空格、制表符等作为分隔符。print是最常见的指令。

[root@xieshan 0707]# awk -F: 'BEGIN{print "######start#####"} $3>500&&$3<1000{print $1,$3}END{print "#####end#####"}' /etc/passwd
######start#####
polkitd 999
chrony 998
zabbix 997
nginx 996
#####end#####
[root@xieshan 0707]# awk -F: 'BEGIN{num=0;print "###start###"} $1~/^feng{2,}/ && $3>2000|| $NF ~ /bash/ {print NR,NF,$1,$3,length($1),$(NF-1),$NF;num++} END{print "行数:"num}' /etc/passwd
###start###
1 7 root 0 4 /root /bin/bash
20 7 sc 1000 2 /home/sc /bin/bash
21 7 sc1 1001 3 /home/sc1 /bin/bash
22 7 ll 1002 2 /home/ll /bin/bash
......省略很多个输出
69 7 sanle 2009 5 /home/sanle /bin/bash
70 7 luodayou 2010 8 /home/luodayou /bin/bash
行数:40
[root@xieshan 0707]# 
[root@xieshan 0707]# who|awk '{print "username:"$1" time:"$3}'
username:root time:2022-07-06
username:root time:2022-07-07
username:root time:2022-07-07
username:root time:2022-07-07
[root@xieshan 0707]# awk '{print "username:"$1," uid:"$3}' /etc/passwd|head -5
username:root:x:0:0:root:/root:/bin/bash  uid:
username:bin:x:1:1:bin:/bin:/sbin/nologin  uid:
username:daemon:x:2:2:daemon:/sbin:/sbin/nologin  uid:
username:adm:x:3:4:adm:/var/adm:/sbin/nologin  uid:
username:lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin  uid:
[root@xieshan 0707]# awk -F: '/bash/{print "username:"$1," uid:"$3}' /etc/passwd|head -5
username:root  uid:0
username:sc  uid:1000
username:sc1  uid:1001
username:ll  uid:1002
username:kim  uid:1003
[root@xieshan 0707]# awk -F: '/feng/{print "username:"$1," uid:"$3}' /etc/passwd|head -5
username:califeng  uid:1025
[root@xieshan 0707]# awk -F: '$1~/feng/{print "username:"$1," uid:"$3}' /etc/passwd|head -5
username:califeng  uid:1025
[root@xieshan 0707]# 
[root@xieshan 0707]# awk -F'[:/]' '{print $1,$10}' /etc/passwd|head
root bash
bin nologin
daemon nologin
adm sbin
lp 
sync sync
shutdown shutdown
halt halt
mail 
operator nologin
[root@xieshan 0707]# vim grade.txt
[root@xieshan 0707]# cat grade.txt 
id     name     chinese     math     english
1      cali      80         80        80
2      rose      90         98        29
3      tom       89         98        89
4      jenny     100        60        90
[root@xieshan 0707]# awk '{print $2,$3}' grade.txt 
name chinese
cali 80
rose 90
tom 89
Jenny 100
[root@xieshan 0707]# vim grade.txt
[root@xieshan 0707]# cat grade.txt 
id     name     chinese     math     english//linux
1      cali      80         80        80//90
2      rose      90         98        29//99
3      tom       89         98        89//78
4      jenny     100        60        90//77
[root@xieshan 0707]# awk -F'[ /]+' '{print $2,$3,$6}' grade.txt   #+表示连续的多个分隔符当成一个分隔符使用，这里的分隔符有空格和/
name chinese linux
cali 80 90
rose 90 99
tom 89 78
jenny 100 77
[root@xieshan 0707]# awk '{gsub("/"," ",$5);print $2,$3,$5}' grade.txt 	#gsub是把$5的/替换成空格，并且当成一个整体$5
name chinese english  linux
cali 80 80  90
rose 90 29  99
tom 89 89  78
jenny 100 90  77
tr命令：字符转换和删除的命令
-s		压缩连续的相同的字符串为同一个字符
-d		删除字符串
[root@xieshan 0707]# cat grade.txt |tr '//' "\t"	#将//转换成一个tab键
id     name     chinese     math    english		linux
1      cali      80         80        80		90
2      rose      90         98        29		99
3      tom       89         98        89		78
4      jenny     100        60        90		77
[root@xieshan 0707]# cat grade.txt |tr -s "/"
id     name     chinese     math    english/linux
1      cali      80         80        80/90
2      rose      90         98        29/99
3      tom       89         98        89/78
4      jenny     100        60        90/77
[root@xieshan 0707]# cat grade.txt |tr -s "/ "		#压缩连续相同的/或者空格
id name chinese math english/linux
1 cali 80 80 80/90
2 rose 90 98 29/99
3 tom 89 98 89/78
4 jenny 100 60 90/77
[root@xieshan 0707]# cat grade.txt |tr -s "/" " "	#将/用空格替换
id name chinese math english linux
1 cali 80 80 80 90
2 rose 90 98 29 99
3 tom 89 98 89 78
4 jenny 100 60 90 77
[root@xieshan 0707]# echo aaaabbbbbbababccab123 |tr ab 89		#将ab替换成89
88889999998989cc89123
[root@xieshan 0707]# awk -F: '$3 ~ /[0-9]{5}/{print $1,$3}' /etc/passwd
nfsnobody 65534
[root@xieshan 0707]# awk -F: '$1 ~ /\/{print $1,$3}' /etc/passwd
luoziyao 2011
输出/etc/passwd里面，uid大于1000，并且shell用的是bash，统计有多少个
[root@xieshan 0707]# awk -F: 'BEGIN{num=0}$7~/bash/&&$3>1000{print $3,$7;num++}END{print "行数："num}' /etc/passwd
1001 /bin/bash
1002 /bin/bash
......省略很多个输出
2010 /bin/bash
2011 /bin/bash
行数：39
[root@xieshan 0707]# 
awk实现输出/etc/passwd的第一行和最后1行
===============未使用awk
[root@xieshan 0707]# head -1 /etc/passwd;tail -1 /etc/passwd
root:x:0:0:root:/root:/bin/bash
luoziyao:x:2011:2011::/home/luoziyao:/bin/bash
===============使用awk
[root@xieshan 0707]# awk 'NR==1{print NR,$0}END{print NR,$0}' /etc/passwd
1 root:x:0:0:root:/root:/bin/bash
71 luoziyao:x:2011:2011::/home/luoziyao:/bin/bash

2.6练习

答案：

1.[root@xieshan 0707]# df -h|awk '{print $1}'
2.[root@xieshan 0707]# awk -F: 'NR==5||NR==10{print NR,$1}' /etc/passwd
3.[root@xieshan 0707]# awk -F: '{print $(NF-1)}' /etc/passwd
4.[root@xieshan 0707]# awk -F: 'NR>=5&&NR<=10 {print $1}' /etc/passwd 
5.[root@xieshan 0707]# awk -F: '$7 !~/bash/ {print $1}' /etc/passwd 
6.[root@xieshan 0707]# awk -F: 'NR~/.5/ {print NR,$0}' /etc/passwd 
   [root@xieshan 0707]# awk -F: 'NR~/5$/ {print NR,$0}' /etc/passwd
7.[root@xieshan 0707]# ip a|awk '$1 ~/^inet$/ && $3 ~/brd/ {print $2,$3}' 
8.[root@xieshan 0707]# ifconfig ens33|awk -F' ' '$2 ~/packets/ {print $1,$5}'
   [root@xieshan 0707]# ifconfig|egrep -A8 "^ens33"|awk '/RX p/ || /TX p/{print $1,$5}'
9.[root@xieshan 0707]# awk -F: 'BEGIN{num=0}$1 ~/^r/ {print $1;num++}END{print "一共有"num"个用户以r开头"}' /etc/passwd
10.[root@xieshan 0707]# watch -n 2 -d "ifconfig|awk 'NR==5{print $5}'"
     [root@xieshan 0707]# watch -n 2 -d "ifconfig|egrep -A8 "^ens33"|awk '/RX p/ || /TX p/{print \$5}'"
watch命令：
-n  interval seconds   指定间隔时间			-d    高亮显示
11.[root@xieshan 0707]# awk -F: 'BEGIN{print"查找结果：";num=0}$1 ~/^r/ {print $1;num++}END{print "行数："num}' /etc/passwd

2.7 awk传参问题

在awk内部调用变量，不需要添加$符号，只有位置变量必须要添加$

在awk中使用，引用的shell变量不需要转义，但是要加$符号，但是位置变量需要转义，注意这里使用双引号

[root@xieshan 0707]# echo $$		#查看当前进程的pid
8184
[root@xieshan 0707]# awk '{print PROCINFO["pid"],PROCINFO["ppid"]}' /etc/passwd	#PROCINFO这个数组是awk内置数组，用来存储进程相关信息

[root@xieshan 0707]# sg=renhaodong		#shell中定义的变量
[root@xieshan 0707]# useradd renhaodong
[root@xieshan 0707]# awk '/sg/{print $1}' /etc/passwd
[root@xieshan 0707]# awk "/sg/{print $1}" /etc/passwd
[root@xieshan 0707]# awk "/$sg/{print \$1}" /etc/passwd	#在awk中使用，引用的shell变量不需要转义，但是要加$符号，但是位置变量需要转义，注意这里使用双引号
renhaodong:x:2012:2012::/home/renhaodong:/bin/bash

2.8 流控

流控：following control

if：if（condition ）

for

函数：

length 统计长度

split 将一段字符串根据分隔符号，对文本进行分隔，存放到数组里，使用for循环遍历读取数组里的内容

gsub 替换

substr 截取部分字符串

toupper [root@xieshan 0707]# awk -F: '{print toupper($1)}' /etc/passwd

tolower [root@xieshan 0707]# awk -F: '{print tolower($1)}' /etc/passwd

2.9 数组

数组：awk里的数组下标从1开始

求和

统计

air -condition ---AC

awk里的for循环格式：

for (i=0;i<10;i++) {print $i;}

for (i in array){print array[i]} -->直接从数组的下标里读一个值，以此类推取完所有的值，遍历

python里字典：key:value

[root@xieshan 0707]# awk -F: '{if ($1 ~/renhaodong/) print "haoge"}' /etc/passwd	#单分支
haoge
[root@xieshan 0707]# awk -F: '{if ($1 ~/renhaodong/) print "haoge";else print "dage"}' /etc/passwd	#双分支
[root@xieshan 0707]# awk -F: '{if ($1 ~/renhaodong/) print "haoge";else if ($3>5000) print "dageda";else print "dage"}' /etc/passwd		#多分支
[root@xieshan 0707]# awk -F: '{if ($3 == 0) print "超级用户";else if ($3>=1&&$3<=999) print "系统用户";else print "普通用户"}' /etc/passwd
[root@xieshan 0707]# awk -F: 'BEGIN{num1=0;num2=0;num3=0}{if ($3 == 0) num1++;else if ($3>=1&&$3<=999) num2++;else num3++}END{print "一共有超级用户："num1,"一 有系统用户："num2,"一共有普通用户："num3}' /etc/passwd
一共有超级用户：1 一共有系统用户：26 一共有普通用户：45
[root@xieshan 0707]# awk -F: '{if ($3 == 0) num1++;else if ($3>=1&&$3<=999) num2++;else num3++}END{print "一共有超级用户："num1,"一共有系统用户："num2,"一共有 通用户："num3}' /etc/passwd	#不提前定义也可以
一共有超级用户：1 一共有系统用户：26 一共有普通用户：45
[root@xieshan 0707]# awk -F: 'BEGIN{num1=0;num2=0;num3=0}{if ($3 == 0) {num1++;print "超级用户"}else if ($3>=1&&$3<=999) {num2++;print "系统用户"}else {num3++;print "普通用户"}}END{print "一共有超级用户："num1,"一共有系统用户："num2,"一共 普通用户："num3}' /etc/passwd	#多条命令使用花括号，不需要再接分号

[root@xieshan 0707]# awk -F: 'length($1) > 6{print $1}' /etc/passwd		
[root@xieshan 0707]# awk -F: '{if (length($1) > 6) print $1}' /etc/passwd
[root@xieshan 0707]# awk -F: '{if (length($1) > 6) print substr($1,1,5)}' /etc/passwd |head -5
split切割：python中和awk一致
>>> mn = "aojiao wangzuxian luoziyao shiyuqian"
>>> mns = mn.split()
>>> mns
['aojiao', 'wangzuxian', 'luoziyao', 'shiyuqian']
>>> sg = "wang/feng/xie/li/zeng/yang"
>>> sg2 = sg.split("/")
>>> sg2
['wang', 'feng', 'xie', 'li', 'zeng', 'yang']
awk里面的数组下标从1开始
[root@xieshan 0707]# awk -F: '{split($6,home_dir,"/")}END{for (i in home_dir)print i,home_dir[i]}' /etc/passwd
[root@xieshan 0707]# awk -F: '{split($6,home_dir,"/");for (i in home_dir)print i,home_dir[i]}' /etc/passwd
[root@xieshan 0707]# awk -F: '{split($6,home_dir,"/");for (i=2;i<4;i++)print i,home_dir[i]}' /etc/passwd

根据一个文件里的内容，批量新建用户和设置密码:

[root@xieshan 0707]# awk '{system("useradd " $1)}' name.txt   	#调用shell命令

方法一：
[root@xieshan 0707]# awk '{system("useradd "$1);system("echo "$2"| passwd "$1" --stdin")}' name.txt
方法二：
[root@xieshan 0707]# cat adduser.sh 
#!/bin/bash
while read user pwd
do
	useradd $user
	echo $pwd|passwd $user --stdin
done < name.txt
方法三：
[root@xieshan 0707]# cat useradd_multi.sh 
#!/bin/bash
username=($(awk '{print $1}' name.txt))	#成为一个数组
userpwd=($(awk '{print $2}' name.txt))	#也是数组
for i in $(seq $(cat name.txt|wc -l))
do	
		useradd ${username[i-1]}
		echo ${userpwd[i-1]}|passwd ${username[i-1]} --stdin
done

对/etc/passwd的第三列求和：
[root@xieshan 0707]# awk -F: '{sum+=$3}END{print sum}' /etc/passwd
136000
对1-100进行求和：
[root@xieshan 0707]# seq 100|awk '{sum+=$1}END{print sum}'
5050

分类+累加求和

统计相同的ip的流量:

[root@xieshan 0707]# cat ip.txt 
172.16.130.26 16274.7
172.16.20.126 8783.61
172.16.130.33 5876.59
173.16.13.145 5389.23
172.16.13.145 5389.23
172.16.13.145 5389.23
172.16.20.126 8783.61
172.16.145.173 4974.36
172.16.13.145 5389.23
173.16.13.145 5389.23
173.16.13.145 5389.23
173.16.13.145 5389.23
[root@xieshan 0707]# awk '{ip[$1]+=$2}END{for (i in ip)print i,ip[i]}' ip.txt|sort -k2 -nr
173.16.13.145 21556.9
172.16.20.126 17567.2
172.16.130.26 16274.7
172.16.13.145 16167.7
172.16.130.33 5876.59
172.16.145.173 4974.36

统计每个人的充值数额，按照升序排序：

[root@xieshan 0707]# cat bill.txt 
feng    100
feng    200
feng    350
li    200
ma   100000
li    239
li    890
zhang  100
zhang   350
ma   1000
[root@xieshan 0707]# awk '{bill[$1]+=$2}END{for (i in bill)print i,bill[i]}' bill.txt |sort -k2 -n
zhang 450
feng 650
li 1329
ma 101000

统计各个省份的票数，输出省份和总票数，按照降序排序：

[root@xieshan 0707]# cat a.txt 
山东 aa  2
河南 bb  3
江西 cc 3
湖南 aa 40
山东 bb 10
江西 dd 6
河南 cc 3
湖南 cc 3
[root@xieshan 0707]# awk '{a[$1]+=$3}END{for (i in a)print i,a[i]}' a.txt |sort -k2 -nr
湖南 43
山东 12
江西 9
河南 6

使用netstat -anplut命令得到一个文本：

1、统计每个state的数量

2、统计输出连接到本主机连接数最多的3个IP，并按连接数从多到少排序（降序)

3、用IP简单的正则匹配上面出现的所有的IP

[root@xieshan 0707]# cat address.txt 
Proto Recv-Q Send-Q Local Address               Foreign Address             State
  tcp        0      0 172.16.18.227:38734         172.16.10.25:5921           ESTABLISHED 
  tcp        0      0 172.16.18.227:33046         172.16.17.83:5921           ESTABLISHED 
  tcp        0      0 127.0.0.1:38978             127.0.0.1:12321             TIME_WAIT   
  tcp        0      0 127.0.0.1:38990             127.0.0.1:12321             TIME_WAIT     
  tcp        0      0 127.0.0.1:3306              127.0.0.1:35422             ESTABLISHED 
  tcp        0      0 127.0.0.1:38912             127.0.0.1:12321             TIME_WAIT  
  tcp        0      0 172.16.18.227:38734         172.16.10.25:5921           ESTABLISHED 
  tcp        0      0 172.16.18.227:33046         172.16.17.83:5921           ESTABLISHED 
  tcp        0      0 127.0.0.1:38978             127.0.0.1:12321             TIME_WAIT   
  tcp        0      0 127.0.0.1:38990             127.0.0.1:12321             TIME_WAIT     
  tcp        0      0 127.0.0.1:3306              127.0.0.1:35422             ESTABLISHED 
  tcp        0      0 127.0.0.1:38912             127.0.0.1:12321             TIME_WAIT 
  tcp        0      0 127.0.0.1:10248             0.0.0.0:*               LISTEN      978/kubelet         
  tcp        0      0 127.0.0.1:10249              0.0.0.0:*               LISTEN      3146/kube-proxy     
  tcp        0      0 192.168.2.130:2379          0.0.0.0:*               LISTEN      2650/etcd           
  tcp        0      0 127.0.0.1:2379               0.0.0.0:*               LISTEN      2650/etcd  
1、统计每个state的数量
[root@xieshan 0707]# awk 'NR>1{a[$6]+=1}END{for (i in a)print i,a[i]}' address.txt |sort -k2 -nr
TIME_WAIT 6
ESTABLISHED 6
LISTEN 4
2、统计输出连接到本主机连接数最多的3个IP，并按连接数从多到少排序（降序)
[root@xieshan 0707]# awk '$6=="ESTABLISHED"{a[$5]+=1}END{for (i in a)print i,a[i]}' address.txt |sort -k2 -nr
172.16.17.83:5921 2
172.16.10.25:5921 2
127.0.0.1:35422 2
 3、用IP简单的正则匹配上面出现的所有的IP
[root@xieshan 0707]# awk '$4,$5 ~/^((25[0-5]|2[0-4]\d|1?\d\d?)\.){3}(25[0-5]|2[0-4]\d|1?\d\d?)$/{print $4,$5}' address.txt 
Local Address
172.16.18.227:38734 172.16.10.25:5921
172.16.18.227:33046 172.16.17.83:5921
127.0.0.1:38978 127.0.0.1:12321
127.0.0.1:38990 127.0.0.1:12321
127.0.0.1:3306 127.0.0.1:35422
127.0.0.1:38912 127.0.0.1:12321
172.16.18.227:38734 172.16.10.25:5921
172.16.18.227:33046 172.16.17.83:5921
127.0.0.1:38978 127.0.0.1:12321
127.0.0.1:38990 127.0.0.1:12321
127.0.0.1:3306 127.0.0.1:35422
127.0.0.1:38912 127.0.0.1:12321
127.0.0.1:10248 0.0.0.0:*
127.0.0.1:10249 0.0.0.0:*
192.168.2.130:2379 0.0.0.0:*
127.0.0.1:2379 0.0.0.0:*

有一个nginx的日志文件：

1.计算每分钟的带宽

2.统计每个URI（即不带问号?后面的内容）的每分钟的频率

[root@xieshan 0707]# cat nginx.log 
##以下是nginx日志的字段含义
##$time_iso8601|$host|$http_cf_connecting_ip|$request|$status|$body_bytes_sent|$http_referer|$http_user_agent
2019-04-25T09:51:58+08:00|a.google.com|47.52.197.27|GET /v2/depth?symbol=aaa HTTP/1.1|200|24|-|apple
2019-04-25T09:52:58+08:00|b.google.com|47.75.159.123|GET /v2/depth?symbol=bbb HTTP/1.1|200|407|-|python-requests/2.20.0
2019-04-25T09:54:58+08:00|d.shuzibi.co|-||HEAD /justfor.txt HTTP/1.0|200|0|-|-
2019-04-25T09:55:58+08:00|e.google.com|13.251.98.2|GET /v2/order_detail?apiKey=ddd HTTP/1.1|200|231|-|python-requests/2.18.4
2019-04-25T09:56:58+08:00|f.google.com|210.3.168.106|GET /v2/trade_detail?apiKey=eee HTTP/1.1|200|24|-|-
2019-04-25T09:57:58+08:00|g.google.com|47.75.115.217|GET /v2/depth?symbol=fff HTTP/1.1|200|397|-|python-requests/2.18.4
2019-04-25T09:58:58+08:00|h.google.com|47.75.58.56|GET /v2/depth?symbol=ggg HTTP/1.1|200|404|-|safari
2019-04-25T09:54:58+08:00|d.shuzibi.co|-||HEAD /justfor.txt HTTP/1.0|200|0|-|-
2019-04-25T09:55:58+08:00|e.google.com|13.251.98.2|GET /v2/order_detail?apiKey=ddd HTTP/1.1|200|231|-|python-requests/2.18.4
2019-04-25T09:56:58+08:00|f.google.com|210.3.168.106|GET /v2/trade_detail?apiKey=eee HTTP/1.1|200|24|-|-
2019-04-25T09:59:58+08:00|i.google.com|188.40.137.175|GET /v2/trade_detail?symbol=hhh HTTP/1.1|200|6644|-|-
2019-04-25T09:59:58+08:00|i.google.com|188.40.137.175|GET /v2/trade_detail?symbol=hhh HTTP/1.1|200|6644|-|-
2019-04-25T09:59:58+08:00|i.google.com|188.40.137.175|GET /v2/trade_detail?symbol=hhh HTTP/1.1|200|6644|-|-
2019-04-25T09:59:58+08:00|i.google.com|188.40.137.175|GET /v2/trade_detail?symbol=hhh HTTP/1.1|200|6644|-|-
2019-04-25T10:01:58+08:00|j.google.com|2600:3c01:0:0:f03c:91ff:fe60:49b8|GET /v2/myposition?apiKey=jjj HTTP/1.1|200|110|-|scan
2019-04-25T09:58:58+08:00|h.google.com|47.75.58.56|GET /v2/depth?symbol=ggg HTTP/1.1|200|404|-|safari
2019-04-25T09:59:58+08:00|i.google.com|188.40.137.175|GET /v2/trade_detail?symbol=hhh HTTP/1.1|200|6644|-|-
2019-04-25T10:01:58+08:00|j.google.com|2600:3c01:0:0:f03c:91ff:fe60:49b8|GET /v2/myposition?apiKey=jjj HTTP/1.1|200|110|-|scan
计算每分钟的带宽
用时间做key，body_bytes_sent做value，进行累计
[root@xieshan 0707]#  awk -F"|" '{traffic[substr($1,1,16)]+=$6}END{for (i in traffic) print i,traffic[i]}' nginx.log|sort -k2 -nr|head -5
2019-04-25T09:59 33220
2019-04-25T09:58 808
2019-04-25T09:55 462
2019-04-25T09:52 407
2019-04-25T09:54 400
统计每个URI（即不带问号?后面的内容）的每分钟的频率
以时间+uri作为key值，出现次数作为value
[root@xieshan 0707]# awk -F"[ |?]+" '{uri[substr($1,1,16)$5]+=1}END{for (i in uri)print i,uri[i]}' nginx.log |sort -k2 -nr|head -3
2019-04-25T09:59/v2/trade_detail 5
2019-04-25T10:01/v2/myposition 2
2019-04-25T09:58/v2/depth 2

awk可以对日志文件进行分析

数据采集/收集--》清洗数据--》数据集--》数据仓库---》数据分析

##########################

求取grade.txt中，每科成绩中分数最高的人和它的姓名

[root@xieshan lianxi]# vim grade.txt 
[root@xieshan lianxi]# cat grade.txt 
学生A 语文 100 
学生B 数学 90 
学生A 英语 99 
学生C 语文 80
学生B 英语 56
[root@xieshan lianxi]# awk '{if (a[$2]<$3) {a[$2]=$3;b[$2]=$1}}END{for (i in a)print "科目："i,"分数："a[i],"姓名："b[i]}' grade.txt 
科目：语文 分数：100 姓名：学生A
科目：数学 分数：90 姓名：学生B
科目：英语 分数：99 姓名：学生A

在上面这个例子中，a[$2]代表的其实是分数，b[$2]代表的是姓名，这都是自己定义的；可以理解为$2--->a[$2]以及$2--->b[$2]

你可能感兴趣的:(Linux,大数据,运维,linux)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
RK3229_Android9.0_Box 4G模块EC200A调试 suifen_ 网络
0、kernel修改这部分完全可以参考Linux的移植：RK3588EC200A-CN【4G模块】调试_rkec200a-cn-CSDN博客1、修改device/rockchip/rk322xdiff--gita/device.mkb/device.mkindexec6bfaa..e7c32d1100755---a/device.mk+++b/device.mk@@-105,6+105,8@@en
linux 安装Sublime Text 3 hhyiyuanyu Python学习 linux sublime text
方法/步骤打开官网http://www.sublimetext.com/3，选择64位进行下载执行命令wgethttps://download.sublimetext.com/sublime_text_3_build_3126_x64.tar.bz2进行下载3、下载完成进行解压,执行tar-xvvfsublime_text_3_build_3126_x64.tar.bz解压4、解压完成以后，移动到
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb