xitong

尚观第6天学习笔记高级命令篇

[root@station230 tmp]# vncviewer 192.168.2.253

高级文件管理命令：
cat主要有三大功能：
1.一次显示整个文件。$ cat filename
2.从键盘创建一个文件。$ cat > filename
只能创建新文件,不能编辑已有文件.
3.将几个文件合并为一个文件： $cat file1 file2 > file

参数：
-n 或 --number 由 1 开始对所有输出的行数编号
-b 或 --number-nonblank 和 -n 相似，只不过对于空白行不编号
-s 或 --squeeze-blank 当遇到有连续两行以上的空白行，就代换为一行的空白行
-v 或 --show-nonprinting
例：
把 textfile1 的档案内容加上行号后输入 textfile2 这个档案里
cat -n textfile1 > textfile2

把 textfile1 和 textfile2 的档案内容加上行号（空白行不加）之后将内容附加到 textfile3 里。
cat -b textfile1 textfile2 >> textfile3

把test.txt文件扔进垃圾箱，赋空值test.txt

cat /dev/null > /etc/test.txt

cat :
[root@station230 tmp]# cat a //查看一个文件
haha
[root@station230 tmp]# cat a > a.txt 添加a到一个文件中会覆盖之前的内容
[root@station230 tmp]# cat a.txt
haha
[root@station230 tmp]# cat a >> a.txt 追加，不会覆盖之前的内容
[root@station230 tmp]# cat a.txt
haha
haha
[root@station230 tmp]# cat -n a.txt 显示内容和行号
1 haha
2 haha

[root@station230 tmp]# cat -b a.txt ／／不显示空行行号但是空格是显示的
1 haha
2 haha

3 haha
[root@station230 tmp]# cat -bs a.txt ／／把多个空行合并成1行
1 haha
2 haha
3 haha

[root@station230 tmp]# cat b.txt
heihei
1111111
2222222
[root@station230 tmp]# tac b.txt //倒序显示
2222222
1111111
heihei

===============================================
[root@station230 tmp]# cat a.txt | grep -v ^$ //不显示空行 ^$ 为显示空行 -v表示取反
haha
haha
haha
================================================

tr:
只能替换单个字符
[root@station230 tmp]# cat a.txt | tr 'h' 'A' //讲所有的h替换成A
AaAa
AaAa
AaAa
[root@station230 tmp]# cat a.txt | tr 'a-z' 'A-Z' //将所有的小写字符换成大写
HAHA
HAHA
HAHA

cut:命令

1 一两句话描述一下cut命令吧!
正如其名，cut的工作就是“剪”，具体的说就是在文件中负责剪切数据用的。
cut是以每一行为一个处理对象的，这种机制和sed是一样的。（关于sed的入门文章将在近期发布）
2 cut一般以什么为依据呢? 也就是说，我怎么告诉cut我想定位到的剪切内容呢?
cut命令主要是接受三个定位方法：
第一，字节（bytes），用选项-b
第二，字符（characters），用选项-c
第三，域（fields），用选项-f 指定第几部分
第四，-d指定分割符
事例：
[root@station230 tmp]# cat c.txt
haha heihei nihao 4444
haha heihei nihao 4444
haha heihei nihao 4444
[root@station230 tmp]# cut -d " " -f 2 c.txt //-d 指定分隔符 -f指定取第几列
heihei
heihei
heihei
[root@station230 tmp]# cut -d " " -f 1,3 c.txt //取第1和第3列
haha nihao
haha nihao
haha nihao
[root@station230 tmp]# cut -d " " -f 3- c.txt //取第三列以后的所有字段
nihao 4444
nihao 4444
nihao 4444
具体事例：
取本机ip地址 192。168。1。253
方法一：
[root@station230 tmp]# ifconfig eth0 | grep Bca | cut -d : -f 2 | cut -d ' ' -f 1
192.168.2.253
方法二：
[root@station230 tmp]# cat -n /etc/sysconfig/network-scripts/ifcfg-eth0 | grep 11 | cut -d = -f 2
192.168.2.253
补充
1 以“字节”定位，给个最简单的例子?
举个例子吧，当你执行ps命令时，会输出类似如下的内容：
[rocrocket@rocrocket programming]$ who
rocrocket :0 2009-01-08 11:07
rocrocket pts/0 2009-01-08 11:23 (:0.0)
rocrocket pts/1 2009-01-08 14:15 (:0.0)
如果我们想提取每一行的第3个字节，就这样：

[rocrocket@rocrocket programming]$ who|cut -b 3
c
c
c

看明白了吧，-b后面可以设定要提取哪一个字节，其实-b和3之间没有空格也是可以的，但推荐有空格:)

2 如果“字节”定位中，我想提取第3，第4、第5和第8个字节，怎么办?
-b支持形如3-5的写法，而且多个定位之间用逗号隔开就成了。看看例子吧：

[rocrocket@rocrocket programming]$ who|cut -b 3-5,8
croe
croe
croe

但有一点要注意，cut命令如果使用了-b选项，那么执行此命令时，cut会先把-b后面所有的定位进行从小到大排序，然后再提取。可不能颠倒定位的顺序哦。这个例子就可以说明这个问题：

[rocrocket@rocrocket programming]$ who|cut -b 8,3-5
croe
croe
croe

3 还有哪些类似“3-5”这样的小技巧，列举一下吧!

[rocrocket@rocrocket programming]$ who
rocrocket :0 2009-01-08 11:07
rocrocket pts/0 2009-01-08 11:23 (:0.0)
rocrocket pts/1 2009-01-08 14:15 (:0.0)

[rocrocket@rocrocket programming]$ who|cut -b -3
roc
roc
roc
[rocrocket@rocrocket programming]$ who|cut -b 3-
crocket :0 2009-01-08 11:07
crocket pts/0 2009-01-08 11:23 (:0.0)
crocket pts/1 2009-01-08 14:15 (:0.0)
想必你也看到了，-3表示从第一个字节到第三个字节，而3-表示从第三个字节到行尾。如果你细心，你可以看到这两种情况下，都包括了第三个字节“c”。
如果我执行who|cut -b -3,3-，你觉得会如何呢？答案是输出整行，不会出现连续两个重叠的c的。看：
[rocrocket@rocrocket programming]$ who|cut -b -3,3-
rocrocket :0 2009-01-08 11:07
rocrocket pts/0 2009-01-08 11:23 (:0.0)
rocrocket pts/1 2009-01-08 14:15 (:0.0)
4 给个以字符为定位标志的最简单的例子吧!
下面例子你似曾相识，提取第3，第4，第5和第8个字符：
[rocrocket@rocrocket programming]$ who|cut -c 3-5,8
croe
croe
croe
不过，看着怎么和-b没有什么区别啊？莫非-b和-c作用一样? 其实不然，看似相同，只是因为这个例子举的不好，who输出的都是单字节字符，所以用-b和-c没有区别，如果你提取中文，区别就看出来了，来，看看中文提取的情况：
[rocrocket@rocrocket programming]$ cat cut_ch.txt
星期一
星期二
星期三
星期四
[rocrocket@rocrocket programming]$ cut -b 3 cut_ch.txt
?
?
?
?
[rocrocket@rocrocket programming]$ cut -c 3 cut_ch.txt
一
二
三
四
看到了吧，用-c则会以字符为单位，输出正常；而-b只会傻傻的以字节（8位二进制位）来计算，输出就是乱码。
既然提到了这个知识点，就再补充一句，如果你学有余力，就提高一下。
当遇到多字节字符时，可以使用-n选项，-n用于告诉cut不要将多字节字符拆开。例子如下：
[rocrocket@rocrocket programming]$ cat cut_ch.txt |cut -b 2
?
?
?
?
[rocrocket@rocrocket programming]$ cat cut_ch.txt |cut -nb 2
[rocrocket@rocrocket programming]$ cat cut_ch.txt |cut -nb 1,2,3
星
星
星
星
5 域是怎么回事呢？解释解释:)
为什么会有“域”的提取呢，因为刚才提到的-b和-c只能在固定格式的文档中提取信息，而对于非固定格式的信息则束手无策。这时候“域”就派上用场了。
（下面的讲解内容是在假设你对/etc/passwd文件的内容和组织形式比较了解的情况下进行的。）
如果你观察过/etc/passwd文件，你会发现，它并不像who的输出信息那样具有固定格式，而是比较零散的排放。但是，冒号在这个文件的每一行中都起到了非常重要的作用，冒号用来隔开每一个项。
我们很幸运，cut命令提供了这样的提取方式，具体的说就是设置“间隔符”，再设置“提取第几个域”，就OK了！
以/etc/passwd的前五行内容为例：
[rocrocket@rocrocket programming]$ cat /etc/passwd|head -n 5
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[rocrocket@rocrocket programming]$ cat /etc/passwd|head -n 5|cut -d : -f 1
root
bin
daemon
adm
lp
看到了吧，用-d来设置间隔符为冒号，然后用-f来设置我要取的是第一个域，再按回车，所有的用户名就都列出来了！呵呵有成就感吧！
当然，在设定-f时，也可以使用例如3-5或者4-类似的格式：
[rorocket@rocrocket programming]$ cat /etc/passwd|head -n 5|cut -d : -f 1,3-5
root:0:0:root
bin:1:1:bin
daemon:2:2:daemon
adm:3:4:adm
lp:4:7:lp
[rocrocket@rocrocket programming]$ cat /etc/passwd|head -n 5|cut -d : -f 1,3-5,7
root:0:0:root:/bin/bash
bin:1:1:bin:/sbin/nologin
daemon:2:2:daemon:/sbin/nologin
adm:3:4:adm:/sbin/nologin
lp:4:7:lp:/sbin/nologin
[rocrocket@rocrocket programming]$ cat /etc/passwd|head -n 5|cut -d : -f -2
root:x
bin:x
daemon:x
adm:x
lp:x
6 如果遇到空格和制表符时，怎么分辨呢？我觉得有点乱，怎么办？
有时候制表符确实很难辨认，有一个方法可以看出一段空格到底是由若干个空格组成的还是由一个制表符组成的。
[rocrocket@rocrocket programming]$ cat tab_space.txt
this is tab finish.
this is several space finish.
[rocrocket@rocrocket programming]$ sed -n l tab_space.txt
this is tab\tfinish.$
this is several space finish.$
看到了吧，如果是制表符（TAB），那么会显示为\t符号，如果是空格，就会原样显示。
通过此方法即可以判断制表符和空格了。
注意，上面sed -n后面的字符是L的小写字母哦，不要看错。（字母l、数字1还有或运算｜真是难分辨啊…，看来这三个比制表符还难分辨…）
7 我应该在cut -d中用什么符号来设定制表符或空格呢?
悄悄的告诉你，cut的-d选项的默认间隔符就是制表符，所以当你就是要使用制表符的时候，完全就可以省略-d选项，而直接用－f来取域就可以了！放心，相信我！
如果你设定一个空格为间隔符，那么就这样：
[rocrocket@rocrocket programming]$ cat tab_space.txt |cut -d ' ' -f 1
this
this
注意，两个单引号之间可确实要有一个空格哦，不能偷懒。
而且，你只能在-d后面设置一个空格，可不许设置多个空格，因为cut只允许间隔符是一个字符。
[rocrocket@rocrocket programming]$ cat tab_space.txt |cut -d ' ' -f 1
cut: the delimiter must be a single character
Try `cut --help' for more information.
8 我想将ps和cut命令配合使用时，怎么总是在最后两行出现重复现象？
这个问题的具体描述是如下这样的。
当cut和ps配合时：
[rocrocket@rocrocket programming]$ ps
PID TTY TIME CMD
2977 pts/0 00:00:00 bash
5032 pts/0 00:00:00 ps
[rocrocket@rocrocket programming]$ ps|cut -b 3
P
9
0
0
看，最后的0重复了两次！！而且，我也试过ps ef或ps aux均有此问题。
而当ps和其他命令配合时，均无此问题，例如cut和who配合则正常：
[rocrocket@rocrocket programming]$ who
rocrocket :0 2009-01-08 11:07
rocrocket pts/0 2009-01-08 11:23 (:0.0)
rocrocket pts/1 2009-01-08 14:15 (:0.0)
[rocrocket@rocrocket programming]$ who|cut -b3
c
c
c
其实这个问题是这样的，ps|cut会自身创建一个进程，所以当ps时也会提取出这个进程，然后通过管道输出到cut，所以cut截取后，就多出了一行，之所以会重复上一行内容，是由于我们恰巧取到了和上一行内容相同的字符而已。
你测试下执行ps和ps|cat就知道原因了！:)
9 cut有哪些缺陷和不足？
猜出来了吧？对，就是在处理多空格时。

如果文件里面的某些域是由若干个空格来间隔的，那么用cut就有点麻烦了，因为cut只擅长处理“以一个字符间隔”的文本内容。

wc的用法：

wc -c filename：显示一个文件的字节数
wc -m filename：显示一个文件的字符数
wc -l filename：显示一个文件的行数
wc -L filename：显示一个文件中的最长行的长度
wc -w filename：显示一个文件的字数
[rocrocket@rocrocket programming]$ cat wc1.txt
1 2
34 5
你好
[rocrocket@rocrocket programming]$ wc -c wc1.txt
16 wc1.txt
[rocrocket@rocrocket programming]$ wc -m wc1.txt
12 wc1.txt
[rocrocket@rocrocket programming]$ wc -l wc1.txt
3 wc1.txt
[rocrocket@rocrocket programming]$ wc -L wc1.txt
4 wc1.txt
[rocrocket@rocrocket programming]$ wc -w wc1.txt
5 wc1.txt

uniq:命令
该命令各选项含义如下：、
– c 显示输出中，在每行行首加上本行在文件中出现的次数。它可取代- u和- d选项。
– d 只显示重复行。
– u 只显示文件中不重复的各行。
– n 前n个字段与每个字段前的空白一起被忽略。一个字段是一个非空格、非制表符的字符串，彼此由制表符和空格隔开(字段从0开始编号)。
+ n 前n个字符被忽略，之前的字符被跳过(字符从0开始编号)。
– f n 与- n相同，这里n是字段数。
– s n 与+n相同，这里n是字符数。
[root@station230 tmp]# cat c.txt | uniq
haha heihei nihao 4444
1111111111111111111111
haha heihei nihao 4444
[root@station230 tmp]# cat c.txt | uniq -c
2 haha heihei nihao 4444
1 1111111111111111111111
1 haha heihei nihao 4444
[root@station230 tmp]# cat c.txt | uniq -d
haha heihei nihao 4444
[root@station230 tmp]# cat c.txt | uniq -u
1111111111111111111111
haha heihei nihao 4444
例子：
统计/bin和/usr/bin目录下有多少个重复的命令
[root@station230 tmp]# ls /bin/ /usr/bin/ | sort | uniq -d | wc -l
13

sort：排序
1 sort的工作原理
sort将文件的每一行作为一个单位，相互比较，比较原则是从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。
[rocrocket@rocrocket programming]$ cat seq.txt
banana
apple
pear
orange
[rocrocket@rocrocket programming]$ sort seq.txt
apple
banana
orange
pear
2 sort的-u选项
它的作用很简单，就是在输出行中去除重复行。
[rocrocket@rocrocket programming]$ cat seq.txt
banana
apple
pear
orange
pear
[rocrocket@rocrocket programming]$ sort seq.txt
apple
banana
orange
pear
pear
[rocrocket@rocrocket programming]$ sort -u seq.txt
apple
banana
orange
pear
pear由于重复被-u选项无情的删除了。
3 sort的-r选项
sort默认的排序方式是升序，如果想改成降序，就加个-r就搞定了。
[rocrocket@rocrocket programming]$ cat number.txt
1
3
5
2
4
[rocrocket@rocrocket programming]$ sort number.txt
1
2
3
4
5
[rocrocket@rocrocket programming]$ sort -r number.txt
5
4
3
2
1
4 sort的-o选项
由于sort默认是把结果输出到标准输出，所以需要用重定向才能将结果写入文件，形如sort filename > newfile。
但是，如果你想把排序结果输出到原文件中，用重定向可就不行了。
[rocrocket@rocrocket programming]$ sort -r number.txt > number.txt
[rocrocket@rocrocket programming]$ cat number.txt
[rocrocket@rocrocket programming]$
看，竟然将number清空了。
就在这个时候，-o选项出现了，它成功的解决了这个问题，让你放心的将结果写入原文件。这或许也是-o比重定向的唯一优势所在。
[rocrocket@rocrocket programming]$ cat number.txt
1
3
5
2
4
[rocrocket@rocrocket programming]$ sort -r number.txt -o number.txt
[rocrocket@rocrocket programming]$ cat number.txt
5
4
3
2
1
5 sort的-n选项
你有没有遇到过10比2小的情况。我反正遇到过。出现这种情况是由于排序程序将这些数字按字符来排序了，排序程序会先比较1和2，显然1小，所以就将10放在2前面喽。这也是sort的一贯作风。
我们如果想改变这种现状，就要使用-n选项，来告诉sort，“要以数值来排序”！
[rocrocket@rocrocket programming]$ cat number.txt
1
10
19
11
2
5
[rocrocket@rocrocket programming]$ sort number.txt
1
10
11
19
2
5
[rocrocket@rocrocket programming]$ sort -n number.txt
1
2
5
10
11
19
6 sort的-t选项和-k选项
如果有一个文件的内容是这样：
[rocrocket@rocrocket programming]$ cat facebook.txt
banana:30:5.5
apple:10:2.5
pear:90:2.3
orange:20:3.4
这个文件有三列，列与列之间用冒号隔开了，第一列表示水果类型，第二列表示水果数量，第三列表示水果价格。
那么我想以水果数量来排序，也就是以第二列来排序，如何利用sort实现？
幸好，sort提供了-t选项，后面可以设定间隔符。（是不是想起了cut和paste的-d选项，共鸣～～）
指定了间隔符之后，就可以用-k来指定列数了。
[rocrocket@rocrocket programming]$ sort -n -k 2 -t : facebook.txt
apple:10:2.5
orange:20:3.4
banana:30:5.5
pear:90:2.3
我们使用冒号作为间隔符，并针对第二列来进行数值升序排序，结果很令人满意。
7 其他的sort常用选项
-f会将小写字母都转换为大写字母来进行比较，亦即忽略大小写
-c会检查文件是否已排好序，如果乱序，则输出第一个乱序的行的相关信息，最后返回1
-C会检查文件是否已排好序，如果乱序，不输出内容，仅返回1
-M会以月份来排序，比如JAN小于FEB等等
-b会忽略每一行前面的所有空白部分，从第一个可见字符开始比较。
有时候学习脚本，你会发现sort命令后面跟了一堆类似-k1,2，或者-k1.2 -k3.4的东东，有些匪夷所思。今天，我们就来搞定它—-k选项！
1 准备素材
$ cat facebook.txt
google 110 5000
baidu 100 5000
guge 50 3000
sohu 100 4500
第一个域是公司名称，第二个域是公司人数，第三个域是员工平均工资。（除了公司名称，其他的别信，都瞎写的^_^）
2 我想让这个文件按公司的字母顺序排序，也就是按第一个域进行排序：（这个facebook.txt文件有三个域）
$ sort -t ‘ ‘ -k 1 facebook.txt
baidu 100 5000
google 110 5000
guge 50 3000
sohu 100 4500
看到了吧，就直接用-k 1设定就可以了。（其实此处并不严格，稍后你就会知道）
3 我想让facebook.txt按照公司人数排序
$ sort -n -t ‘ ‘ -k 2 facebook.txt
guge 50 3000
baidu 100 5000
sohu 100 4500
google 110 5000
不用解释，我相信你能懂。
但是，此处出现了问题，那就是baidu和sohu的公司人数相同，都是100人，这个时候怎么办呢？按照默认规矩，是从第一个域开始进行升序排序，因此baidu排在了sohu前面。
4 我想让facebook.txt按照公司人数排序，人数相同的按照员工平均工资升序排序：
$ sort -n -t ‘ ‘ -k 2 -k 3 facebook.txt
guge 50 3000
sohu 100 4500
baidu 100 5000
google 110 5000
看，我们加了一个-k2 -k3就解决了问题。对滴，sort支持这种设定，就是说设定域排序的优先级，先以第2个域进行排序，如果相同，再以第3个域进行排序。（如果你愿意，可以一直这么写下去，设定很多个排序优先级）
5 我想让facebook.txt按照员工工资降序排序，如果员工人数相同的，则按照公司人数升序排序：（这个有点难度喽）
$ sort -n -t ‘ ‘ -k 3r -k 2 facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
guge 50 3000
此处有使用了一些小技巧，你仔细看看，在-k 3后面偷偷加上了一个小写字母r。你想想，再结合我们上一篇文章，能得到答案么？揭晓：r和-r选项的作用是一样的，就是表示逆序。因为sort默认是按照升序排序的，所以此处需要加上r表示第三个域（员工平均工资）是按照降序排序。此处你还可以加上n，就表示对这个域进行排序时，要按照数值大小进行排序，举个例子吧：
$ sort -t ‘ ‘ -k 3nr -k 2n facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
guge 50 3000
看，我们去掉了最前面的-n选项，而是将它加入到了每一个-k选项中了。
6 -k选项的具体语法格式
要继续往下深入的话，就不得不来点理论知识。你需要了解-k选项的语法格式，如下：
[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]
这个语法格式可以被其中的逗号（“，”）分为两大部分，Start部分和End部分。
先给你灌输一个思想，那就是“如果不设定End部分，那么就认为End被设定为行尾”。这个概念很重要的，但往往你不会重视它。
Start部分也由三部分组成，其中的Modifier部分就是我们之前说过的类似n和r的选项部分。我们重点说说Start部分的FStart和C.Start。
C.Start也是可以省略的，省略的话就表示从本域的开头部分开始。之前例子中的-k 2和-k 3就是省略了C.Start的例子喽。
FStart.CStart，其中FStart就是表示使用的域，而CStart则表示在FStart域中从第几个字符开始算“排序首字符”。
同理，在End部分中，你可以设定FEnd.CEnd，如果你省略.CEnd，则表示结尾到“域尾”，即本域的最后一个字符。或者，如果你将CEnd设定为0(零)，也是表示结尾到“域尾”。
7 突发奇想，从公司英文名称的第二个字母开始进行排序：
$ sort -t ‘ ‘ -k 1.2 facebook.txt
baidu 100 5000
sohu 100 4500
google 110 5000
guge 50 3000
看，我们使用了-k 1.2，这就表示对第一个域的第二个字符开始到本域的最后一个字符为止的字符串进行排序。你会发现baidu因为第二个字母是a而名列榜首。sohu和 google第二个字符都是o，但sohu的h在google的o前面，所以两者分别排在第二和第三。guge只能屈居第四了。
8 又突发奇想，，只针对公司英文名称的第二个字母进行排序，如果相同的按照员工工资进行降序排序：
$ sort -t ‘ ‘ -k 1.2,1.2 -k 3,3nr facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
guge 50 3000
由于只对第二个字母进行排序，所以我们使用了-k 1.2,1.2的表示方式，表示我们“只”对第二个字母进行排序。（如果你问“我使用-k 1.2怎么不行？”，当然不行，因为你省略了End部分，这就意味着你将对从第二个字母起到本域最后一个字符为止的字符串进行排序）。对于员工工资进行排序，我们也使用了-k 3,3，这是最准确的表述，表示我们“只”对本域进行排序，因为如果你省略了后面的3，就变成了我们“对第3个域开始到最后一个域位置的内容进行排序” 了。
9 在modifier部分还可以用到哪些选项？
可以用到b、d、f、i、n 或 r。
其中n和r你肯定已经很熟悉了。
b表示忽略本域的签到空白符号。
d表示对本域按照字典顺序排序（即，只考虑空白和字母）。
f表示对本域忽略大小写进行排序。
i表示忽略“不可打印字符”，只针对可打印字符进行排序。（有些ASCII就是不可打印字符，比如\a是报警，\b是退格，\n是换行，\r是回车等等）
10 思考思考关于-k和-u联合使用的例子：
$ cat facebook.txt
google 110 5000
baidu 100 5000
guge 50 3000
sohu 100 4500
这是最原始的facebook.txt文件。
$ sort -n -k 2 facebook.txt
guge 50 3000
baidu 100 5000
sohu 100 4500
google 110 5000
$ sort -n -k 2 -u facebook.txt
guge 50 3000
baidu 100 5000
google 110 5000
当设定以公司员工域进行数值排序，然后加-u后，sohu一行就被删除了！原来-u只识别用-k设定的域，发现相同，就将后续相同的行都删除。
$ sort -k 1 -u facebook.txt
baidu 100 5000
google 110 5000
guge 50 3000
sohu 100 4500
$ sort -k 1.1,1.1 -u facebook.txt
baidu 100 5000
google 110 5000
sohu 100 4500
这个例子也同理，开头字符是g的guge就没有幸免于难。
$ sort -n -k 2 -k 3 -u facebook.txt
guge 50 3000
sohu 100 4500
baidu 100 5000
google 110 5000
咦！这里设置了两层排序优先级的情况下，使用-u就没有删除任何行。原来-u是会权衡所有-k选项，将都相同的才会删除，只要其中有一级不同都不会轻易删除的:)（不信，你可以自己加一行sina 100 4500试试看）
11 最诡异的排序：
$ sort -n -k 2.2,3.1 facebook.txt
guge 50 3000
baidu 100 5000
sohu 100 4500
google 110 5000
以第二个域的第二个字符开始到第三个域的第一个字符结束的部分进行排序。
第一行，会提取0 3，第二行提取00 5，第三行提取00 4，第四行提取10 5。
又因为sort认为0小于00小于000小于0000….
因此0 3肯定是在第一个。10 5肯定是在最后一个。但为什么00 5却在00 4前面呢？（你可以自己做实验思考一下。）
答案揭晓：原来“跨域的设定是个假象”，sort只会比较第二个域的第二个字符到第二个域的最后一个字符的部分，而不会把第三个域的开头字符纳入比较范围。当发现00和00相同时，sort就会自动比较第一个域去了。当然baidu在sohu前面了。用一个范例即可证实：
$ sort -n -k 2.2,3.1 -k 1,1r facebook.txt
guge 50 3000
sohu 100 4500
baidu 100 5000
google 110 5000
12 有时候在sort命令后会看到+1 -2这些符号，这是什么东东？
关于这种语法，最新的sort是这么进行解释的：
On older systems, `sort’ supports an obsolete origin-zero syntax `+POS1 [-POS2]‘ for specifying sort keys. POSIX 1003.1-2001 (*note Standards conformance::) does not allow this; use `-k’ instead.

diff：比较两个文件的不同
1)diff的传统格式输出.
　　############################################
　　cat before.txt
　　输出:
　　This is a line to be deleted
　　This is a line that will be changed
　　This is a line that will be unchanged
　　cat after.txt
　　输出:
　　This is a line that has been changed
　　This is a line that will be unchanged
　　This is a line that has been added
　　############################################
　　diff before.txt after.txt
　　输出:
　　1,2c1
　　< This is a line to be deleted
　　< This is a line that will be changed
　　---
　　> This is a line that has been changed
　　3a3
　　> This is a line that has been added
　　############################################
　　注释:
　　传统格式的输出
　　1,2c1是指替换第1个文件的第1,2行到第2个文件的第2行,这里的1,2是指第1个文件的第1,2行,c是替换的意思,最后的1是第2个文件的第1行
　　<号是指第1个文件更改或删除的行
　　---号是分割两个文件
　　>号是第2个文件中增加或删除的行
　　3a3是指将第2个文件的第3行插入到第一个文件的第3行
　　也就是说第1个文件的:
　　< This is a line to be deleted
　　< This is a line that will be changed
　　被替换成第2个文件的:
　　> This is a line that has been changed
　　由于第1个文件的第3行和第2个文件的第2行一致,所以不做修改.
　　由于第2个文件的第3行是第1个文件所不具有的,所以在第1个文件的最后一行增加:
　　> This is a line that has been added

2)patch命令的应用
　　用diff的传统格式输出:
　　#################################
　　diff before.txt after.txt >mypatch.txt
　　#################################
　　用patch修补before.txt文件,使before.txt和after.txt一致.
　　#################################
　　cat mypatch.txt |patch before.txt
　　输出:
　　patching file before.txt
　　#################################
　　比较两个文件，现在是一致的了.
　　#################################
　　cmp before.txt after.txt
　　#################################
　　用patch命令恢复before.txt.
　　#################################
　　patch -R before.txt <mypatch.txt
　　输出:
　　patching file before.txt
　　#################################
　　注:-R标记告诉patch在反向上应用区别或者撤销patch.
　　再比较两个文件,现在不一致了.
　　#################################
　　cmp before.txt after.txt
　　输出:
　　before.txt after.txt differ: byte 17, line 1
　　#################################

3)diff的统一格式输出.
　　#################################
　　diff -u before.txt after.txt |tee mypatch.diff
　　输出:
　　--- before.txt 2009-06-20 05:21:49.000000000 +0800
　　+++ after.txt 2009-06-20 04:03:16.000000000 +0800
　　@@ -1,3 +1,3 @@
　　-This is a line to be deleted
　　-This is a line that will be changed
　　+This is a line that has been changed
　　This is a line that will be unchanged
　　+This is a line that has been added
　　#################################
　　注释:
　　diff -u选项是统一格式输出.
　　--- before.txt 2009-06-20 05:21:49.000000000 +0800
　　--- before.txt是指旧文件
　　+++ after.txt 2009-06-20 04:03:16.000000000 +0800
　　+++ after.txt是指新文件.
　　@@ -1,3 +1,3 @@
　　@@ -1,3是指第1个文件一共有3行,+1,3 @@是指第2个文件一共有3行.
　　-This is a line to be deleted
　　-This is a line that will be changed
　　是被删除的行
　　+This is a line that has been changed
　　是增加的行
　　This is a line that will be unchanged
　　没有-号和+号是指该行不变,因为after.txt和before.txt都有这行.
　　+This is a line that has been added
　　是增加的行
　　diff的统一格式比较与输出是按顺序进行的.
4)diff命令在目录中的应用.
　　新建old和new目录,old目录包含了初始内容,new目录包含文件的最新版本.
　　##########################################
　　mkdir old new
　　echo "This is one. It's unchanged." | tee old/one new/one
　　echo "This is two. It will change." > old/two
　　echo "This is two. It changed.">new/two
　　echo "This is three. It's new" > new/three
　　##########################################
　　创建修补文件
　　##########################################
　　diff -Nur old/ new/ >mypatch.diff
　　##########################################
　　注:-r选项按照文件目录递归创建修补文件.
　　-u还是统一模式
　　-N是指当diff遇到一个只存在于两个树中的一个树中的文件时,默认情况下跳过文件并且打印一个警告到stderr.
　　这个行为可以通过-N选项来更改,这也导致了diff认为丢失的文件实际上是存在的,但它是空的.采用这种方式,
　　一个修补文件可以包括已经创建的文件.然后应用修补程序创建新的文件.
　　##########################################
　　more mypatch.diff
　　输出:
　　diff -Nur old/three new/three
　　--- old/three 1970-01-01 08:00:00.000000000 +0800
　　+++ new/three 2009-06-20 06:55:34.000000000 +0800
　　@@ -0,0 +1 @@
　　+This is three. It's new
　　diff -Nur old/two new/two
　　--- old/two 2009-06-20 06:55:08.000000000 +0800
　　+++ new/two 2009-06-20 06:55:21.000000000 +0800
　　@@ -1 +1 @@
　　-This is two. It will change.
　　+This is two. It changed.
　　##########################################
[root@station230 tmp]# diff a b > patch.diff 比较不同并产生补丁文件
打补丁：
[root@station230 tmp]# patch a patch.diff
patching file a
[root@station230 tmp]# cat a
haha
haha
1111
2222

查找命令：
whereis which locate find
[root@station230 tmp]# whereis ls
ls: /bin/ls /usr/share/man/man1p/ls.1p.gz /usr/share/man/man1/ls.1.gz
[root@station230 tmp]# which passwd
/usr/bin/passwd
[root@station230 tmp]# which ls
alias ls='ls --color=tty'
/bin/ls
[root@station230 tmp]# whatis ls
locate：
[root@station230 tmp]# touch abcd.txt
[root@station230 tmp]# locate abcd.txt(关键字)
[root@station230 tmp]# vim /etc/updatedb.conf locate数据库配置文件
[root@station230 tmp]#
[root@station230 tmp]# locate abcd.txt
[root@station230 tmp]# updatedb 手动更新数据库

find:
#find 路径条件动作［-exec(-ok) rm....］
按名称：
[root@station230 tmp]# find / -name passwd
[root@station230 tmp]# find / -name *passwd*
[root@station230 tmp]# find / -name ??passwd
按大小：
[root@station230 tmp]# find /tmp/ -size 20M
/tmp/suibian1
[root@station230 tmp]# find /tmp/ -size -20M
[root@station230 tmp]# find /tmp/ -size +10M -a -size -20M
/tmp/suibian3
[root@station230 tmp]# find /tmp/ -size +10M -a -name suibian
[root@station230 tmp]# find /tmp/ -size +10M -a -name suibian3
/tmp/suibian3
根据类型查找：
[root@station230 tmp]# find /dev -type d
文件类型：
f
d
c
b
s
l
p
[root@station230 tmp]# find /tmp ! $ -type d -a -name .\* $
按时间：
[root@station230 tmp]# find /tmp -amin -3
[root@station230 tmp]# atime
[root@station230 tmp]# ctime
[root@station230 tmp]# mtime
[root@station230 tmp]# 后面跟天数
[root@station230 tmp]# amin
[root@station230 tmp]# cmin
[root@station230 tmp]# mmin
[root@station230 tmp]# 后面跟分钟
按权限：
[root@station230 b]# find /b -perm 544
/b/a
按链接(硬链接)个数：
[root@station230 b]# find -links 4
./e
./f
./a
./d
#ln -s a b 软链接重新创建一个新的inod
#ln a c 硬链接不重新创建
inod真正存储文件信息
按用户和组：
[root@station230 b]# find -user user1
[root@station230 b]# find -group root
查找完了之后作些其他的动作:-exec -0k（会询问）
[root@station230 b]# find -user user1 -exec file {} \;
[root@station230 b]# find -name b -ok rm {} \;
< rm ... ./b > ?
[root@station230 b]# find -name b
./b
[root@station230 b]# find -name b | xargs rm
[root@station230 b]# ls

你可能感兴趣的:(学习笔记)

Django快速上手案例 - 学习笔记项目（下）孤寒者 Django框架从入门到实战 django 后端 python 实战项目学习笔记项目快速上手
目录：每篇前言：1.让用户能够输入数据（1）添加新主题①用于添加主题的表单②URL模式new_topic③视图函数new_topic()④模板new_topic⑤链接到页面new_topic（2）添加新条目①用于添加新条目的表单②URL模式new_entry③视图函数new_entry()④模板new_entry⑤链接到页面new_entry（3）编辑已有条目①URL模式edit_entry②视图
闭包、装饰器学习笔记（第二次学习） CptainLee 学习笔记 python 闭包装饰器
以下是整理后的笔记格式：---#闭包与装饰器##一、闭包的概念，作用，条件###作用：1.**保存外部函数的变量**：可以让一个变量常驻于内存。```python deffunc(): a=10 definner(): print(a) returna returninner ret=func()````inner`函数的执行时间不确定，但必须保证`inn
python学习笔记（判断第几天） troublemaker、 #Python基础学习笔记零基础 python
每天30min学习python—判断第几天目录判断第几天1.0+2.0判断第几天3.0判断第几天4.0课后练习(1.0+2.0)实现功能输入某年某月某日，判断这是一年中的第几天？2.0新增：用tuple替换list知识点元组（tuple）特殊的数列类型一旦被创建不能修改，使得代码安全使用逗号和圆括号表示，比如（2,3,4）访问方式和列表相同tuple中元素可以是不同类型tuple中可以使用索引访问
Python的学习笔记案例5--判断第几天2.0 lanxingbudui Python的学习笔记8个案例 Python 判断第几天列表元组
1.0可以说使用“最笨”的方法得到日期是本年度的第几天，下面逐渐地改进方法，使用最简洁的代码来得到我们想要的东西。使用列表代替元组：首先，使用函数封装判断是否闰年的部分代码；其次，使用列表代替元组，更新2月份的天数，减少判断条件；最后，整体规范代码，使用{}占位符，使得输入结果更美观。"""作者：langxingbudui版本：2.0日期：2019-06-12功能：输入某年某月某日，判断这一天是这
python 网格_python 栅格处理利器之Rasterio weixin_40003512 python 网格
本文主要是Automatizedatadownloadautomating-gis-processes.github.io中栅格图像处理的学习笔记，分享给大家，同时也便于自己记忆以及查看，节省时间。数据准备如果手头有数据，可以跳过该步骤，如果没有，可以按照原文提供的下载链接，保存数据。importosimporturllibdefget_filename(url):"""Parsesfilenam
rust学习笔记20-Trait 水蜜桃one rust 学习笔记
Rust的trait是定义类型行为的核心机制，类似于其他语言中的接口（interface），但功能更强大。它是Rust实现多态（polymorphism）和抽象的核心工具。定义trait使用trait关键字定义一组方法签名（可包含默认实现）：traitHasArea{fnarea(&self)->f64;fnprint_area(&self){println!("面积是:{}",&self.are
ElasticSearch7学习笔记之重建索引、预处理、数据建模与压力测试 coder_szc ElasticSearch elasticsearch
文章目录重建索引使用场景UpdateByQuery1、插入数据2、改变Mapping3、变更生效4、查询测试Reindex1、新建索引2、重建索引3、查询测试IngestNode与数据预处理简介Pipeline与Processor_ingest/pipeline/_simulate管道api通过管道插入数据通过管道重建索引Painless脚本管道与painless脚本painless脚本更新数据保
第五天开始Unity Shader的学习之旅之Unity中的基础光照之漫反射光照模型傻欣一号 unity 学习游戏引擎
UnityShader的学习笔记第五天开始UnityShader的学习之旅之Unity中的基础光照之漫反射光照模型文章目录UnityShader的学习笔记前言一、Unity中的环境光和自发光二、漫反射光照模型逐顶点光照①Shader名称②定义属性③Tags④CGPROGRAM和ENDCG⑤定义vert和frag⑥#include"Lighting.cginc"⑦fixed4_Diffuse⑧a2v
鸿蒙NEXT开发中使用星闪服务
大家好，我是V哥，学习鸿蒙开发的星闪服务，整理了这个学习笔记分享给大家。NearLinkKit（星闪服务）是鸿蒙操作系统提供的一种低功耗、高速率的短距离通信服务，它允许设备之间进行连接和数据交互。以下是一些具体的使用案例和步骤，以帮助理解如何在实际业务中使用星闪服务。以下这些场景使用星闪智能座舱车内降噪：使用星闪服务在车辆内部进行音频信号的传输，以实现主动降噪功能。互动投屏：通过星闪服务将手机或其
【pytorch】图像数据预处理子根笔记 pytorch python 深度学习
本文是记录一些在深度学习中的预处理的一些语法和函数torchvision.transforms的图像变换[PyTorch学习笔记]2.3二十二种transforms图片数据预处理方法-知乎TORCHVISION.TRANSFORMS的图像预处理_阿巫兮兮的博客-CSDN博客PyTorch09：transforms图像变换、方法操作及自定义方法-YEY的博客|YEYBlog2D、3D中心裁剪：imp
Flink 源码解读系列 DataStream 带 Watermark 生成的时间戳分配器 @SmartSi Flink 源码解读 Flink flink java 大数据 Watermark
传送门：Flink系统性学习笔记Flink1.10这篇文章主要从源码角度讲一下FlinkDataStream中带Watermark生成的时间戳分配器。我们通常通过DataStream的assignTimestampsAndWatermarks方法分配时间戳并生成Watermark。assignTimestampsAndWatermarks方法可以传入两种时间戳分配器：周期性生成Watermark的
C++ 学习笔记 ShAn DiAn 学习笔记 c++
1.虚函数（VirtualFunction）定义：用virtual声明，允许派生类重写（覆盖）基类函数，实现运行时多态核心特性：动态绑定：通过基类指针/引用调用虚函数时，实际调用的是对象类型的函数（运行时确定）虚函数表（vtable）：每个包含虚函数的类有一个虚函数表，存储虚函数地址；对象内存中包含指向该表的指针（vptr）虚析构函数：若基类指针指向派生类对象，基类析构函数必须为虚函数，否则可能导
Flask学习笔记之g对象醉里_挑灯看剑 flask python flask
保存全局变量的g属性：g：globalg对象是专门用来保存用户的数据的。g对象在一次请求中的所有的代码的地方，都是可以使用的。g作为flask程序全局的一个临时变量,充当者中间媒介的作用,我们可以通过它传递一些数据，g保存的是当前请求的全局变量，不同的请求会有不同的全局变量，通过不同的threadid区别
黑马Go语言与区块链学习笔记码中求乐 go 区块链
GO语言统一了协程混乱的生态协程并不是Go特有的专利，很多语言都有协程这个概念，比方说很多语言支持await/waitfor，lambda，yield，loop，next……这些关键字的配合使用也只提供了一种从程序当中“中断”的能力，对于协程作业来说还远远不够。但是协程的实现其实是比较依赖操作系统的，所以别的语言在语义层面上支持协程的力度会显得非常非常地保守，作者更愿意把这件事情交给“协程库”去实
HTML5 Audio（音频）学习笔记齐尹秦 HTML学习笔记 html5 音视频学习
一、HTML5音频简介HTML5引入了元素，用于在网页中播放音频文件。这使得音频的嵌入变得更加简单和标准化。在HTML5之前，大多数音频是通过插件（如Flash）来播放的，但这种方式存在兼容性问题，因为并非所有浏览器都支持相同的插件。HTML5的元素为音频播放提供了一种标准方法。二、浏览器支持情况InternetExplorer9+、Firefox、Opera、Chrome和Safari都支持元素
HTML5 Geolocation（地理定位）学习笔记齐尹秦 HTML学习笔记 html5 学习笔记
一、HTML5Geolocation简介HTML5Geolocation（地理定位）API用于获取用户的地理位置信息。通过这个API，可以获取用户的纬度、经度、海拔等信息。由于地理定位可能涉及用户隐私，因此只有在用户同意的情况下，才能获取其位置信息。GeolocationAPI支持以下浏览器：InternetExplorer9+FirefoxChromeSafariOpera对于拥有GPS的设备（
TVD（Total Variation Diminishing）有限差分格式 Hardess-god TVD 算法
当然可以！下面是一篇关于TVD（TotalVariationDiminishing）有限差分格式的博客文章草稿，适合用于技术类博客或学习笔记。TVD（TotalVariationDiminishing）有限差分格式简介在计算流体力学（CFD）中，数值格式的选择对于模拟结果的精度与稳定性有着至关重要的影响。尤其在求解双曲型守恒律（如欧拉方程、可压缩Navier-Stokes方程）时，传统的中心差分格
Buildroot学习笔记憨猪在度假学习笔记
一、什么是BuildrootBuildroot是一个工具，它使用交叉编译，可以简化和自动化为嵌入式系统构建一个完整Linux系统的过程。Buildroot能够为您的目标对象生成交叉编译工具链、根文件系统、Linux内核镜像和bootloader引导加载程序。Buildroot可以独立应用于这些选项的任意组合（例如，您可以使用现有的交叉编译工具链，通过Buildroot来单独构建根文件系统）。Bui
朝颜的计算机网络学习笔记【Chapter 3.数据链路层】朝颜75Hz 学习网络网络协议
课程来源：「湖科大」计算机网络微课堂视频传送门Chapter3.数据链路层3.1数据链路层概述基本概念链路（Link）：就是从一个结点到相邻结点的一段物理线路，而中间没有任何其他的交换结点。数据链路（DataLink）：是指把实现通信协议的硬件和软件加到链路上，就构成了数据链路。数据链路层以帧为单位传输和处理数据。数据链路层的几个重要问题举例1：对于点对点信道的数据链路层而言封装成帧应用层协议数据
git 标签学习笔记 AI算法网奇 git git
目录轻量级标签带注释的标签（推荐）给指定commit打标签推送单个标签，需要单独推送，代码推送不会推送标签推送所有标签删除标签轻量级标签gittagv1.0.0只是简单地给当前commit打上v1.0.0标签。带注释的标签（推荐）gittag-av1.0.0-m"发布版本1.0.0"-a表示创建带注释的标签，-m说明标签的意义。给指定commit打标签gittag-av1.0.0-m"发布版本1.
python循环语句-爬虫学习笔记 Yang张洋 python学习笔记学习笔记 python pycharm
循环语句：可以让我们的代码重复的去执行1、while循环：while条件：代码过程：判断条件是否为真，如果真，执行代码，然后再次判断条件，。。。直到条件为假循环结束如：实现1-2+3-4+5-6....-100=?i=1s=0whilei<100:s=s-1i=i+2print(s)认识两个语句break:让当前这个循环立即停止continue：停止当前本次循环，继续执行下一次循环2、for循环字
2024年大数据最全教你IDEA解决GIT冲突_idea git解决冲突(2)，2024年最新面试复盘 2401_84170337 程序员大数据 intellij-idea git
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新需要这份系统化资料的朋友，可以戳这里获取能够多人协作:Git支持多人同时对同一个代码库进行协作开发，可以方便地合并不同人的修改或者解决代码冲突。以
使用UE4制作RPG类游戏（学习笔记6）（技术笔记5）＜刺客信条＞ FS9000 学习笔记技术笔记 ue4 游戏学习
项目介绍SLG：策略游戏SRPG:模拟类角色扮演游戏FTG：格斗游戏SPG：体育竞技类游戏MSC∶音乐游戏RCG（RAC）：竞速游戏STG：射击类游戏FPS：第一人称视角射击游戏TPS：第三人称视角射击游戏RPG：角色扮演游戏由玩家扮演游戏中的一个或数个角色，有完整的故事情节的游戏。玩家可能会与冒险类游戏混淆，其实区分很简单，RPG游戏更强调的是剧情发展和个人体验，一般来说，RPG可分为日式和美式
python学习笔记：range()函数用法 sunhaoning Python python
>>>range(1,5)#代表从1到5(不包含5)[1,2,3,4]>>>range(1,5,2)#代表从1到5，间隔2(不包含5)[1,3]>>>range(5)#代表从0到5(不包含5)[0,1,2,3,4]再看看list的操作:array=[1,2,5,3,6,8,4]#其实这里的顺序标识是[1,2,5,3,6,8,4](0，1，2，3，4，5，6)(-7,-6,-5,-4,-3,-2,-
【嵌入式学习笔记】---- MCO时钟 @Luminescence 嵌入式学习笔记学习笔记单片机
在STM32系列微控制器中，MCO（MicrocontrollerClockOutput）时钟输出功能是一项非常实用的功能，它可以用来将内部时钟信号输出到外部引脚，为外部设备提供时钟信号。本文将深入探讨STM32中MCO时钟输出功能的原理、配置以及应用场景。MCO时钟输出功能简介MCO时钟输出功能允许将STM32微控制器内部的时钟信号输出到指定的引脚上。通过配置MCO时钟输出功能，可以将系统时钟、
Tailwind CSS 学习笔记(二) SSHSHLSH css 前端
一、辅助工具在vscode中使用TailwindCSS，可安装官方提供的TailwindCSSIntelliSense插件，该插件可以提供自动补全、语法高亮及检查功能。二、TailwindCSS中的基本单位CSS中常见单位1、绝对单位绝对单位的值固定，不依赖其他元素或设备特性，通常用于打印或固定尺寸场景：像素(px):表示屏幕上的物理像素点，是绝对单位中最常用的。但实际物理尺寸受屏幕分辨率（dpi
Tailwind CSS 学习笔记(一) SSHSHLSH 前端UI 前端 css
一、简介TailwindCSS是一个工具优先的CSS框架，只需书写HTML代码，无需书写CSS，即可快速构建美观的网站。二、优点1、简洁、规整，避免了随意取类名TailwindCSS的工具类(Utilityclasses)能够为你提供一套约束系统，避免让你的样式表中出现随意的取值。它让颜色、间距、排版、阴影以及一切取值保持一致，并最终形成一个精心构建的设计系统2、灵活性强、你所想地就能实现由于Ta
python爬虫学习笔记-requests基础资料小助手 python #python爬虫 python 爬虫学习
爬虫初始为什么要学习爬虫之前在授课过程中，好多同学都问过我这样的一个问题：为什么要学习爬虫，学习爬虫能够为我们以后的发展带来那些好处？其实学习爬虫的原因和为我们以后发展带来的好处都是显而易见的，无论是从实际的应用还是从就业上。我们都知道，当前我们所处的时代是大数据的时代，在大数据时代，要进行数据分析，首先要有数据源，而学习爬虫，可以让我们获取更多的数据源，并且这些数据源可以按我们的目的进行采集。优
python学习笔记--实现简单的爬虫(一) moxiaoran5753 python
任务：爬取豆瓣最受欢迎的250个电影的资料链接：豆瓣电影Top250用浏览器打开后，使用F12或鼠标右键--检查，查看网页的源代码，分析网页结构，如下图所示：分析后得知：1.电影名位于class为hd的div中，里边嵌套中一层a标签和span标签，最终目的地为；2.电影评分位于class_="rating_num"的span中；3.电影资料位于class_="bd"的div中；参见下图：下面通过编
ensp学习笔记我就是一粒沙学习笔记华为
目录eNSP介绍VRP的介绍eNSP具有的显著特点任务实施——添加网络设备并修改标签名任务实施——配置设备主菜单包含的内容工具栏网络设备区工作区设备接口区任务实施——设置设备名称任务实施——设置系统时钟任务实施——设置标题信息任务实施——查看网络设备的基本信息任务实施——配置设备接口信息使用undo命令行undo命令用户恢复默认设置undo命令用来禁用某个功能undo命令用户删除某项配置命令行在线
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f