利用sed 命令去掉windows下回车符及空白符
windows下的回车符为 /r/n 而unix下的回车符是 /n
1.去掉所有行的空格
sed -i 's/ //g' df.txt
2.去掉所有行的空格
sed -e 's/ //g' df.txt >cwm.txt
3.将每一行拖尾的“空白字符”(空格,制表符)删除
sed 's/ *$//' df.txt >cwm.txt
4.将每一行中的前导和拖尾的空白字符删除
sed 's/^ *//;s/ *$//' df.txt >cwm.txt
5.去掉空行
sed '/^$/d' df.txt >cwm.txt
sed -e '/^$/d' df.txt >cwm.txt
sed -i '/^$/d' df.txt
这三个是等价的 但第三个会改变原文件
6.去掉windows下的回车符 (注意^M 在linux 下写法 按^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m)
sed -i 's/^M//g' df.txt
7.去掉windows下的回车符 (注意^M 在linux 下写法 按^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m)
sed -e 's/^M//g' df.txt >cwm.txt
8.sed 用正则表达式 8个字符一组换行
echo "aaaaaaaabbbbbbbbccccccccdddddddd"|sed 's/./{8/}/&/n/g'
aaaaaaaa
bbbbbbbb
cccccccc
dddddddd
也等价于
dos2unix df.txt >cwm.txt
----------------------------------------------------------------------------------------------
******如何去掉文件中行尾的回车符号^M******
sed 's/^M//g w newfilename' oldfilename
其中:
s 表示Searchg 表示搜索全文,缺省是搜索第一个^M 是回车换行符,输入方法是按住CTRL+v,松开v,按m
w 表示写到新文件中.
例子1
86103113234778,
86103145878770,
86103116778768,
86103111879708, sed 's/^86//;s/,$//' user.txt #去掉开头的86 及尾部的,号
例子2
103113234778
103145878770
103116778768
103111879708
sed -e 's/^/86/' user.txt #每行行首加上86
86103113234778
86103145878770
86103116778768
86103111879708
------------------------------------------------------------------
我有一个文件:
aaa,
bbb,
ccc,
ddd,
eee,
fff,
想删除第3,6,9。。。的空行并且合并12,45,78。。。行,
结果如下:
aaa,bbb,
ccc,ddd,
eee,fff,
.......
解法
sed -e '/^$/d' -e 'N;s//n//g'
或
sed 'N;N;s//n//g' (行数必须是3的倍数,不然最后一行不对)
对于替换单引号外层应加双引号
sed "s/^/'/;s/$/'/" 营帐GPRS用户.txt
===========================================================================
用sed 模式空间把时间格式加个空格
[oracle@TestAs4 filter]$ more nd_td.txt
13211124412,2008-08-2613:24:07,2008-08-2615:28:39
13144035749,2008-08-2613:24:06,2008-08-2615:30:39
13144023993,2008-08-2613:19:11,2008-08-2615:37:34
13006601565,2008-08-2612:04:15,2008-08-2615:40:34
13178665198,2008-08-2613:17:49,2008-08-2615:42:35
13058107546,2008-08-2613:08:41,2008-08-2615:49:35
13246005230,2008-08-2613:27:20,2008-08-2615:54:36
[oracle@TestAs4 filter]$ sed 's//(2008-[0-9][0-9]-[0-9][0-9]/)/& /g' nd_td.txt |more
13211124412,2008-08-26 13:24:07,2008-08-26 15:28:39
13144035749,2008-08-26 13:24:06,2008-08-26 15:30:39
13144023993,2008-08-26 13:19:11,2008-08-26 15:37:34
13006601565,2008-08-26 12:04:15,2008-08-26 15:40:34
13178665198,2008-08-26 13:17:49,2008-08-26 15:42:35
13058107546,2008-08-26 13:08:41,2008-08-26 15:49:35
13246005230,2008-08-26 13:27:20,2008-08-26 15:54:36
13169867085,2008-08-26 13:18:14,2008-08-26 15:58:34
13043484284,2008-08-26 12:04:07,2008-08-26 16:03:35
以下两个都是利用模式空间替换实现的
sed 's//(2008-[0-9][0-9]-[0-9][0-9]/)//1 /g' nd_td.txt |more
sed 's//(2008-[0-9][0-9]-[0-9][0-9]/)/([0-9][0-9]:[0-9][0-9]:[0-9][0-9]/)//1 /2/g' nd_td.txt |more
#echo ${orjtext0.txt//[!a-z]||[!0-9]} >orjtext1.txt
#sed -e 's/^M//g' orjtext01.txt >orjtext0.txt
#cat orjtext0.txt|sed s//n/r//n/ >orjtext01.txt
#doc2unix orjtext0.txt orjtext01.txt
col -b < orjtext0.txt > orjtext01.txt
cat orjtext01.txt|grep -v '^#'|sed '/^$/d' >>orjtext02.txt #把#号注释掉的和空行去掉
#sed -e 's/^#//' orjtext01.txt >orjtext02.txt #把#号注释掉的行去掉
#sed -i '/^[ /t]*///#d' orjtext01.txt