关于linux文本与windows文本换行符的区别

课堂上有一道题目是删除Windows⽂本⽂件中的ʻ^Mʼ 字符,我天真地以为是用类似 tr -d "^M" 的命令来解决。(当然,即便真的是删除ʻ^Mʼ 字符,这条命令也是不正确的,它会把不挨着的^和M也分别剔除,在此我们先不讨论这个问题)。

使用cat -A选项来查看文本隐藏的符号。
原来windows文本在linux系统内显示时,它的回车符是以^M的字样显示的。我们要剔除的是这个回车符


关于linux文本与windows文本换行符的区别_第1张图片

linux文本的换行符只有一个'$'
windows文本的换行符则为^M$
分别表示为\n 和 \r\n
\r=CR carrige return (回车)
\n=LF line feed(新行)

要剔除这个回车符自然很简单了,把\r去除就好了
tr -d "\r" < win.txt > win_to_linx.txt


关于linux文本与windows文本换行符的区别_第2张图片

然而,只有对于他们的区别有了真正的了解,才能长久地记住。于是在网络上找到关于CR和LF的由来:

为什么windows文本的换行有两个组成部分呢。原来,它是根据早期的打字机演绎而来的。
早在计算机发明之前,有一种电传打字机,每秒钟可打10个字符。
但是这种打字机每次换行需要0.2秒,刚好是打两个字符所需要的时间。
如果在换行时又有新字符传过来,那么将会丢失两个字符。
为了解决这个问题,人们设计了两个字符加在每行后面,表示一行的结束。
其一叫做“回车”(CR),表示将打字机的打字头移动到改行的行首;
另一个叫做“换行”(LF),表示纸带移动一行,相当于打字头移动到下一行行首的位置。
这就是“换行”和“回车”的来历。
后来计算机发明后,正如“菜单”这种餐饮业的术语被用到计算机上一样,打字机的这两个概念也被用到了计算机上。

而linux产生的时候,\r就被省略了,只剩下\n作为换行符。
了解了背后的故事,以后就可以轻而易举地记起删除windows文本中的^M字符,实质上是完成windows文本到linux文本的转换,删掉行尾的\r即可。

由此,我联想到英语对于学习linux的重要性。
记住回车r用是carriage Return中的r 换行是n用的New line中的n,就能迅速的了解需要保留和删除的部分。
1.linux中很多命令本身就是英语单词,单词简写/略缩,或者单词首字母联写,如
who; echo; date; cut(单词)
ls - list; cp -copy; mv -move; man -manuals(简写)
grep - globle search regular expression and print out the line
pwd - print working directory
2.在命令选项中,有很多常用的选项在不同命令中都表示相同意义
-a all (ls -a|cp -a) 全部
-h human-readable (ls -h|df -h) 以人类易读(单位)显示
-i interactive (mv -i) 互动:执行前询问
-v verbose (cp -v|rpm -v) “冗长啰嗦的”--显示详细信息
-R recursive (chmod -R|ls -R) 递归执行
-r reverse (sort -nr| ll -r) 反向排列
-t time (ll -t) 按时间排序

  1. 在逻辑运算中
    -eq equal
    -ne not equal
    -lt less than
    -gt greater than

我不时听到有同学询问同桌:这命令要实现某个效果需要加什么选项,那个命令是什么作用。
如果能理解这些单词和字母所代表的英文原意,在这个基础上来记忆命令和它们的选项,就能有效避免这种常常问常常忘,常常查询常常忘的状况了。

你可能感兴趣的:(关于linux文本与windows文本换行符的区别)