经典shell十三问

[转贴]比较经典---Unix,linux shell 十三問?

代码:
   
1)	為何叫做 shell ? 

在介紹 shell 是甚麼東西之前,不妨讓我們重新檢視使用者與電腦系統的關係: 
圖(FIXME) 

我們知道電腦的運作不能離開硬體,但使用者卻無法直接對硬體作驅動, 
硬體的驅動只能透過一個稱為"作業系統(Operating System)"的軟體來控管, 
事實上,我們每天所談的 linux ,嚴格來說只是一個作業系統,我們稱之為"核心(kernel)"。 
然而,從使用者的角度來說,使用者也沒辦法直接操作 kernel , 
而是透過 kernel 的"外殼"程式,也就是所謂的 shell ,來與 kernel 溝通。 
這也正是 kernel 跟 shell 的形像命名關係。如圖: 
圖(FIXME) 

從技術角度來說,shell 是一個使用者與系統的互動界面(interface), 
主要是讓使用者透過命令行(command line)來使用系統以完成工作。 
因此,shell 的最簡單的定義就是---命令解譯器(Command Interpreter): 
* 將使用者的命令翻譯給核心處理, 
* 同時,將核心處理結果翻譯給使用者。 

每次當我們完成系統登入(log in),我們就取得一個互動模式的 shell ,也稱為 login shell 或 primary shell。 
若從行程(process)角度來說,我們在 shell 所下達的命令,均是 shell 所產生的子行程。這現像,我們暫可稱之為 fork 。 
如果是執行腳本(shell script)的話,腳本中的命令則是由另外一個非互動模式的子 shell (sub shell)來執行的。 
也就是 primary shell 產生 sub shell 的行程,sub shell 再產生 script 中所有命令的行程。 
(關於行程,我們日後有機會再補充。) 

這裡,我們必須知道:kernel 與 shell 是不同的兩套軟體,而且都是可以被替換的: 
* 不同的作業系統使用不同的 kernel , 
* 而在同一個 kernel 之上,也可使用不同的 shell 。 
在 linux 的預設系統中,通常都可以找到好幾種不同的 shell ,且通常會被列於如下檔案裡: 
/etc/shells 
不同的 shell 有著不同的功能,且也彼此各異、或說"大同小異"。 
常見的 shell 主要分為兩大主流: 
sh: 
burne shell (sh) 
burne again shell (bash) 
csh: 
c shell (csh) 
tc shell (tcsh) 
korn shell (ksh) 
(FIXME) 

大部份的 Linux 系統的預設 shell 都是 bash ,其原因大致如下兩點: 
* 自由軟體 
* 功能強大 
bash 是 gnu project 最成功的產品之一,自推出以來深受廣大 Unix 用戶喜愛, 
且也逐漸成為不少組織的系統標準。
2)	shell prompt(PS1) 與 Carriage Return(CR) 的關係? 

當你成功登錄進一個文字界面之後,大部份情形下, 
你會在熒幕上看到一個不斷閃爍的方塊或底線(視不同版本而別), 
我們稱之為*遊標*(coursor)。 
遊標的作用就是告訴你接下來你從鍵盤輸入的按鍵所插入的位置, 
且每輸如一鍵遊標便向右邊移動一個格子,若連續輸入太多的話,則自動接在下一行輸入。 

假如你剛完成登錄還沒輸入任何按鍵之前,你所看到的遊標所在位置的同一行的左邊部份, 
我們稱之為*提示符號*(prompt)。 
提示符號的格式或因不同系統版本而各有不同,在 Linux 上,只需留意最接近遊標的一個可見的提示符號,通常是如下兩者之一: 
$:給一般使用者帳號使用 
#:給 root (管理員)帳號使用 

事實上,shell prompt 的意思很簡單: 
* 是 shell 告訴使用者:您現在可以輸入命令行了。 
我們可以說,使用者只有在得到 shell prompt 才能打命令行, 
而 cursor 是指示鍵盤在命令行所輸入的位置,使用者每輸入一個鍵,cursor 就往後移動一格, 
直到碰到命令行讀進 CR(Carriage Return,由 Enter 鍵產生)字符為止。 
CR 的意思也很簡單: 
* 是使用者告訴 shell:老兄你可以執行我的命令行了。 
嚴格來說: 
* 所謂的命令行,就是在 shell prompt 與 CR 字符之間所輸入的文字。 
(思考:為何我們這裡堅持使用 CR 字符而不說 Enter 鍵呢?答案在後面的學習中揭曉。) 

不同的命令可接受的命令行格式或有不同,一般情況下,一個標準的命令行格式為如下所列: 
command-name options argument 

若從技術細節來看,shell 會依據 IFS(Internal Field Seperator) 將 command line 所輸入的文字給拆解為"字段"(word)。 
然後再針對特殊字符(meta)先作處理,最後再重組整行 command line 。 
(注意:請務必理解上兩句話的意思,我們日後的學習中會常回到這裡思考。) 

其中的 IFS 是 shell 預設使用的欄位分隔符號,可以由一個及多個如下按鍵組成: 
* 空白鍵(White Space) 
* 表格鍵(Tab) 
* 回車鍵(Enter) 

系統可接受的命令名稱(command-name)可以從如下途逕獲得: 
* 明確路逕所指定的外部命令 
* 命令別名(alias) 
* 自定功能(function) 
* shell 內建命令(built-in) 
* $PATH 之下的外部命令 
每一個命令行均必需含用命令名稱,這是不能缺少的。
3) 別人 echo、你也 echo ,是問 echo 知多少? 

承接上一章所介紹的 command line ,這裡我們用 echo 這個命令加以進一步說明。 
溫習---標準的 command line 包含三個部件: 
* command_name option argument 

echo 是一個非常簡單、直接的 Linux 命令: 
* 將 argument 送出至標準輸出(STDOUT),通常就是在監視器(monitor)上輸出。 
(註:stdout 我們日後有機會再解說,或可先參考如下討論: 
http://www.chinaunix.net/forum/viewtopic.php?t=191375 ) 

為了更好理解,不如先讓我們先跑一下 echo 命令好了: 
代码:
$ echo 

$

你會發現只有一個空白行,然後又回到 shell prompt 上了。 
這是因為 echo 在預設上,在顯示完 argument 之後,還會送出一個換行符號(new-line charactor)。 
但是上面的 command 並沒任何的 argument ,那結果就只剩一個換行符號了... 
若你要取消這個換行符號,可利用 echo 的 -n option : 
代码:
$ echo -n 
$

不妨讓我們回到 command line 的概念上來討論上例的 echo 命令好了: 
* command line 只有 command_name(echo) 及 option(-n),並沒有任何 argument 。 
要想看看 echo 的 argument ,那還不簡單﹗接下來,你可試試如下的輸入: 
代码:
$ echo first line 
first line 
$ echo -n first line 
first line $

於上兩個 echo 命令中,你會發現 argument 的部份顯示在你的熒幕,而換行符號則視 -n option 的有無而別。 
很明顯的,第二個 echo 由於換行符號被取消了,接下來的 shell prompt 就接在輸出結果同一行了... ^_^ 

事實上,echo 除了 -n options 之外,常用選項還有: 
-e :啟用反斜線控制字符的轉換(參考下表) 
-E:關閉反斜線控制字符的轉換(預設如此) 
-n :取消行末之換行符號(與 -e 選項下的 /c 字符同意) 

關於 echo 命令所支援的反斜線控制字符如下表: 
/a:ALERT / BELL (從系統喇叭送出鈴聲) 
/b:BACKSPACE ,也就是向左刪除鍵 
/c:取消行末之換行符號 
/E:ESCAPE,跳脫鍵 
/f:FORMFEED,換頁字符 
/n:NEWLINE,換行字符 
/r:RETURN,回車鍵 
/t:TAB,表格跳位鍵 
/v:VERTICAL TAB,垂直表格跳位鍵 
/n:ASCII 八進位編碼(以 x 開首為十六進位) 
//:反斜線本身 
(表格資料來自 O'Reilly 出版社之 Learning the Bash Shell, 2nd Ed.) 

或許,我們可以透過實例來了解 echo 的選項及控制字符: 

例一: 
代码:
$ echo -e "a/tb/tc/nd/te/tf" 
a       b       c 
d       e       f

上例運用 /t 來區隔 abc 還有 def ,及用 /n 將 def 換至下一行。 

例二: 
代码:
$ echo -e "/141/011/142/011/143/012/144/011/145/011/146" 
a       b       c 
d       e       f

與例一的結果一樣,只是使用 ASCII 八進位編碼。 

例三: 
代码:
$ echo -e "/x61/x09/x62/x09/x63/x0a/x64/x09/x65/x09/x66" 
a       b       c 
d       e       f

與例二差不多,只是這次換用 ASCII 十六進位編碼。 

例四: 
代码:
$ echo -ne "a/tb/tc/nd/te/bf/a" 
a       b       c 
d       f $

因為 e 字母後面是刪除鍵(/b),因此輸出結果就沒有 e 了。 
在結束時聽到一聲鈴嚮,那是 /a 的傑作﹗ 
由於同時使用了 -n 選項,因此 shell prompt 緊接在第二行之後。 
若你不用 -n 的話,那你在 /a 後再加個 /c ,也是同樣的效果。 

事實上,在日後的 shell 操作及 shell script 設計上,echo 命令是最常被使用的命令之一。 
比方說,用 echo 來檢查變量值: 
代码:
$ A=B 
$ echo $A 
B 
$ echo $? 
0

(註:關於變量概念,我們留到下兩章才跟大家說明。) 

好了,更多的關於 command line 的格式,以及 echo 命令的選項, 
就請您自行多加練習、運用了...
4) " "(雙引號) 與 ' '(單引號)差在哪? 

還是回到我們的 command line 來吧... 
經過前面兩章的學習,應該很清楚當你在 shell prompt 後面敲打鍵盤、直到按下 Enter 的時候, 
你輸入的文字就是 command line 了,然後 shell 才會以行程的方式執行你所交給它的命令。 
但是,你又可知道:你在 command line 輸入的每一個文字,對 shell 來說,是有類別之分的呢? 

簡單而言(我不敢說這是精確的定議,註一),command line 的每一個 charactor ,分為如下兩種: 
* literal:也就是普通純文字,對 shell 來說沒特殊功能。 
* meta:對 shell 來說,具有特定功能的特殊保留字元。 
(註一:關於 bash shell 在處理 command line 時的順序說明, 
請參考 O'Reilly 出版社之 Learning the Bash Shell, 2nd Edition,第 177 - 180 頁的說明, 
尤其是 178 頁的流程圖 Figure 7-1 ... ) 

Literal 沒甚麼好談的,凡舉 abcd、123456 這些"文字"都是 literal ... (easy?) 
但 meta 卻常使我們困惑..... (confused?) 
事實上,前兩章我們在 command line 中已碰到兩個機乎每次都會碰到的 meta : 
* IFS:由 <space> 或 <tab> 或 <enter> 三者之一組成(我們常用 space )。 
* CR:由 <enter> 產生。 
IFS 是用來拆解 command line 的每一個詞(word)用的,因為 shell command line 是按詞來處理的。 
而 CR 則是用來結束 command line 用的,這也是為何我們敲 <enter> 命令就會跑的原因。 
除了 IFS 與 CR ,常用的 meta 還有: 
= : 設定變量。 
$ : 作變量或運算替換(請不要與 shell prompt 搞混了)。 

> :重導向 stdout。 
< :重導向 stdin。 
|:命令管線。 
& :重導向 file descriptor ,或將命令置於背境執行。 
( ):將其內的命令置於 nested subshell 執行,或用於運算或命令替換。 
{ }:將其內的命令置於 non-named function 中執行,或用在變量替換的界定範圍。 
; :在前一個命令結束時,而忽略其返回值,繼續執行下一個命令。 
&& :在前一個命令結束時,若返回值為 true,繼續執行下一個命令。 
|| :在前一個命令結束時,若返回值為 false,繼續執行下一個命令。 
!:執行 history 列表中的命令 
.... 

假如我們需要在 command line 中將這些保留字元的功能關閉的話,就需要 quoting 處理了。 
在 bash 中,常用的 quoting 有如下三種方法: 
* hard quote:' ' (單引號),凡在 hard quote 中的所有 meta 均被關閉。 
* soft quote: " " (雙引號),在 soft quoe 中大部份 meta 都會被關閉,但某些則保留(如 $ )。(註二) 
* escape : / (反斜線),只有緊接在 escape (跳脫字符)之後的單一 meta 才被關閉。 
( 註二:在 soft quote 中被豁免的具體 meta 清單,我不完全知道, 
有待大家補充,或透過實作來發現及理解。 ) 

下面的例子將有助於我們對 quoting 的了解: 
代码:
   $ A=B C   # 空白鍵未被關掉,作為 IFS 處理。 
   $ C: command not found. (FIXME) 
   $ echo $A 
    
   $ A="B C"   # 空白鍵已被關掉,僅作為空白鍵處理。 
   $ echo $A 
   B C

在第一次設定 A 變量時,由於空白鍵沒被關閉,command line 將被解讀為: 
* A=B 然後碰到<IFS>,再執行 C 命令 
在第二次設定 A 變量時,由於空白鍵被置於 soft quote 中,因此被關閉,不再作為 IFS : 
* A=B<space>C 
事實上,空白鍵無論在 soft quote 還是在 hard quote 中,均會被關閉。Enter 鍵亦然: 
代码:
   $ A='B 
   > C 
   > ' 
   $ echo $A 
   B 
   C

在上例中,由於 <enter> 被置於 hard quote 當中,因此不再作為 CR 字符來處理。 
這裡的 <enter> 單純只是一個斷行符號(new-line)而已,由於 command line 並沒得到 CR 字符, 
因此進入第二個 shell prompt (PS2,以 > 符號表示),command line 並不會結束, 
直到第三行,我們輸入的 <enter> 並不在 hard quote 裡面,因此並沒被關閉, 
此時,command line 碰到 CR 字符,於是結束、交給 shell 來處理。 

上例的 <enter> 要是被置於 soft quote 中的話,也會同樣被關閉,用 escape 亦可: 
代码:
   $ A=B/ 
   > C/ 
   > 
   $ echo $A 
   B 
   C

上例中,第一個 <enter> 跟第二個 <enter> 均被 escape 字符關閉了,因此也不作為 CR 來處理, 
但第三個 <enter> 由於沒被跳脫,因此作為 CR 結束 command line 。 

至於 soft quote 跟 hard quote 的不同,主要是對於某些 meta 的關閉與否,以 $ 來作說明: 
代码:
   $ A=B/ C 
   $ echo "$A" 
   B C 
   $ echo '$A' 
   $A

在第一個 echo 命令行中,$ 被置於 soft quote 中,將不被關閉,因此繼續處理變量替換, 
因此 echo 將 A 的變量值輸出到熒幕,也就得到 "B C" 的結果。 
在第二個 echo 命令行中,$ 被置於 hard quote 中,則被關閉,因此 $ 只是一個 $ 符號, 
並不會用來作變量替換處理,因此結果是 $ 符號後面接一個 A 字母:$A 。 

-------------------------------------- 
練習與思考:如下結果為何不同? 
代码:
   $ A=B/ C 
   $ echo '"$A"'   # 最外面的是單引號 
   "$A" 
   $ echo "'$A'"   # 最外面的是雙引號 
   'B C' 
   (提示:單引號及雙引號,在 quoting 中均被關?#93;了。)

-------------------------------------- 

在 CU 的 shell 版裡,我發現有很多初學者的問題,都與 quoting 理解的有關。 
比方說,若我們在 awk 或 sed 的命令參數中調用之前設定的一些變量時,常會問及為何不能的問題。 
要解決這些問題,關鍵點就是: 
* 區分出 shell meta 與 command meta 

前面我們提到的那些 meta ,都是在 command line 中有特殊用途的, 
比方說 { } 是將其內一系列 command line 置於不具名的函式中執行(可簡單視為 command block ), 
但是,awk 卻需要用 { } 來區分出 awk 的命令區段(BEGIN, MAIN, END)。 
若你在 command line 中如此輸入: 
代码:
$ awk {print $0} 1.txt

由於 { } 在 shell 中並沒關閉,那 shell 就將 {print $0} 視為 command block , 
但同時又沒有" ; "符號作命令區隔,因此就出現 awk 的語法錯誤結果。 

要解決之,可用 hard quote : 
代码:
$ awk '{print $0}' 1.txt

上面的 hard quote 應好理解,就是將原本的 {、<space>、$(註三)、} 這幾個 shell meta 關閉, 
避免掉在 shell 中遭到處理,而完整的成為 awk 參數中的 command meta 。 
( 註三:而其中的 $0 是 awk 內建的 field number ,而非 awk 的變量, 
awk 自身的變量無需使用 $ 。) 
要是理解了 hard quote 的功能,再來理解 soft quote 與 escape 就不難: 
代码:
awk "{print /$0}" 1.txt 
awk /{print/ /$0/} 1.txt


然而,若你要改變 awk 的 $0 的 0 值是從另一個 shell 變量讀進呢? 
比方說:已有變量 $A 的值是 0 ,那如何在 command line 中解決 awk 的 $$A 呢? 
你可以很直接否定掉 hard quoe 的方案: 
代码:
$ awk '{print $$A}' 1.txt

那是因為 $A 的 $ 在 hard quote 中是不能替換變量的。 

聰明的讀者(如你!),經過本章學習,我想,應該可以解釋為何我們可以使用如下操作了吧: 
代码:
A=0 
awk "{print /$$A}" 1.txt 
awk /{print/ /$$A/} 1.txt 
awk '{print $'$A'}' 1.txt 
awk '{print $'"$A"'}' 1.txt     # 注:"$A" 包在 soft quote 中


或許,你能舉出更多的方案呢.... ^_^

5) var=value?export 前後差在哪? 

這次讓我們暫時丟開 command line ,先來了解一下 bash 變量(variable)吧... 

所謂的變量,就是就是利用一個特定的"名稱"(name)來存取一段可以變化的"值"(value)。 

*設定(set)* 
在 bash 中,你可以用 "=" 來設定或重新定義變量的內容: 
name=value 
在設定變量的時侯,得遵守如下規則: 
* 等號左右兩邊不能使用區隔符號(IFS),也應避免使用 shell 的保留字元(meta charactor)。 
* 變量名稱不能使用 $ 符號。 
* 變量名稱的第一個字母不能是數字(number)。 
* 變量名稱長度不可超過 256 個字母。 
* 變量名稱及變量值之大小寫是有區別的(case sensitive)。 

如下是一些變量設定時常見的錯誤: 
A= B :不能有 IFS 
1A=B :不能以數字開頭 
$A=B :名稱不能有 $ 
a=B :這跟 a=b 是不同的 
如下則是可以接受的設定: 
A=" B" :IFS 被關閉了 (請參考前面的 quoting 章節) 
A1=B :並非以數字開頭 
A=$B :$ 可用在變量值內 
This_Is_A_Long_Name=b :可用 _ 連接較長的名稱或值,且大小寫有別。 

*變量替換(substitution)* 
Shell 之所以強大,其中的一個因素是它可以在命令行中對變量作替換(substitution)處理。 
在命令行中使用者可以使用 $ 符號加上變量名稱(除了在用 = 號定義變量名稱之外), 
將變量值給替換出來,然後再重新組建命令行。 
比方: 
代码:
   $ A=ls 
   $ B=la 
   $ C=/tmp 
   $ $A -$B $C

(注意:以上命令行的第一個 $ 是 shell prompt ,並不在命令行之內。) 
必需強調的是,我們所提的變量替換,只發生在 command line 上面。(是的,讓我們再回到 command line 吧﹗) 
仔細分析最後那行 command line ,不難發現在被執行之前(在輸入 CR 字符之前), 
$ 符號會對每一個變量作替換處理(將變量值替換出來再重組命令行),最後會得出如下命令行: 
代码:
   ls -la /tmp

還記得第二章我請大家"務必理解"的那兩句嗎?若你忘了,那我這裡再重貼一遍: 
引用:
若從技術細節來看,shell 會依據 IFS(Internal Field Seperator) 將 command line 所輸入的文字給拆解為"字段"(word)。 
然後再針對特殊字符(meta)先作處理,最後再重組整行 command line 。 

這裡的 $ 就是 command line 中最經典的 meta 之一了,就是作變量替換的﹗ 
在日常的 shell 操作中,我們常會使用 echo 命令來查看特定變量的值,例如: 
代码:
   $ echo $A -$B $C

我們已學過, echo 命令只單純將其 argument 送至"標準輸出"(STDOUT,通常是我們的熒幕)。 
所以上面的命令會在熒幕上得到如下結果: 
代码:
   ls -la /tmp

這是由於 echo 命令在執行時,會先將 $A(ls)、$B(la)、跟 $C(/tmp) 給替換出來的結果。 

利用 shell 對變量的替換處理能力,我們在設定變量時就更為靈活了: 
A=B 
B=$A 
這樣,B 的變量值就可繼承 A 變量"當時"的變量值了。 
不過,不要以"數學羅輯"來套用變量的設定,比方說: 
A=B 
B=C 
這樣並不會讓 A 的變量值變成 C 。再如: 
A=B 
B=$A 
A=C 
同樣也不會讓 B 的值換成 C 。 
上面是單純定義了兩個不同名稱的變量:A 與 B ,它們的值分別是 B 與 C 。 
若變量被重復定義的話,則原有舊值將被新值所取代。(這不正是"可變的量"嗎? ^_^) 
當我們在設定變量的時侯,請記著這點: 
* 用一個名稱儲存一個數值 
僅此而已。 

此外,我們也可利用命令行的變量替換能力來"擴充"(append)變量值: 
A=B:C:D 
A=$A:E 
這樣,第一行我們設定 A 的值為 "B:C:D",然後,第二行再將值擴充為 "A:B:C:E" 。 
上面的擴充範例,我們使用區隔符號( : )來達到擴充目的, 
要是沒有區隔符號的話,如下是有問題的: 
A=BCD 
A=$AE 
因為第二次是將 A 的值繼承 $AE 的提換結果,而非 $A 再加 E ﹗ 
要解決此問題,我們可用更嚴謹的替換處理: 
A=BCD 
A=${A}E 
上例中,我們使用 {} 將變量名稱的範圍給明確定義出來, 
如此一來,我們就可以將 A 的變量值從 BCD 給擴充為 BCDE 。 

(提示:關於 ${name} 事實上還可做到更多的變量處理能力,這些均屬於比較進階的變量處理, 
現階段暫時不介紹了,請大家自行參考資料。如 CU 的貼子: 

http://www.chinaunix.net/forum/viewtopic.php?t=201843 
) 

* export * 

嚴格來說,我們在當前 shell 中所定義的變量,均屬於"本地變量"(local variable), 
只有經過 export 命令的"輸出"處理,才能成為環境變量(environment variable): 
代码:
   $ A=B 
   $ export A

或: 
代码:
   $ export A=B

經過 export 輸出處理之後,變量 A 就能成為一個環境變量供其後的命令使用。 
在使用 export 的時侯,請別忘記 shell 在命令行對變量的"替換"(substitution)處理, 
比方說: 
代码:
   $ A=B 
   $ B=C 
   $ export $A

上面的命令並未將 A 輸出為環境變量,而是將 B 作輸出, 
這是因為在這個命令行中,$A 會首先被提換出 B 然後再"塞回"作 export 的參數。 

要理解這個 export ,事實上需要從 process 的角度來理解才能透徹。 
我將於下一章為大家說明 process 的觀念,敬請留意。 

*取消變量* 

要取消一個變量,在 bash 中可使用 unset 命令來處理: 
代码:
   unset A

與 export 一樣,unset 命令行也同樣會作變量替換(這其實就是 shell 的功能之一), 
因此: 
代码:
   $ A=B 
   $ B=C 
   $ unset $A

事實上所取消的變量是 B 而不是 A 。 

此外,變量一旦經過 unset 取消之後,其結果是將整個變量拿掉,而不僅是取消其變量值。 
如下兩行其實是很不一樣的: 
代码:
   $ A= 
   $ unset A

第一行只是將變量 A 設定為"空值"(null value),但第二行則讓變量 A 不在存在。 
雖然用眼睛來看,這兩種變量狀態在如下命令結果中都是一樣的: 
代码:
   $ A= 
   $ echo $A 

   $ unset A 
   $ echo $A 
   

請學員務必能識別 null value 與 unset 的本質區別,這在一些進階的變量處理上是很嚴格的。 
比方說: 
代码:
   $ str=      # 設為 null 
   $ var=${str=expr}   # 定義 var 
   $ echo $var 
    
   $ echo $str 
    
   $ unset str   # 取消 
   $ var=${str=expr}   # 定義 var 
   $ echo $var 
   expr 
   $ echo $str 
   expr

聰明的讀者(yes, you!),稍加思考的話, 
應該不難發現為何同樣的 var=${str=expr} 在 null 與 unset 之下的不同吧? 
若你看不出來,那可能是如下原因之一: 
a. 你太笨了 
b. 不了解 var=${str=expr} 這個進階處理 
c. 對本篇說明還沒來得及消化吸收 
e. 我講得不好 
不知,你選哪個呢?.... ^_^

6) exec 跟 source 差在哪? 

這次先讓我們從 CU Shell 版的一個實例貼子來談起吧: 
( http://www.chinaunix.net/forum/viewtopic.php?t=194191 ) 

例中的提問是: 
引用:

cd /etc/aa/bb/cc可以執行 
但是把這條命令寫入shell時shell不執行! 
這是什么原因呀! 


我當時如何回答暫時別去深究,先讓我們了解一下行程(process)的觀念好了。 
首先,我們所執行的任何程式,都是由父行程(parent process)所產生出來的一個子行程(child process), 
子行程在結束後,將返回到父行程去。此一現像在 Linux 系統中被稱為 fork 。 
(為何要程為 fork 呢?嗯,畫一下圖或許比較好理解... ^_^ ) 
當子行程被產生的時候,將會從父行程那裡獲得一定的資源分配、及(更重要的是)繼承父行程的環境﹗ 
讓我們回到上一章所談到的"環境變量"吧: 
* 所謂環境變量其實就是那些會傳給子行程的變量。 
簡單而言,"遺傳性"就是區分本地變量與環境變量的決定性指標。 
然而,從遺傳的角度來看,我們也不難發現環境變量的另一個重要特徵: 
* 環境變量只能從父行程到子行程單向繼承。換句話說:在子行程中的環境如何變更,均不會影響父行程的環境。 

接下來,再讓我們了解一下命令腳本(shell script)的概念。 
所謂的 shell script 講起來很簡單,就是將你平時在 shell prompt 後所輸入的多行 command line 依序寫入一個文件去而已。 
其中再加上一些條件判斷、互動界面、參數運用、函數調用、等等技巧,得以讓 script 更加"聰明"的執行, 
但若撇開這些技巧不談,我們真的可以簡單的看成 script 只不過依次執行預先寫好的命令行而已。 

再結合以上兩個概念(process + script),那應該就不難理解如下這句話的意思了: 
* 正常來說,當我們執行一個 shell script 時,其實是先產生一個 sub-shell 的子行程,然後 sub-shell 再去產生命令行的子行程。 
然則,那讓我們回到本章開始時所提到的例子再從新思考: 
引用:

cd /etc/aa/bb/cc可以執行 
但是把這條命令寫入shell時shell不執行! 
這是什么原因呀! 


我當時的答案是這樣的: 
引用:

因為,一般我們跑的 shell script 是用 subshell 去執行的。 
從 process 的觀念來看,是 parent process 產生一個 child process 去執行, 
當 child 結束後,會返回 parent ,但 parent 的環境是不會因 child 的改變而改變的。 
所謂的環境元數很多,凡舉 effective id, variable, workding dir 等等... 
其中的 workding dir ($PWD) 正是樓主的疑問所在: 
當用 subshell 來跑 script 的話,sub shell 的 $PWD 會因為 cd 而變更, 
但當返回 primary shell 時,$PWD 是不會變更的。 


能夠了解問題的原因及其原理是很好的,但是?如何解決問題恐怕是我們更感興趣的﹗是吧?^_^ 
那好,接下來,再讓我們了解一下 source 命令好了。 
當你有了 fork 的概念之後,要理解 source 就不難: 
* 所謂 source 就是讓 script 在當前 shell 內執行、而不是產生一個 sub-shell 來執行。 
由於所有執行結果均於當前 shell 內完成,若 script 的環境有所改變,當然也會改變當前環境了﹗ 
因此,只要我們要將原本單獨輸入的 script 命令行變成 source 命令的參數,就可輕易解決前例提到的問題了。 
比方說,原本我們是如此執行 script 的: 
代码:
./my.script

現在改成這樣即可: 
代码:
source ./my.script 
或: 
. ./my.script


說到這裡,我想,各位有興趣看看 /etc 底下的眾多設定文件, 
應該不難理解它們被定議後,如何讓其他 script 讀取並繼承了吧? 
若然,日後你有機會寫自己的 script ,應也不難專門指定一個設定文件以供不同的 script 一起"共用"了... ^_^ 

okay,到這裡,若你搞得懂 fork 與 source 的不同,那接下來再接受一個挑戰: 
---- 那 exec 又與 source/fork 有何不同呢? 
哦... 要了解 exec 或許較為複雜,尤其扯上 File Descriptor 的話... 
不過,簡單來說: 
* exec 也是讓 script 在同一個行程上執行,但是原有行程則被結束了。 
也就是簡而言之:原有行程會否終止,就是 exec 與 source/fork 的最大差異了。 

嗯,光是從理論去理解,或許沒那麼好消化,不如動手"實作+思考"來的印像深刻哦。 
下面讓我們寫兩個簡單的 script ,分別命令為 1.sh 及 2.sh : 

1.sh 
代码:

#!/bin/bash 
A=B 
echo "PID for 1.sh before exec/source/fork:$$" 
export A 
echo "1.sh: /$A is $A" 
case $1 in 
        exec) 
                echo "using exec..." 
                exec ./2.sh ;; 
        source) 
                echo "using source..." 
                . ./2.sh ;; 
        *) 
                echo "using fork by default..." 
                ./2.sh ;; 
esac 
echo "PID for 1.sh after exec/source/fork:$$" 
echo "1.sh: /$A is $A" 


2.sh 
代码:

#!/bin/bash 
echo "PID for 2.sh: $$" 
echo "2.sh get /$A=$A from 1.sh" 
A=C 
export A 
echo "2.sh: /$A is $A" 


然後,分別跑如下參數來觀察結果: 
代码:

$ ./1.sh fork 
$ ./1.sh source 
$ ./1.sh exec 


或是,你也可以參考 CU 上的另一貼子: 
http://www.chinaunix.net/forum/viewtopic.php?t=191051 

好了,別忘了仔細比較輸出結果的不同及背後的原因哦... 
若有疑問,歡迎提出來一起討論討論~~~ 

happy scripting! ^_^

7) ( ) 與 { } 差在哪? 

嗯,這次輕鬆一下,不講太多... ^_^ 

先說一下,為何要用 ( ) 或 { } 好了。 
許多時候,我們在 shell 操作上,需要在一定條件下一次執行多個命令, 
也就是說,要麼不執行,要麼就全執行,而不是每次依序的判斷是否要執行下一個命令。 
或是,需要從一些命令執行優先次順中得到豁免,如算術的 2*(3+4) 那樣... 
這時候,我們就可引入"命令群組"(command group)的概念:將多個命令集中處理。 

在 shell command line 中,一般人或許不太計較 ( ) 與 { } 這兩對符號的差異, 
雖然兩者都可將多個命令作群組化處理,但若從技術細節上,卻是很不一樣的: 
( ) 將 command group 置於 sub-shell 去執行,也稱 nested sub-shell。 
{ } 則是在同一個 shell 內完成,也稱為 non-named command group。 
若,你對上一章的 fork 與 source 的概念還記得了的話,那就不難理解兩者的差異了。 
要是在 command group 中扯上變量及其他環境的修改,我們可以根據不同的需求來使用 ( ) 或 { } 。 
通常而言,若所作的修改是臨時的,且不想影響原有或以後的設定,那我們就 nested sub-shell , 
反之,則用 non-named command group 。 

是的,光從 command line 來看,( ) 與 { } 的差別就講完了,夠輕鬆吧~~~ ^_^ 
然而,若這兩個 meta 用在其他 command meta 或領域中(如 Regular Expression),還是有很多差別的。 
只是,我不打算再去說明了,留給讀者自己慢慢發掘好了... 
我這裡只想補充一個概念,就是 function 。 
所謂的 function ,就是用一個名字去命名一個 command group ,然後再調用這個名字去執行 command group 。 
從 non-named command group 來推斷,大概你也可以猜到我要說的是 { } 了吧?(yes! 你真聰明﹗ ^_^ ) 

在 bash 中,function 的定義方式有兩種: 
方式一: 
代码:
function function_name { 
    command1 
    command2 
    command3 
    .... 
}

方式二: 
代码:
fuction_name () { 
    command1 
    command2 
    command3 
    .... 
}

用哪一種方式無所謂,只是若碰到所定意的名稱與現有的命令或別名(Alias)衝突的話,方式二或許會失敗。 
但方式二起碼可以少打 function 這一串英文字母,對懶人來說(如我),又何樂不為呢?... ^_^ 

function 在某一程度來說,也可稱為"函式",但請不要與傳統編程所使用的函式(library)搞混了,畢竟兩者差異很大。 
惟一相同的是,我們都可以隨時用"已定義的名稱"來調用它們... 
若我們在 shell 操作中,需要不斷的重覆質行某些命令,我們首先想到的,或許是將命令寫成命令稿(shell script)。 
不過,我們也可以寫成 function ,然後在 command line 中打上 function_name 就可當一舨的 script 來使用了。 
只是若你在 shell 中定義的 function ,除了可用 unset function_name 取消外,一旦退出 shell ,function 也跟著取消。 
然而,在 script 中使用 function 卻有許多好處,除了可以提高整體 script 的執行效能外(因為已被載入), 
還可以節省許多重覆的代碼... 

簡單而言,若你會將多個命令寫成 script 以供調用的話,那,你可以將 function 看成是 script 中的 script ... ^_^ 
而且,透過上一章介紹的 source 命令,我們可以自行定義許許多多好用的 function ,再集中寫在特定文件中, 
然後,在其他的 script 中用 source 將它們載入並反覆執行。 
若你是 RedHat Linux 的使用者,或許,已經猜得出 /etc/rc.d/init.d/functions 這個文件是作啥用的了~~~ ^_^ 

okay,說要輕鬆點的嘛,那這次就暫時寫到這吧。祝大家學習愉快﹗ ^_^

8) $(( )) 與 $( ) 還有${ } 差在哪? 

我們上一章介紹了 ( ) 與 { } 的不同,這次讓我們擴展一下,看看更多的變化:$( ) 與 ${ } 又是啥玩意兒呢? 

在 bash shell 中,$( ) 與 ` ` (反引號) 都是用來做命令替換用(command substitution)的。 
所謂的命令替換與我們第五章學過的變量替換差不多,都是用來重組命令行: 
* 完成引號裡的命令行,然後將其結果替換出來,再重組命令行。 
例如: 
代码:
$ echo the last sunday is $(date -d "last sunday" +%Y-%m-%d)

如此便可方便得到上一星期天的日期了... ^_^ 

在操作上,用 $( ) 或 ` ` 都無所謂,只是我"個人"比較喜歡用 $( ) ,理由是: 

1, ` ` 很容易與 ' ' ( 單引號)搞混亂,尤其對初學者來說。 
有時在一些奇怪的字形顯示中,兩種符號是一模一樣的(直豎兩點)。 
當然了,有經驗的朋友還是一眼就能分變兩者。只是,若能更好的避免混亂,又何樂不為呢? ^_^ 

2, 在多層次的復合替換中,` ` 須要額外的跳脫( /` )處理,而 $( ) 則比較直觀。例如: 
這是錯的: 
代码:
command1 `command2 `command3` `

原本的意圖是要在 command2 `command3` 先將 command3 提換出來給 command 2 處理, 
然後再將結果傳給 command1 `command2 ...` 來處理。 
然而,真正的結果在命令行中卻是分成了 `command2 ` 與 `` 兩段。 
正確的輸入應該如下: 
代码:
command1 `command2 /`command3/` `


要不然,換成 $( ) 就沒問題了: 
代码:
command1 $(command2 $(command3))

只要你喜歡,做多少層的替換都沒問題啦~~~ ^_^ 

不過,$( ) 並不是沒有斃端的... 
首先,` ` 基本上可用在全部的 unix shell 中使用,若寫成 shell script ,其移植性比較高。 
而 $( ) 並不見的每一種 shell 都能使用,我只能跟你說,若你用 bash2 的話,肯定沒問題... ^_^ 

接下來,再讓我們看 ${ } 吧... 它其實就是用來作變量替換用的啦。 
一般情況下,$var 與 ${var} 並沒有啥不一樣。 
但是用 ${ } 會比較精確的界定變量名稱的範圍,比方說: 
代码:
$ A=B 
$ echo $AB 

原本是打算先將 $A 的結果替換出來,然後再補一個 B 字母於其後, 
但在命令行上,真正的結果卻是只會提換變量名稱為 AB 的值出來... 
若使用 ${ } 就沒問題了: 
代码:
$ echo ${A}B 
BB


不過,假如你只看到 ${ } 只能用來界定變量名稱的話,那你就實在太小看 bash 了﹗ 
有興趣的話,你可先參考一下 cu 本版的精華文章: 
http://www.chinaunix.net/forum/viewtopic.php?t=201843 

為了完整起見,我這裡再用一些例子加以說明 ${ } 的一些特異功能: 
假設我們定義了一個變量為: 
file=/dir1/dir2/dir3/my.file.txt 
我們可以用 ${ } 分別替換獲得不同的值: 
${file#*/}:拿掉第一條 / 及其左邊的字串:dir1/dir2/dir3/my.file.txt 
${file##*/}:拿掉最後一條 / 及其左邊的字串:my.file.txt 
${file#*.}:拿掉第一個 . 及其左邊的字串:file.txt 
${file##*.}:拿掉最後一個 . 及其左邊的字串:txt 
${file%/*}:拿掉最後條 / 及其右邊的字串:/dir1/dir2/dir3 
${file%%/*}:拿掉第一條 / 及其右邊的字串:(空值) 
${file%.*}:拿掉最後一個 . 及其右邊的字串:/dir1/dir2/dir3/my.file 
${file%%.*}:拿掉第一個 . 及其右邊的字串:/dir1/dir2/dir3/my 
記憶的方法為: 
# 是去掉左邊(在鑑盤上 # 在 $ 之左邊) 
% 是去掉右邊(在鑑盤上 % 在 $ 之右邊) 
單一符號是最小匹配﹔兩個符號是最大匹配。

${file:0:5}:提取最左邊的 5 個字節:/dir1 
${file:5:5}:提取第 5 個字節右邊的連續 5 個字節:/dir2 

我們也可以對變量值裡的字串作替換: 
${file/dir/path}:將第一個 dir 提換為 path:/path1/dir2/dir3/my.file.txt 
${file//dir/path}:將全部 dir 提換為 path:/path1/path2/path3/my.file.txt 

利用 ${ } 還可針對不同的變數狀態賦值(沒設定、空值、非空值): 
${file-my.file.txt} :假如 $file 為空值,則使用 my.file.txt 作默認值。(保留沒設定及非空值) 
${file:-my.file.txt} :假如 $file 沒有設定或為空值,則使用 my.file.txt 作默認值。 (保留非空值) 
${file+my.file.txt} :不管 $file 為何值,均使用 my.file.txt 作默認值。 (不保留任何值) 
${file:+my.file.txt} :除非 $file 為空值,否則使用 my.file.txt 作默認值。 (保留空值) 
${file=my.file.txt} :若 $file 沒設定,則使用 my.file.txt 作默認值,同時將 $file 定義為非空值。 (保留空值及非空值) 
${file:=my.file.txt} :若 $file 沒設定或為空值,則使用 my.file.txt 作默認值,同時將 $file 定義為非空值。 (保留非空值) 
${file?my.file.txt} :若 $file 沒設定,則將 my.file.txt 輸出至 STDERR。 (保留空值及非空值)) 
${file:?my.file.txt} :若 $file 沒設定或為空值,則將 my.file.txt 輸出至 STDERR。 (保留非空值) 

還有哦,${#var} 可計算出變量值的長度: 
${#file} 可得到 27 ,因為 /dir1/dir2/dir3/my.file.txt 剛好是 27 個字節... 

接下來,再為大家介稍一下 bash 的組數(array)處理方法。 
一般而言,A="a b c def" 這樣的變量只是將 $A 替換為一個單一的字串, 
但是改為 A=(a b c def) ,則是將 $A 定義為組數... 
bash 的組數替換方法可參考如下方法: 
${A[@]} 或 ${A[*]} 可得到 a b c def (全部組數) 
${A[0]} 可得到 a (第一個組數),${A[1]} 則為第二個組數... 
${#A[@]} 或 ${#A[*]} 可得到 4 (全部組數數量) 
${#A[0]} 可得到 1 (即第一個組數(a)的長度),${A[3]} 可得到 3 (第一個組數(def)的長度) 
A[3]=xyz 則是將第 4 個組數重新定義為 xyz ... 

諸如此類的.... 
能夠善用 bash 的 $( ) 與 ${ } 可大大提高及簡化 shell 在變量上的處理能力哦~~~ ^_^ 

好了,最後為大家介紹 $(( )) 的用途吧:它是用來作整數運算的。 
在 bash 中,$(( )) 的整數運算符號大致有這些: 
+ - * / :分別為 "加、減、乘、除"。 
% :餘數運算 
& | ^ !:分別為 "AND、OR、XOR、NOT" 運算。 

例: 
代码:
$ a=5; b=7; c=2 
$ echo $(( a+b*c )) 
19 
$ echo $(( (a+b)/c )) 
6 
$ echo $(( (a*b)%c)) 
1


在 $(( )) 中的變量,可用 $ 符號來替換,也可以不用,如: 
$(( $a + $b * $c)) 也可得到 19 的結果 

此外,$(( )) 還可作不同進位(如二進位、八進位、十六進位)作運算呢,只是,輸出結果皆為十進位而已: 
echo $((16#2a)) 結果為 42 (16進位轉十進位) 
以一個實用的例子來看看吧: 
假如當前的 umask 是 022 ,那麼新建文件的權限即為: 
代码:
$ umask 022 
$ echo "obase=8;$(( 8#666 & (8#777 ^ 8#$(umask)) ))" | bc 
644


事實上,單純用 (( )) 也可重定義變量值,或作 testing: 
a=5; ((a++)) 可將 $a 重定義為 6 
a=5; ((a--)) 則為 a=4 
a=5; b=7; ((a < b)) 會得到 0 (true) 的返回值。 
常見的用於 (( )) 的測試符號有如下這些: 

<:小於 
>:大於 
<=:小於或等於 
>=:大於或等於 
==:等於 
!=:不等於

不過,使用 (( )) 作整數測試時,請不要跟 [ ] 的整數測試搞混亂了。(更多的測試我將於第十章為大家介紹) 

怎樣?好玩吧.. ^_^ okay,這次暫時說這麼多... 
上面的介紹,並沒有詳列每一種可用的狀態,更多的,就請讀者參考手冊文件囉...

9) $@ 與 $* 差在哪? 

要說 $@ 與 $* 之前,需得先從 shell script 的 positional parameter 談起... 
我們都已經知道變量(variable)是如何定義及替換的,這個不用再多講了。 
但是,我們還需要知道有些變量是 shell 內定的,且其名稱是我們不能隨意修改的, 
其中就有 positional parameter 在內。 

在 shell script 中,我們可用 $0, $1, $2, $3 ... 這樣的變量分別提取命令行中的如下部份: 
代码:
script_name parameter1 parameter2 parameter3 ...

我們很容易就能猜出 $0 就是代表 shell script 名稱(路逕)本身,而 $1 就是其後的第一個參數,如此類推.... 
須得留意的是 IFS 的作用,也就是,若 IFS 被 quoting 處理後,那麼 positional parameter 也會改變。 
如下例: 
代码:
my.sh p1 "p2 p3" p4

由於在 p2 與 p3 之間的空白鍵被 soft quote 所關閉了,因此 my.sh 中的 $2 是 "p2 p3" 而 $3 則是 p4 ... 

還記得前兩章我們提到 fucntion 時,我不是說過它是 script 中的 script 嗎? ^_^ 
是的,function 一樣可以讀取自己的(有別於 script 的) postitional parameter ,惟一例外的是 $0 而已。 
舉例而言:假設 my.sh 裡有一個 fucntion 叫 my_fun , 若在 script 中跑 my_fun fp1 fp2 fp3 , 
那麼,function 內的 $0 是 my.sh ,而 $1 則是 fp1 而非 p1 了... 

不如寫個簡單的 my.sh script 看看吧: 
代码:
#!/bin/bash 

my_fun() { 
    echo '$0 inside function is '$0 
    echo '$1 inside function is '$1 
    echo '$2 inside function is '$2 
} 

echo '$0 outside function is '$0 
echo '$1 outside function is '$1 
echo '$2 outside function is '$2 

my_fun fp1 "fp2 fp3"

然後在 command line 中跑一下 script 就知道了: 
代码:
chmod +x my.sh 
./my.sh p1 "p2 p3" 
$0 outside function is ./my.sh 
$1 outside function is p1 
$2 outside function is p2 p3 
$0 inside function is ./my.sh 
$1 inside function is fp1 
$2 inside function is fp2 fp3


然而,在使用 positional parameter 的時候,我們要注意一些陷阱哦: 
* $10 不是替換第 10 個參數,而是替換第一個參數($1)然後再補一個 0 於其後﹗ 
也就是,my.sh one two three four five six seven eigth nine ten 這樣的 command line , 
my.sh 裡的 $10 不是 ten 而是 one0 哦... 小心小心﹗ 
要抓到 ten 的話,有兩種方法: 

方法一是使用我們上一章介紹的 ${ } ,也就是用 ${10} 即可。 

方法二,就是 shift 了。 
用通俗的說法來說,所謂的 shift 就是取消 positional parameter 中最左邊的參數( $0 不受影響)。 
其預設值為 1 ,也就是 shift 或 shift 1 都是取消 $1 ,而原本的 $2 則變成 $1、$3 變成 $2 ... 
若 shift 3 則是取消前面三個參數,也就是原本的 $4 將變成 $1 ... 
那,親愛的讀者,你說要 shift 掉多少個參數,才可用 $1 取得 ${10} 呢? ^_^ 

okay,當我們對 positional parameter 有了基本概念之後,那再讓我們看看其他相關變量吧。 
首先是 $# :它可抓出 positional parameter 的數量。 
以前面的 my.sh p1 "p2 p3" 為例: 
由於 p2 與 p3 之間的 IFS 是在 soft quote 中,因此 $# 可得到 2 的值。 
但如果 p2 與 p3 沒有置於 quoting 中話,那 $# 就可得到 3 的值了。 
同樣的道理在 function 中也是一樣的... 

因此,我們常在 shell script 裡用如下方法測試 script 是否有讀進參數: 
代码:
[ $# = 0 ]

假如為 0 ,那就表示 script 沒有參數,否則就是有帶參數... 

接下來就是 $@ 與 $* : 
精確來講,兩者只有在 soft quote 中才有差異,否則,都表示"全部參數"( $0 除外)。 
舉例來說好了: 
若在 command line 上跑 my.sh p1 "p2 p3" p4 的話, 
不管是 $@ 還是 $* ,都可得到 p1 p2 p3 p4 就是了。 
但是,如果置於 soft quote 中的話: 
"$@" 則可得到 "p1" "p2 p3" "p4" 這三個不同的詞段(word)﹔ 
"$*" 則可得到 "p1 p2 p3 p4" 這一整串單一的詞段。 

我們可修改一下前面的 my.sh ,使之內容如下: 
代码:
#!/bin/bash 

my_fun() { 
    echo "$#" 
} 

echo 'the number of parameter in "$@" is '$(my_fun "$@") 
echo 'the number of parameter in "$*" is '$(my_fun "$*")


然後再執行 ./my.sh p1 "p2 p3" p4 就知道 $@ 與 $* 差在哪了 ... ^_^

10) && 與 || 差在哪? 

好不容易,進入兩位數的章節了... 一路走來,很辛苦吧?也很快樂吧? ^_^ 

在解答本章題目之前,先讓我們了解一個概念:return value ﹗ 
我們在 shell 下跑的每一個 command 或 function ,在結束的時候都會傳回父行程一個值,稱為 return value 。 
在 shell command line 中可用 $? 這個變量得到最"新"的一個 return value ,也就是剛結束的那個行程傳回的值。 
Return Value(RV) 的取值為 0-255 之間,由程式(或 script)的作者自行定議: 
* 若在 script 裡,用 exit RV 來指定其值,若沒指定,在結束時以最後一道命令之 RV 為值。 
* 若在 function 裡,則用 return RV 來代替 exit RV 即可。 

Return Value 的作用,是用來判斷行程的退出狀態(exit status),只有兩種: 
* 0 的話為"真"( true ) 
* 非 0 的話為"假"( false ) 

舉個例子來說明好了: 
假設當前目錄內有一份 my.file 的文件,而 no.file 是不存在的: 
代码:
$ touch my.file 
$ ls my.file 
$ echo $?   # first echo 
0 
$ ls no.file 
ls: no.file: No such file or directory 
$ echo $?   # second echo 
1 
$ echo $?   # third echo 
0

上例的第一個 echo 是關於 ls my.file 的 RV ,可得到 0 的值,因此為 true ﹔ 
第二個 echo 是關於 ls no.file 的 RV ,則得到非 0 的值,因此為 false ﹔ 
第三個 echo 是關於第二個 echo $? 的 RV ,為 0 的值,因此也為 true 。 

請記住:每一個 command 在結束時都會送回 return value 的﹗不管你跑甚麼樣的命令... 
然而,有一個命令卻是"專門"用來測試某一條件而送出 return value 以供 true 或 false 的判斷, 
它就是 test 命令了﹗ 
若你用的是 bash ,請在 command line 下打 man test 或 man bash 來了解這個 test 的用法。 
這是你可用作參考的最精確的文件了,要是聽別人說的,僅作參考就好... 
下面我只簡單作一些輔助說明,其餘的一律以 man 為準: 

首先,test 的表示式我們稱為 expression ,其命令格式有兩種: 
代码:
test expression 
or: 
[ expression ]

(請務必注意 [ ] 之間的空白鍵﹗) 
用哪一種格式沒所謂,都是一樣的效果。(我個人比較喜歡後者...) 

其次,bash 的 test 目前支援的測試對像只有三種: 
* string:字串,也就是純文字。 
* integer:整數( 0 或正整數,不含負數或小數點)。 
* file:文件。 
請初學者一定要搞清楚這三者的差異,因為 test 所用的 expression 是不一樣的。 
以 A=123 這個變量為例: 
* [ "$A" = 123 ]:是字串的測試,以測試 $A 是否為 1、2、3 這三個連續的"文字"。 
* [ "$A" -eq 123 ]:是整數的測試,以測試 $A 是否等於"一百二十三"。 
* [ -e "$A" ]:是關於文件的測試,以測試 123 這份"文件"是否存在。 

第三,當 expression 測試為"真"時,test 就送回 0 (true) 的 return value ,否則送出非 0 (false)。 
若在 expression 之前加上一個 " ! "(感嘆號),則是當 expression 為"假時" 才送出 0 ,否則送出非 0 。 
同時,test 也允許多重的覆合測試: 
* expression1 -a expression2 :當兩個 exrepssion 都為 true ,才送出 0 ,否則送出非 0 。 
* expression1 -o expression2 :只需其中一個 exrepssion 為 true ,就送出 0 ,只有兩者都為 false 才送出非 0 。 
例如: 
代码:
[ -d "$file" -a -x "$file" ]

是表示當 $file 是一個目錄、且同時具有 x 權限時,test 才會為 true 。 

第四,在 command line 中使用 test 時,請別忘記命令行的"重組"特性, 
也就是在碰到 meta 時會先處理 meta 再重新組建命令行。(這個特性我在第二及第四章都曾反覆強調過) 
比方說,若 test 碰到變量或命令替換時,若不能滿足 expression 格式時,將會得到語法錯誤的結果。 
舉例來說好了: 
關於 [ string1 = string2 ] 這個 test 格式, 
在 = 號兩邊必須要有字串,其中包括空(null)字串(可用 soft quote 或 hard quote 取得)。 
假如 $A 目前沒有定義,或被定議為空字串的話,那如下的寫法將會失敗: 
代码:
$ unset A 
$ [ $A = abc ] 
[: =: unary operator expected

這是因為命令行碰到 $ 這個 meta 時,會替換 $A 的值,然後再重組命令行,那就變成了: 
[ = abc ] 
如此一來 = 號左邊就沒有字串存在了,因此造成 test 的語法錯誤﹗ 
但是,下面這個寫法則是成立的: 
代码:
$ [ "$A" = abc ] 
$ echo $? 
1

這是因為在命令行重組後的結果為: 
[ "" = abc ] 
由於 = 左邊我們用 soft quote 得到一個空字串,而讓 test 語法得以通過... 

讀者諸君請務必留意這些細節哦,因為稍一不慎,將會導至 test 的結果變了個樣﹗ 
若您對 test 還不是很有經驗的話,那在使用 test 時不妨先採用如下這一個"法則": 
* 假如在 test 中碰到變量替換,用 soft quote 是最保險的﹗ 
若你對 quoting 不熟的話,請重新溫習第四章的內容吧... ^_^ 

okay,關於更多的 test 用法,老話一句:請看 man page 吧﹗ ^_^ 

雖然洋洋灑灑講了一大堆,或許你還在嘀咕.... 那... 那個 return value 有啥用啊?﹗ 
問得好﹗ 
告訴你:return value 的作用可大了﹗若你想讓你的 shell 變"聰明"的話,就全靠它了: 
* 有了 return value,我們可以讓 shell 跟據不同的狀態做不同的時情... 

這時候,才讓我來揭曉本章的答案吧~~~ ^_^ 
&& 與 || 都是用來"組建"多個 command line 用的: 
* command1 && command2 :其意思是 command2 只有在 RV 為 0 (true) 的條件下執行。 
* command1 || command2 :其意思是 command2 只有在 RV 為非 0 (false) 的條件下執行。 
來,以例子來說好了: 
代码:
$ A=123 
$ [ -n "$A" ] && echo "yes! it's ture." 
yes! it's ture. 
$ unset A 
$ [ -n "$A" ] && echo "yes! it's ture." 
$ [ -n "$A" ] || echo "no, it's NOT ture." 
no, it's NOT ture.

(註:[ -n string ] 是測試 string 長度大於 0 則為 true 。) 
上例的第一個 && 命令行之所以會執行其右邊的 echo 命令,是因為上一個 test 送回了 0 的 RV 值﹔ 
但第二次就不會執行,因為為 test 送回非 0 的結果... 
同理,|| 右邊的 echo 會被執行,卻正是因為左邊的 test 送回非 0 所引起的。 

事實上,我們在同一命令行中,可用多個 && 或 || 來組建呢: 
代码:
$ A=123 
$ [ -n "$A" ] && echo "yes! it's ture." || echo "no, it's NOT ture." 
yes! it's ture. 
$ unset A 
$ [ -n "$A" ] && echo "yes! it's ture." || echo "no, it's NOT ture." 
no, it's NOT ture.

怎樣,從這一刻開始,你是否覺得我們的 shell 是"很聰明"的呢? ^_^ 

好了,最後,佈置一道習題給大家做做看、、、 
下面的判斷是:當 $A 被賦與值時,再看是否小於 100 ,否則送出 too big! : 
代码:
$ A=123 
$ [ -n "$A" ] && [ "$A" -lt 100 ] || echo 'too big!' 
too big!

若我將 A 取消,照理說,應該不會送文字才對啊(因為第一個條件就不成立了)... 
代码:
$ unset A 
$ [ -n "$A" ] && [ "$A" -lt 100 ] || echo 'too big!' 
too big!

為何上面的結果也可得到呢? 
又,如何解決之呢? 
(提示:修改方法很多,其中一種方法可利用第七章介紹過的 command group ...) 

快﹗告我我答案﹗其餘免談....

11) > 與 < 差在哪? 

這次的題目之前我在 CU 的 shell 版已說明過了: 

http://bbs.chinaunix.net/forum/24/20031030/191375.html 
這次我就不重寫了,將貼子的內容"抄"下來就是了... 

-------------- 
11.1 
談到 I/O redirection ,不妨先讓我們認識一下 File Descriptor (FD) 。 

程式的運算,在大部份情況下都是進行數據(data)的處理, 
這些數據從哪讀進?又,送出到哪裡呢? 
這就是 file descriptor (FD) 的功用了。 

在 shell 程式中,最常使用的 FD 大概有三個,分別為: 
0: Standard Input (STDIN) 
1: Standard Output (STDOUT) 
2: Standard Error Output (STDERR) 

在標準情況下,這些 FD 分別跟如下設備(device)關聯: 
stdin(0): keyboard 
stdout(1): monitor 
stderr(2): monitor 

我們可以用如下下命令測試一下: 
代码:
$ mail -s test root 
this is a test mail. 
please skip. 
^d (同時按 crtl 跟 d 鍵) 

很明顯,mail 程式所讀進的數據,就是從 stdin 也就是 keyboard 讀進的。 
不過,不見得每個程式的 stdin 都跟 mail 一樣從 keyboard 讀進, 
因為程式作者可以從檔案參數讀進 stdin ,如: 
代码:
$ cat /etc/passwd 

但,要是 cat 之後沒有檔案參數則又如何呢? 
哦,請您自己玩玩看囉.... ^_^ 
代码:
$ cat 


(請留意數據輸出到哪裡去了,最後別忘了按 ^d 離開...) 

至於 stdout 與 stderr ,嗯... 等我有空再續吧... ^_^ 
還是,有哪位前輩要來玩接龍呢? 

-------------- 
11.2 
沿文再續,書接上一回... ^_^ 

相信,經過上一個練習後,你對 stdin 與 stdout 應該不難理解吧? 
然後,讓我們繼續看 stderr 好了。 
事實上,stderr 沒甚麼難理解的:說穿了就是"錯誤信息"要往哪邊送而已... 
比方說,若讀進的檔案參數是不存在的,那我們在 monitor 上就看到了: 
代码:
$ ls no.such.file 
ls: no.such.file: No such file or directory 


若,一個命令同時產生 stdout 與 stderr 呢? 
那還不簡單,都送到 monitor 來就好了: 
代码:
$ touch my.file 
$ ls my.file no.such.file 
ls: no.such.file: No such file or directory 
my.file 


okay,至此,關於 FD 及其名稱、還有相關聯的設備,相信你已經沒問題了吧? 
那好,接下來讓我們看看如何改變這些 FD 的預設數據通道, 
我們可用 < 來改變讀進的數據通道(stdin),使之從指定的檔案讀進。 
我們可用 > 來改變送出的數據通道(stdout, stderr),使之輸出到指定的檔案。 

比方說: 
代码:
$ cat < my.file 

就是從 my.file 讀進數據 
代码:
$ mail -s test root < /etc/passwd 

則是從 /etc/passwd 讀進... 
這樣一來,stdin 將不再是從 keyboard 讀進,而是從檔案讀進了... 
嚴格來說,< 符號之前需要指定一個 FD 的(之間不能有空白), 
但因為 0 是 < 的預設值,因此 < 與 0< 是一樣的﹗ 

okay,這個好理解吧? 
那,要是用兩個 << 又是啥呢? 
這是所謂的 HERE Document ,它可以讓我們輸入一段文本,直到讀到 << 後指定的字串。 
比方說: 
代码:
$ cat <<FINISH 
first line here 
second line there 
third line nowhere 
FINISH 

這樣的話,cat 會讀進 3 行句子,而無需從 keyboard 讀進數據且要等 ^d 結束輸入。 

至於 > 又如何呢? 
且聽下回分解.... 

-------------- 
11.3 
okay,又到講古時間~~~ 

當你搞懂了 0< 原來就是改變 stdin 的數據輸入通道之後,相信要理解如下兩個 redirection 就不難了: 
* 1> 

* 2> 
前者是改變 stdout 的數據輸出通道,後者是改變 stderr 的數據輸出通道。 
兩者都是將原本要送出到 monitor 的數據轉向輸出到指定檔案去。 
由於 1 是 > 的預設值,因此,1> 與 > 是相同的,都是改 stdout 。 

用上次的 ls 例子來說明一下好了: 
代码:
$ ls my.file no.such.file 1>file.out 
ls: no.such.file: No such file or directory 

這樣 monitor 就只剩下 stderr 而已。因為 stdout 給寫進 file.out 去了。 
代码:
$ ls my.file no.such.file 2>file.err 
my.file 

這樣 monitor 就只剩下 stdout ,因為 stderr 寫進了 file.err 。 
代码:
$ ls my.file no.such.file 1>file.out 2>file.err 

這樣 monitor 就啥也沒有,因為 stdout 與 stderr 都給轉到檔案去了... 

呵~~~ 看來要理解 > 一點也不難啦﹗是不?沒騙你吧? ^_^ 
不過,有些地方還是要注意一下的。 
首先,是 file locking 的問題。比方如下這個例子: 
代码:
$ ls my.file no.such.file 1>file.both 2>file.both 

從 file system 的角度來說,單一檔案在單一時間內,只能被單一的 FD 作寫入。 
假如 stdout(1) 與 stderr(2) 都同時在寫入 file.both 的話, 
則要看它們在寫入時否碰到同時競爭的情形了,基本上是"先搶先贏"的原則。 
讓我們用周星馳式的"慢鏡頭"來看一下 stdout 與 stderr 同時寫入 file.out 的情形好了: 
* 第 1, 2, 3 秒為 stdout 寫入 
* 第 3, 4, 5 秒為 stderr 寫入 
那麼,這時候 stderr 的第 3 秒所寫的數據就丟失掉了﹗ 
要是我們能控制 stderr 必須等 stdout 寫完再寫,或倒過來,stdout 等 stderr 寫完再寫,那問題就能解決。 
但從技術上,較難掌控的,尤其是 FD 在作"長期性"的寫入時... 

那,如何解決呢?所謂山不轉路轉、路不轉人轉嘛, 
我們可以換一個思維:將 stderr 導進 stdout 或將 stdout 導進 sterr ,而不是大家在搶同一份檔案,不就行了﹗ 
bingo﹗就是這樣啦: 
* 2>&1 就是將 stderr 併進 stdout 作輸出 
* 1>&2 或 >&2 就是將 stdout 併進 stderr 作輸出 
於是,前面的錯誤操作可以改為: 
代码:
$ ls my.file no.such.file 1>file.both 2>&1 
或 
$ ls my.file no.such.file 2>file.both >&2 


這樣,不就皆大歡喜了嗎? 呵~~~ ^_^ 

不過,光解決了 locking 的問題還不夠,我們還有其他技巧需要了解的。 
故事還沒結束,別走開﹗廣告後,我們再回來...﹗ 


-------------- 
11.4 
okay,這次不講 I/O Redirction ,講佛吧... 
(有沒搞錯?﹗網中人是否頭殼燒壞了?...) 嘻~~~ ^_^ 

學佛的最高境界,就是"四大皆空"。至於是空哪四大塊?我也不知,因為我還沒到那境界... 
但這個"空"字,卻非常值得我們返複把玩的: 
--- 色即是空、空即是色﹗ 
好了,施主要是能夠領會"空"的禪意,那離修成正果不遠矣~~~ 

在 Linux 檔案系統裡,有個設備檔位於 /dev/null 。 
許多人都問過我那是甚麼玩意兒?我跟你說好了:那就是"空"啦﹗ 
沒錯﹗空空如也的空就是 null 了.... 請問施主是否忽然有所頓誤了呢?然則恭喜了~~~ ^_^ 

這個 null 在 I/O Redirection 中可有用得很呢: 
* 若將 FD1 跟 FD2 轉到 /dev/null 去,就可將 stdout 與 stderr 弄不見掉。 
* 若將 FD0 接到 /dev/null 來,那就是讀進 nothing 。 
比方說,當我們在執行一個程式時,畫面會同時送出 stdout 跟 stderr , 
假如你不想看到 stderr (也不想存到檔案去),那可以: 
代码:
$ ls my.file no.such.file 2>/dev/null 
my.file


若要相反:只想看到 stderr 呢?還不簡單﹗將 stdout 弄到 null 就行: 
代码:
$ ls my.file no.such.file >/dev/null 
ls: no.such.file: No such file or directory 


那接下來,假如單純只跑程式,不想看到任何輸出結果呢? 
哦,這裡留了一手上次節目沒講的法子,專門贈予有緣人﹗... ^_^ 
除了用 >/dev/null 2>&1 之外,你還可以如此: 
代码:
$ ls my.file no.such.file &>/dev/null 

(提示:將 &> 換成 >& 也行啦~~! ) 

okay?講完佛,接下來,再讓我們看看如下情況: 
代码:
$ echo "1" > file.out 
$ cat file.out 
1 
$ echo "2" > file.out 
$ cat file.out 
2 

看來,我們在重導 stdout 或 stderr 進一份檔案時,似乎永遠只獲得最後一次導入的結果。 
那,之前的內容呢? 
呵~~~ 要解決這個問提很簡單啦,將 > 換成 >> 就好: 
代码:
$ echo "3" >> file.out 
$ cat file.out 
2 
3 

如此一來,被重導的目標檔案之內容並不會失去,而新的內容則一直增加在最後面去。 
easy ? 呵 ... ^_^ 

但,只要你再一次用回單一的 > 來重導的話,那麼,舊的內容還是會被"洗"掉的﹗ 
這時,你要如何避免呢? 
----備份﹗ yes ,我聽到了﹗不過.... 還有更好的嗎? 
既然與施主這麼有緣份,老納就送你一個錦囊妙法吧: 
代码:
$ set -o noclobber 
$ echo "4" > file.out 
-bash: file: cannot overwrite existing file 


那,要如何取消這個"限制"呢? 
哦,將 set -o 換成 set +o 就行: 
代码:
$ set +o noclobber 
$ echo "5" > file.out 
$ cat file.out 
5 


再問:那... 有辦法不取消而又"臨時"蓋寫目標檔案嗎? 
哦,佛曰:不可告也﹗ 
啊~~~ 開玩笑的、開玩笑的啦~~~ ^_^ 唉,早就料到人心是不足的了﹗ 
代码:
$ set -o noclobber 
$ echo "6" >| file.out 
$ cat file.out 
6 

留意到沒有:在 > 後面再加個" | "就好(注意: > 與 | 之間不能有空白哦).... 

呼.... (深呼吸吐納一下吧)~~~ ^_^ 
再來還有一個難題要你去參透的呢: 
代码:
$ echo "some text here" > file 
$ cat < file 
some text here 
$ cat < file > file.bak 
$ cat < file.bak 
some text here 
$ cat < file > file 
$ cat < file 


嗯?﹗注意到沒有?﹗﹗ 
---- 怎麼最後那個 cat 命令看到的 file 竟是空的?﹗ 
why? why? why? 

同學們:下節課不要遲到囉~~~! 


-------------- 
11.5 
噹噹噹~~~ 上課囉~~~ ^_^ 

前面提到:$ cat < file > file 之後原本有內容的檔案結果卻被洗掉了﹗ 
要理解這一現像其實不難,這只是 priority 的問題而已: 
* 在 IO Redirection 中,stdout 與 stderr 的管道會先準備好,才會從 stdin 讀進資料。 
也就是說,在上例中,> file 會先將 file 清空,然後才讀進 < file , 
但這時候檔案已經被清空了,因此就變成讀不進任何資料了... 

哦~~~ 原來如此~~~~ ^_^ 
那... 如下兩例又如何呢? 
代码:
$ cat <> file 
$ cat < file >> file 


嗯... 同學們,這兩個答案就當練習題囉,下節課之前請交作業﹗ 

好了,I/O Redirection 也快講完了,sorry,因為我也只知道這麼多而已啦~~~ 嘻~~ ^_^ 
不過,還有一樣東東是一定要講的,各位觀眾(請自行配樂~!#@!$%) : 
---- 就是 pipe line 也﹗ 

談到 pipe line ,我相信不少人都不會陌生: 
我們在很多 command line 上常看到的" | "符號就是 pipe line 了。 
不過,究竟 pipe line 是甚麼東東呢? 
別急別急... 先查一下英漢字典,看看 pipe 是甚麼意思? 
沒錯﹗它就是"水管"的意思... 
那麼,你能想像一下水管是怎麼一根接著一根的嗎? 
又,每根水管之間的 input 跟 output 又如何呢? 
嗯?? 
靈光一閃:原來 pipe line 的 I/O 跟水管的 I/O 是一模一樣的: 
* 上一個命令的 stdout 接到下一個命令的 stdin 去了﹗ 
的確如此... 不管在 command line 上你使用了多少個 pipe line , 
前後兩個 command 的 I/O 都是彼此連接的﹗(恭喜:你終於開竅了﹗ ^_^ ) 

不過... 然而... 但是... ... stderr 呢? 
好問題﹗不過也容易理解: 
* 若水管漏水怎麼辦? 
也就是說:在 pipe line 之間,前一個命令的 stderr 是不會接進下一命令的 stdin 的, 
其輸出,若不用 2> 導到 file 去的話,它還是送到監視器上面來﹗ 
這點請你在 pipe line 運用上務必要注意的。 

那,或許你又會問: 
* 有辦法將 stderr 也餵進下一個命令的 stdin 去嗎? 
(貪得無厭的家夥﹗) 
方法當然是有,而且你早已學過了﹗ ^_^ 
我提示一下就好: 
* 請問你如何將 stderr 合併進 stdout 一同輸出呢? 
若你答不出來,下課之後再來問我吧... (如果你臉皮真夠厚的話...) 

或許,你仍意尤未盡﹗或許,你曾經碰到過下面的問題: 
* 在 cm1 | cm2 | cm3 ... 這段 pipe line 中,若要將 cm2 的結果存到某一檔案呢? 

若你寫成 cm1 | cm2 > file | cm3 的話, 
那你肯定會發現 cm3 的 stdin 是空的﹗(當然啦,你都將水管接到別的水池了﹗) 
聰明的你或許會如此解決: 
代码:
cm1 | cm2 > file ; cm3 < file 

是的,你的確可以這樣做,但最大的壞處是:這樣一來,file I/O 會變雙倍﹗ 
在 command 執行的整個過程中,file I/O 是最常見的最大效能殺手。 
凡是有經驗的 shell 操作者,都會盡量避免或降低 file I/O 的頻率。 

那,上面問題還有更好方法嗎? 
有的,那就是 tee 命令了。 
* 所謂 tee 命令是在不影響原本 I/O 的情況下,將 stdout 複製一份到檔案去。 
因此,上面的命令行可以如此打: 
代码:
cm1 | cm2 | tee file | cm3 

在預設上,tee 會改寫目標檔案,若你要改為增加內容的話,那可用 -a 參數達成。 

基本上,pipe line 的應用在 shell 操作上是非常廣泛的,尤其是在 text filtering 方面, 
凡舉 cat, more, head, tail, wc, expand, tr, grep, sed, awk, ... 等等文字處理工具, 
搭配起 pipe line 來使用,你會驚覺 command line 原來是活得如此精彩的﹗ 
常讓人有"眾裡尋他千百度,驀然回首,那人卻在燈火闌珊處﹗"之感... ^_^ 

.... 

好了,關於 I/O Redirection 的介紹就到此告一段落。 
若日後有空的話,再為大家介紹其它在 shell 上好玩的東西﹗bye... ^_^

11) > 與 < 差在哪? 

這次的題目之前我在 CU 的 shell 版已說明過了: 

http://bbs.chinaunix.net/forum/24/20031030/191375.html 
這次我就不重寫了,將貼子的內容"抄"下來就是了... 

-------------- 
11.1 
談到 I/O redirection ,不妨先讓我們認識一下 File Descriptor (FD) 。 

程式的運算,在大部份情況下都是進行數據(data)的處理, 
這些數據從哪讀進?又,送出到哪裡呢? 
這就是 file descriptor (FD) 的功用了。 

在 shell 程式中,最常使用的 FD 大概有三個,分別為: 
0: Standard Input (STDIN) 
1: Standard Output (STDOUT) 
2: Standard Error Output (STDERR) 

在標準情況下,這些 FD 分別跟如下設備(device)關聯: 
stdin(0): keyboard 
stdout(1): monitor 
stderr(2): monitor 

我們可以用如下下命令測試一下: 
代码:
$ mail -s test root 
this is a test mail. 
please skip. 
^d (同時按 crtl 跟 d 鍵) 

很明顯,mail 程式所讀進的數據,就是從 stdin 也就是 keyboard 讀進的。 
不過,不見得每個程式的 stdin 都跟 mail 一樣從 keyboard 讀進, 
因為程式作者可以從檔案參數讀進 stdin ,如: 
代码:
$ cat /etc/passwd 

但,要是 cat 之後沒有檔案參數則又如何呢? 
哦,請您自己玩玩看囉.... ^_^ 
代码:
$ cat 


(請留意數據輸出到哪裡去了,最後別忘了按 ^d 離開...) 

至於 stdout 與 stderr ,嗯... 等我有空再續吧... ^_^ 
還是,有哪位前輩要來玩接龍呢? 

-------------- 
11.2 
沿文再續,書接上一回... ^_^ 

相信,經過上一個練習後,你對 stdin 與 stdout 應該不難理解吧? 
然後,讓我們繼續看 stderr 好了。 
事實上,stderr 沒甚麼難理解的:說穿了就是"錯誤信息"要往哪邊送而已... 
比方說,若讀進的檔案參數是不存在的,那我們在 monitor 上就看到了: 
代码:
$ ls no.such.file 
ls: no.such.file: No such file or directory 


若,一個命令同時產生 stdout 與 stderr 呢? 
那還不簡單,都送到 monitor 來就好了: 
代码:
$ touch my.file 
$ ls my.file no.such.file 
ls: no.such.file: No such file or directory 
my.file 


okay,至此,關於 FD 及其名稱、還有相關聯的設備,相信你已經沒問題了吧? 
那好,接下來讓我們看看如何改變這些 FD 的預設數據通道, 
我們可用 < 來改變讀進的數據通道(stdin),使之從指定的檔案讀進。 
我們可用 > 來改變送出的數據通道(stdout, stderr),使之輸出到指定的檔案。 

比方說: 
代码:
$ cat < my.file 

就是從 my.file 讀進數據 
代码:
$ mail -s test root < /etc/passwd 

則是從 /etc/passwd 讀進... 
這樣一來,stdin 將不再是從 keyboard 讀進,而是從檔案讀進了... 
嚴格來說,< 符號之前需要指定一個 FD 的(之間不能有空白), 
但因為 0 是 < 的預設值,因此 < 與 0< 是一樣的﹗ 

okay,這個好理解吧? 
那,要是用兩個 << 又是啥呢? 
這是所謂的 HERE Document ,它可以讓我們輸入一段文本,直到讀到 << 後指定的字串。 
比方說: 
代码:
$ cat <<FINISH 
first line here 
second line there 
third line nowhere 
FINISH 

這樣的話,cat 會讀進 3 行句子,而無需從 keyboard 讀進數據且要等 ^d 結束輸入。 

至於 > 又如何呢? 
且聽下回分解.... 

-------------- 
11.3 
okay,又到講古時間~~~ 

當你搞懂了 0< 原來就是改變 stdin 的數據輸入通道之後,相信要理解如下兩個 redirection 就不難了: 
* 1> 

* 2> 
前者是改變 stdout 的數據輸出通道,後者是改變 stderr 的數據輸出通道。 
兩者都是將原本要送出到 monitor 的數據轉向輸出到指定檔案去。 
由於 1 是 > 的預設值,因此,1> 與 > 是相同的,都是改 stdout 。 

用上次的 ls 例子來說明一下好了: 
代码:
$ ls my.file no.such.file 1>file.out 
ls: no.such.file: No such file or directory 

這樣 monitor 就只剩下 stderr 而已。因為 stdout 給寫進 file.out 去了。 
代码:
$ ls my.file no.such.file 2>file.err 
my.file 

這樣 monitor 就只剩下 stdout ,因為 stderr 寫進了 file.err 。 
代码:
$ ls my.file no.such.file 1>file.out 2>file.err 

這樣 monitor 就啥也沒有,因為 stdout 與 stderr 都給轉到檔案去了... 

呵~~~ 看來要理解 > 一點也不難啦﹗是不?沒騙你吧? ^_^ 
不過,有些地方還是要注意一下的。 
首先,是 file locking 的問題。比方如下這個例子: 
代码:
$ ls my.file no.such.file 1>file.both 2>file.both 

從 file system 的角度來說,單一檔案在單一時間內,只能被單一的 FD 作寫入。 
假如 stdout(1) 與 stderr(2) 都同時在寫入 file.both 的話, 
則要看它們在寫入時否碰到同時競爭的情形了,基本上是"先搶先贏"的原則。 
讓我們用周星馳式的"慢鏡頭"來看一下 stdout 與 stderr 同時寫入 file.out 的情形好了: 
* 第 1, 2, 3 秒為 stdout 寫入 
* 第 3, 4, 5 秒為 stderr 寫入 
那麼,這時候 stderr 的第 3 秒所寫的數據就丟失掉了﹗ 
要是我們能控制 stderr 必須等 stdout 寫完再寫,或倒過來,stdout 等 stderr 寫完再寫,那問題就能解決。 
但從技術上,較難掌控的,尤其是 FD 在作"長期性"的寫入時... 

那,如何解決呢?所謂山不轉路轉、路不轉人轉嘛, 
我們可以換一個思維:將 stderr 導進 stdout 或將 stdout 導進 sterr ,而不是大家在搶同一份檔案,不就行了﹗ 
bingo﹗就是這樣啦: 
* 2>&1 就是將 stderr 併進 stdout 作輸出 
* 1>&2 或 >&2 就是將 stdout 併進 stderr 作輸出 
於是,前面的錯誤操作可以改為: 
代码:
$ ls my.file no.such.file 1>file.both 2>&1 
或 
$ ls my.file no.such.file 2>file.both >&2 


這樣,不就皆大歡喜了嗎? 呵~~~ ^_^ 

不過,光解決了 locking 的問題還不夠,我們還有其他技巧需要了解的。 
故事還沒結束,別走開﹗廣告後,我們再回來...﹗ 


-------------- 
11.4 
okay,這次不講 I/O Redirction ,講佛吧... 
(有沒搞錯?﹗網中人是否頭殼燒壞了?...) 嘻~~~ ^_^ 

學佛的最高境界,就是"四大皆空"。至於是空哪四大塊?我也不知,因為我還沒到那境界... 
但這個"空"字,卻非常值得我們返複把玩的: 
--- 色即是空、空即是色﹗ 
好了,施主要是能夠領會"空"的禪意,那離修成正果不遠矣~~~ 

在 Linux 檔案系統裡,有個設備檔位於 /dev/null 。 
許多人都問過我那是甚麼玩意兒?我跟你說好了:那就是"空"啦﹗ 
沒錯﹗空空如也的空就是 null 了.... 請問施主是否忽然有所頓誤了呢?然則恭喜了~~~ ^_^ 

這個 null 在 I/O Redirection 中可有用得很呢: 
* 若將 FD1 跟 FD2 轉到 /dev/null 去,就可將 stdout 與 stderr 弄不見掉。 
* 若將 FD0 接到 /dev/null 來,那就是讀進 nothing 。 
比方說,當我們在執行一個程式時,畫面會同時送出 stdout 跟 stderr , 
假如你不想看到 stderr (也不想存到檔案去),那可以: 
代码:
$ ls my.file no.such.file 2>/dev/null 
my.file


若要相反:只想看到 stderr 呢?還不簡單﹗將 stdout 弄到 null 就行: 
代码:
$ ls my.file no.such.file >/dev/null 
ls: no.such.file: No such file or directory 


那接下來,假如單純只跑程式,不想看到任何輸出結果呢? 
哦,這裡留了一手上次節目沒講的法子,專門贈予有緣人﹗... ^_^ 
除了用 >/dev/null 2>&1 之外,你還可以如此: 
代码:
$ ls my.file no.such.file &>/dev/null 

(提示:將 &> 換成 >& 也行啦~~! ) 

okay?講完佛,接下來,再讓我們看看如下情況: 
代码:
$ echo "1" > file.out 
$ cat file.out 
1 
$ echo "2" > file.out 
$ cat file.out 
2 

看來,我們在重導 stdout 或 stderr 進一份檔案時,似乎永遠只獲得最後一次導入的結果。 
那,之前的內容呢? 
呵~~~ 要解決這個問提很簡單啦,將 > 換成 >> 就好: 
代码:
$ echo "3" >> file.out 
$ cat file.out 
2 
3 

如此一來,被重導的目標檔案之內容並不會失去,而新的內容則一直增加在最後面去。 
easy ? 呵 ... ^_^ 

但,只要你再一次用回單一的 > 來重導的話,那麼,舊的內容還是會被"洗"掉的﹗ 
這時,你要如何避免呢? 
----備份﹗ yes ,我聽到了﹗不過.... 還有更好的嗎? 
既然與施主這麼有緣份,老納就送你一個錦囊妙法吧: 
代码:
$ set -o noclobber 
$ echo "4" > file.out 
-bash: file: cannot overwrite existing file 


那,要如何取消這個"限制"呢? 
哦,將 set -o 換成 set +o 就行: 
代码:
$ set +o noclobber 
$ echo "5" > file.out 
$ cat file.out 
5 


再問:那... 有辦法不取消而又"臨時"蓋寫目標檔案嗎? 
哦,佛曰:不可告也﹗ 

啊~~~ 開玩笑的、開玩笑的啦~~~ ^_^ 唉,早就料到人心是不足的了﹗ 
代码:
$ set -o noclobber 
$ echo "6" >| file.out 
$ cat file.out 
6 

留意到沒有:在 > 後面再加個" | "就好(注意: > 與 | 之間不能有空白哦).... 

呼.... (深呼吸吐納一下吧)~~~ ^_^ 
再來還有一個難題要你去參透的呢: 
代码:
$ echo "some text here" > file 
$ cat < file 
some text here 
$ cat < file > file.bak 
$ cat < file.bak 
some text here 
$ cat < file > file 
$ cat < file 


嗯?﹗注意到沒有?﹗﹗ 
---- 怎麼最後那個 cat 命令看到的 file 竟是空的?﹗ 
why? why? why? 

同學們:下節課不要遲到囉~~~! 


-------------- 
11.5 
噹噹噹~~~ 上課囉~~~ ^_^ 

前面提到:$ cat < file > file 之後原本有內容的檔案結果卻被洗掉了﹗ 
要理解這一現像其實不難,這只是 priority 的問題而已: 
* 在 IO Redirection 中,stdout 與 stderr 的管道會先準備好,才會從 stdin 讀進資料。 
也就是說,在上例中,> file 會先將 file 清空,然後才讀進 < file , 
但這時候檔案已經被清空了,因此就變成讀不進任何資料了... 

哦~~~ 原來如此~~~~ ^_^ 
那... 如下兩例又如何呢? 
代码:
$ cat <> file 
$ cat < file >> file 


嗯... 同學們,這兩個答案就當練習題囉,下節課之前請交作業﹗ 

好了,I/O Redirection 也快講完了,sorry,因為我也只知道這麼多而已啦~~~ 嘻~~ ^_^ 
不過,還有一樣東東是一定要講的,各位觀眾(請自行配樂~!#@!$%) : 
---- 就是 pipe line 也﹗ 

談到 pipe line ,我相信不少人都不會陌生: 
我們在很多 command line 上常看到的" | "符號就是 pipe line 了。 
不過,究竟 pipe line 是甚麼東東呢? 
別急別急... 先查一下英漢字典,看看 pipe 是甚麼意思? 
沒錯﹗它就是"水管"的意思... 
那麼,你能想像一下水管是怎麼一根接著一根的嗎? 
又,每根水管之間的 input 跟 output 又如何呢? 
嗯?? 
靈光一閃:原來 pipe line 的 I/O 跟水管的 I/O 是一模一樣的: 
* 上一個命令的 stdout 接到下一個命令的 stdin 去了﹗ 
的確如此... 不管在 command line 上你使用了多少個 pipe line , 
前後兩個 command 的 I/O 都是彼此連接的﹗(恭喜:你終於開竅了﹗ ^_^ ) 

不過... 然而... 但是... ... stderr 呢? 
好問題﹗不過也容易理解: 
* 若水管漏水怎麼辦? 
也就是說:在 pipe line 之間,前一個命令的 stderr 是不會接進下一命令的 stdin 的, 
其輸出,若不用 2> 導到 file 去的話,它還是送到監視器上面來﹗ 
這點請你在 pipe line 運用上務必要注意的。 

那,或許你又會問: 
* 有辦法將 stderr 也餵進下一個命令的 stdin 去嗎? 
(貪得無厭的家夥﹗) 
方法當然是有,而且你早已學過了﹗ ^_^ 
我提示一下就好: 
* 請問你如何將 stderr 合併進 stdout 一同輸出呢? 
若你答不出來,下課之後再來問我吧... (如果你臉皮真夠厚的話...) 

或許,你仍意尤未盡﹗或許,你曾經碰到過下面的問題: 
* 在 cm1 | cm2 | cm3 ... 這段 pipe line 中,若要將 cm2 的結果存到某一檔案呢? 

若你寫成 cm1 | cm2 > file | cm3 的話, 
那你肯定會發現 cm3 的 stdin 是空的﹗(當然啦,你都將水管接到別的水池了﹗) 
聰明的你或許會如此解決: 
代码:
cm1 | cm2 > file ; cm3 < file 

是的,你的確可以這樣做,但最大的壞處是:這樣一來,file I/O 會變雙倍﹗ 
在 command 執行的整個過程中,file I/O 是最常見的最大效能殺手。 
凡是有經驗的 shell 操作者,都會盡量避免或降低 file I/O 的頻率。 

那,上面問題還有更好方法嗎? 
有的,那就是 tee 命令了。 
* 所謂 tee 命令是在不影響原本 I/O 的情況下,將 stdout 複製一份到檔案去。 
因此,上面的命令行可以如此打: 
代码:
cm1 | cm2 | tee file | cm3 

在預設上,tee 會改寫目標檔案,若你要改為增加內容的話,那可用 -a 參數達成。 

基本上,pipe line 的應用在 shell 操作上是非常廣泛的,尤其是在 text filtering 方面, 
凡舉 cat, more, head, tail, wc, expand, tr, grep, sed, awk, ... 等等文字處理工具, 
搭配起 pipe line 來使用,你會驚覺 command line 原來是活得如此精彩的﹗ 
常讓人有"眾裡尋他千百度,驀然回首,那人卻在燈火闌珊處﹗"之感... ^_^ 

.... 

好了,關於 I/O Redirection 的介紹就到此告一段落。 
若日後有空的話,再為大家介紹其它在 shell 上好玩的東西﹗bye... ^_^

13) for what? while 與 until 差在哪? 

終於,來到 shell 十三問的最後一問了... 長長吐一口氣~~~~ 

最後要介紹的是 shell script 設計中常見的"循環"(loop)。 
所謂的 loop 就是 script 中的一段在一定條件下反覆執行的代碼。 
bash shell 中常用的 loop 有如下三種: 
* for 
* while 
* until 

for loop 是從一個清單列表中讀進變量值,並"依次"的循環執行 do 到 done 之間的命令行。 
例: 
代码:
for var in one two three four five 
do 
    echo ----------- 
    echo '$var is '$var 
    echo 
done

上例的執行結果將會是: 
1) for 會定義一個叫 var 的變量,其值依次是 one two three four five 。 
2) 因為有 5 個變量值,因此 do 與 done 之間的命令行會被循環執行 5 次。 
3) 每次循環均用 echo 產生三行句子。 
而第二行中不在 hard quote 之內的 $var 會依次被替換為 one two three four five 。 
4) 當最後一個變量值處理完畢,循環結束。


我們不難看出,在 for loop 中,變量值的多寡,決定循環的次數。 
然而,變量在循環中是否使用則不一定,得視設計需求而定。 
倘若 for loop 沒有使用 in 這個 keyword 來指定變量值清單的話,其值將從 $@ (或 $* )中繼承: 
代码:
for var; do 
    .... 
done

(若你忘記了 positional parameter ,請溫習第 9 章...) 

for loop 用於處理"清單"(list)項目非常方便, 
其清單除了可明確指定或從 positional parameter 取得之外, 
也可從變量替換或命令替換取得... (再一次提醒:別忘了命令行的"重組"特性﹗) 
然而,對於一些"累計變化"的項目(如整數加減),for 亦能處理: 
代码:
for ((i=1;i<=10;i++)) 
do 
   echo "num is $i" 
done


除了 for loop ,上面的例子我們也可改用 while loop 來做到: 
代码:
num=1 
while [ "$num" -le 10 ]; do 
    echo "num is $num" 
    num=$(($num + 1)) 
done


while loop 的原理與 for loop 稍有不同: 
它不是逐次處理清單中的變量值,而是取決於 while 後面的命令行之 return value : 
* 若為 ture ,則執行 do 與 done 之間的命令,然後重新判斷 while 後的 return value 。 
* 若為 false ,則不再執行 do 與 done 之間的命令而結束循環。 

分析上例: 
1) 在 while 之前,定義變量 num=1 。 
2) 然後測試(test) $num 是否小於或等於 10 。 
3) 結果為 true ,於是執行 echo 並將 num 的值加一。 
4) 再作第二輪測試,其時 num 的值為 1+1=2 ,依然小於或等於 10,因此為 true ,繼續循環。 
5) 直到 num 為 10+1=11 時,測試才會失敗... 於是結束循環。


我們不難發現: 
* 若 while 的測試結果永遠為 true 的話,那循環將一直永久執行下去: 
代码:
while :; do 
    echo looping... 
done

上例的" : "是 bash 的 null command ,不做任何動作,除了送回 true 的 return value 。 
因此這個循環不會結束,稱作死循環。 
死循環的產生有可能是故意設計的(如跑 daemon),也可能是設計錯誤。 
若要結束死尋環,可透過 signal 來終止(如按下 ctrl-c )。 
(關於 process 與 signal ,等日後有機會再補充,十三問暫時略過。) 

一旦你能夠理解 while loop 的話,那,就能理解 until loop : 
* 與 while 相反,until 是在 return value 為 false 時進入循環,否則結束。 
因此,前面的例子我們也可以輕鬆的用 until 來寫: 
代码:
num=1 
until [ ! "$num" -le 10 ]; do 
    echo "num is $num" 
    num=$(($num + 1)) 
done

或是: 
代码:
num=1 
until [ "$num" -gt 10 ]; do 
    echo "num is $num" 
    num=$(($num + 1)) 
done


okay ,關於 bash 的三個常用的 loop 暫時介紹到這裡。 
在結束本章之前,再跟大家補充兩個與 loop 有關的命令: 
* break 
* continue 
這兩個命令常用在複合式循環裡,也就是在 do ... done 之間又有更進一層的 loop , 
當然,用在單一循環中也未嘗不可啦... ^_^ 

break 是用來打斷循環,也就是"強迫結束" 循環。 
若 break 後面指定一個數值 n 的話,則"從裡向外"打斷第 n 個循環, 
預設值為 break 1 ,也就是打斷當前的循環。 
在使用 break 時需要注意的是, 它與 return 及 exit 是不同的: 
* break 是結束 loop 
* return 是結束 function 
* exit 是結束 script/shell 

而 continue 則與 break 相反:強迫進入下一次循環動作。 
若你理解不來的話,那你可簡單的看成:在 continue 到 done 之間的句子略過而返回循環頂端... 
與 break 相同的是:continue 後面也可指定一個數值 n ,以決定繼續哪一層(從裡向外計算)的循環, 
預設值為 continue 1 ,也就是繼續當前的循環。 

在 shell script 設計中,若能善用 loop ,將能大幅度提高 script 在複雜條件下的處理能力。 
請多加練習吧.... 


----------- 

好了,該是到了結束的時候了。 
婆婆媽媽的跟大家囉唆了一堆關於 shell 的基礎概念, 
目的不是要告訴大家"答案",而是要帶給大家"啟發"... 
在日後關於 shell 的討論中,我或許會經常用"鏈接"方式指引回來十三問中的內容, 
以便我們在進行技術探討時彼此能有一些討論基礎,而不至於各說各話、徒費時力。 
但,更希望十三問能帶給你更多的思考與樂趣,至為重要的是透過實作來加深理解。 

是的,我很重視"實作"與"獨立思考"這兩項學習要素,若你能夠掌握其中真義,那請容我說聲: 
--- 恭喜﹗十三問你沒白看了﹗ ^_^ 


p.s. 
至於補充問題部份,我暫時不寫了。而是希望: 
1) 大家擴充題目。 
2) 一起來寫心得。 

Good luck and happy studying!
13) for what? while 與 until 差在哪? 

終於,來到 shell 十三問的最後一問了... 長長吐一口氣~~~~ 

最後要介紹的是 shell script 設計中常見的"循環"(loop)。 
所謂的 loop 就是 script 中的一段在一定條件下反覆執行的代碼。 
bash shell 中常用的 loop 有如下三種: 
* for 
* while 
* until 

for loop 是從一個清單列表中讀進變量值,並"依次"的循環執行 do 到 done 之間的命令行。 
例: 
代码:
for var in one two three four five 
do 
    echo ----------- 
    echo '$var is '$var 
    echo 
done

上例的執行結果將會是: 
1) for 會定義一個叫 var 的變量,其值依次是 one two three four five 。 
2) 因為有 5 個變量值,因此 do 與 done 之間的命令行會被循環執行 5 次。 
3) 每次循環均用 echo 產生三行句子。 
而第二行中不在 hard quote 之內的 $var 會依次被替換為 one two three four five 。 
4) 當最後一個變量值處理完畢,循環結束。


我們不難看出,在 for loop 中,變量值的多寡,決定循環的次數。 
然而,變量在循環中是否使用則不一定,得視設計需求而定。 
倘若 for loop 沒有使用 in 這個 keyword 來指定變量值清單的話,其值將從 $@ (或 $* )中繼承: 
代码:
for var; do 
    .... 
done

(若你忘記了 positional parameter ,請溫習第 9 章...) 

for loop 用於處理"清單"(list)項目非常方便, 
其清單除了可明確指定或從 positional parameter 取得之外, 
也可從變量替換或命令替換取得... (再一次提醒:別忘了命令行的"重組"特性﹗) 
然而,對於一些"累計變化"的項目(如整數加減),for 亦能處理: 
代码:
for ((i=1;i<=10;i++)) 
do 
   echo "num is $i" 
done


除了 for loop ,上面的例子我們也可改用 while loop 來做到: 
代码:
num=1 
while [ "$num" -le 10 ]; do 
    echo "num is $num" 
    num=$(($num + 1)) 
done


while loop 的原理與 for loop 稍有不同: 
它不是逐次處理清單中的變量值,而是取決於 while 後面的命令行之 return value : 
* 若為 ture ,則執行 do 與 done 之間的命令,然後重新判斷 while 後的 return value 。 
* 若為 false ,則不再執行 do 與 done 之間的命令而結束循環。 

分析上例: 
1) 在 while 之前,定義變量 num=1 。 
2) 然後測試(test) $num 是否小於或等於 10 。 
3) 結果為 true ,於是執行 echo 並將 num 的值加一。 
4) 再作第二輪測試,其時 num 的值為 1+1=2 ,依然小於或等於 10,因此為 true ,繼續循環。 
5) 直到 num 為 10+1=11 時,測試才會失敗... 於是結束循環。


我們不難發現: 
* 若 while 的測試結果永遠為 true 的話,那循環將一直永久執行下去: 
代码:
while :; do 
    echo looping... 
done

上例的" : "是 bash 的 null command ,不做任何動作,除了送回 true 的 return value 。 
因此這個循環不會結束,稱作死循環。 
死循環的產生有可能是故意設計的(如跑 daemon),也可能是設計錯誤。 
若要結束死尋環,可透過 signal 來終止(如按下 ctrl-c )。 
(關於 process 與 signal ,等日後有機會再補充,十三問暫時略過。) 

一旦你能夠理解 while loop 的話,那,就能理解 until loop : 
* 與 while 相反,until 是在 return value 為 false 時進入循環,否則結束。 
因此,前面的例子我們也可以輕鬆的用 until 來寫: 
代码:
num=1 
until [ ! "$num" -le 10 ]; do 
    echo "num is $num" 
    num=$(($num + 1)) 
done

或是: 
代码:
num=1 
until [ "$num" -gt 10 ]; do 
    echo "num is $num" 
    num=$(($num + 1)) 
done


okay ,關於 bash 的三個常用的 loop 暫時介紹到這裡。 
在結束本章之前,再跟大家補充兩個與 loop 有關的命令: 
* break 
* continue 
這兩個命令常用在複合式循環裡,也就是在 do ... done 之間又有更進一層的 loop , 
當然,用在單一循環中也未嘗不可啦... ^_^ 

break 是用來打斷循環,也就是"強迫結束" 循環。 
若 break 後面指定一個數值 n 的話,則"從裡向外"打斷第 n 個循環, 
預設值為 break 1 ,也就是打斷當前的循環。 
在使用 break 時需要注意的是, 它與 return 及 exit 是不同的: 
* break 是結束 loop 
* return 是結束 function 
* exit 是結束 script/shell 

而 continue 則與 break 相反:強迫進入下一次循環動作。 
若你理解不來的話,那你可簡單的看成:在 continue 到 done 之間的句子略過而返回循環頂端... 
與 break 相同的是:continue 後面也可指定一個數值 n ,以決定繼續哪一層(從裡向外計算)的循環, 
預設值為 continue 1 ,也就是繼續當前的循環。 

在 shell script 設計中,若能善用 loop ,將能大幅度提高 script 在複雜條件下的處理能力。 
請多加練習吧.... 


----------- 

好了,該是到了結束的時候了。 
婆婆媽媽的跟大家囉唆了一堆關於 shell 的基礎概念, 
目的不是要告訴大家"答案",而是要帶給大家"啟發"... 
在日後關於 shell 的討論中,我或許會經常用"鏈接"方式指引回來十三問中的內容, 
以便我們在進行技術探討時彼此能有一些討論基礎,而不至於各說各話、徒費時力。 
但,更希望十三問能帶給你更多的思考與樂趣,至為重要的是透過實作來加深理解。 

是的,我很重視"實作"與"獨立思考"這兩項學習要素,若你能夠掌握其中真義,那請容我說聲: 
--- 恭喜﹗十三問你沒白看了﹗ ^_^ 


p.s. 
至於補充問題部份,我暫時不寫了。而是希望: 
1) 大家擴充題目。 
2) 一起來寫心得。 

Good luck and happy studying!

你可能感兴趣的:(经典shell十三问)