Bash字符串处理(与Java对照) - 25.字符串分割(成数组)

Bash字符串处理(与Java对照) - 25.字符串分割(成数组)

In Java

String.split

 String[]     split(String regex)
          根据给定的正则表达式的匹配来拆分此字符串。
 String[]     split(String regex, int limit)
          根据匹配给定的正则表达式来拆分此字符串。

 

In Bash

简单介绍一下Bash中的数组的定义和使用方法

在Bash中,每个变量都可以作为一维数组使用,并且Bash也只支持一维数组。

$VAR等同于${VAR[0]}

 

还有一种多此一举的声明数组的方法:declare -a VAR

 

数组数据的设置方式有:

VAR=(v1 v2 v3)

VAR=([0]=v0 [1]=v1 [2]=v2)

VAR[0]=v0

 

引用数组元素的方式:

$VAR  ${VAR}  ${VAR[0]}  第0个元素

${VAR[n]}  第n个元素(n从0开始计算)

 

引用整个数组:

${VAR[*]}  ${VAR[*]}   这两种方式等同,会把数组展开。

"${VAR[*]}"  表示把数组拼接在一起的整个字符串,如果作为参数传递,会把整个字符串作为一个参数。

"${VAR[@]}"  如果作为参数传递,表示把数组中每个元素作为一个参数,数组有多少个元素,就会展开成多少个参数。

 

计算数组元素长度:

${#VAR[*]}  ${#VAR[@]}   不是 ${#VAR},因为它等同于 ${#VAR[0]}


注意:数组元素长度 != 最大索引 + 1,因为Bash的数组是稀疏数组(Sparse array)。

[root@web ~]# a[1]=1
[root@web ~]# a[1000]=1000
[root@web ~]# declare -p a
declare -a a='([1]="1" [1000]="1000")'
[root@web ~]# echo "$a"

[root@web ~]# echo "$a[1]"
[1]
[root@web ~]# echo "${a[@]}"
1 1000
[root@web ~]# echo "${#a[@]}"
2
[root@web ~]#

 

遍历数组元素:(注意双引号)

for ELEM in "${ARRAY[@]}"

do

    echo $ELEM

done

 

以空白作为分隔符来拆分字符串构造数组

ARR=($STR)

注意$STR不能加引号。

 

[root@jfht ~]# STR="Hello World"
[root@jfht ~]# ARR=($STR)
[root@jfht ~]# declare -p ARR
declare -a ARR='([0]="Hello" [1]="World")'
[root@jfht ~]#

 

用指定分隔符来拆分字符串构造数组

如果分隔符不是空白,而是别的,那么需要借助IFS变量。

default IFS (Internal Field Separator, which is space/tab/new line)

 

[root@jfht ~]# echo $PATH
/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
[root@jfht ~]# IFS=: DIRS=($PATH)
[root@jfht ~]# declare -p DIRS  
declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'
[root@jfht ~]#

 

但是下面的方式是不行的。

[root@jfht ~]# echo $PATH
/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
[root@jfht ~]# IFS=: declare -a DIRS=($PATH)
[root@jfht ~]# declare -p DIRS
declare -a DIRS='([0]="/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin")'
[root@jfht ~]#

 

使用read -a来拆分字符串构造数组

All work and no play makes Jack a dull boy.
只会用功不玩耍,聪明孩子也变傻。

 

[root@jfht ~]# PROVERB="All work and no play makes Jack a dull boy."
[root@jfht ~]# read -a WORDS <<<$PROVERB
[root@jfht ~]# echo "$WORDS"
All
[root@jfht ~]# echo "${#WORDS}"
3

[root@jfht ~]# echo "${WORDS[*]}"
All work and no play makes Jack a dull boy.
[root@jfht ~]# echo "${WORDS[@]}"
All work and no play makes Jack a dull boy.
[root@jfht ~]# echo "${#WORDS[*]}"
10
[root@jfht ~]# echo "${#WORDS[@]}"
10

 

前面的例子中要分割的字符串是以空格分割的,现在举一个以:分割的例子。

[root@jfht ~]# echo $IFS

[root@jfht ~]# IFS=: read -r -a DIRS <<<"$PATH"
[root@jfht ~]# echo $IFS

[root@jfht ~]# declare -p DIRS
declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'
[root@jfht ~]# 

 

下面的例子是将当前工作目录以/进行分割。

[root@jfht ctmw]# echo $PWD
/root/work191/ct08/src/ctmw
[root@jfht ctmw]# IFS=/ read -r -a PARTS <<<$PWD
[root@jfht ctmw]# declare -p PARTS
declare -a PARTS='([0]=" root work191 ct08 src ctmw")'
[root@jfht ctmw]#
[root@jfht ctmw]# IFS=/ read -r -a PARTS <<<"$PWD"
[root@jfht ctmw]# declare -p PARTS                
declare -a PARTS='([0]="" [1]="root" [2]="work191" [3]="ct08" [4]="src" [5]="ctmw")'
[root@jfht ctmw]#

 

使用cut命令分隔字符串

echo "$STR" | cut -f $N

以TAB分隔,打印第N个子串值,N从1开始计数。

echo "$STR" | cut -d "$DELIM" -d $N

以指定DELIM分隔,打印第N个子串值,N从1开始计数。

其中,-d部分也可以是$N1,$N2,$N3的形式,即输出多个子串。

 

A good beginning is half done.
良好的开端是成功的一半。

 

[root@jfht ~]# STR="A good beginning is half done."
[root@jfht ~]# echo $STR | cut -d ' ' -f 2         
good

 

[root@jfht ~]# echo $PATH
/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
[root@jfht ~]# echo $PATH | cut -d ':' -f 3
/usr/apache/apache-ant-1.7.1/bin

[root@jfht ~]# echo $PATH | cut -d ':' -f 3,5
/usr/apache/apache-ant-1.7.1/bin:/usr/local/bin

 

使用awk命令分隔字符串

echo "$STR" | awk '{print $1}'

echo "$STR" | awk '{print $2}'

注意:awk后面的参数用单引号,不能用双引号。

 

[root@jfht ~]# STR="A good beginning is half done."
[root@jfht ~]# echo "$STR" | awk '{print $1}'
A
[root@jfht ~]# echo "$STR" | awk '{print $2}'
good
[root@jfht ~]# echo "$STR" | awk '{print $5,$6}'
half done.

 

 

 

 

本文链接:http://codingstandards.iteye.com/blog/1164910   (转载请注明出处)

返回目录:Java程序员的Bash实用指南系列之字符串处理(目录) 

上节内容:Bash字符串处理(与Java对照) - 24.文件路径字符串的处理

下节内容:Bash字符串处理(与Java对照) - 26.根据位置和长度截取子串

 

 

你可能感兴趣的:(Bash基础)