Bash字符串处理(与Java对照) - 25.字符串分割(成数组)
In Java
String.split
String[] split(String regex)
根据给定的正则表达式的匹配来拆分此字符串。
String[] split(String regex, int limit)
根据匹配给定的正则表达式来拆分此字符串。
In Bash
简单介绍一下Bash中的数组的定义和使用方法
在Bash中,每个变量都可以作为一维数组使用,并且Bash也只支持一维数组。
$VAR等同于${VAR[0]}
还有一种多此一举的声明数组的方法:declare -a VAR
数组数据的设置方式有:- VAR=(v1 v2 v3)
- VAR=([0]=v0 [1]=v1 [2]=v2)
- VAR[0]=v0
复制代码 引用数组元素的方式:
$VAR ${VAR} ${VAR[0]} 第0个元素
${VAR[n]} 第n个元素(n从0开始计算)
引用整个数组:
${VAR} ${VAR} 这两种方式等同,会把数组展开。
"${VAR}" 表示把数组拼接在一起的整个字符串,如果作为参数传递,会把整个字符串作为一个参数。
"${VAR[@]}" 如果作为参数传递,表示把数组中每个元素作为一个参数,数组有多少个元素,就会展开成多少个参数。
计算数组元素长度:
${#VAR} ${#VAR[@]} 不是 ${#VAR},因为它等同于 ${#VAR[0]}
注意:数组元素长度 != 最大索引 + 1,因为Bash的数组是稀疏数组(Sparse array)。- [root@web ~]# a[1]=1
- [root@web ~]# a[1000]=1000
- [root@web ~]# declare -p a
- declare -a a='([1]="1" [1000]="1000")'
- [root@web ~]# echo "$a"
- [root@web ~]# echo "$a[1]"
- [1]
- [root@web ~]# echo "${a[@]}"
- 1 1000
- [root@web ~]# echo "${#a[@]}"
- 2
- [root@web ~]#
复制代码 遍历数组元素:(注意双引号)
- for ELEM in "${ARRAY[@]}"
- do
- echo $ELEM
- done
复制代码 以空白作为分隔符来拆分字符串构造数组
ARR=($STR)
注意$STR不能加引号。- [root@jfht ~]# STR="Hello World"
- [root@jfht ~]# ARR=($STR)
- [root@jfht ~]# declare -p ARR
- declare -a ARR='([0]="Hello" [1]="World")'
- [root@jfht ~]#
复制代码 用指定分隔符来拆分字符串构造数组
如果分隔符不是空白,而是别的,那么需要借助IFS变量。- default IFS (Internal Field Separator, which is space/tab/new line)
-
- [root@jfht ~]# echo $PATH
- /usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
- [root@jfht ~]# IFS=: DIRS=($PATH)
- [root@jfht ~]# declare -p DIRS
- declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'
- [root@jfht ~]#
复制代码 但是下面的方式是不行的。- [root@jfht ~]# echo $PATH
- /usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
- [root@jfht ~]# IFS=: declare -a DIRS=($PATH)
- [root@jfht ~]# declare -p DIRS
- declare -a DIRS='([0]="/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin")'
- [root@jfht ~]#
复制代码 使用read -a来拆分字符串构造数组
All work and no play makes Jack a dull boy.
只会用功不玩耍,聪明孩子也变傻。
- [root@jfht ~]# PROVERB="All work and no play makes Jack a dull boy."
- [root@jfht ~]# read -a WORDS <<<$PROVERB
- [root@jfht ~]# echo "$WORDS"
- All
- [root@jfht ~]# echo "${#WORDS}"
- 3
- [root@jfht ~]# echo "${WORDS[*]}"
- All work and no play makes Jack a dull boy.
- [root@jfht ~]# echo "${WORDS[@]}"
- All work and no play makes Jack a dull boy.
- [root@jfht ~]# echo "${#WORDS[*]}"
- 10
- [root@jfht ~]# echo "${#WORDS[@]}"
- 10
复制代码 前面的例子中要分割的字符串是以空格分割的,现在举一个以:分割的例子。
- [root@jfht ~]# echo $IFS
- [root@jfht ~]# IFS=: read -r -a DIRS <<<"$PATH"
- [root@jfht ~]# echo $IFS
- [root@jfht ~]# declare -p DIRS
- declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'
- [root@jfht ~]#
复制代码 下面的例子是将当前工作目录以/进行分割。- [root@jfht ctmw]# echo $PWD
- /root/work191/ct08/src/ctmw
- [root@jfht ctmw]# IFS=/ read -r -a PARTS <<<$PWD
- [root@jfht ctmw]# declare -p PARTS
- declare -a PARTS='([0]=" root work191 ct08 src ctmw")'
- [root@jfht ctmw]#
- [root@jfht ctmw]# IFS=/ read -r -a PARTS <<<"$PWD"
- [root@jfht ctmw]# declare -p PARTS
- declare -a PARTS='([0]="" [1]="root" [2]="work191" [3]="ct08" [4]="src" [5]="ctmw")'
- [root@jfht ctmw]#
复制代码 使用cut命令分隔字符串
echo "$STR" | cut -f $N
以TAB分隔,打印第N个子串值,N从1开始计数。
echo "$STR" | cut -d "$DELIM" -d $N
以指定DELIM分隔,打印第N个子串值,N从1开始计数。
其中,-d部分也可以是$N1,$N2,$N3的形式,即输出多个子串。
A good beginning is half done.
良好的开端是成功的一半。- [root@jfht ~]# STR="A good beginning is half done."
- [root@jfht ~]# echo $STR | cut -d ' ' -f 2
- good
-
- [root@jfht ~]# echo $PATH
- /usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
- [root@jfht ~]# echo $PATH | cut -d ':' -f 3
- /usr/apache/apache-ant-1.7.1/bin
- [root@jfht ~]# echo $PATH | cut -d ':' -f 3,5
- /usr/apache/apache-ant-1.7.1/bin:/usr/local/bin
复制代码 使用awk命令分隔字符串- echo "$STR" | awk '{print $1}'
- echo "$STR" | awk '{print $2}'
复制代码 注意:awk后面的参数用单引号,不能用双引号。- [root@jfht ~]# STR="A good beginning is half done."
- [root@jfht ~]# echo "$STR" | awk '{print $1}'
- A
- [root@jfht ~]# echo "$STR" | awk '{print $2}'
- good
- [root@jfht ~]# echo "$STR" | awk '{print $5,$6}'
- half done.
复制代码 本文链接:http://codingstandards.iteye.com/blog/1164910 (转载请注明出处) |