在Bash中如何提取子字符串

对于形如 someletters_12345_moreleters.ext 的文件名，我想提取其中的5位数字并将它们放入一个变量中。

明确一下细节，一个文件名的形式是若干个字符（不包含下划线），跟着一个五位的数字，数字两边都有一个下划线，最后跟着另一组若干个字符（不包含下划线）。我想要提取这个5位数字并将它存入一个变量中。

我非常感兴趣于完成这一目标的不同方法。

number=$(echo 'someletters_12345_subsequentchars.ext' | cut -d'_' -f 2)
echo $number
1
2

number=$(echo 'someletters_12345_subsequentchars.ext' | awk -F'_' '{print $2}')
echo $number
1
2

input="someletters_12345_subsequentchars.ext"
tmp=${input#*_}
number=${tmp%_*}
echo $number
1
2
3
4

tmp=${input#*_}: 这是 bash 中的参数扩展操作，# 符号在这里用于删除从左边开始匹配的第一个 _ 及其左边的所有字符。所以，tmp 变量将被赋值为 "12345_subsequentchars.ext"，去掉了原字符串中从左开始的第一个 _ 及其之前的 someletters 部分。
number=${tmp%_*}: 同样是 bash 的参数扩展操作，但这次 % 符号用于删除从右边开始匹配的第一个 _ 及其右边的所有字符。因此，number 变量将被赋值为 "12345"，去掉了原字符串中从右开始的第一个 _ 及其之后的 subsequentchars.ext 部分。

number=$(echo "someletters_12345_subsequentchars.ext" | tr -cd '[[:digit:]]')
echo $number
1
2

number=$(echo "$filename" | grep -oE '[[:digit:]]{5}' | head -1)
echo $number
1
2

总结起来，第一行命令的目的是从变量 $filename 所代表的字符串中找到第一个连续的五位数字序列，并将它存入 number 变量中。

参考：