awk匹配输出正则部分

(1)hadoop fs -ls hdfs://zhihu-tc:8020/user/hive/warehouse/ad_trigger.db/*??/|awk '{match($NF,/.*([0-9]{8}).*/,a); print $0}'

(2)awk提取"keyword":[和,"time""之间的特征串

cat target.20180627.16 |awk -F"\t" '{match($2,/"keyword":\[(.*?),"time"/,a); gsub("]", "", a[1]); if(a[1] != "") print $1"\t"a[1]}'

注意:awk的match的贪婪匹配

(3)awk判断字符串仅含有中文和数字的方法:

echo ""杭州婚博会 2017""|awk '{gsub("[^\\u4e00-\\u9fa5]+|[0-9a-zA-Z]+","",$0); print $0 == ""}' 替换完如果为空就是仅含有中文和数字、字母的


https://blog.csdn.net/choumin/article/details/71023199

你可能感兴趣的:(正则表达式)