hadoop输入路径读取文件的正则通配符

1.    *                                代表0到多个字符

2.   ?                                代表单一字符

3.   [ ab ]                         代表字符类型,匹配{a,b}中的一个字符

4    [ ^ab ]                        代表不是{a,b}中的一个字符

5    [ a-b ]                         代表匹配一个a到b之间的字符包括ab,ASCII代码在a-b之间的

6    [ ^a-b]                         代表不在a到b之间的字符包括ab

7.   {a,b}                           代表匹配a或b的一个语句

8.    \c                               代表转义字符匹配原字符c



实例:

/*                                     /2007    /2008

/*/*                                  /2007/11   /2008/11

/200?                             /2007   /2008

/200[78]                        /2007  /2008

/200[7-8]                       /2007  /2008


其实通配符并不能完全匹配索要的路径可以使用pathfilter对象来使用进行编程方式的匹配路径,后面在更新讲这个问题。。。

你可能感兴趣的:(hadoop,输入文件通配符)