world_hello_100

C# Regular Expressions Cheat Sheet

Cheat sheet for C# regular expressions metacharacters, operators, quantifiers etc

Character	Description
\	Marks the next character as either a special character or escapes a literal. For example, "n" matches the character "n". "\n" matches a newline character. The sequence "\\" matches "\" and "\(" matches "(". Note: double quotes may be escaped by doubling them: ""
^	Depending on whether the MultiLine option is set, matches the position before the first character in a line, or the first character in the string.
$	Depending on whether the MultiLine option is set, matches the position after the last character in a line, or the last character in the string.
*	Matches the preceding character zero or more times. For example, "zo*" matches either "z" or "zoo".
+	Matches the preceding character one or more times. For example, "zo+" matches "zoo" but not "z".
?	Matches the preceding character zero or one time. For example, "a?ve?" matches the "ve" in "never".
.	Matches any single character except a newline character.
(pattern)	Matches pattern and remembers the match. The matched substring can be retrieved from the resultingMatches collection, using Item[0]...[n]. To match parentheses characters ( ), use "$" or "$".
(?pattern)	Matches pattern and gives the match a name.
(?:pattern)	A non-capturing group
(?=...)	A positive lookahead
(?!...)	A negative lookahead
(?<=...)	A positive lookbehind .
(?	A negative lookbehind .
x\|y	Matches either x or y. For example, "z\|wood" matches "z" or "wood". "(z\|w)oo" matches "zoo" or "wood".
{n}	n is a non-negative integer. Matches exactly n times. For example, "o{2}" does not match the "o" in "Bob," but matches the first two o's in "foooood".
{n,}	n is a non-negative integer. Matches at least n times. For example, "o{2,}" does not match the "o" in "Bob" and matches all the o's in "foooood." "o{1,}" is equivalent to "o+". "o{0,}" is equivalent to "o*".
{n,m}	m and n are non-negative integers. Matches at leastn and at mostm times. For example, "o{1,3}" matches the first three o's in "fooooood." "o{0,1}" is equivalent to "o?".
[xyz]	A character set. Matches any one of the enclosed characters. For example, "[abc]" matches the "a" in "plain".
[^xyz]	A negative character set. Matches any character not enclosed. For example, "[^abc]" matches the "p" in "plain".
[a-z]	A range of characters. Matches any character in the specified range. For example, "[a-z]" matches any lowercase alphabetic character in the range "a" through "z".
[^m-z]	A negative range characters. Matches any character not in the specified range. For example, "[m-z]" matches any character not in the range "m" through "z".
\b	Matches a word boundary, that is, the position between a word and a space. For example, "er\b" matches the "er" in "never" but not the "er" in "verb".
\B	Matches a non-word boundary. "ea*r\B" matches the "ear" in "never early".
\d	Matches a digit character. Equivalent to [0-9].
\D	Matches a non-digit character. Equivalent to [^0-9].
\f	Matches a form-feed character.
\k	A back-reference to a named group.
\n	Matches a newline character.
\r	Matches a carriage return character.
\s	Matches any white space including space, tab, form-feed, etc. Equivalent to "[ \f\n\r\t\v]".
\S	Matches any nonwhite space character. Equivalent to "[^ \f\n\r\t\v]".
\t	Matches a tab character.
\v	Matches a vertical tab character.
\w	Matches any word character including underscore. Equivalent to "[A-Za-z0-9_]".
\W	Matches any non-word character. Equivalent to "[^A-Za-z0-9_]".
\num	Matches num, where num is a positive integer. A reference back to remembered matches. For example, "(.)\1" matches two consecutive identical characters.
\n	Matches n, where n is an octal escape value. Octal escape values must be 1, 2, or 3 digits long. For example, "\11" and "\011" both match a tab character. "\0011" is the equivalent of "\001" & "1". Octal escape values must not exceed 256. If they do, only the first two digits comprise the expression. Allows ASCII codes to be used in regular expressions.
\xn	Matches n, where n is a hexadecimal escape value. Hexadecimal escape values must be exactly two digits long. For example, "\x41" matches "A". "\x041" is equivalent to "\x04" & "1". Allows ASCII codes to be used in regular expressions.
\un	Matches a Unicode character expressed in hexadecimal notation with exactly four numeric digits. "\u0200" matches a space character.
\A	Matches the position before the first character in a string. Not affected by the MultiLine setting
\Z	Matches the position after the last character of a string. Not affected by the MultiLine setting.
\G	Specifies that the matches must be consecutive, without any intervening non-matching characters.

Currently rated 4.51 by 263 people

Date Posted: Saturday, May 19, 2007 8:36 PM
Last Updated: Sunday, June 13, 2010 10:33 AM
Posted by: Mikesdotnetting
Total Views to date: 611779

Comments

Monday, December 29, 2008 10:02 AM from Steve

Thanks. Been quite a while since I last used Regular Expressions. Your cheat sheet is just what the doctor ordered.

Tuesday, February 17, 2009 4:33 PM from Dhwanit

Thanks! This was very helpful!

Saturday, April 4, 2009 12:11 PM from pat

Maybe also good to mention that "?" can be used to indicate non-greedy match ie .*? Often quite handy

Thursday, April 16, 2009 4:32 PM from DJ

Anyone know the correct way to check for the dash/minus "-" character?

Thursday, April 16, 2009 8:39 PM from Mike

DJ:

Escape it with a backslash: \-

Monday, June 1, 2009 7:12 PM from Jeff

The descriptions for \W and \w are not completely correct.

You say they're equivalent to [A-Za-z0-9] or [^A-Za-z0-9] when in fact \w allows extended ASCII chars to pass through, e.g. accented letters from non-English languages.

Friday, July 17, 2009 6:39 PM from Rick

Thanks for the great resource. I was wondering if I could link to your article from a help file I'm creating for my company's product which uses c# regular expressions to search through a text file.

Friday, July 17, 2009 7:20 PM from Mike

@Rick

Yes, by all means

Thursday, August 13, 2009 12:49 AM from Roland

Cool, but now how do I use it in code?

Thursday, August 13, 2009 4:42 PM from Alister

One that's missing:

\k : a back-reference to a named group.

Thursday, August 13, 2009 11:02 PM from Mike

@Roland

Huh?

Sunday, September 20, 2009 4:35 AM from Tim

I tried using (pattern) to parse out "(Preferred)" from a string and Visual C# 2008 required me to enter it as (\$Preferred\$) . So in order to match parentheses characters ( ), it should be listed as "\$" or "\$" not "$" or "$" as stated above.

Tuesday, November 24, 2009 11:32 AM from Tomas

How can I write expression with negative number?.. like Column = -8. It doesn't work and result is empty ..

Friday, December 4, 2009 3:03 AM from Steve Wellens

Very nice.

I hope you don't mind me pointing out a very useful, and more importantly free, tool for developing Regular Expressions.

http://www.ultrapico.com/Expresso.htm

Friday, December 4, 2009 6:37 AM from Mike

@Steve,

Thanks for that. I've kept meaning to update this entry with a link to Expresso. You've done it for me now :o)

Sunday, June 6, 2010 6:51 AM from Marc D

Dude... awesome cheat sheet. I just started learning/using/attempting to use reg expressions, so this list rocks:D One thing I think would be great would be how to put together patterns. Some of the patterns out there are just confusing looking. Anyway.. Good job!

Thursday, June 10, 2010 9:38 PM from greensweater

One that's missing: \k : a back-reference to a named group.

as in:

^(?[0-9]*)=\k$

123=123 match
123=456 fail

Sunday, June 13, 2010 10:34 AM from Mike

@Alister and greensweater

I've added \k now. Thanks for pointing it out.

Monday, June 21, 2010 10:49 AM from Jonas

Regular expression comment(#) is missing.

Thursday, July 29, 2010 1:41 PM from chhanda

Excellent

Tuesday, August 3, 2010 12:32 PM from vijay

Thanks for your help.

Friday, August 20, 2010 5:59 PM from alexitosrv

Nice resource. Also Expresso is such a great tool.

Thank you very much.

Monday, September 6, 2010 9:43 PM from Alistair

\x for stripping non printable ascii characters is a life saver for me. The samples on Regexlib.com just don't work in .NET. Thanks for providing this resource. No wonder it's the most popular page on your great site!

Thursday, October 7, 2010 4:34 PM from mark

whats the modifier to make searches/matches case insensitive?

thanks

Saturday, October 9, 2010 7:46 AM from Mike

@mark

For .NET, you apply it as a RegexOptions parameter: http://msdn.microsoft.com/en-us/library/system.text.regularexpressions.regexoptions.aspx

Friday, December 3, 2010 7:20 AM from suddu

As Tim said,for parenthesis you should use \$ and \$

Monday, December 13, 2010 4:03 PM from Niels Heurlin

Ok as a cheat sheet. I was hoping for some examples.

Wednesday, January 26, 2011 7:42 PM from Dominic

Thanks, this saved my day!

I needed an expression to match anything (including newlines and embedded HTML tags) in the element of an HTML document.

This worked in C#:
pattern = @"";

Thursday, May 12, 2011 6:58 PM from dev

please send me regularexpression for
(mm/dd/yyyy HH:MM:SS AM/PM)

Thank you

Thursday, May 12, 2011 7:46 PM from Mike

@dev,

You don't need a regular expression. You need DateTime.TryParse().

Saturday, August 17, 2013 12:53 AM from Art

Haha, I can't believe you bothered responding to "dev"...

Anyway, thanks for the great resource!

Tuesday, December 17, 2013 5:54 PM from Ric

The \un example should be "\u0020", rather than "\u0200"--that would give you Ȁ instead.

=========================================================================================

Regular Expressions

(See also http://linuxreviews.org/beginner/tao_of_regular_expressions andhttp://en.wikipedia.org/wiki/Regular_expressions)

To fully utilize shell scripting and certain commands and utilities commonly used in scripts (expr, sed, awk, etc.), you need to know how to use regular expressions.

Do not confuse regular expressions with shell globbing (filename expansion).
- sh/ksh/bash do not normally use regular expressions, but can do file globbing, which use conventions that are similar to regular expressions.

Regular expressions are sets of characters and/or metacharacters that represent text patterns.

The main uses for regular expressions are text searches and string manipulation.
- A regular expression matches a single character or a set of characters ( a substring or an entire string).

Regexp (regular expression) meta-characters

The asterisk * matches any number of repeats of the character string or regexp preceding it, including zero.

     "1133*" matches 11 + one or more 3's + possibly other characters:
     113, 1133, 111312, and so forth.

The dot . matches any one character, except a newline.

     "13." matches 13 plus at least one of any character (including a
     space): 1133, 11333, but not 13 (additional character missing).

     ".*" matches any number of any characters.

The caret ^ matches the beginning of a line, but sometimes, depending on context, negates the meaning of a set of characters in an regexp.

The dollar sign $ at the end of an regexp matches the end of a line.

     "^$" matches blank lines.

Brackets […] enclose a set of characters to match in a single regexp.

       "[xyz]" matches the characters x, y, or z.

       "[c-n]" matches any of the characters in the range c to n.

       "[B-Pk-y]" matches any of the characters in the ranges B to P and k to y

       "[a-z0-9]" matches any lowercase letter or any digit.

       "[^b-d]" matches all characters except those in the range b to d.
                (This is an instance of ^ negating or inverting the meaning of
                the following regexp, taking on a role similar to ! in a different
                context.)

       Combined sequences of bracketed characters match common word
       patterns.

       "[Yy][Ee][Ss]" matches yes, Yes, YES, yEs, and so forth.

       "[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9][0-9][0-9]" matches any
       Social Security number.

The backslash \ escapes a special character, which means that character gets interpreted literally.

     A "\$" reverts back to its literal meaning of "$", rather than its
     regexp meaning of end-of-line. Likewise a "\\" has the literal meaning
     of "\".

( ) - treats the expression between ( and ) as a group. Also, saves the characters matched by the expression into temporary holding areas. Up to nine pattern matches can be saved in a single regular expression. They can be referenced as \1 through \9. On the shell command line or in scripts, the ( and ) metacharacters have be escaped like this: .

| - “or” two conditions together

       "him|her" matches "it belongs to him" and "it belongs to her"

       "(Memo|Report)20.\.txt" matches Memo201.txt, Report20a.txt, and
       Report209.txt; note use of grouping ().  Certain applications
       require the parens () to be escaped:  \( and \)

       $ w | grep "jchung\|clayton" # Note the "\|" in the grep regexp.

Extended regular expressions

Used in egrep, awk, and Perl

The question mark ? matches zero or one of the previous regexp. It is generally used for matching single characters.

     im?ing matches swiing, swiming, but not swimming

The plus + matches one or more of the previous regexp. It serves a role similar to the *, but does not match zero occurrences.

     9+ matches 9, 99, 999, but not 88

{i}, {i,j} - match a specific number of instances or instances within a range of the preceding character.
- If used on the command line the {} chars may have to be escaped with “\”: \{ \}

       A[0-9]{3} matches "A" followed by exactly 3 digits (A123 but not
       A1234).

       [0-9]{4,6} matches any sequence of 4, 5 or 6 digits

Simple regexp examples using the %s (search and replace) command in vi

    :%s/  */ /g          Change 1 or more spaces into a single space.
    :%s/ *$//            Remove all spaces from the end of the line.
    :%s/^/ /             Insert a space at the beginning of every line.
    :%s/^[0-9][0-9]* //  Remove all numbers at the beginning of a line.
    :%s/b[aeio]g/bug/g   Change all occurences of bag, beg, big, and bog, to
                         bug.

Medium regexp example using search and replace in vi

Change all instances of foo( a,b,c) to foo(b, a,c). where a, b, and c can be any parameters supplied to foo(). That is, we must be able to make changes like the following:

 Before                   After
 ------                   -----
 foo(10,7,2)              foo(7,10,2)
 foo(x+13,y-2,10)         foo(y-2,x+13,10)
 foo(bar(8),x+y+z,5)      foo(x+y+z,bar(8),5)

 The following substitution command will do the trick:

 :%s/foo(\([^,]*\),\([^,]*\),\([^)]*\))/foo(\2,\1,\3)/g

 [^,]  means any character which is not a comma.

 [^,]*  means 0 or more characters which are not commas.

 \([^,]*\)  using grouping \( )\, tags the non-comma characters as \1 for use
 in the replacement part of the command.

 \([^,]*\),  means that we must match 0 or more non-comma characters
 which are followed by a comma. The non-comma characters are tagged.

 foo(\([^,]*\),  translates to "after you find foo(, tag all characters up to
 the next comma as \1".

Lab Activity

1. Download http://rockhopper.monmouth.edu/~jchung/cs370/fa10/files/roster.fa06 and http://rockhopper.monmouth.edu/~jchung/cs370/fa10/files/roster.fa08 . Put the contentsof roster.* intoa singleroster file. Using search and replace invi or a vi-like editor that understands regular expressions, convert the rawroster file to a list with the following format:

        Lastname-Firstname:StudentID

The list would be even better if Lastname and Firstname were both lower case, like this:

        lastname-firstname:StudentID

============================================================================

echo "111(222)333"|sed 's/($.*$)/\1\1/' 返回如下

111222222333

解读，这其中圆括号扮演定义一个区域的含义，当然前提是反斜杠标记的括号；

对于以上的用法：($.*$)/ 匹配(222)这个部分，并且将222作为区域，并且是区域1，如果后面还有区域则依次为2、3等，接着/\1\1/代表将(222)替换为两个区域1的内容，就是222222；

=======================================================

作者:吕晓波
出处:不详
如果我们问那些UNIX系统的爱好者他们最喜欢什么，答案除了稳定的系统和可以远程启动之外，十有八九的人会提到正则表达式；如果我们再问他们最头痛的是什么，可能除了复杂的进程控制和安装过程之外，还会是正则表达式。那么正则表达式到底是什么？如何才能真正的掌握正则表达式并正确的加以灵活运用？本文将就此展开介绍，希望能够对那些渴望了解和掌握正则表达式的读者有所助益。
入门简介
　　简单的说，正则表达式是一种可以用于模式匹配和替换的强有力的工具。我们可以在几乎所有的基于UNIX系统的工具中找到正则表达式的身影，例如，vi编辑器，Perl或PHP脚本语言，以及awk或sed shell程序等。此外，象JavaScript这种客户端的脚本语言也提供了对正则表达式的支持。由此可见，正则表达式已经超出了某种语言或某个系统的局限，成为人们广为接受的概念和功能。
　　正则表达式可以让用户通过使用一系列的特殊字符构建匹配模式，然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较，根据比较对象中是否包含匹配模式，执行相应的程序。
　　举例来说，正则表达式的一个最为普遍的应用就是用于验证用户在线输入的邮件地址的格式是否正确。如果通过正则表达式验证用户邮件地址的格式正确，用户所填写的表单信息将会被正常处理；反之，如果用户输入的邮件地址与正则表达的模式不匹配，将会弹出提示信息，要求用户重新输入正确的邮件地址。由此可见正则表达式在WEB应用的逻辑判断中具有举足轻重的作用。
基本语法
　　在对正则表达式的功能和作用有了初步的了解之后，我们就来具体看一下正则表达式的语法格式。
　　正则表达式的形式一般如下：
　　/love/
　　其中位于“/”定界符之间的部分就是将要在目标对象中进行匹配的模式。用户只要把希望查找匹配对象的模式内容放入“/”定界符之间即可。为了能够使用户更加灵活的定制模式内容，正则表达式提供了专门的“元字符”。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符，可以用来规定其前导字符（即位于元字符前面的字符）在目标对象中的出现模式。
　　较为常用的元字符包括： “+”， “*”，以及 “?”。其中，“+”元字符规定其前导字符必须在目标对象中连续出现一次或多次，“*”元字符规定其前导字符必须在目标对象中出现零次或连续多次，而“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次。
　　下面，就让我们来看一下正则表达式元字符的具体应用。
　　/fo+/
　　因为上述正则表达式中包含“+”元字符，表示可以与目标对象中的 “fool”, “fo”, 或者 “football”等在字母f后面连续出现一个或多个字母o的字符串相匹配。
　　/eg*/
　　因为上述正则表达式中包含“*”元字符，表示可以与目标对象中的 “easy”, “ego”, 或者 “egg”等在字母e后面连续出现零个或多个字母g的字符串相匹配。
　　/Wil?/
　　因为上述正则表达式中包含“？”元字符，表示可以与目标对象中的 “Win”, 或者 “Wilson”,等在字母i后面连续出现零个或一个字母l的字符串相匹配。
　　除了元字符之外，用户还可以精确指定模式在匹配对象中出现的频率。例如，
　　/jim/
　　上述正则表达式规定字符m可以在匹配对象中连续出现2-6次，因此，上述正则表达式可以同jimmy或jimmmmmy等字符串相匹配。
　　在对如何使用正则表达式有了初步了解之后，我们来看一下其它几个重要的元字符的使用方式。
　　\s：用于匹配单个空格符，包括tab键和换行符；
　　\S：用于匹配除单个空格符之外的所有字符；
　　\d：用于匹配从0到9的数字；
　　\w：用于匹配字母，数字或下划线字符；
　　\W：用于匹配所有与\w不匹配的字符；
　　. ：用于匹配除换行符之外的所有字符。
　　（说明：我们可以把\s和\S以及\w和\W看作互为逆运算）
　　下面，我们就通过实例看一下如何在正则表达式中使用上述元字符。
　　/\s+/
　　上述正则表达式可以用于匹配目标对象中的一个或多个空格字符。
　　/\d000/
　　如果我们手中有一份复杂的财务报表，那么我们可以通过上述正则表达式轻而易举的查找到所有总额达千元的款项。
　　除了我们以上所介绍的元字符之外，正则表达式中还具有另外一种较为独特的专用字符，即定位符。定位符用于规定匹配模式在目标对象中的出现位置。
　　较为常用的定位符包括： “^”, “$”, “\b” 以及 “\B”。其中，“^”定位符规定匹配模式必须出现在目标字符串的开头，“$”定位符规定匹配模式必须出现在目标对象的结尾，\b定位符规定匹配模式必须出现在目标字符串的开头或结尾的两个边界之一，而“\B”定位符则规定匹配对象必须位于目标字符串的开头和结尾两个边界之内，即匹配对象既不能作为目标字符串的开头，也不能作为目标字符串的结尾。同样，我们也可以把“^”和“$”以及“\b”和“\B”看作是互为逆运算的两组定位符。举例来说：
　　/^hell/
　　因为上述正则表达式中包含“^”定位符，所以可以与目标对象中以 “hell”, “hello”或 “hellhound”开头的字符串相匹配。
　　/ar$/
　　因为上述正则表达式中包含“$”定位符，所以可以与目标对象中以 “car”, “bar”或 “ar” 结尾的字符串相匹配。
　　/\bbom/
　　因为上述正则表达式模式以“\b”定位符开头，所以可以与目标对象中以 “bomb”, 或 “bom”开头的字符串相匹配。
　　/man\b/
　　因为上述正则表达式模式以“\b”定位符结尾，所以可以与目标对象中以 “human”, “woman”或 “man”结尾的字符串相匹配。
　　为了能够方便用户更加灵活的设定匹配模式，正则表达式允许使用者在匹配模式中指定某一个范围而不局限于具体的字符。例如：
　　/[A-Z]/
　　上述正则表达式将会与从A到Z范围内任何一个大写字母相匹配。
　　/[a-z]/
　　上述正则表达式将会与从a到z范围内任何一个小写字母相匹配。
　　/[0-9]/
　　上述正则表达式将会与从0到9范围内任何一个数字相匹配。
　　/([a-z][A-Z][0-9])+/
　　上述正则表达式将会与任何由字母和数字组成的字符串，如 “aB0” 等相匹配。这里需要提醒用户注意的一点就是可以在正则表达式中使用 “()” 把字符串组合在一起。“()”符号包含的内容必须同时出现在目标对象中。因此，上述正则表达式将无法与诸如 “abc”等的字符串匹配，因为“abc”中的最后一个字符为字母而非数字。
　　如果我们希望在正则表达式中实现类似编程逻辑中的“或”运算，在多个不同的模式中任选一个进行匹配的话，可以使用管道符 “|”。例如：
　　/to|too|2/
　　上述正则表达式将会与目标对象中的 “to”, “too”, 或 “2” 相匹配。
　　正则表达式中还有一个较为常用的运算符，即否定符 “[^]”。与我们前文所介绍的定位符 “^” 不同，否定符 “[^]”规定目标对象中不能存在模式中所规定的字符串。例如：
　　/[^A-C]/
　　上述字符串将会与目标对象中除A，B，和C之外的任何字符相匹配。一般来说，当“^”出现在 “[]”内时就被视做否定运算符；而当“^”位于“[]”之外，或没有“[]”时，则应当被视做定位符。
　　最后，当用户需要在正则表达式的模式中加入元字符，并查找其匹配对象时，可以使用转义符“\”。例如：
　　/Th\*/
　　上述正则表达式将会与目标对象中的“Th*”而非“The”等相匹配。
使用实例
　　在对正则表达式有了较为全面的了解之后，我们就来看一下如何在Perl，PHP，以及JavaScript中使用正则表达式。
　　通常，Perl中正则表达式的使用格式如下：
　　operator / regular-expression / string-to-replace / modifiers
　　运算符一项可以是m或s，分别代表匹配运算和替换运算。
　　其中，正则表达式一项是将要进行匹配或替换操作的模式，可以由任意字符，元字符，或定位符等组成。替换字符串一项是使用s运算符时，对查找到的模式匹配对象进行替换的字符串。最后的参数项用来控制不同的匹配或替换方式。例如：
　　s/geed/good/
　　将会在目标对象中查找第一个出现的geed字串，并将其替换为good。如果我们希望在目标对象的全局范围内执行多次查找—替换操作的话，可以使用参数 “g”，即s/love/lust/g。
　　此外，如果我们不需要限制匹配的大小写形式的话，可以使用参数 “i ”。例如，
　　m/JewEL/i
　　上述正则表达式将会与目标对象中的jewel，Jewel，或JEWEL相匹配。
　　在Perl中，使用专门的运算符“=~”指定正则表达式的匹配对象。例如：
　　$flag =~ s/abc/ABC/
　　上述正则表达式将会把变量$flag中的字串abc替换为ABC。
　　下面，我们就在Perl程序中加入正则表达式，验证用户邮件地址格式的有效性。代码如下：
--------------------------------------------------------
　　#!/usr/bin/perl
　　# get input
　　print “What's your email address?\n”;
　　$email =
　　chomp($email);
　　# match and display result
　　if($email =~ /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/)
　　{
　　print(“Your email address is correct!\n”);
　　}
　　else
　　　{
　　　　print(“Please try again!\n”);
　　　}
--------------------------------------------------------
　　如果用户更偏爱PHP的话，可以使用ereg()函数进行模式匹配操作。ereg()函数的使用格式如下：
　　 ereg(pattern, string)
　　其中，pattern代表正则表达式的模式，而string则是执行查找替换操作的目标对象。同样是验证邮件地址，使用PHP编写的程序代码如下：
--------------------------------------------------------
　　
　　 if (ereg(“^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+”,$email))
　　　 { echo “Your email address is correct!”;}
　　 else
　　　 { echo “Please try again!”;}
　　 ?>
--------------------------------------------------------
　　最后，我们在来看一下JavaScript。JavaScript 1.2中带有一个功能强大的RegExp()对象，可以用来进行正则表达式的匹配操作。其中的test()方法可以检验目标对象中是否包含匹配模式，并相应的返回true或false。
　　我们可以使用JavaScript编写以下脚本，验证用户输入的邮件地址的有效性。
--------------------------------------------------------
　　
　　
　　　
　　　
　　
　　
　　　
　　　
　　　
　　
　
--------------------------------------------------------

复制代码

================================================================
根据这坛里的链接找到的台湾出品的几篇好贴,感觉很不错,又受到了一次基础培训和巩固复习.所以收藏后也共享给大家,谢谢!

Regular Expression 简介

中央研究院计算中心
ASPAC 计划
[email protected]
技术报告: 94019
1995 年 2 月 9 日
Version : 1.0

版权声明

目录
Why Regular Expression
组成 Regular Expression 的元素
使用 Regular Expression 时的注意事项
范例
Appendix : Test using Regular Expression in various environments
HP-UX
Sun Solaris 2.X
AIX 3.2.5
GNU Tools

Why Regular Expression
Regular Expression 是一种字符串表达的方式. 使用者可使用一个简短的 Regular Expression 来表示〝具有某特征〞或者〝复杂难以描述〞的所有字符串. 而日常数据处理中, 最常进行的工作是『从档案中找出具有某特征的字符串, 再加以处理(打印,置换, 计算...)』. 此时, Regular Expression 便可派上用场. 使用一个简短的 Regular Expression 便可完全指定需要加以处理的资料 , 避免反复判断找寻的困扰. 譬如 :
若使用 MS-DOS 中文字编辑器 edit 的找寻功能, 可来找出档案中所有的 ``prg1.c''; 但 edit 却无法一次同时找寻字符串``prg1.c''、``prg2.c'' ... 或 ``prg8.c''; 必需反复执行八次找寻的动作.

可是在 UNIX 中的 vi , 使用一个 Regular Expression `` prg[0-8]\.c'' 便可同时表示上述八个字符串, 如此一次就可找出指定的所有字符串.

可见 Regular Expression 确实十分便利. 然而, MS-DOS 下许多工具的设计并不支持解读 Regular Expression. 但 UNIX 环境下除了 vi 外, 还有许多工具都接受 Regular Expression, 如 : grep、sed、awk、csplit... . 使用这些工具时, 便可应用 Regular Expression 来指定欲找寻的字符串; 并可配合这些工具的其它功能将找寻到的数据进一步地加以处理.

Regular Expression 的特色是简短且表达力强. 它所表达的可以是某一特定的字符串, 也可以是具有某一共同特征的"所有"字符串(如上例). Regular Expression 中定义了一组特殊字符, 它们代表着某些特别的意义; 使用者可藉这些特殊字符来表示字符串的下列特征 :

描述组成字符串的元素(components) : 例如 : Regular Expression ``[Tt]he'' 代表字符串 ``The'' 或 ``the''.
限制字符串出现的位置 : 例如 : Regular Expression ``^The'' 代表『出现于行首』的字符串 ``The''.
由于 Regular Expression 具有极佳的字符串表示能力. 往后, 读者若能多利用 UNIX 上接受 Regular Expression 的工具, 且灵活应用 Regular Expression; 则可避免撰写程序进行复杂字符串判断(parsing) 的麻烦. 如此, 才能真正发挥各工具的的功能, 减轻数据处理时的负担, 并增加数据处理的效率.

--------------------------------------------------------------------------------

Note 1
UNIX中定义了数种字符串表达方式, Regular Expression 及 Extended Regular Expression 是常见的二种. 另一种是使用于Shell命令列, 将参数展开}(expand)成文件名称的" attern Matching Notation", 这种表示法与 Regular Expressions 的语法差异较大, 甚至有数项用法相左, 故位未列入本文讨论以免读者混淆.

组成 Regular Expression 的元素
Regular Expression 是由普通字符、及一组具有特殊意义的字符所构成. 本节主要介绍各种特殊字符所代表的意义及其用法. 读者学习时应留心 : 有时, 同一特殊字符, 会因出现在字符串中不同的位置或连接其它特殊字符, 而有不同的意义. 本文中为有别于一般的字符串, 所有 Regular Expression 都以粗体字体表示, 且加注``Regexp''于其前方.
组成 Regular Expression 的元素及所代表的意义如下 :

[普通字符] 除了``.''、``[''、``]''、``*''、``+''、``?''、 ``|''、``^''、``$''、``{''、``}''、``\''、 ``<''、``>''、``(''、``)'' 外之所有字符.
由普通字符所组成的 Regular Expression 其意义与原字符串字面意义相同. 例如 :

普通字符``A''也可当成一个 Regular Expression. Regexp `` A'' 与一般字符``A''代表相同的意义.
Regexp `` the'' 与一般字符串``the''代表相同的意义.
[ .] Metacharacter 用以代表任意一个字符. 须留心 UNIX Shell 中使用``?''表示任意一个字符, 使用``*''代表任意长度的字符串(这是另一种称为 ``Pattern Matching Notation'' 的字符串表示法). Regular Expression 中则使用`` .'' 来代表``一个''任意字符(注意: 并非任意长度的字符串). 而 Regular Expression 中`` *''另有其它涵意, 并不代表任意长度的字符串. 例如

Regexp `` .'' 可用以代表任意一个字符. 如 ``A''、``1''、``+''、...
Regexp `` ...'' 则代表一个由任意3个字符所的字符串. 譬如 ``123''、``abc''、``# 1''、...
[ ^] 限制字符串必须出现于行首. (用法见下例)
[ $] 限制字符串必须出现于行末.
[例如 :] Regexp `` ^The'' 用以表示所有出现于行首的字符串``The''. Regexp `` The$'' 用以表示所有出现于行末的字符串``The''. Regexp `` ^The$'' 则用以表示一个仅含字符串``The''的数据列. Regexp `` ^$'' 表示一个空白的数据列（行首与行尾之间未存在任一字符）.

[ \] 将特殊字符还原成字面意义的字符. Regular Expression 中特殊字符将被解释成特定的意义. 若要表示特殊字符的字面(literal meaning) 意义时, 在特殊字符之前加上 ``\'' 即可.

[例如 :] 使用 Regular Expression 来表示字符串``a.out''时, 不可写成 Regexp `` a.out''. 因为`` .''在 Regular Expression 中是特殊字符, 表示任一字符.
可合乎(match) Regexp `` a.out'' 的字符串将不只 ``a.out'' 一个; 字符串``a2out'',``a3out'', ``aaout''... 都合于 Regexp `` a.out''.
正确的表示法应为 : Regexp `` a\.out''

`` \'' 在 Regular Expression 中的另一个意义是当成 Escape character.

[例如 :] `` \t'' 用以表示 tab. `` \n'' 表示换行符号.
[...] 『字符集合』, 用以表示两中括号间所有的字符当中的任一个.
[例如 : ] Regexp `` [123]'' 可用以表示字符 ``1''、``2'' 或 ``3''. Regexp `` [Tt]'' 可用以表示字符 ``T'' 或 ``t''. 所以, Regexp " [Tt]he" 表示字符串 "The" 或 "the". (注意 : 一个字符集合仅代表``一个''字符.)
使用时, 需留心字符集合 [ ] 内不可随意留空白.

例如 : Regexp `` [ Tt ]'' 中括号内有空格符, 故除了可用以表示字符``T''或``t''", 也可代表一个 `` ''(空格符).
- 字符集合中可使用 `` -'' 来指定字符的区间, 其用法如下:
Regexp `` [0-9]'' 等于 Regexp `` [0123456789]'' 用以表示任意 "一个" 阿拉伯数字. 同理 Regexp `` [A-Z]'' 用以表示任意 "一个" 大写英文字母.

但应留心 :

Regexp " [0-9a-z]" 并不等于 Regexp " [0-9][a-z]"; 前者表示一个字符(阿拉伯数字或小写英文字母), 后者表示二个字符.
Regexp " [-9]" 或 " [9-]" 仅用以代表字符 ``9''或 ``-''.
[ [\^{}... ]] 使用 [\^{...]} 产生字符集合的补集(complement set). 其用法如下 :

Regexp `` [^M]'' 用以表示除字符``M''外的``一个''任意字符
字符集合 `` [Tt]''表示字符 ``T'' 或 ``t''. 若要指定 ``T'' 或 ``t'' 之外的任一个字符, 可用Regexp `` [^Tt]'' 表示.
Regexp `` [^a-zA-Z]''表示英文字母之外的任一个字符.
需留心 `` ^''之位置; `` ^'' 必须紧接于 `` ['' 之后, 才代表字符集合的补集.

[例如 :] Regexp `` [0-9^]'' 表示一个阿拉伯数字或字符 `` ^'', 并非代表阿伯数字外的任意字符.
* 用以形容其前的字符或字符集合可重复任意次数的特殊字符.
`` *'' 形容它前方之字符(或字符集合)可出现 1 次或多次, 或不出现. 例如 :

Regexp ``ab*'' 中, `` *'' 形容它前方的字符 ``b'' 可出现 1 次或多次, 或不出现. 所以, Regexp ``ab*'' 可表示字符串 ``a''、``ab''、``abb''、 ``abbb''、...
Regexp `` T[0-9]*\.c'' 中, 使用 `` *'' 形容其前的字符集合 `` [0-9]''(一个阿拉伯数字)出现的次数 : 可为 0 次或多次.
故 Regexp `` T[0-9]*\.c''可用以表示 ``T.c''、``T0.c''、 ``T1.c''、``T2.c''、...、``T9.c''、``T00.c''、``T01.c''、``T02.c''、...、 ``T09.c''、``T10.c''、...``T99.c''、``T000.c''、...

[ \<] `` \< Regexp'' 表示一个出现于"前缀"且又合于(match)该 Regexp 的字符串 (用法见下例).
[ \>] ``Regexp \>'' 表示一个出现于"字末"且又合于(match)该 Regexp 的字符串.
这里所谓的``字(word)''系指被 tab、逗点、句点或空格符(space) 所分隔开的字符串.
[例如 :]
资料 ``One is red, and the other is white.'' 中字符串 ``One'', ``is'', ``red'', ``and'', ``the'', ``other'', ``is'', ``white'' 便是所谓的 "字(word)". 而该资料列中,
合于 Regexp ``[Tt]he''的字符串如下(粗体字标示)
``One is red, and the other is white.''
合于 Regexp `` \<[Tt]he\>''却仅有(粗体字标示)
``One is red, and the other is white.''
因同时使用`` \<''及`` \>'' 限制合于 Regexp `` [Tt]he''的字符串, 必须紧接于前缀及字尾之间; 故 ``other''中的子字符串 ``the''并不合于这个 Regular Expression.

[注 :] \<, \> 这二个特殊字符, 并不是很通用. 请参考 Appendix A 中的附表.
$ ... )\ 于 Regular Expression 中使用 `` \(''``{ $}''来括住一部分的 Regular Expression; 其后可用 `` \1'''来表示第一次被`` $'' `` $'' 括住的部份. 若 Regular Expression 中使用了数次`` $'' `` $'' 来括住不同的部分, 则依次使用 ``\1'', `` \2'', `` \3'' ,...(最多可用到 `` \9'')来表示之前括住的 Regular Expression. 其用法如下 :

[用法一.]
例如: 欲表示像``aa'',``bb'',``cc'',...``zz'' 等字符串.
使用 Regexp `` [a-z]''则表示任一个小写的英文字母.
使用 Regexp `` [a-z][a-z]''则表示二个任意的小写英文字母. 它除表示 ``aa'',``bb'',``cc'',...``zz''等字符串外, 也可表示``ab'', ``ac'',``ad'',...等字符串(这不是题意所要求的字符串).
这时可以`` $'' `` $'' 来括住第一个 `` [a-z]'' (Regular Expression 解译的程序, 会暂时记录实际找寻到的英文字母). 之后, 便可以 Regexp ``\1'' 来指定适才被记录下的英文字母即为所要找寻字符串的第二个字符. 故正确的表示法如下 :
Regexp `` $[a-z]$\1''

例如 : 欲表示像 ``789w987'', ``abcwcba'', ``theweht'',....等具对称性的字符串.(该字符串的特征是 ``w''之前后三个字符相互对称) 该类字符串的表示法如下 :
Regexp `` $.$$.$$.$w\3\2\1" Regexp中`` .''表示任意一个字符. 因字符``w''之前出现的三个字符并无任何限制, 故可用 `` ...''表之. 但每个`` .''分别用 `` $'',`` $'' 括住, 之后便可使用 `` \1'', `` \2'', `` \3'' 分别代表将来实际匹配到的前三个字符.

用法二. 进行字符串找寻并置换(Replace)时, 若将被置入的新字符串不是一个固定的字符串, 与被找到的原字符串有关时(见下例说明). 此时, 可先以 来括住一部分的Regular Expression; 再于将被新置入的字符串中使用`` \1'', `` \2'',... 来表示当时被找到的字符串(或其子字符串).
例 : 欲找出档案中具有 ``prog12.c'', ``prog9.c'', ``prog832.c'',... 等式样的字符串, 并将其置换成(以上列三个字符串为例) ``[ note 12]'', ``[ note 9]'', ``[ note 832]''. 在这例子中, 因事先不知道所找寻到的字符串(prog数字.c)中的数字为何, 故无法事先决定应换成什么新字符串. 合于本例所要找寻的字符串其 Regular Expression 为 :
Regexp `` prog[0-9][0-9]*\.c'' 上式中 `` [0-9][0-9]*'' 表一位或一位以上的阿拉伯数字, 因执行前并不知道该部分实际会匹配什么数值, 故找到的字符串将来应置换成什么, 事前无法指定. 这情况, 也可用`` $'',`` $'' 来括住 `` [0-9][0-9]* '', 在置换的新字符串中再以 \1 表示找寻时实际匹配到的数字.

读者可编辑一数据文件, 再以sed执行下列命令, 观察其执行结果.

$sed -e 's/ prog$[0-9][0-9]*$\.c/[ note \1]/g' 资料文件名

\{ 数字, 数字\} 一种于 Regular Expression 中形容其前的字符或字符集合出现次数的表示法. 其型态与用法如下 :

\{下限数字, 上限数字\}
例如 : Regexp "[0-9]\{2,4\}"用以表示2到4位的阿拉伯数字.
{ 数字}
例如 : Regexp `` ax\{99\}'' 用以表示一个 ``a'' 之后接上99个 ``x'' 所组成的字符串.
\{下限数字, \} 例如 : Regexp `` ax\{2,\}'' 用以表示一个 ``a'' 之后接上2个或更多的 ``x''所组成的字符串.
+ 形容其前的字符或字符集合出现一次或一次以上(注三).
例如 : Regexp `` [0-9]+'' 用以表示一位或一位以上的数字.

? 形容其前的字符或字符集合可出现一次或不出现(注三).

[例如 :] Regexp ``[+-]?[0-9]+'' 表示数字(一位以上)之前可出现一个正负号或不出现正负号.
[ (...)] 用以括住一群字符,且将之视成一个group(见下面说明)(注三)
例如 :
Regexp `` 12+'' 表示字符串 "12","122","1222","12222",...
Regexp `` (12)+'' 表示字符串 "12","1212","1212","1212"....

上式中字符串 ``12''以( )括住,整个视为一个group, 故被重复符号``+'' 所形容的是``12''而非 ``2'', 重复出现的也是 ``12''.

| 表示逻辑上的 "or" (注三)
例如 : Regexp `` Oranges?|apples?|water'' 可用以表示字符串``Orange'', ``Oranges''
或 ``apple'', ``apples''
或 ``water''

注三 : 上列 + , ?, (...), | 等用法, 为 Extended Regular Expression 中新增列的用法. awk 及 egrep 中所使用的 Regular Expression 即为 Extended Regular Expression. 但 vi, sed, grep,...等软件中并无这些用法.
& ``&''并非 Regular Expression 中的特殊字符. 但以 Regular Expression 进行字符串找寻置换(Replace)时, 常会用到 ``\&''. \ 在许多 Unix tool 中, 当 ``\&''出现在『将被置入的新字符串』时, 它用以表示 ``实际被找到合于所指定的 Regular Expression 的字符串'' (见下例说明)
例如 : 找出档案中所有合乎 Regexp ``a[0-9]*\.c'' 的字符串, 并在其前后加上小括号.依题意要求, 档案中所有如 ``a12.c'', ``a932.c'', ``a45.c'' ,...等字符串都应置换为 ``(a12.c)'', ``(a932.c)'', ``(a45.c)'',.. . . 遇到这情况,可令『将被置入的新字符串』为 `` (& '' 此时, ``&''便是用来表示实际上被找到合于 Regexp ``a[0-9]*\.c'' 的字符串.
下列是使用 UNIX 上不同的工具, 来处理本例要求的字符串置换.

vi 以 vi 编辑该档案,并在 vi 命令输入模式下输入
: s/a[0-9]*\.c/(& /g
sed 执行如下命令 ( $ 表 Shell 命令列的提示符号 )
$ sed -e 's/a[0-9]*\.c/ (& /g' 数据文件名称
awk 执行如下命令 ( $ 表 Shell 命令列的提示符号 )
$ awk '{ gsub(/a[0-9]*\.c/, "(& " ; print }' 数据文件名称

--------------------------------------------------------------------------------

Note 2:
上列字符在 Regular Expression 中代表特殊意义, 称之为特殊字符. 但 Unix 中不同的指令对 Regular Expression 的解释能力不尽相同, 故对特殊字符也有不同的认定. 请参考尾页附表.

使用 Regular Expression 时的注意事项
学习 Regular Expression 除了应了解其中特殊字符所代表的意义外; 在实际应用时, 也有一些应该注意的事项. 倘若忽略了这些特点, 往往会造成字符串无法正确比对, 而导至结果错误. 本节除了介绍这些应予留心的事项外, 也提供各软件在解读 Regular Expression, 进行字符串比对时所依据的二项重要原则.

接受 Regular Expression 的指令或工具, 它们找寻字符串时系按照下列二原则:

由左往右进行字符串找寻.
尽可能寻找最长且合于所指定 Regular Expression 的字符串.
例如 : 应用 Regexp `` a.*b''(代表以"a"开头以"b"结尾的任意字符串),于数据列 ``12 3ab0aab4 56'' 中找寻合于该条件的字符串.
该资料列中合于 Regexp `` a.*b'' 的字符串有 ``ab'', ``aab'', ``ab0aab''. 但按上列二原则「由左往右找, 且尽可能寻找最长的字符串」实际上被找到的字符串将为 ``ab0aab''.

Regular Expression 有许多不同的版本 UNIX 中不同的指令对同一个 Regular Expression 可能会有不同的解释. 原因是这些指令无法完全解释前节所述 Regular Expression 中所有的特殊字符. 这就是所谓 "Regular Expression 有许多不同的版本"

例如 : egrep 中对 Regexp `` an?'' 解释成字符串 ``a'' 或 ``an''. 但 vi 中对 Regexp `` an?'' 只解释成字符串 ``an?''. 因为 vi 中并不把 `` ?'' 当成 Regular Expression 的特殊字原解释.
Appendix A 附表中列出 UNIX 中常用的指令及它所接受的 Regular Expression 特殊字符.

勿将Shell上所使用的字符串表示法(Pattern Matching Notation) 与 Regular Expression 混淆.
Regexp `` a*'' 用以表示一个完全由字符 "a" 所组成的任意长度字符串. 但在 Shell 命令列上执行 ``ls a*'', 却会列出目前工作目录下所有以 "a" 开头的档案与子目录.两者对 ``a*'' 的解释并不相同. 因为 Shell 所接受的是另一种名为 ``Pattern Matching Notation'' 的表示法, 两者并不相同请勿混淆.

在含有中文之文字文件中, 使用 Regular Expression 进行字符串找寻时, 可能会发生错误.
譬如 : 找寻左大括号"{", 结果中文的"程"也被找出. 这并非 Regular Expression 出了错误. 因每个中文字都是由 2 个 bytes 组成, 而中文``程''字的后一个 byte 恰被解释成``{''.所以除非所使用的指令有自动避开中文字的功能, 否则中文字的后一个 byte 被误判的机率并不低. 故读者在含有中文文字的档案中, 进行字符串找寻并置换时, 最好是逐次确认后再行置换.

并非所有软件都接受 Regular Expression(有解读 Regular Expression 的能力). 一般而言,就算某软件(工具)可接受 Regular Expression , 它也并非把所有的字串或参数当成 Regular Expression 解释. 读者使用 Regular Expression 时, 应先确定该软件会把该些字符串当成 Regular Expression 解释(可翻查其 manual page), 如此才可获得正确的结果.

范例
本节列出数个 Regular Expression 的应用简例, 供读者参考. 由这些范例中, 读者可一窥实际应用时, 如何藉由 Regular Expression 来表达字符串, 来完成某些目的. 至于各指令像 vi, sed, awk, ...中之语法说明已非本文所能涵盖, 读者请自行参考相关书籍.

a. 将档案中所有字符串 ``Regular Expression'' 或 ``Regular expression'' 换成 ``Regexp''.
以 vi 编辑该档案, 并在 vi 命令输入模式下执行 :
:1,$ s/ Regular [Ee]xpression/Regexp/g
b. 将档案中所有具 ``ddd-dddd'' 特征的字符串(d表阿拉伯数字)之前插入字符串 ``Tel :''.
以 vi 编辑该档案, 并在, vi 命令输入模式下执行 :
:1,$ s/[0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]/Tel:&/g
说明 : `` &'' 代表执行时实际合于该 Regular Expression 的字符串.
c. 将档案中所有俱有 `` program数字.c'' 特征的字符串换成 ``test数字.f''.
解法 : 以vi编辑该档案, 并在vi命令输入mode下执行 :
:1,$ s/ program$[0-9][0-9]**$\.c/test\1.f/g
说明 : Regexp `` [0-9][0-9]*'' 表示一位或一位以上的阿拉伯数字. `` \1'' 被找到的字符串中的数值部分. (被$...$括住的部分).
d. 将档案中第5-13行, 整个区域往右移5格(空格符).
解法 : 以vi编辑该档案, 并在vi命令输入mode下执行
:5,13 s/ .*/ &/

说明 : Regexp `` .*" 用以 match 整个数据列(之后以&表之). 并用 `` &''(5个空白及原先之资料列)取代该列资料.
e. 将上例档案中的数据列(5-13行), 往左移回3格.
解法 : 以vi编辑该档案, 并在vi命令输入mode下执行
:5,13 s/ \^ ///

说明 : 将行首的三个空格符换成空字符串.
f. 试从一个档案的全名中分离出其路径及文件名.

解法 : 编辑如下的script并取名为 ``sepname''
awk '
BEGIN {
match( ARGV[1], /.*\//)
print "path=", substr(ARGV[1], 1 ,RLENGTH-1)
print "name=", name = substr(ARGV[1], RLENGTH+1 )
} ' $1 }

执行 $ sepname /usr/local/bin/xdvi
结果印出 path= /usr/local/bin
name= xdvi
g. 将档案中以``From''或``from''为行首的数据打印出
执行 $ awk '/^[Ff]rom/ ' 数据文件文件名

h. 去除挡案中空白行
执行 $ sed -e "/ ^$/d"

后语
虽然 Regular Expression 仅是一种字符串的表示方式, 但从上列的范例中不难窥出, 配合接受 Regular Expression 的指令或工具, 其应用面将远超出找寻字符串及置换字符串. 使用 Regular Expression 不仅扩大了字符串的表达能力, 让使用者很容易进行字符串判断; 使数据处理的过程便为更为迅速便利.

Appendix : Test using Regular Expression in various environments
HP-UX
下表列出测试 HP-UX Release 9.0 中常见的工具对 Regular Expression 中各种特殊字符的接受能力.

ex vi sed awk grep egrep 说明
. * * * * * *
* * * * * * *
^ * * * * * *
$ * * * * * *
\ * * * * * *
[ ] * * * * * *
与\1...\9 合用(一) * * 把\1...\9用于 Regular Expression 中
与\1...\9 合用(二) * * * - - 把\1...\9用于欲置换的新字符串中
{重复次数} * *
{下限,上限} * *
{下限, } * *
\< \> * *
+ * *
? * *
| * *
( ) * *
\ * * * * - -

* 表示该指令有解释这种特殊字符的能力.
- 表示未测试该项功能.

Sun Solaris 2.X
下表列出测试 Sun Solaris 2.x 中常见的工具对 Regular Expression 中各种特殊字符的接受能力

ex vi sed awk grep egrep 说明
. * * * * * *
* * * * * * *
^ * * * * * *
$ * * * * * *
\ * * * * * *
[ ] * * * * * *
与\1...\9 合用(一) * * * * 把\1...\9用于 Regular Expression 中
与\1...\9 合用(二) * * * - - 把\1...\9用于欲置换的新字符串中
{重复次数} * * * *
{下限,上限} * * * *
{下限, } * * * *
\< \> * * * *
+ * *
? * *
| * *
( ) * *
\ * * * * - -

* 表示该指令有解释这种特殊字符的能力.
- 表示未测试该项功能.

AIX 3.2.5
下表列出测试 AIX 3.2.5 中常见的工具对 Regular Expression 中各种特殊字符的接受能力.

ex vi sed awk grep egrep 说明
. * * * * * *
* * * * * * *
^ * * * * * *
$ * * * * * *
\ * * * * * *
[ ] * * * * * *
与\1...\9 合用(一) * * 把\1...\9用于 Regular Expression 中
与\1...\9 合用(二) * * * - - 把\1...\9用于欲置换的新字符串中
{重复次数} * *
{下限,上限} * *
{下限, } * *
\< \> * *
+ * *
? * *
| * *
( ) * *
\ * * * * - -

* 表示该指令有解释这种特殊字符的能力.
- 表示未测试该项功能.

GNU Tools
下表列出测试 GNU 所提供的工具对 Regular Expression 中各种特殊字符的接受能力.

sed awk grep -G egrep -E emacs 说明
. * * * * *
* * * * * *
^ * * * * *
$ * * * * *
\ * * * * *
[ ] * * * * *
与\1...\9 合用(一) * * 把\1...\9用于 Regular Expression 中
与\1...\9 合用(二) * - - * 把\1...\9用于欲置换的新字符串中
{重复次数} * *
{下限,上限} * *
{下限, } * *
\< \> * * * *
+ * * *
? * * *
| * *
( ) * *
\ * * - -

* 表示该指令有解释这种特殊字符的能力.
- 表示未测试该项功能.

你可能感兴趣的:(programming)

面试基础---面试刷题推荐动态规划算法：背包问题与最长公共子序列 WeiLai1112 leetcode刷题算法面试动态规划 java 分布式
动态规划算法：背包问题与最长公共子序列引言：动态规划的核心思想动态规划（DynamicProgramming,DP）是一种解决复杂问题的算法思想，通过将问题分解为子问题，并保存子问题的解，避免重复计算，从而提高效率。本文将详细讲解动态规划在背包问题和最长公共子序列中的应用，并提供易于记忆的代码模板。一、背包问题1.1问题描述给定n个物品，每个物品有一个重量w[i]和一个价值v[i]。现在有一个容量
Spring AOP（面向切面编程）详解 pjx987 Spring java 数据库
引言在前两篇文章中，我们已经介绍了Spring框架的基本概念和核心组件。本文将重点探讨Spring框架中的一个重要特性——面向切面编程（Aspect-OrientedProgramming，AOP）。AOP是一种编程范式，旨在通过将横切关注点（如日志记录、事务管理等）从业务逻辑中分离出来，从而提高代码的模块化程度和可维护性。1.AOP基础概念1.1什么是AOP？面向切面编程（AOP）是一种编程技术
从零开始大模型开发与微调：编码器的实现 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：编码器的实现作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：自然语言处理，大模型，Transformer架构，编码器模块，序列到序列学习文章目录从零开始大模型开发与微调：编码器的实现1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系2.1编码器模块简介2.2编码器与Transfo
什么是API？ API小爬虫 python java php c++c语言
API（ApplicationProgrammingInterface，应用程序编程接口）是一种允许不同软件系统之间进行交互的接口。它定义了一组规则和定义，使得一个软件程序可以请求另一个软件程序的服务，而无需了解其内部实现细节。API是现代软件开发中非常重要的概念，广泛应用于各种场景，包括操作系统、库、框架、Web服务等。一、API的主要功能（一）数据交互API允许不同系统之间交换数据。例如，一个
C语言标准 Thomas_TangShiMing c语言开发语言
演进历史：C语言是为了开发Unix系统而创建的，一开始，并没有形成所谓的C标准，C语言最初的开发者是DennisM.Ritchie和KennethLaneThompson。1973年，Unix系统的核心正式采用C语言改写。1987年，BrianW.Kernighan/DennisM.Ritchie合著的《TheCProgrammingLanguage》第一版是公认的C标准，通常称为K&RC或经典C
【C++】Operator Overloading bryant_meng C /C++c++开发语言运算符重载重载规则友元函数
《C++程序设计基础教程》——刘厚泉，李政伟，二零一三年九月版，学习笔记文章目录1、什么是运算符重载2、运算符重载规则3、运算符重载的实现形式3.1、重载为类的成员函数3.2、重载为友元函数4、应用实例更多有趣的代码示例，可参考【Programming】1、什么是运算符重载在C++中，运算符重载是一种允许程序员为用户定义的类型（如类和结构体）指定如何使用标准运算符（如+,-,*,/,==,>等）的
QP 问题（Quadratic Programming, 二次规划） BineHello 算法人工智能强化学习自动驾驶线性代数
QP问题（QuadraticProgramming,二次规划）是什么？QP（QuadraticProgramming，二次规划）是一类优化问题，其中目标函数是二次型函数，约束条件可以是线性等式或不等式。QP问题是线性规划（LP，LinearProgramming）的扩展形式，广泛应用于最优控制、机器学习、金融优化、信号处理等领域。一、QP问题的数学定义标准形式的QP问题如下：min⁡x12xTQx
多模态大模型：技术原理与实战模型压缩实战 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战模型压缩实战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：多模态大模型，技术原理，模型压缩，实战，TensorFlow，PyTorch，模型压缩方法，应用场景1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，多模态大模型在图像识别、语音识别、自然语言处理等领域的应用越来越广泛。然而，多模态大模型通常具有庞大
The Rust Programming Language 学习 (二) niandb rust 开发语言 java
通用编程概念变量和可变性默认情况下变量是不可变的（immutable）,不过你也可以选择让变量是可变的（mutable）.变量的遮蔽你可以声明和前面变量具有相同名称的新变量,说这个是第一个变量被第二个变量遮蔽（shadow），这意味着当我们使用变量时我们看到的会是第二个变量的值。我们可以通过使用相同的变量名并重复使用let关键字来遮蔽变量，如下程序并不会报错:letx=5;letx=x+1;{le
Python机器学习实战：使用Flask构建机器学习API AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：使用Flask构建机器学习API作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域，模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程，难以实现模型的自动化、可视化和复现。为了解决这一问题，将机器学习模型封装成可访问的API变得越来越流行。Fla
Spring WebFlux：响应式编程 m0_74825223 面试学习路线阿里巴巴 spring java 后端
在软件开发领域，随着互联网应用的规模和复杂性不断增加，传统的编程模型逐渐暴露出一些局限性，尤其是在面对高并发、大规模数据流处理等场景时。为了应对这些挑战，响应式编程（ReactiveProgramming）应运而生，它提供了一种更为高效、灵活的编程范式，以适应不断变化的系统需求。1.SpringWebFlux简介WebFlux提供了一个非阻塞、异步的Web框架，允许开发者构建高性能、可伸缩的Web
函数式编程猫哥不给力 javascript 前端函数式编程
什么是函数式编程函数式编程(FunctionalProgramming,FP)，FP是编程范式之一，我们常听说的编程范式还有面向过程编程、面向对象编程。面向对象编程的思维方式：把现实世界中的事物抽象成程序世界中的类和对象，通过封装、继承和多态来演示事物事件的联系函数式编程的思维方式：把现实世界的事物和事物之间的联系抽象到程序世界（对运算过程进行抽象）程序的本质：根据输入通过某种运算获得相应的输出，
动态规划经典算法详解与C++实现金外飞176 算法算法动态规划 c++
动态规划经典算法详解与C++实现动态规划（DynamicProgramming）是解决复杂问题的重要方法，通过将问题分解为重叠子问题并记录中间结果实现高效计算。本文精选六大经典动态规划问题，提供详细的算法解析和C++实现代码。一、斐波那契数列（基础入门）算法原理通过存储已计算结果避免重复计算，时间复杂度从O(2^n)优化到O(n)状态转移方程dp[i]=dp[i-1]+dp[i-2]C++实现#i
spring AOP详解 web15085415935 面试学习路线阿里巴巴 spring java 后端
文章目录AOP1环境准备1.1工程及接口创建1.2工程存在的问题1.2.1问题1.2.2解决思路2AOP面向切面编程2.1AOP概述2.2AOP原理分析3基于注解的AOP3.1入门示例3.2使用流程3.3切入点表达式3.4练习3.5通知类型AOPAOP（AspectOrientProgramming）是一种设计思想，是软件设计领域中的面向切面编程，它是面向对象编程(OOP)的一种补充和完善；实际项
【SpringBoot】Spring AOP详解一只爱打拳的程序猿 Spring spring java 后端 spring boot
目录一、什么是SpringAOP二、SpringAOP实现2.1添加SpringAOP依赖2.2定义切面和切点2.3解释AspectJ2.4什么是通知一、什么是SpringAOPAOP（AspectOrientedProgramming）即面向切面编程，是对某一类事件的集中处理。面向切面编程（AOP）是一种编程范式，旨在将横切关注点（如日志记录、事务管理、权限验证等）从业务逻辑代码中分离出来，从而
Pyhton网络编程_UDP_TCP(IP地址--端口--socket编程) Felix-微信(Felixzfb) 网络编程 TCP UDP
Python高级语法——网络编程——进阶学习笔记项目中案例参考：https://github.com/FangbaiZhang/Python_advanced_learning/tree/master/03_Python_network_programming1网络通信使用网络能够把多方链接在一起，然后可以进行数据传递所谓的网络编程就是，让在不同的电脑上的软件能够进行数据传递，即进程之间的通信1.
API简介汐度清风
1、定义API（applicationprogramminginterface，应用程序编程接口）是一些预先定义的函数，目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力，而又无需访问源码，或理解内部工作机制的细节。2、组成一个完整的接口一般包含以下内容：（1）接口说明（2）请求链接（url）（3）请求方法（get、post、put、delete，对应见、生、变、灭）（4）请求参数
golang 从零单排 (一) 安装环境 hamburgerDaddy1 golang 从零单排 golang 开发语言后端
1.下载安装打开网址TheGoProgrammingLanguage直接点击下载go1.24.1.windows-amd64.msi下载完成直接双击下一步下一步安装完成环境变量自动设置不必配置2.验证win+r输入cmd打开命令行输入goversion
动态规划--简单递推一只IT小小鸟算法知识 dp acm 动态规划学习动态规划递推
动态规划一直是ACM竞赛中的重点，同时又是难点，因为该算法时间效率高，代码量少，多元性强，主要考察思维能力、建模抽象能力、灵活度。*************************************************************************************************************动态规划（英语：Dynamicprogramming
SAP-ABAP:SAP的生产计划模块PP的bapi详细介绍及使用场景爱喝水的鱼丶 VIP详情查看专栏 SAP-ABAP开发基础详解 ABAP开发之必须知道的 SAP 运维 ABAP 开发语言 ERP
SAPPP（生产计划）模块中的BAPI（BusinessApplicationProgrammingInterface）是用于在SAP系统中与其他系统（如MES、ERP或其他第三方系统）进行数据交互的标准接口。BAPI基于SAP的RFC（RemoteFunctionCall）技术，允许外部程序调用SAP的业务逻辑，实现生产计划相关数据的创建、修改、查询和删除操作。以下是SAPPP模块中常用BAPI
c/c++中const char*, char const*, char*const 的区别 ForTodayzzZ c/c++
Bjarne在他的TheC++ProgrammingLanguage里面给出过一个助记的方法：把一个声明从右向左读。char*constcp;(*读成pointerto)cpisaconstpointertocharconstchar*p;pisapointertoconstchar;charconst*p;一、constchar*ptr;定义一个指向字符常量的指针，这里，ptr是一个指向char
特征工程 (Feature Engineering) AGI大模型与大数据研究院计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
特征工程(FeatureEngineering)作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在机器学习和数据科学领域，特征工程（FeatureEngineering）一直是一个至关重要的环节。它指的是从原始数据中提取或构造出有助于模型学习的特征，从而提高模型预测准确性的过程。特征工程的成功与否，直接关系到模型性能的好坏
INT2067/INT5051 Introduction to Programming 后端
Assignment2INT2067/INT5051IntroductiontoProgrammingandProblemSolving2024-2025Semester2DueDate:March16,2025(Sunday)1IntroductionInthisassignment,youneedtoimplementatext-basedgamebasedontheriddleaboutaf
INT2067/INT5051 Introduction to Programming 后端
Assignment2INT2067/INT5051IntroductiontoProgrammingandProblemSolving2024-2025Semester2DueDate:March16,2025(Sunday)1IntroductionInthisassignment,youneedtoimplementatext-basedgamebasedontheriddleaboutaf
对比 ThinkPHP 中间件和 Java AOP 众乐乐_2008 php 中间件 java 开发语言
是的，ThinkPHP的中间件（Middleware）类似于Java的AOP（Aspect-OrientedProgramming，面向切面编程），特别是SpringAOP中的拦截器（Interceptor）或过滤器（Filter）。两者都是在请求进入控制器之前、或者响应返回客户端之前，拦截并执行额外的逻辑，比如身份验证、日志记录、数据转换等。对比ThinkPHP中间件和JavaAOP特性Thin
The Rust Programming Language 学习 (一) niandb rust 学习 c++linux c语言
说明关于参考的教程TheRustProgrammingLanguage是英文版本的由于本人英语水平相当的有限,所以我们这里直接去看翻译好的版本Rust程序设计语言.下面我们将两个地址全部都贴出来.TheRustProgrammingLanguageRust程序设计语言Rust官方文档中文教程教程中提到的一些前置翻译已参照最新的Rust1.58.0版及开发版进行调整，这是目前网上最新的中文版本，最后
跨境电商平台中的API接口应用与挑战 lovelin+vI7809804594 大数据 python 人工智能数据分析爬虫
在全球化背景下，跨境电商已成为推动国际贸易发展的重要力量。跨境电商平台作为商家与消费者之间的桥梁，承载着商品展示、交易处理、支付结算、物流追踪等一系列复杂功能。API（ApplicationProgrammingInterface，应用程序编程接口）接口作为连接不同系统与服务平台的桥梁，在跨境电商平台中发挥着举足轻重的作用。然而，随着技术的不断进步和电商行业的快速发展，API接口在跨境电商平台中的
SAP-ABAP:Sap的SD模块bapi详解，带实例爱喝水的鱼丶 ABAP SAP ERP 运维开发语言
在SAPSD（销售与分销）模块中，BAPI（BusinessApplicationProgrammingInterface）是用于与其他系统（如外部程序、EDI、Web服务等）或内部模块集成的重要工具。BAPI封装了业务逻辑，提供标准化的接口，支持创建、修改、查询销售订单、发货单、发票等核心业务对象。以下是SD模块中常见BAPI的详解及使用要点：一、BAPI核心概念BAPI是什么？基于RFC（Re
编程语言发展史之：面向对象编程语言 AI天才研究院 AI大模型企业级应用开发实战一天一门编程语言编程实践大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介面向对象编程(Object-OrientedProgramming，OOP)是一种计算机编程方法，它以数据抽象、继承和多态作为编程哲学基础，并通过类、对象和消息传递的方式实现对真实世界的模拟,[1][2][3]。在过去几十年里，面向对象编程已经成为一种主流的程序设计方法，并且越来越受到开发者的欢迎。特别是在大型软件系统中，采用面向对象的方法可以有效地提高开发效率
深入理解AOP（面向切面编程）：从基础到高级用法江沉晚呤时前端 github 后端 .netcore asp.net c#
1.什么是AOP？AOP（Aspect-OrientedProgramming，面向切面编程）是一种编程范式，它通过将横切关注点从核心业务逻辑中分离出来，帮助我们更好地组织代码。横切关注点是指那些在程序多个部分都需要关注的功能，如日志记录、事务管理、性能监控等，这些功能并不是直接影响业务逻辑，但却需要在多个地方重复出现。通过AOP，我们可以避免这些代码的重复，减少冗余并提高代码的可维护性。1.1A
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi