西门仙忍

RE2，C++正则表达式库实战

RE2简介

RE2是,一个高效、原则性的正则表达式库，由Rob Pike和Russ Cox两位来自google的大牛用C++实现。他俩同时也是Go语言的主导者。Go语言中的regexp正则表达式包，也是RE2的Go实现。

RE2是，一个快速、安全，线程友好，PCRE、PERL和Python等回溯正则表达式引擎（backtracking regular expression engine）的一个替代品。RE2支持Linux和绝大多数的Unix平台，但不支持Windows（如果有必要，你可以自己hack）。

RE2的特点

回溯引擎（Backtracking engine）通常是典型的完整的功能和便捷的语法糖，但是即使很小的输入都可能强制进入指数级时间处理场景。RE2应用自动机理论理论，来保证在一个尺寸的输入上正则表达式搜索运行于一个时间线。RE2实现了内存限制，所以搜索可以被制约在一个固定大小的内存。RE2被设计为使用一个很小的固定C++堆栈足迹，无论它必须处理的输入或正则表达式是什么。从而RE2在多线程环境非常有用，当线程栈不能武断的增大时。

当输入（数据集）很大时，RE2通常比回溯引擎快很多。它采用自动机理论，实施别的引擎无法进行的优化。

不同于绝大多数基于自动机的引擎，RE2实现了几乎所有Perl和PCRE特点，和语法糖。它找到最左-优先（leftmost-first）匹配，同时匹配Perl可能匹配的，并且能返回子匹配信息。最明显的例外是，RE2去掉了对反向引用（backreferences）和一般性零-宽度断言（zero-width assertion）的支持，因为无法高效实现。

为了相对简单语法的使用者，RE2，有一个POSIX模式，仅接受POSIX egrep算子，实现最左-最长整体匹配（leftmost-longest overall matching）。

¹ Technical note: there's a difference between submatches and backreferences. Submatches let you find out what certain subexpressions matched after the match is over, so that you can find out, after matching dogcat against (cat|dog)(cat|dog), that \1 is dog and \2 is cat. Backreferences let you use those subexpressions during the match, so that (cat|dog)\1 matches catcat and dogdog but not catdog or dogcat.

RE2支持子匹配萃取（submatch extraction），但是不支持反向引用（backreferences）。

如果你必须要反向引用和一般性断言，而RE2不支持，那么你可以看一下irregexp，Google Chrome的正则表达式引擎。

玩转RE2

安装

你可以下载发行版的代码包，然后解压进行安装。这里介绍，另一种安装方式：

需要安装Mercurial SCM和C++编译器（g++的克隆）：

下载代码，并进行安装：


    hg clone http://re2.googlecode.com/hg re2
    cd re2
    make test
    make testinstall
    sudo make install

在BSD系统, 使用gmake替换make

使用RE2库

使用RE2库开发C++应用，需要在代码中包含re2/re2.h头文件，链接时增加 -lre2以及-lpthread（多线环境使用）选项。

语法

在POSIX模式，RE@接受标准POSIX (egrep)语法正则表达式。在Perl模式，RE2接受大部分Perl操作符。唯一例外的是，那些要求回溯（潜在需要指数级的运行时）实现的部分。其中，包括反向引用（子匹配，还是支持的）和一般性断言。RE2,默认为Perl模式。

C++ 高级接口

这里包括两个基本的操作：

RE2::FullMatch: 要求regexp表达式匹配整个输入文本。
RE2::PartialMatch: 在输入文本中寻找一个子匹配。在POSIX模式，返回最左-最长匹配，Perl模式也是相同的匹配。

例如，

vi re2_high_interface_test.cc


#include 
#include 
#include 

int
main(void)
{
    assert(RE2::FullMatch("hello", "h.*o"));
    assert(!RE2::FullMatch("hello", "e"));

    assert(RE2::PartialMatch("hello", "h.*o"));
    assert(RE2::PartialMatch("hello", "e"));

    std::cout << "Ok" << std::endl;
    return 0;
}

编译程序：

 g++ -o re2_high_interface_test re2_high_interface_test.cc -lre2

执行re2_high_interface_test，程序正常运行，显示结果Ok。

子匹配萃取

两个匹配函数，都支持附加参数，来指定子匹配。此参数可以是一个字符串或一个整数类型或StringPiece类型。一个StringPiece是一个指向原始输入的指针,和一个字符串的长度计数。有点类似一个string，但是有自己的存储。和使用指针一样，当使用StringPiece时，你必须小心谨慎，原始文本已被删除或不在相同的边界时，不能使用。

示例：

vi re2_submatch_ex_test.cc


#include 
#include 
#include 

int
main(void)
{
    int i;
    std::string s;
    assert(RE2::FullMatch("ruby:1234", "(\\w+):(\\d+)", &s, &i));
    assert(s == "ruby");
    assert(i == 1234);

    // Fails: "ruby" cannot be parsed as an integer.
    assert(!RE2::FullMatch("ruby", "(.+)", &i));

    // Success; does not extract the number.
    assert(RE2::FullMatch("ruby:1234", "(\\w+):(\\d+)", &s));

    // Success; skips NULL argument.
    assert(RE2::FullMatch("ruby:1234", "(\\w+):(\\d+)", (void*)NULL, &i));

    // Fails: integer overflow keeps value from being stored in i.
    assert(!RE2::FullMatch("ruby:123456789123", "(\\w+):(\\d+)", &s, &i));

    std::cout << "Ok" << std::endl;
    return 0;
}

g++ -o re2_submatch_ex_test re2_submatch_ex_test.cc -lre2

预编译的正则表达式

上面的示例都是每次调用的时编译一次正则表达式。相反，你可以编译一次正则表达式，保存到一个RE2对象中，然后在每次调用时重用这个对象。

示例:

vi re2_prec_re_test.cc


#include 
#include 
#include 

int
main(void)
{
    int i;
    std::string s;
    RE2 re("(\\w+):(\\d+)");
    assert(re.ok());  // compiled; if not, see re.error();

    assert(RE2::FullMatch("ruby:1234", re, &s, &i));
    assert(RE2::FullMatch("ruby:1234", re, &s));
    assert(RE2::FullMatch("ruby:1234", re, (void*)NULL, &i));
    assert(!RE2::FullMatch("ruby:123456789123", re, &s, &i));

    std::cout << "Ok" << std::endl;
    return 0;
}

g++ -o re2_prec_re_test re2_prec_re_test.cc -lre2

选项

RE2构造器还有第二个可选参数，可以用来改变RE2的默认选项。例如，预定义的Quiet选项，当正则表达式解析失败时，不打印错误消息：

vi re2_options_test.cc


#include 
#include 
#include 

int
main(void)
{
    RE2 re("(ab", RE2::Quiet);  // don't write to stderr for parser failure
    assert(!re.ok());  // can check re.error() for details

    std::cout << "Ok" << std::endl;
    return 0;
}

编译程序：

g++ -o re2_options_test re2_options_test.cc -lre2

其他有用的预定义选项，是Latin1 (禁用UTF-8)和POSIX (使用POSIX语法和最左-最长匹配)。

你可以定义自己的RE2::Options对象，然后配置它。所有的选项在re2/re2.h文件中。

Unicode规范化

RE2操作Unicode的码点（code points）: 它没有试图进行规范化。例如，正则表达式/ü/(U+00FC, u和分音符)不匹配"ü"(U+0075 U+0308, u紧挨结合分音符)。规范化，是一个长期，参与的话题。最小的解决方案，如果你需要这样的匹配，是在使用RE2之前的处理环节中同时规范化正则表达式和输入。相关主题的更多细节，请参考http://www.unicode.org/reports/tr15/。

额外的技巧和窍门

RE2的高级应用技巧，如构造自己的参数列表，或将RE2作为词法分析器使用或解析十六进制、十进制和C-基数数字，请参考re2.h文件。

“回溯”与“非回溯”的区别

以下照片内容，源自“sregex: matching Perl 5 regexes on data streams”讲演文档.

RE2的各种包装

An Inferno wrapper is at http://code.google.com/p/inferno-re2/.

A Python wrapper is at http://github.com/facebook/pyre2/.

A Ruby wrapper is at http://github.com/axic/rre2/.

An Erlang wrapper is at http://github.com/tuncer/re2/.

A Perl wrapper is at http://search.cpan.org/~dgl/re-engine-RE2-0.05/lib/re/engine/RE2.pm.

An Eiffel wrapper is at http://sourceforge.net/projects/eiffelre2/.

RE2支持的语法

这里列出了RE2支持的正则表达式语法。同时，也列出了PCRE、PERL和VIM接受的语法。蓝色内容是，RE2不支持的语法。


Single characters:
`.`	any character, including newline (s=true)
`[xyz]`	character class
`[^xyz]`	negated character class
`\d`	Perl character class
`\D`	negated Perl character class
`[:alpha:]`	ASCII character class
`[:^alpha:]`	negated ASCII character class
`\pN`	Unicode character class (one-letter name)
`\p{Greek}`	Unicode character class
`\PN`	negated Unicode character class (one-letter name)
`\P{Greek}`	negated Unicode character class

Composites:
`xy`	`x` followed by `y`
`x\|y`	`x` or `y` (prefer `x`)

Repetitions:
`x`	zero or more `x`, prefer more
`x+`	one or more `x`, prefer more
`x?`	zero or one `x`, prefer one
`x{n,m}`	`n` or `n`+1 or ... or `m` `x`, prefer more
`x{n,}`	`n` or more `x`, prefer more
`x{n}`	exactly `n` `x`
`x?`	zero or more `x`, prefer fewer
`x+?`	one or more `x`, prefer fewer
`x??`	zero or one `x`, prefer zero
`x{n,m}?`	`n` or `n`+1 or ... or `m` `x`, prefer fewer
`x{n,}?`	`n` or more `x`, prefer fewer
`x{n}?`	exactly `n` `x`
`x{}`	(≡ `x`) (NOT SUPPORTED) VIM
`x{-}`	(≡ `x?`) (NOT SUPPORTED) VIM
`x{-n}`	(≡ `x{n}?`) (NOT SUPPORTED) VIM
`x=`	(≡ `x?`) (NOT SUPPORTED) VIM

Possessive repetitions:
`x+`	zero or more `x`, possessive (NOT SUPPORTED)
`x++`	one or more `x`, possessive (NOT SUPPORTED)
`x?+`	zero or one `x`, possessive (NOT SUPPORTED)
`x{n,m}+`	`n` or ... or `m` `x`, possessive (NOT SUPPORTED)
`x{n,}+`	`n` or more `x`, possessive (NOT SUPPORTED)
`x{n}+`	exactly `n` `x`, possessive (NOT SUPPORTED)

Grouping:
`(re)`	numbered capturing group
`(?Pre)`	named & numbered capturing group
`(?re)`	named & numbered capturing group (NOT SUPPORTED)
`(?'name're)`	named & numbered capturing group (NOT SUPPORTED)
`(?:re)`	non-capturing group
`(?flags)`	set flags within current group; non-capturing
`(?flags:re)`	set flags during re; non-capturing
`(?#text)`	comment (NOT SUPPORTED)
`(?\|x\|y\|z)`	branch numbering reset (NOT SUPPORTED)
`(?>re)`	possessive match of `re` (NOT SUPPORTED)
`re@>`	possessive match of `re` (NOT SUPPORTED) VIM
`%(re)`	non-capturing group (NOT SUPPORTED) VIM

Flags:
`i`	case-insensitive (default false)
`m`	multi-line mode: ^ and $ match begin/end line in addition to begin/end text (default false)
`s`	let `.` match `\n` (default false)
`U`	ungreedy: swap meaning of `x` and `x?`, `x+` and `x+?`, etc (default false)
Flag syntax is `xyz` (set) or `-xyz` (clear) or `xy-z` (set `xy`, clear `z`).

Empty strings:
`^`	at beginning of text or line (`m`=true)
`$`	at end of text (like `\z` not `\Z`) or line (`m`=true)
`\A`	at beginning of text
`\b`	at word boundary (`\w` on one side and `\W`, `\A`, or `\z` on the other)
`\B`	not a word boundary
`\G`	at beginning of subtext being searched (NOT SUPPORTED) PCRE
`\G`	at end of last match (NOT SUPPORTED) PERL
`\Z`	at end of text, or before newline at end of text (NOT SUPPORTED)
`\z`	at end of text
`(?=re)`	before text matching `re` (NOT SUPPORTED)
`(?!re)`	before text not matching `re` (NOT SUPPORTED)
`(?<=re)`	after text matching `re` (NOT SUPPORTED)
`(?`	after text not matching `re` (NOT SUPPORTED)
`re&`	before text matching `re` (NOT SUPPORTED) VIM
`re@=`	before text matching `re` (NOT SUPPORTED) VIM
`re@!`	before text not matching `re` (NOT SUPPORTED) VIM
`re@<=`	after text matching `re` (NOT SUPPORTED) VIM
`re@`	after text not matching `re` (NOT SUPPORTED) VIM
`\zs`	sets start of match (= \K) (NOT SUPPORTED) VIM
`\ze`	sets end of match (NOT SUPPORTED) VIM
`\%^`	beginning of file (NOT SUPPORTED) VIM
`\%$`	end of file (NOT SUPPORTED) VIM
`\%V`	on screen (NOT SUPPORTED) VIM
`\%#`	cursor position (NOT SUPPORTED) VIM
`\%'m`	mark `m` position (NOT SUPPORTED) VIM
`\%23l`	in line 23 (NOT SUPPORTED) VIM
`\%23c`	in column 23 (NOT SUPPORTED) VIM
`\%23v`	in virtual column 23 (NOT SUPPORTED) VIM

Escape sequences:
`\a`	bell (≡ `\007`)
`\f`	form feed (≡ `\014`)
`\t`	horizontal tab (≡ `\011`)
`\n`	newline (≡ `\012`)
`\r`	carriage return (≡ `\015`)
`\v`	vertical tab character (≡ `\013`)
`*`	literal , for any punctuation character
`\123`	octal character code (up to three digits)
`\x7F`	hex character code (exactly two digits)
`\x{10FFFF}`	hex character code
`\C`	match a single byte even in UTF-8 mode
`\Q...\E`	literal text `...` even if `...` has punctuation

`\1`	backreference (NOT SUPPORTED)
`\b`	backspace (NOT SUPPORTED) (use `\010`)
`\cK`	control char ^K (NOT SUPPORTED) (use `\001` etc)
`\e`	escape (NOT SUPPORTED) (use `\033`)
`\g1`	backreference (NOT SUPPORTED)
`\g{1}`	backreference (NOT SUPPORTED)
`\g{+1}`	backreference (NOT SUPPORTED)
`\g{-1}`	backreference (NOT SUPPORTED)
`\g{name}`	named backreference (NOT SUPPORTED)
`\g`	subroutine call (NOT SUPPORTED)
`\g'name'`	subroutine call (NOT SUPPORTED)
`\k`	named backreference (NOT SUPPORTED)
`\k'name'`	named backreference (NOT SUPPORTED)
`\lX`	lowercase `X` (NOT SUPPORTED)
`\ux`	uppercase `x` (NOT SUPPORTED)
`\L...\E`	lowercase text `...` (NOT SUPPORTED)
`\K`	reset beginning of `$0` (NOT SUPPORTED)
`\N{name}`	named Unicode character (NOT SUPPORTED)
`\R`	line break (NOT SUPPORTED)
`\U...\E`	upper case text `...` (NOT SUPPORTED)
`\X`	extended Unicode sequence (NOT SUPPORTED)

`\%d123`	decimal character 123 (NOT SUPPORTED) VIM
`\%xFF`	hex character FF (NOT SUPPORTED) VIM
`\%o123`	octal character 123 (NOT SUPPORTED) VIM
`\%u1234`	Unicode character 0x1234 (NOT SUPPORTED) VIM
`\%U12345678`	Unicode character 0x12345678 (NOT SUPPORTED) VIM

Character class elements:
`x`	single character
`A-Z`	character range (inclusive)
`\d`	Perl character class
`[:foo:]`	ASCII character class `foo`
`\p{Foo}`	Unicode character class `Foo`
`\pF`	Unicode character class `F` (one-letter name)

Named character classes as character class elements:
`[\d]`	digits (≡ `\d`)
`[^\d]`	not digits (≡ `\D`)
`[\D]`	not digits (≡ `\D`)
`[^\D]`	not not digits (≡ `\d`)
`[[:name:]]`	named ASCII class inside character class (≡ `[:name:]`)
`[^[:name:]]`	named ASCII class inside negated character class (≡ `[:^name:]`)
`[\p{Name}]`	named Unicode property inside character class (≡ `\p{Name}`)
`[^\p{Name}]`	named Unicode property inside negated character class (≡ `\P{Name}`)

Perl character classes:
`\d`	digits (≡ `[0-9]`)
`\D`	not digits (≡ `[^0-9]`)
`\s`	whitespace (≡ `[\t\n\f\r ]`)
`\S`	not whitespace (≡ `[^\t\n\f\r ]`)
`\w`	word characters (≡ `[0-9A-Za-z]`)
`\W`	not word characters (≡ `[^0-9A-Za-z]`)

`\h`	horizontal space (NOT SUPPORTED)
`\H`	not horizontal space (NOT SUPPORTED)
`\v`	vertical space (NOT SUPPORTED)
`\V`	not vertical space (NOT SUPPORTED)

ASCII character classes:
`[:alnum:]`	alphanumeric (≡ `[0-9A-Za-z]`)
`[:alpha:]`	alphabetic (≡ `[A-Za-z]`)
`[:ascii:]`	ASCII (≡ `[\x00-\x7F]`)
`[:blank:]`	blank (≡ `[\t ]`)
`[:cntrl:]`	control (≡ `[\x00-\x1F\x7F]`)
`[:digit:]`	digits (≡ `[0-9]`)
`[:graph:]`	graphical (≡ `[!-~] == [A-Za-z0-9!"#$%&'()+,-./:;<=>?@[\]^``{\|}~])`
`[:lower:]`	lower case (≡ `[a-z]`)
`[:print:]`	printable (≡ `[ -~] == [ [:graph:]]`)
`[:punct:]`	punctuation (≡ `[!-/:-@[-{-~]`)
`[:space:]`	whitespace (≡ `[\t\n\v\f\r ]`)
`[:upper:]`	upper case (≡ `[A-Z]`)
`[:word:]`	word characters (≡ `[0-9A-Za-z]`)
`[:xdigit:]`	hex digit (≡ `[0-9A-Fa-f]`)

Unicode character class names--general category:
`C`	other
`Cc`	control
`Cf`	format
`Cn`	unassigned code points (NOT SUPPORTED)
`Co`	private use
`Cs`	surrogate
`L`	letter
`LC`	cased letter (NOT SUPPORTED)
`L&`	cased letter (NOT SUPPORTED)
`Ll`	lowercase letter
`Lm`	modifier letter
`Lo`	other letter
`Lt`	titlecase letter
`Lu`	uppercase letter
`M`	mark
`Mc`	spacing mark
`Me`	enclosing mark
`Mn`	non-spacing mark
`N`	number
`Nd`	decimal number
`Nl`	letter number
`No`	other number
`P`	punctuation
`Pc`	connector punctuation
`Pd`	dash punctuation
`Pe`	close punctuation
`Pf`	final punctuation
`Pi`	initial punctuation
`Po`	other punctuation
`Ps`	open punctuation
`S`	symbol
`Sc`	currency symbol
`Sk`	modifier symbol
`Sm`	math symbol
`So`	other symbol
`Z`	separator
`Zl`	line separator
`Zp`	paragraph separator
`Zs`	space separator

Unicode character class names--scripts:
`Arabic`	Arabic
`Armenian`	Armenian
`Balinese`	Balinese
`Bengali`	Bengali
`Bopomofo`	Bopomofo
`Braille`	Braille
`Buginese`	Buginese
`Buhid`	Buhid
`Canadian_Aboriginal`	Canadian Aboriginal
`Carian`	Carian
`Cham`	Cham
`Cherokee`	Cherokee
`Common`	characters not specific to one script
`Coptic`	Coptic
`Cuneiform`	Cuneiform
`Cypriot`	Cypriot
`Cyrillic`	Cyrillic
`Deseret`	Deseret
`Devanagari`	Devanagari
`Ethiopic`	Ethiopic
`Georgian`	Georgian
`Glagolitic`	Glagolitic
`Gothic`	Gothic
`Greek`	Greek
`Gujarati`	Gujarati
`Gurmukhi`	Gurmukhi
`Han`	Han
`Hangul`	Hangul
`Hanunoo`	Hanunoo
`Hebrew`	Hebrew
`Hiragana`	Hiragana
`Inherited`	inherit script from previous character
`Kannada`	Kannada
`Katakana`	Katakana
`Kayah_Li`	Kayah Li
`Kharoshthi`	Kharoshthi
`Khmer`	Khmer
`Lao`	Lao
`Latin`	Latin
`Lepcha`	Lepcha
`Limbu`	Limbu
`Linear_B`	Linear B
`Lycian`	Lycian
`Lydian`	Lydian
`Malayalam`	Malayalam
`Mongolian`	Mongolian
`Myanmar`	Myanmar
`New_Tai_Lue`	New Tai Lue (aka Simplified Tai Lue)
`Nko`	Nko
`Ogham`	Ogham
`Ol_Chiki`	Ol Chiki
`Old_Italic`	Old Italic
`Old_Persian`	Old Persian
`Oriya`	Oriya
`Osmanya`	Osmanya
`Phags_Pa`	'Phags Pa
`Phoenician`	Phoenician
`Rejang`	Rejang
`Runic`	Runic
`Saurashtra`	Saurashtra
`Shavian`	Shavian
`Sinhala`	Sinhala
`Sundanese`	Sundanese
`Syloti_Nagri`	Syloti Nagri
`Syriac`	Syriac
`Tagalog`	Tagalog
`Tagbanwa`	Tagbanwa
`Tai_Le`	Tai Le
`Tamil`	Tamil
`Telugu`	Telugu
`Thaana`	Thaana
`Thai`	Thai
`Tibetan`	Tibetan
`Tifinagh`	Tifinagh
`Ugaritic`	Ugaritic
`Vai`	Vai
`Yi`	Yi

Vim character classes:
`\i`	identifier character (NOT SUPPORTED)/font> VIM
`\I`	`\i` except digits (NOT SUPPORTED) VIM
`\k`	keyword character (NOT SUPPORTED) VIM
`\K`	`\k` except digits (NOT SUPPORTED) VIM
`\f`	file name character (NOT SUPPORTED) VIM
`\F`	`\f` except digits (NOT SUPPORTED) VIM
`\p`	printable character (NOT SUPPORTED) VIM
`\P`	`\p` except digits (NOT SUPPORTED) VIM
`\s`	whitespace character (≡ `[ \t]`) (NOT SUPPORTED) VIM
`\S`	non-white space character (≡ `[^ \t]`) (NOT SUPPORTED) VIM
`\d`	digits (≡ `[0-9]`) VIM
`\D`	not `\d` VIM
`\x`	hex digits (≡ `[0-9A-Fa-f]`) (NOT SUPPORTED) VIM
`\X`	not `\x` (NOT SUPPORTED) VIM
`\o`	octal digits (≡ `[0-7]`) (NOT SUPPORTED) VIM
`\O`	not `\o` (NOT SUPPORTED) VIM
`\w`	word character VIM
`\W`	not `\w` VIM
`\h`	head of word character (NOT SUPPORTED) VIM
`\H`	not `\h` (NOT SUPPORTED) VIM
`\a`	alphabetic (NOT SUPPORTED) VIM
`\A`	not `\a` (NOT SUPPORTED) VIM
`\l`	lowercase (NOT SUPPORTED) VIM
`\L`	not lowercase (NOT SUPPORTED) VIM
`\u`	uppercase (NOT SUPPORTED) VIM
`\U`	not uppercase (NOT SUPPORTED) VIM
`_x`	`\x` plus newline, for any `x` (NOT SUPPORTED) VIM

Vim flags:
`\c`	ignore case (NOT SUPPORTED) VIM
`\C`	match case (NOT SUPPORTED) VIM
`\m`	magic (NOT SUPPORTED) VIM
`\M`	nomagic (NOT SUPPORTED) VIM
`\v`	verymagic (NOT SUPPORTED) VIM
`\V`	verynomagic (NOT SUPPORTED) VIM
`\Z`	ignore differences in Unicode combining characters (NOT SUPPORTED) VIM

Magic:
`(?{code})`	arbitrary Perl code (NOT SUPPORTED) PERL
`(??{code})`	postponed arbitrary Perl code (NOT SUPPORTED) PERL
`(?n)`	recursive call to regexp capturing group `n` (NOT SUPPORTED)
`(?+n)`	recursive call to relative group `+n` (NOT SUPPORTED)
`(?-n)`	recursive call to relative group `-n` (NOT SUPPORTED)
`(?C)`	PCRE callout (NOT SUPPORTED) PCRE
`(?R)`	recursive call to entire regexp (≡ `(?0)`) (NOT SUPPORTED)
`(?&name)`	recursive call to named group (NOT SUPPORTED)
`(?P=name)`	named backreference (NOT SUPPORTED)
`(?P>name)`	recursive call to named group (NOT SUPPORTED)
`(?(cond)true\|false)`	conditional branch (NOT SUPPORTED)
`(?(cond)true)`	conditional branch (NOT SUPPORTED)
`(ACCEPT)`	make regexps more like Prolog (NOT SUPPORTED)
`(COMMIT)`	(NOT SUPPORTED)
`(F)`	(NOT SUPPORTED)
`(FAIL)`	(NOT SUPPORTED)
`(MARK)`	(NOT SUPPORTED)
`(PRUNE)`	(NOT SUPPORTED)
`(SKIP)`	(NOT SUPPORTED)
`(THEN)`	(NOT SUPPORTED)
`(ANY)`	set newline convention (NOT SUPPORTED)
`(ANYCRLF)`	(NOT SUPPORTED)
`(CR)`	(NOT SUPPORTED)
`(CRLF)`	(NOT SUPPORTED)
`(LF)`	(NOT SUPPORTED)
`(BSR_ANYCRLF)`	set \R convention (NOT SUPPORTED) PCRE
`(*BSR_UNICODE)`	(NOT SUPPORTED) PCRE

扩展阅读

"perlre - Perl regular expressions" http://perldoc.perl.org/perlre.html
"Implementing Regular Expressions" http://swtch.com/~rsc/regexp
The re1 project: http://code.google.com/p/re1
The re2 project: http://code.google.com/p/re2
sregex: A non-backtracking regex engine matching on data streams
sregex: matching Perl 5 regexes on data streams: http://agentzh.org/misc/slides/yapc-na-2013-sregex.pdf

参考资料

RE2官网资料：http://code.google.com/p/re2/wiki/
sregex: matching Perl 5 regexes on data streams: http://agentzh.org/misc/slides/yapc-na-2013-sregex.pdf

你可能感兴趣的:(正则)

机器学习——正则化、欠拟合、过拟合、学习曲线代码的建筑师学习记录机器学习机器学习学习曲线过拟合欠拟合正则化
过拟合（overfitting）:模型只能拟合训练数据的状态。即过度训练。避免过拟合的几种方法：①增加全部训练数据的数量（最为有效的方式）②使用简单的模型（简单的模型学不够，复杂的模型学的太多），这里的简单指的是不要过于复杂③正则化（对目标函数后加上正则化项）：使得这个“目标函数+正则化项”的值最小，即为正则化，用防止参数变得过大（参数值变小，意味着对目标函数的影响变小），λ是正则化参数，代表正则
LinuX---Shell正则表达式雁过留声花欲落 Shell linux 正则表达式
正则表达式正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些符合某个模式的文本。在Linux中，grep，sed，awk等命令都支持通过正则表达式进行模式匹配。常规匹配一串不包含特殊字符的正则表达式匹配它自己，例如：feng@ubuntu:~$cat/etc/passwd|grep-E'feng'就会匹配所有包含feng的行。
利用matlab实现贝叶斯优化算法（BO）优化支持向量机回归(SVR)的超参数是内啡肽耶算法 matlab 支持向量机机器学习回归
【导读】在机器学习建模中，支持向量机（SVM）回归模型的效果高度依赖超参数选择。但手动调参就像"大海捞针"，而网格搜索又面临"计算爆炸"的难题。今天给大家介绍一个智能调参黑科技——贝叶斯优化算法。通过Matlab实现，只需几分钟就能让模型性能自动升级！一、为什么要用贝叶斯优化调参？传统调参三大痛点：C参数（正则化强度）：过小导致过拟合，过大削弱模型能力ε参数（不敏感区域）：决定对预测误差的容忍度核
input限制只能输入正整数 _虾仁不眨眼_ javascript html5
要限制input元素只能输入正整数，可以使用以下几种方法：1.使用HTML5的type="number"属性这种方式可以限制输入框只接受数字输入，并且可以通过min和step属性设置最小值和步长。2.使用正则表达式进行输入验证使用@input事件监听输入框的输入事件，并在validateInput方法中使用正则表达式过滤掉非数字和非正整数的字符。//html//jsmethods:{validat
华为OD机试 - 字符匹配 - 正则表达式（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od 正则表达式 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述给你一个字符串数组（每个字符串均由小写字母组成）和一个字符规律（
Java对正则表达式的支持（手机、身份证校验）周里奥工具正则表达式 java
目录1【数量:单个】字符匹配2【数量:单个】字符集(可以从里面任选一个字符)。3【数量:单个】简化字符集;4【边界匹配】5【数量表示】默认情况下只有添加上了数量单位才可以匹配多位字符;6【逻辑表达式】可以连接多个正则7【理解字符\的含义】\在Java中的含义\在正则表达式中的含义\出现在Java的正则表达式中处理举例1：[email protected]举例2：ab\abJava对正则的支持类-常用方法
java中校验手机号码的正则表达式尼采呀 java 正则表达式开发语言
一.匹配说明：正则表达式是描述字符串内容格式，使用它来匹配一个字符串的内容是否符合要求1.[]:表示一个字符,该字符可以是[]中指定的内容例如:[abc]:这个字符可以是a或b或c[a-z]:表示任意一个小写字母[a-zA-Z]:表示任意一个字母[a-zA-Z0-9_]:表示任意一个数字字母下划线[^abc]:该字符只要不是a或b或c预定义字符:.:表示任意一个字符,没有范围限制\d:表示任意一个
Java突击小练习--利用正则表达式来简易的校验邮箱与手机号格式 CJH~ java 正则表达式 mysql
//校验邮箱publicclassTestEmail{publicstaticvoidmain(String[]args){Scannerinput=newScanner(System.in);//*号代表任意数量，放在0-9a-zA-Z后面，代表可以写任意数量的字母和数字//@是邮箱的符号，接在刚刚那串的后面//|代表或，也就是说@后可以跟着qq或163或sina中的任意字符串，代表哪家邮箱//
正则表达式全解析 + Java常用示例我真的不想做程序员算法 java java 后端开发语言算法正则表达式
目录一、正则表达式基础（一）元字符（二）字符集（三）量词二、正则表达式常用示例（一）验证邮箱格式（二）验证电话号码格式（三）提取网页中的链接（四）验证日期格式（五）验证URL格式三、正则表达式在Java中的应用（一）匹配操作（二）替换操作（三）分割操作四、总结一、正则表达式基础正则表达式是一种用于匹配字符串的强大工具。它使用特定的语法来定义匹配模式，可以在文本处理、表单验证、数据提取等场景中发挥重
【正则表达式】 lmk565 工具正则表达式
文章目录1元字符2重复3字符4分支条件5反义6分组6.1捕获分组6.2非捕获分组7零宽断言8注释9贪婪与懒惰10POSIX字符类（仅US-ASCII）11转义12匹配模式1元字符代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白符\d匹配数字^匹配字符串的开始$匹配字符串的结束\b匹配字符串的结束举例：8答案：\d2重复代码/语法说明*重复零次或更多次+重复一次
iOS OC使用正则表达式去除特殊符号并加粗文本，适用于接入AI大模型的流模式数据的文字处理 MrZWCui iOS ios xcode objective-c 正则表达式学习
1、编写逻辑使用分类(Category)的方法拓展NSString，本文使用NSString(Markdown)，NSString的分类来编写一个通用方法，使用正则表达式匹配字符串实现去除特殊字符，并自定义文字属性。在接入AI大模型后，返回的字符串会带有特殊字符用于做文字处理，下面代码简单进行了文字处理展示。2、代码实现1、NSString+Markdown.h#importNS_ASSUME_N
正则表达式大神乔伊工具正则表达式
前言如果你学会了，可以忽略本文章，或去项目经验地图寻找更多答案原则1.找规律2.不要追求完美3.思考：什么开头？什么结束？什么类型？多少位数？什么范围？出现次数？语法一：对象写法letreg=newRegExp(/\d{5}/)letreg=newRegExp("\\d{5}")letstr='我的号码是12345'console.log(reg.test(str))//true二：字面量方式：l
正则问题-DFS 艾菲尔上的铁塔梦xx 深度优先算法
题目描述考虑一种简单的正则表达式：只由x()|组成的正则表达式。小明想求出这个正则表达式能接受的最长字符串的长度。例如((xx|xxx)x|(x|xx))xx能接受的最长字符串是：xxxxxx，长度是6。输入描述一个由x()|组成的正则表达式。输入长度不超过100，保证合法。输出描述这个正则表达式能接受的最长字符串的长度。输入输出样例示例输入((xx|xxx)x|(x|xx))xx输出6运行限制最
蓝桥杯历届试题正则问题(非dfs解决) C+G Leetcode中级算法
文章目录题目题目解析解题代码题外话–网上清一色的dfs模拟也是够离谱，搁这一个接着一个抄呢？题目oj平台题目解析如果围绕着如何从左到右进行遍历更新那我觉得确实半天难以得到分数，但只要转念一想：我们如果是处理没有括号的正则计数，会发现非常的容易，那么我们找到一种方法：通过一个函数将一个括号范围内的正则表达式的最大值进行更新。我们通过另一个函数将整个括号的表达式替换为对应的x数量。不断重复1、2过程，
Nginx、LVS、HAProxy 的区别和优缺点青年夏日科技 nginx 运维
Nginx、LVS、HAProxy是目前使用最广泛的三种负载均衡软件，本人都在多个项目中实施过，通常会结合Keepalive做健康检查，实现故障转移的高可用功能。1）在四层（tcp）实现负载均衡的软件：lvs------>重量级nginx------>轻量级，带缓存功能，正则表达式较灵活haproxy------>模拟四层转发，较灵活2）在七层（http）实现反向代理的软件：haproxy----
【玩转正则表达式】一套万能的针对所有场景都适用的写出正则表达式的步骤 ThisIsClark 玩转正则表达式正则表达式
正则表达式作为一个强力的文本模式匹配工具，在功能强大的另一面是不低的使用门槛。对于很多开发者或者使用者来说，最大的问题就是面对一串待匹配的字符串，不知道如何正确的写出正则表达式。我因为是公司正则表达式相关功能的开发者，所以用户使用正则相关的功能时经常都会来找我问一个问题：我有一个xxx的字符串，想提取某某元素，应该怎么写正则表达式。于是在这个过程中，我不光积累了对正则表达式语法的熟练程度，更是对如
解锁Linux命令行的终极指南：从日常操作到系统掌控领码科技技能篇 Linux命令日常操作系统管理 Shell脚本
摘要Linux操作系统凭借其开源、高效、稳定的特性，已成为开发者和运维工程师的核心工具。本文深度解析Linux命令的底层逻辑与实战技巧，涵盖文件管理、权限控制、进程监控、网络运维等高频场景，结合Shell脚本编写与正则表达式应用，助您实现从命令行基础到高阶系统管理的跃迁。精选80+核心指令详解，配合真实案例与避坑指南，让您轻松驾驭Linux系统的日常运维与深度优化。关键词：Linux命令、日常操作
XGBoost算法深度解析：从原理到实践彩旗工作室人工智能算法机器学习人工智能
一、算法起源与核心思想XGBoost（eXtremeGradientBoosting）由陈天奇于2014年提出，是梯度提升决策树（GBDT）的优化版本。其核心思想通过迭代集成弱学习器（CART树）逐步修正预测误差，并引入正则化机制控制模型复杂度，防止过拟合。与GBDT相比，XGBoost在目标函数中融合了损失函数（衡量预测误差）和正则化项（约束树结构与叶子权重），形成结构风险最小化框架，从而提升泛
文件关键字搜索技术要点与实战体制教科书
本文还有配套的精品资源，点击获取简介：在IT行业中，能够通过输入关键字高效定位和管理大量文档是一项重要的技能。此功能通常集成于文件管理软件、搜索引擎或脚本程序中。技术实现包括文件系统API、文本搜索算法和文件过滤规则。本文将详细介绍这些技术要点，例如使用文件系统API遍历文件、采用高效文本搜索算法（如Boyer-Moore）以及应用文件过滤规则（包括类型筛选和正则表达式匹配）。特殊文件格式如Out
爬虫的精准识别：基于 User-Agent 的正则实现 Small踢倒coffee_氕氘氚经验分享笔记
##摘要随着互联网技术的飞速发展，网络爬虫在数据采集、搜索引擎优化等领域的应用日益广泛。然而，恶意爬虫的存在也给网站安全和数据隐私带来了严重威胁。因此，精准识别爬虫行为成为网络安全领域的重要课题。本文提出了一种基于User-Agent正则表达式的爬虫识别方法，通过分析User-Agent字符串的特征，构建正则表达式规则，实现对爬虫的精准识别。实验结果表明，该方法具有较高的识别准确率和较低的误报率，
电话的正则表达式几度泥的菜花 javascript 前端
‌‌正则表达式是一种强大的文本处理工具，用于匹配、查找、替换或提取字符串中的特定模式‌。它由普通字符和特殊字符（元字符）组成，其中元字符具有特殊含义，用于定义匹配规则。‌电话的正则表达式根据不同国家和地区的规范有所不同。下面是一些常见的电话正则表达式示例：1.中国大陆的电话正则表达式对于中国大陆的手机号码，通常是11位数字，以1开头，第二位数字为3、4、5、6、7、8、9中的一个。手机号码（11位
Java字符串以“.“分割 slient_love 软件开发
今天开发中需要对图片地址进行拼接，使用字符串分割函数split()进行处理，发现数组为空：Stringtemp=image[i];String[]str=temp.split(".");在百度之后发现，需要使用转义字符。测试成功~String[]str=temp.split("\\.");注意哦，在正则表达式中，小数点指的是任意字符，因此不能直接用".“来匹配小数点，需要使用”\\."来匹配小数点
22. dirmap：高级 Web 目录与文件扫描工具白帽少女安琪拉安全工具网络安全网络
1.1项目介绍dirmap是一款功能强大的Web目录与文件扫描工具，专注于快速发现目标网站的隐藏路径、敏感文件及未授权接口。其通过多线程、递归扫描和智能过滤机制，显著提升扫描效率与准确性，适用于红队渗透、漏洞挖掘及资产测绘等场景。1.1.1核心功能多线程扫描：默认50线程，可自定义调整以平衡性能与隐蔽性。智能结果过滤：自动排除重复状态码（如404）。支持正则匹配响应内容，识别动态路由（如/user
华为机试—字符串通配符 rigidwill666 华为机考华为算法数据结构动态规划 c++
题目在计算机中，通配符是一种特殊语法，广泛应用于文件搜索、数据库、正则表达式等领域。让我们来学习通配符的匹配规则：‘*’符号代表匹配0个或以上的数字或字母；‘?’符号代表匹配1个数字或字母；小写字母字符代表匹配自身和自身的大写字母形态；大写字母字符代表匹配自身和自身的小写字母形态；其他字符代表匹配自身。现在，对于给定的通配符字符串s和目标字符串p，不考虑大小写，请判断s是否可以匹配得到p。如果可以
Python网络爬虫实战：抓取猫眼TOP100电影信息莱财一哥
本文还有配套的精品资源，点击获取简介：在Python中，Web爬虫是获取互联网数据的关键技能。本教程将指导如何结合使用requests库和正则表达式来从猫眼电影网站的TOP100榜单中抓取电影信息。首先通过requests库发送HTTP请求获取网页内容，然后运用正则表达式提取电影名和评分等信息。在进行网络爬虫时，遵守robots.txt规则，设置请求延时，并考虑处理网站的反爬虫策略。对于更复杂的网
ES6 字符串和正则表达式(三) 小李学软件 ES6学习 javascript es6 es6/es7
更好的Unicode支持早期，由于存储空间宝贵，Unicode使用16位二进制来存储文字。我们将一个16位的二进制编码叫做一个码元（CodeUnit）。后来，由于技术的发展，Unicode对文字编码进行了扩展，将某些文字扩展到了32位（占用两个码元），并且，将某个文字对应的二进制数字叫做码点（CodePoint）。ES6为了解决这个困扰，为字符串提供了方法：codePointAt，根据字符串码元的
Linux fgrep 命令使用详解 linux
简介fgrep（fixGREP）命令搜索固定字符串，而不将特殊字符解释为正则表达式。它相当于grep-F。基础语法fgrep[OPTIONS]"STRING"FILE或grep-F[OPTIONS]"STRING"FILE示例用法在文件中查找包含“error”的所有行fgrep"error"logfile.txt或grep-F"error"logfile.txt搜索多个字符串keywords.tx
论文摘要生成器：用TextRank算法实现文献关键信息提取 Atlas Shepherd python 算法自然语言处理 python 信息可视化
我们基于python代码，使用PyQt5创建图形用户界面（GUI），同时支持中英文两种语言的文本论文文献关键信息提取。PyQt5：用于创建GUI应用程序。jieba：中文分词库，用于中文文本的处理。re：正则表达式模块，用于文本清理和句子分割。numpy：提供数值计算能力，如数组操作、矩阵运算等，主要用于TextRank算法的实现。importsysimportreimportjiebaimpor
爬虫的精准识别：基于 User-Agent 的正则实现伏羲栈 Java 爬虫正则表达式 java javascript
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
用5个实例学习python正则表达式基本用法_跟我一起学Python20 灏瀚星空 python 学习正则表达式经验分享学习方法
用5个实例学习python正则表达式基本用法_跟我一起学Python20为什么学习正则表达式？正则表达式是处理文本的"瑞士军刀"，它能帮助你：✅快速验证用户输入格式（手机号/邮箱）✅批量提取文本中的特定信息（日期/链接）✅智能替换敏感内容✅高效清理杂乱数据本文将通过5个真实场景，结合Python代码，带你掌握正则表达式的核心用法。场景一：手机号验证（基础匹配）需求：验证用户输入的11位手机号（以1
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。