给我瓶叶小白

R语言正则表达式

在用R处理网页抓取的数据的时候，总是会涉及到正则表达式，看到一篇不错的介绍转载如下
正则表达式是一种查找以及字符串替换操作。正则表达式在文本编辑器中广泛使用，比如正则表达式被用于：
•检查文本中是否含有指定的特征词
•找出文中匹配特征词的位置
•从文本中提取信息，比如：字符串的子串
•修改文本

与文本编辑器相似，几乎所有的高级编程语言都支持正则表达式。在这样的语境下，“文本”也就是一个字符串，可以执行的操作都是类似的。一些编程语言（比如Perl，JavaScript）会检查正则表达式的语法。
正则表达式是什么？
正则表达式只是一个字符串。没有长度限制，但是，这样的正则表达式长度往往较短。如下所示是一些正则表达式的例子：
•I had a S+ day today
•[A-Za-z0-9-_]{3,16}
•dddd-dd-dd
•v(d+)(.d+)*
•TotalMessages="(.*?)"
•<[^<>]>

这些字符串实际上都是微型计算机程序。正则表达式的语法，实际上是一种轻量级、简洁、适用于特定领域的编程语言。记住这一点，那么你就很容易理解下面的事情：
•每一个正则表达式，都可以分解为一个指令序列，比如“先找到这样的字符，再找到那样的字符，再从中找到一个字符。。。”

•每一个正则表达式都有输入（文本）和输出（匹配规则的输出，有时是修改后的文本）
•正则表达式有可能出现语法错误——不是所有的字符串都是正则表达式
•正则表达式语法很有个性，也可以说很恐怖
•有时可以通过编译，使得正则表达式执行更快

在实现中，正则表达式还有其他的特点。本文将重点讨论正则表达式的核心语法，在几乎所有的正则表达式中都可以见到这些规则。
特别提示：正则表达式与文件通配语法无关，比如 *.xml
正则表达式的基础语法字符正则表达式中包含了一系列的字符，这些字符只能匹配它们本身。有一些被称为“元字符”的特殊字符，可以匹配一些特殊规则。
如下所示的例子中，我用红色标出了元字符。
•I had a S+ day today
•[A-Za-z0-9-_]{3,16}
•dddd-dd-dd
•v(d+)(.d+)*
•TotalMessages="(.*?)"
•<[^<>]*>

大部分的字符，包括所有的字母和数字字符，是普通字符。也就意味着，它们只能匹配它们自己，如下所示的正则表达式：
cat
意味着，只能匹配一个字符串，以“c”开头，然后是字符“a”，紧跟着是字符“t”的字符串。
到目前为止，正则表达式的功能类似于
•常规的Find功能
•Java中的 String.indexOf() 函数
•PHP中的 strpos()函数
•等等

注意：不做特殊说明，正则表达式中是区分大小写的。但是，几乎所有正则表达式的实现，都会提供一个Flag用来控制是否区分大小写。
点“.”我们第一个要讲解的元字符是“.”。这个符号意味着可以匹配任意一个字符。如下所示的正则表达式：
c.t
意味着匹配“以c开头,之后是任意一个字符，紧跟着是字母t”的字符串。
在一段文本中，这样的正则表达式可以用来找出cat, cot, czt这样的字符串，甚至可以找出c.t这样的组合，但是不能找到ct或者是coot这样的字符串。
使用反斜杠“”可以忽略元字符，使得元字符的功能与普通字符一样。所以，正则表达式
c.t
表示“找到字母c,然后是一个句号（“.”），紧跟着字母t”
反斜杠本身也是一个元字符，这意味着反斜杠本身也可以通过相似的方法变回到普通字符的用途。因此，正则表达式
c\t
表示匹配“以字符c开头,然后是一个反斜杠，紧跟着是字母t”的字符串。
注意！在正则表达式的实现中，.是不能用于匹配换行符的。”换行符“的表示方法在不同实现中也不同。实际编程时，请参考相关文档。在本文中，我认为.是可以匹配任意字符的。实现环境通常会提供一个Flag标志位，来控制这一点。
字符类字符类是一组在方括号内的字符，表示可以匹配其中的任何一个字符。
•正则表达式c[aeiou]t，表示可以匹配的字符串是”以c开头，接着是aeiou中的任何一个字符，最后以t结尾”。在文本的实际应用中，这样的正则表达式可以匹配：cat,cet,cit,cot,cut五种字符串。
•正则表达式[0123456789]表示匹配任意一个整数。
•正则表达式[a]表示匹配单字符a。

包含忽略字符的例子

•a

表示匹配字符串[a]
•[[]ab]表示匹配的字符为”["或者'']”或者”a”,或者”b”
•[\[]]表示匹配的字符为””或者 “[”或者"]“

在字符类中，字符的重复和出现顺序并不重要。[dabaaabcc]与[abc]是相同的
重要提示：字符类中和字符类外的规则有时不同，一些字符在字符类中是元字符，在字符类外是普通字符。一些字符正好相反。还有一些字符在字符类中和字符类外都是元字符，这要视情况而定！
比如，.表示匹配任意一个字符，而[.]表示匹配一个全角句号。这不是一回事！

字符类的范围在字符集中，你可以通过使用短横线来表示匹配字母或数字的范围。
•[b-f]与[b,c,d,e,f]相同，都是匹配一个字符”b”或”c”或”d”或”e”或”f”
•[A-Z]与[ABCDEFGHIJKLMNOPQRSTUVWXYZ]相同，都是匹配任意一个大写字母。
•[1-9]与[123456789]相同，都是匹配任意一个非零数字。

练习使用目前我们已经讲解的正则表达式相关知识，在字典中匹配找到含有最多连续元音的单词，同时找到含有最多连续辅音的单词。
答案[aeiou][aeiou][aeiou][aeiou][aeiou][aeiou] 这样的正则表达式，可以匹配连续含有六个元音的单词，比如 euouae 和 euouaes。
同样的，恐怖的正则表达式[bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz] 可以找到连续含有十个辅音的单词sulphhydryls.
下文中，我们会讲解，怎样有效缩短这样的正则表达式长度。
在字符类之外，短横线没有特殊含义。正则表达式a-z，表示匹配字符串“以a开头，然后是一个短横线，以z结尾”。
范围和单独的字符可能在一个字符类中同时出现：
•[0-9.,]表明匹配一个数字，或者一个全角句号，或者一个逗号
•[0-9a-fA-F]意味着匹配一个十六进制数
•[a-zA-Z0-9-]意味着匹配一个字母、数字或者一个短横线

练习使用已经介绍过的正则表达式知识，匹配YYYY-MM-DD格式的日期。
答案[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9].
同样的，下文中，我们会介绍怎样有效减少这样的正则表达式长度。
虽然你可以尝试在正则表达式中使用一些非字母或数字作为范围的最后一个符号，比如abc[!-/]def，但是这并不是在每种实现中都合法。即使这样的语法是合法的，这样的语义也是模糊的。最好不要这样使用。
同时，你必须谨慎选择范围的边界值。即使[A-z]在你使用的实现中，是合法的，也可能会产生无法预料的运行结果。（注意，在z到a之间，是有字符存在的）
注意：范围的字符值代表的是字符而已，并不能代表数值范围，比如[1-31]表示匹配一个数字，是1或者2或者3，而不是匹配一个数值在1到31之间的数。
字符类的反义你可以在字符类的起始位放一个反义符。
•[^a]表示匹配任何不是“a”的字符
•[^a-zA-Z0-9]表示匹配任何不是字母也不是数字的字符
•[^abc]匹配一个为“^”或者a或者b或者c的字符
•[^^]表示匹配任何不为“^”的字符

练习在字典中，找到一个不满足“在e之前有i，但是没有c”的例子。
答案

cie和[^c]ei都要可以找到很多这样的例子，比如ancient,science,viel,weigh
转义字符类d这个正则表达式与[0-9]作用相同，都是匹配任何一个数字。（要匹配d,应该使用正则表达式\d）
w与[0-9A-Za-z]相同，都表示匹配一个数字或字母字符
s意味着匹配一个空字符（空格，制表符，回车或者换行）
另外
•D与[^0-9]相同，表示匹配一个非数字字符。
•W与[^0-9A-Za-z]相同，表示匹配一个非数字同时不是字母的字符。
•S表示匹配一个非空字符。

这些是你必须掌握的字符。你可能已经注意到了，一个全角句号“.”也是一个字符类，可以匹配任意一个字符。
很多正则表达式的实现中，提供了更多的字符类，或者是标志位在ASCII码的基础上，扩展现有的字符类。
特别提示：统一字符集中包含除了0至9之外的更多数字字符，同样的，也包含更多的空字符和字母字符。实际使用正则表达式时，请仔细查看相关文档。
练习简化正则表达式 [0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9].
答案dddd-dd-dd.
重复在字符或字符集之后，你可以使用{ }大括号来表示重复
•正则表达式a{1}与a意思相同，都表示匹配字母a
•a{3}表示匹配字符串“aaa”
•a{0}表示匹配空字符串。从这个正则表达式本身来看，它毫无意义。如果你对任何文本执行这样的正则表达式，你可以定位到搜索的起始位置，即使文本为空。
•a{2}表示匹配字符串“a{2}”
•在字符类中，大括号没有特殊含义。[{}]表示匹配一个左边的大括号，或者一个右边的大括号

练习简化下面的正则表达式
•z.......z
•dddd-dd-dd
•[aeiou][aeiou][aeiou][aeiou][aeiou][aeiou]
•[bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz][bcdfghjklmnpqrstvwxyz]

答案•z.{7}z
•d{4}-d{2}-d{2}
•[aeiou]{6}
•[bcdfghjklmnpqrstvwxyz]{10}

注意：重复字符是没有记忆性的，比如[abc]{2}表示先匹配”a或者b或者c”，再匹配”a或者b或者c”，与匹配”aa或者ab或者ac或者ba或者bb或者bc或者ca或者cb或者cc“一样。[abc]{2}并不能表示匹配”aa或者bb或者cc“

指定重复次数范围重复次数是可以指定范围的
•x{4,4}与x{4}相同
•colou{0,1}r表示匹配colour或者color
•a{3,5}表示匹配aaaaa或者aaaa或者aaa

注意这样的正则表达式会优先匹配最长字符串，比如输入 I had an aaaaawful day会匹配单词aaaaawful中的aaaaa，而不会匹配其中的aaa。
重复次数是可以有范围的，但是有时候这样的方法也不能找到最佳答案。如果你的输入文本是I had an aaawful daaaaay那么在第一次匹配时，只能找到aaawful，只有再次执行匹配时才能找到daaaaay中的aaaaa.
重复次数的范围可以是开区间
•a{1，}表示匹配一个或一个以上的连续字符a。依然是匹配最长字符串。当找到第一个a之后，正则表达式会尝试匹配尽量多个的连续字母a。
•.{0,}表示匹配任意内容。无论你输入的文本是什么，即使是一个空字符串，这个正则表达式都会成功匹配全文并返回结果。

练习使用正则表达式找到双引号。要求输入字符串可能包含任意个字符。
调整你的正则表达式使得在一对双引号中间不再包含其他的双引号。
答案 ".{0,}", 然后 "[^"]{0,}".

关于重复的转义字符？与{0,1}相同，比如，colou?r表示匹配colour或者color
*与{0,}相同。比如，.*表示匹配任意内容
+与{1，}相同。比如,w+表示匹配一个词。其中”一个词”表示由一个或一个以上的字符组成的字符串，比如_var或者AccountName1.
这些是你必须知道的常用转义字符，除此之外还有:
•?*+ 表示匹配字符串”?*+”
•[?*+]表示匹配一个问号，或者一个*号，或者一个加号

练习简化下列的正则表达式:
•".{0,}" and "[^"]{0,}"
•x?x?x?
•y*y*
•z+z+z+z+

答案•".*" and "[^"]*"
•x{0,3}
•y*
•z{4,}

练习写出正则表达式，寻找由非字母字符分隔的两个单词。如果是三个呢？六个呢？
w+W+w+, w+W+w+W+w+, w+W+w+W+w+W+w+W+w+W+w+.
下文中，我们将简化这个正则表达式。

非贪婪匹配正则表达式 “.*” 表示匹配双引号，之后是任意内容，之后再匹配一个双引号。注意，其中匹配任意内容也可以是双引号。通常情况下，这并不是很有用。通过在句尾加上一个问号，可以使得字符串重复不再匹配最长字符。
•d{4,5}?表示匹配dddd或者ddddd。也就是和d{4}一样
•colou??r与colou{0,1}r相同，表示找到color或者colour。这与colou?r一样。
•“.*?”表示先匹配一个双引号，然后匹配最少的字符，然后是一个双引号，与上面两个例子不同，这很有用。

选择匹配你可以使用|来分隔可以匹配的不同选择:
•cat|dog表示匹配”cat”或者”dog”
•red|blue|以及red||blue以及|red|blue都表示匹配red或者blue或者一个空字符串
•a|b|c与[abc]相同
•cat|dog||表示匹配”cat”或者”dog”或者一个分隔符”|“
•[cat|dog]表示匹配a或者c或者d或者g或者o或者t或者一个分隔符“|”

练习简化下列正则表达式:
•s|t|u|v|w
•aa|ab|ba|bb
•[abc]|[^abc]
•[^ab]|[^bc]
•[ab][ab][ab]?[ab]?

答案

•[s-w]
•[ab]{2}
•.
•[^b]
•[ab]{2,4}

练习在《时间机器中》找到一对括号中的内容，然后通过修改正则表达式，找到不含括号的内容。
答案.∗. 然后是, [()]∗.

分组可以包括空字符串：
•(red|blue)表示匹配red或者blue或者是一个空字符串
•abc()def与abcdef相同

你也可以在分组的基础上使用重复：
•(red|blue)？与(red|blue|)相同
•w+(s+w+)表示匹配一个或多个由空格分隔的单词

练习简化正则表达式 w+W+w+W+w+ 以及 w+W+w+W+w+W+w+W+w+W+w+.
答案w+(W+w+){2}, w+(W+w+){5}.

单词分隔符在单词和非单词之间有单词分隔符。记住，一个单词w是[0-9A-Za-z_]，而非单词字符是W(大写)，表示[^0-9A-Za-z_].
在文本的开头和结尾通常也有单词分隔符。
在输入文本it’s a cat中，实际有八个单词分隔符。如果我们在cat之后在上一个空格，那就有九个单词分隔符。.
•b表示匹配一个单词分隔符
•bwwwb表示匹配一个三字母单词
•aba表示匹配两个a中间有一个单词分隔符。这个正则表达式永远不会有匹配的字符，无论输入怎样的文本。

单词分隔符本身并不是字符。它们的宽度为0。下列正则表达式的作用不同
•(bcat)b
•(bcatb)
•b(cat)b
•b(catb)

练习在词典中找到最长的单词。
答案在尝试之后发现，b.{45,}b可以在字典中找到最长单词

换行符一篇文本中可以有一行或多行，行与行之间由换行符分隔，比如：
•Line一行文字
•Line break换行符
•Line一行文字
•Line break换行符
•…
•Line break换行符
•Line一行文字

注意，所有的文本都是以一行结束的，而不是以换行符结束。但是，任意一行都可能为空，包括最后一行。
行的起始位置，是在换行符和下一行首字符之间的空间。考虑到单词分隔符，文本的起始位置也可以当做是首行位置。
最后一行是最后一行的尾字符和换行符之间的空间。考虑到单词分隔符，文本的结束也可以认为是行的结束。
那么新的格式表示如下:
•Start-of-line, line, end-of-line
•Line break
•Start-of-line, line, end-of-line
•Line break
•…
•Line break
•Start-of-line, line, end-of-line

基于上述概念:
•^表示匹配行的开始位置
•$表示匹配行的结束位置
•^&表示一个空行
•^.*& 表示匹配全文内容，因为行的开始符号也是一个字符，"."会匹配这个符号。找到单独的一行，可以使用 ^.*?$
•^表示匹配字符串“^
表示匹配字符串“^
”
•[表示匹配一个
]表示匹配一个
。但是，[^]不是合法的正则表达式。记住在方括号中，字符有不同的特殊含义。要想在方括号内匹配^，必须用[^]

与字符分隔符一样，换行符也不是字符。它们宽度为0.如下所示的正则表达式作用不同：
•(^cat)$
•(^cat$)
•^(cat)$
•^(cat$)

练习使用正则表达式在《时间机器》中找到最长的一行。
答案使用正则表达式^.{73,}可以匹配长度为的一行文本分界在很多的正则表达式实现中，将和
可以匹配长度为73的一行文本分界在很多的正则表达式实现中，将和
作为文本的开始符号和结束符号。
还有一些实现中，用A和z作为文本的开始和结束符号。
捕捉和替换从这里开始，正则表达式真正体现出了它的强大。
捕获组你已经知道了使用括号可以匹配一组符号。使用括号也可以捕获子串。假设正则表达式是一个小型计算机程序，那么捕获子串就是它输出的一部分。
正则表达式(w*)ility表示匹配以ility结尾的词。第一个被捕获的部分是由w*控制的。比如，输入的文本内容中有单词accessibility，那么首先被捕获的部分是accessib。如果输入的文本中有单独的ility，则首先被捕获的是一个空字符串。
你可能会有很多的捕获字符串，它们可能靠得很近。捕获组从左向右编号。也就是只需要对左括号计数。
假设有这样的正则表达式：(w+) had a ((w+) w+)
输入的内容是：I had a nice day

•捕获组1：I
•捕获组2：nice day
•捕获组3:nice

在一些正则表达式的实现中，你可以从零开始编号，编号零表示匹配整句话：I had a nice day.
在其他的实现中，如果没有制定捕获组，那么捕获组1会自动地填入捕获组0的信息。
是的，这也意味着会有很多的括号。有一些正则表达式的实现中，提供了“非捕获组”的语法，但是这样的语法并不是标准语法，因此我们不会介绍。
从一个成功的匹配中返回的捕获组个数，与使用原来的正则表达式获得的捕获组个数相同。记住这一点，你可以解释一些奇怪的现象。.
正则表达式（（cat）|dog）表示匹配cat或者dog。这里有两个捕获组，如果输入文本是dog，那么捕获组1是dog,捕获组2为空。
正则表达式a(w)*表示匹配一个以a开头的单词。这里只有一个捕获组
•如果输入文本为a,捕获组1为空。
•如果输入文本为ad,捕获组为d
•如果输入文本为avocado，捕获组1为v。但是捕获组0表示整个单词avocado.

替换假如你使用了一个正则表达式去匹配字符串，你可以描述另外一个字符串来替换其中的匹配字符。用来替换的字符串称为替换表达式。它的功能类似于
•常规的Replace会话
•Java中的String.replace()函数
•PHP的str_replace()函数
•等等

练习将《时间机器》中所有的元音字母替换为r。
答案使用正则表达式[aeiou]以及[AEIOU]，对应的替换字符串分别为r,R.

但是，你可以在替换表达式中引用捕获组。这是在替换表达式中，你可以唯一操作的地方。这也是非常有效的，因为这样你就不用重构你找到的字符串。
假设你正在尝试将美国风格的日期表示MM/DD/YY替换为ISO 8601日期表示YYYY-MM-DD
•从正则表达式(dd)/(dd)/(dd)开始。注意，这其中有三个捕获组：月份，日期和两位的年份。

•.捕获组的内容和捕获组编号之间用反斜杠分隔，因此你的替换表达式应该是203-1-2.
•如果我们输入的文本中包含03/04/05表示2005年3月4日那么：
•捕获组1:03
•捕获组2：04
•捕获组3：05
•替换字符串2005-03-04.

在替换表达式中，你可以多次使用捕获组
•对于双元音，正则表达式为([aeiou])，替换表达式为ll
•在替换表达式中不能使用反斜杠。比如，你在计算机程序中希望使用字符串中使用部分文本。那么，你必须在每个双引号或者反斜杠之前加上反斜杠。

•你的正则表达式可以是([\"])。捕获组1是双引号或者反斜杠
•你的替换表达式应该是\l

在某些实现中，采用美元符号$代替

练习使用正则表达式和替换表达式，将23h59这样的时间戳转化为23:59.
答案正则表达式finds the timestamps, 替换表达式1:2

反向引用在一个正则表达式中，你也可以引用捕获组。这称作：反向引用
比如，[abc]{2}表示匹配aa或者ab或者ac或者ba或者bb或者bc或者ca或者cb或者cc.但是{[abc]}1表示只匹配aa或者bb或者cc.
练习在字典中，找到包含两次重复子串的最长单词，比如papa, coco
b(.{6,})1b 匹配 chiquichiqui.
如果我们不在乎单词的完整性，我们可以忽略单词的分解，使用正则表达式 (.{7,})1匹配countercountermeasure 以及 countercountermeasures.
使用正则表达式编程特别提醒：
过度使用的反斜杠在一些编程语言，比如Java中，对于包含正则表达式的字符串没有特殊标记。字符串有着自己的过滤规则，这是优先于正则表达式规则的，这是频繁使用反斜杠的原因。
比如在Java中
•匹配一个数字，使用的正则表达式从d变为代码中的String re= “\d”
•匹配双引号字符串的正则表达式从"[^"]*" 变为String re = “”[^"]*”"
•匹配反斜杠或者是左边方括号，或者右边方括号的正则表达式从[\[]] 变为String re = “[\\

]”;
•String re = "\s"; 和String re = "[ trn]"; 是等价的. 注意它们实际执行调用时的层次不同。

在其他的编程语言中，正则表达式是由特殊标明的，比如使用/。下面是JavaScript的例子：
•匹配一个数字，d会简单写成 var regExp = /d/;.
•匹配一个反斜杠或者一个左边的方括号或者一个右边的方括号， var regExp = /[\[]]/;
•var regExp = /s/; 和 var regExp = /[ trn]/; 是等价的
•当然，这意味着在使用/时必须重复两次。比如找到URL必须使用var regExp = /https?:///;.

我希望现在你能明白，我为什么让你特别注意反斜杠。
动态正则表达式当你动态创建一个正则表达式的时候请特别小心。如果你使用的字符串不够完善的花，可能会有意想不到的匹配结果。这可能导致语法错误，更糟糕的是，你的正则表达式语法正确，但是结果无法预料。
错误的Java代码：
String sep = System.getProperty(“file.separator”); String[] directories = filePath.split(sep);
Bug:String.split() 认为sep是一个正则表达式。但是，在Windows中，Sep是表示匹配一个反斜杠，也就是与正则表达式”\”相同。这个正则表达式是正确的，但是会返回一个异常：PatternSyntaxException.
任何好的编程语言都会提供一种良好的机制来跳过字符串中所有的元字符。在Java中，你可以这样实现：
String sep = System.getProperty(“file.separator”);
String[] directories = filePath.split(Pattern.quote(sep));
循环中的正则表达式将正则表达式字符串加入反复运行的程序中，是一种开销很大的操作。如果你可以在循环中避免使用正则表达式，你可以大大提高效率。
其他建议输入验证正则表达式可以用来进行输入验证。但是严格的输入验证会使得用户体验较差。比如：
信用卡号在一个网站上，我输入了我的卡号比如 1234 5678 8765 4321 网站拒绝接收。因为它使用了正则表达式d{16}。
正则表达式应该考虑到用户输入的空格和短横线。
实际上，为什么不先过滤掉所有的非数字字符，然后再进行有效性验证呢？这样做，可以先使用D以及空的替换表达式。
练习在不先过滤掉所有的非数字字符的情况下，使用正则表达式验证卡号的正确性。
答案D*(dD*){16} is one of several variations which would accomplish this.

名字不要使用正则表达式来验证姓名。实际上，即使可以，也不要企图验证姓名。
程序员对名字的错误看法:
•名字中不含空格
•名字中没有连接符号
•名字中只会使用ASCII码字符
•名字中出现的字都在特殊字符集中
•名字至少要有M个字的长度
•名字不会超过N个字的长度
•人们只有一个名
•人们只有一个中间名
•人们只有一个姓（最后三条是从英语的人名考虑）

电子邮件地址不要使用正则表达式验证邮箱地址的正确性。
首先，这样的验证很难是精确的。电子邮件地址是可以用正则表达式验证的，但是表达式会非常的长并且复杂。
短的正则表达式会导致错误。（你知道吗？电子邮箱地址中会有一些注释）
第二，即使一个电子邮件地址可以成功匹配正则表达式，也不代表这个邮箱实际存在。邮箱的唯一验证方法，是发送验证邮件。
注意在严格的应用场景中，不要使用正则表达式来解析HTML或者XML。解析HTML或者XML：
1.使用简单的正则表达式不能完成
2.总体来说非常困难
3.已经有其他的方法解决

找到一个已经有的解析库来完成这个工作
这就是55分钟的全部内容总结：
•字符: a b c d 1 2 3 4 etc.
•字符类: . [abc] [a-z] d w s
•. 代表任何字符
•d 表示“数字”
•w 表示”字母”, [0-9A-Za-z_]
•s 表示 “空格, 制表符,回车或换行符”
•否定字符类: [^abc] D W S

•重复: {4} {3,16} {1,} ? * +
•? 表示 “零次或一次”
•* 表示 “大于零次”
•+ 表示 “一次或一次以上”
•如果不加上？，所有的重复都是最长匹配的（贪婪）

•分组: (Septem|Octo|Novem|Decem)ber
•词，行以及文本的分隔: b ^ $ A z
•转义字符: 1 2 3 etc. (在匹配表达式和替换表达式中都可用)

•元字符: . [ ] { } ? * + | ( ) ^ $
•在字符类中使用元字符: [ ] - ^
•使用反斜杠可以忽略元字符:

致谢正则表达式非常常用而且非常有用。每个人在编辑文本或是编写程序时都必须了解怎样使用正则表达式。
练习选择正则表达式的某种实现，阅读相关文档。我保证，你会学到更多。
本文来自: 人大经济论坛 R语言论坛版，详细出处参考： http://bbs.pinggu.org/forum.php?mod=viewthread&tid=3285884&page=1

你可能感兴趣的:(R语言)

【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
R语言标准普尔500指数Garch(1,1)模型 ronghuilin
一、例3.3标准普尔500指数的月超额收益率，从1926年开始，共792个观察值，如图所示。记rt为超额收益率，rt的样本ACF和rt2的样本PACF。在间隔为1，3时有少许序列相关性，但主要特征是平方序列显示的强烈线性相关性。例题建立garch(1,1)模型的过程：（1）应用arma(p,q)模型消除数据的线性依赖（2）在arma(p,q)模型基础上，建立garch(1,1)模型（3）改进g
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
学习小组Day4笔记--王英芳一万万万万
R语言基础准备工作电脑用户名需要是英文R基础，Rstudio人性化界面资源Rfordatasciencechapter1下载RandRstudio给自己一个全新的R语言环境R是什么一种变成语言，统计计算和绘图的环境，汇集了许多函数，强大分析功能。图形界面Rstudio开源集成开发环境IDE4个板块，脚本编辑器，控制台（脚本运行，结果显示），environment（对象/变量列表）history，文
R语言基础笔记 waterHBO r语言笔记开发语言
起因:今天不知道要写什么。把之前的笔记复制一下。代码开头，导入:#清除系统变量rm(list=ls())#隐藏警告信息:options(warn=-1)#把当前目录，设置为工作目录。library(rstudioapi)current_folder_path0.0&ideology<10.0)分组聚合，类似groupby()df2<-aggregate(df1KaTeXparseerror:Exp
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
生态位宽度计算&可视化展示（R语言）光疏介质 r语言
生态位宽度是指物种（或其它生物单位）在群落中所利用的各种不同资源的总和。物种的生态位越宽，该物种的特化程度就越小，倾向于泛化种（generalistspecies）；物种的生态位越窄，倾向于是一个特化种（specialistsspecies）。本篇所使用为生态位宽度指数即**Levins的生态位宽度指数。**（除此之外也有用shannon指数）#安装并加载必要的包if(!requireNamesp
R语言多项逻辑回归-因变量是无序多分类医学和生信笔记医学统计学 r语言医学统计学
因变量是无序多分类资料（＞2）时，可使用多分类逻辑回归（multinomiallogisticregression）。使用课本例16-5的数据，课本电子版及数据已上传到QQ群，自行下载即可。某研究人员欲了解不同社区和性别之间居民获取健康知识的途径是否相同，对2个社区的314名成人进行了调查，其中X1是社区，社区1用0表示，社区2用1表示；X2是性别，0是男，1是女，Y是获取健康知识途径，1是传统大
Protocol Buffer编译器安装雪域迷影
本文翻译自ProtocolBufferCompilerInstallationProtocolBufferCompilerInstallation如何安装protocolbuffer编译器尽管不是强制性的，但gRPC应用程序通常利用ProtocolBuufer来进行服务定义和数据序列化。该站点上的大多数示例代码都使用protocolbuffer语言（proto3）的版本3。protocolbuff
R语言自学笔记-2内置数据集实验室长工
#b站视频——R语言入门与数据分析#内置数据集#固定格式的数据（矩阵、数据框或一个时间序列等）#统计建模、回归分析等试验需要找合适的数据集#R内置数据集，存储在，通过help(package="datasets")#通过data函数访问这些数据集data()#得到新窗口前面：数据集名字后面：内容#包含R所有用到的数据类型，包括：向量、矩阵、列表、因子、数据框以及时间序列等#直接输入数据集的名字就可
在TCGA上下载数据并且进行处理 Red Red 生信小技巧 r语言数据库
浏览器搜索TCGAGDC进入网站在TCGA数据库主页选择“Repository”模式根据所需要的选项在侧边栏选择数据清空购物车！！第一次登陆可忽略将刚刚选择好的数据加入购物车，并且在购物车里下载Metadata和Cart数据，下载到同一个文件夹下。使用R语言脚本对数据进行处理，将其提取为genesymbol和样本的数据，推荐看一下该博主处理数据！！真的非常详细！他R语言脚本在这个链接里
R语言-非结构化数据-文本数据读入 pdc31czy R r语言数据分析
#2.2.2非结构化数据-文本数据读入rm(list=ls())#清空工作空间##1.读入简单文本数据###假如数据包含大量经过结构化的文本数据#只需按照读入csv等标准式数据的方法读入#例：novel=read.csv("novel.csv",fileEncoding="UTF-8")head(novel)##2.用readtable读入文本###文本数据普通读法test=read.table(
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
r语言做绘制精美pcoa图_R语言高级绘图 — ggplot2 weixin_39560002 r语言做绘制精美pcoa图
2)PCA的作图PCA主成分分析，可以将高维数据进行降维处理。我们的OTU表格就是典型的高维数据，可以对其进行降维处理得到主成分PC1和PC2，然后将所有样品都分解到这两个成分方向，进行散点绘图，可以直观的看出样品间的差异。首先需要一系列的统计处理，然后用ggplot2进行绘图，过程如下：#加载需要的三个包(需要先下载，再加载)>library(ade4)>library(ggplot2)>lib
科研绘图系列：R语言扩展物种堆积图（Extended Stacked Barplot）生信学习者1 SCI科研绘图系列 r语言数据可视化数据分析
介绍R语言的扩展物种堆积图是一种数据可视化工具，它不仅展示了物种的堆积结果，还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异，为研究者提供了一种有效的数据解读方式。加载R包knitr::opts_chunk$set(warning=F,message=F)library(tidyverse)library(phyloseq)library(g
科研绘图系列：R语言柱状图分布（histogram plot）生信学习者1 SCI科研绘图系列 r语言数据可视化
文章目录介绍加载R包读取数据画图介绍柱状图（BarChart）是一种常用的数据可视化图表，用于展示和比较不同类别或组的数据。它通过在二维平面上绘制一系列垂直或水平的柱子来表示数据的大小，每个柱子的长度或高度代表一个数据点的数值。柱状图非常适合于展示分类数据的分布和比较。柱状图的特点：直观比较：柱状图可以直观地展示不同类别之间的数值比较，易于理解。分类展示：数据按照类别或组别进行分组展示，每个类别用
科研绘图系列：R语言富集散点图（enrichment scatter plot）生信学习者1 SCI科研绘图系列 r语言数据可视化
介绍富集通路散点图（EnrichmentPathwayScatterPlot）是一种数据可视化工具，用于展示基因集富集分析（GeneSetEnrichmentAnalysis,GSEA）的结果。横坐标是对应基因名称，纵坐标是通路名称，图中的点表示该基因在某个通路下的qvalue，可以简单理解为不同环境下的贡献大小。加载R包导入所需要的R包，在导入前需要用户自己安装。library(readxl)l
Python-Matplotlib安装及简单使用 riyuexingchen0909 python python 图形
在使用NumPy进行学习统计计算时是枯燥的，大量的数据令我们很头疼，所以我们需要把它图形化显示。Matplotlib是一个Python的图形框架，类似于MATLAB和R语言。Matplotlib的官网地址是http://matplotlib.org/，下载地址为http://matplotlib.org/downloads.html，选择对应的版本即可安装，我选择的版本为matplotlib-1.
sublime安装python库_Mac OS 轻松用 Sublime Text 3 配置Python编译环境 weixin_39603397
最近在学习数据分析相关的知识，对比Python和R语言在数据分析领域的优劣，Python更胜一筹。要学习Python，首先需要搭建编译环境。一.编译工具的选择Python的编译工具有两种，1.文本编辑器，SublimeText3,(还有vim,VistualStudioCode),此处重点介绍SublimeText32.集成开发环境(IDE),主要有pycharmpython，iclipsepyt
在linux（ubuntu）中使用网页版的rstudio Chao_Powell_Hou
RStudio是R语言集成开发环境的应用软件，RStudioServer是一个基于web访问的RStudio云端开发环境，需要安装在服务器上，支持多用户远程访问使用。可以在网页端打开，而且界面与windows版本的相同。安装就先不说了，挺简单的。安装完成后输入rstudio-server可以看到相应的指令。image.png为了激活，我们输入rstudio-serverstart，就已经激活了。但
推荐一份生物信息学入门很好的参考材料小明的数据分析笔记本
链接是https://bioinformatics.uconn.edu/resources-and-events/tutorials-2/这个是康涅狄格大学（UniversityofConnecticut）提供的一份教程，主要的内容包括1、生物信息学中经常用到的文件格式image.png2、linux操作系统和R语言的基础知识image.png3、转录组数据的处理流程image.png这里包括有参
R语言基础学习 weixin_55475210 r语言学习开发语言
R与RStudioR语言是数据科学和统计分析的语言，适合数据分析和数据可视化。R是开源的，拥有丰富的包（packages），可以与优化软件进行交互。RStudio提供了R语言的集成开发环境，支持代码编辑、运行、调试等功能。下载R：CRAN下载RStudio：RStudioDownloadRStudio界面基本操作保存/打开代码文件使用.R扩展名。保存/打开环境文件使用.Rdata扩展名。快捷键操作
学习小组Day5笔记--森蝶松风
数据结构Day5+数据结构.png新手注意事项1.R的赋值符号不是等号，而是<-2.在Console控制台输入命令，相当于Linux的命令行3.R的代码都是带括号的，括号必须是英文的。4.显示工作路径getwd()5.向量是由元素组成的，元素可以是数字或者字符串。6.表格在R语言中改名叫数据框7.函数或者命令不会用时，除了百度/谷歌搜索以外，用这个命令查看帮助：?read.table，调出对应的帮
学习小组Day6笔记--魏麻将魏麻将
R包什么？R包是R函数，编码和样本数据的集合，它们存储在R环境中的名为“library”的目录下。默认情况下，R在安装过程中安装一组软件包。当需要某些特定的目的时，也可根据需要添加更多的包。当我们启动R控制台时，默认情况下只有默认软件包可用。已经安装的其他软件包必须明确加载才能被要使用的R程序使用。注意：学生信，R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。安装和加载R
centos7 r语言安装_centos7 R-4.0.2 安装 weixin_39777404 centos7 r语言安装
tar-zvxfR-4.0.2.tar.gzcdR-*yuminstall-ygccyuminstall-ygcc-gfortranyuminstall-ygcc-c++yuminstall-yglibc-headersyuminstall-ylibreadline6-devgfortranyuminstall-yreadline-develyuminstall-ywgetlibXt-devely
linux下载R语言失败,[已解决]CentOS7下安装rjags失败 installation of package ‘rjags’ had non-zero exit status... 宁静致远敏 linux下载R语言失败
问题CentOS7下安装rjags失败installationofpackage‘rjags’hadnon-zeroexitstatus详细报错>install.packages("gbs2ploidy",dependencies=TRUE)alsoinstallingthedependency‘rjags’tryingURL'https://cran.rstudio.com/src/contri
Centos 安装R语言环境 3.6 118路司机 R CentOS centos r语言 python
前言目前R语言最新版已经是4.0以上了，所以安装旧版本可以通过下载源码方式安装。源码地址https://cran.r-project.org/src/base/R-3/步骤1.下载源码wgethttps://cran.r-project.org/src/base/R-3/R-3.6.3.tar.gz2.解压tar-zxvfR-3.6.3.tar.gzcdR-3.6.33.配置安装目录mkdir/u
R语言使用rpart包构建决策树模型实战、使用prune函数按照指定复杂度对决策树剪枝、使用rpart.plot包中的prp函数可视化训练、剪枝好的决策树 statistics.insight r语言决策树数据挖掘机器学习
R语言使用rpart包构建决策树模型实战、使用prune函数按照指定复杂度对决策树剪枝、使用rpart.plot包中的prp函数可视化训练、剪枝好的决策树、type参数、extra参数、fallen.leaves参数控制决策树精细化显示目录R语言使用rpart包构建决策树模型、使用prune函数按照指定复杂度对决策树剪枝、使用rpart.plot包中的prp函数可视化训练、剪枝好的决策树、type
r语言变量长度不一致怎么办_C语言，C++常见编译错误 weixin_39624094 r语言变量长度不一致怎么办
fatalerrorC1003:errorcountexceedsnumber;stoppingcompilation中文对照：错误太多，停止编译分析：修改之前的错误，再次编译fatalerrorC1004:unexpectedendoffilefound中文对照：文件未结束分析：一个函数或者一个结构定义缺少“}”、或者在一个函数调用或表达式中括号没有配对出现、或者注释符“”不完整等fataler
科研绘图系列：R语言单细胞差异基因四分图（Quad plot）生信学习者2 R语言可视化 r语言数据分析数据挖掘
介绍在单细胞分析领域，为了探究不同分组间同一细胞类型的基因表达差异，研究者们常采用四分图（QuadPlot）作为分析工具。该图形的横轴代表比较组1，而纵轴代表比较组2。通过这种布局，四分图能够有效地展示两组间共有的差异表达基因，从而为深入理解细胞类型在不同条件下的分子特性提供直观的视角。这种可视化方法不仅揭示了组间基因表达的异同，还有助于识别可能在生物学过程或疾病发生中起关键作用的基因。加载R包导
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源