th936

python正则表达式

关于python正则表达式的一篇入门文章，很有用，所以转过来了

原文出处：http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

本文介绍了Python对于正则表达式的支持，包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式，这些主题请查看其他教程。

注意：本文基于Python2.4完成；如果看到不明白的词汇请记得百度谷歌或维基，whatever。

尊重作者的劳动，转载请注明作者及原文地址

1. 正则表达式基础

1.1. 简单介绍

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式，只需要简单看一看就可以上手了。

下图展示了使用正则表达式进行匹配的流程：
re_simple

正则表达式的大致匹配过程是：依次拿出表达式和文本中的字符比较，如果每一个字符都能匹配，则匹配成功；一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界，这个过程会稍微有一些不同，但也是很好理解的，看下图中的示例以及自己多使用几次就能明白。

下图列出了Python支持的正则表达式元字符和语法：
pyre

1.2. 数量词的贪婪模式与非贪婪模式

正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的（在少数语言里也可能是默认非贪婪），总是尝试匹配尽可能多的字符；非贪婪的则相反，总是尝试匹配尽可能少的字符。例如：正则表达式"ab*"如果用于查找"abbbc"，将找到"abbb"。而如果使用非贪婪的数量词"ab*?"，将找到"a"。

1.3. 反斜杠的困扰

与大多数编程语言相同，正则表达式里使用"\"作为转义字符，这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\"：前两个和后两个分别用于在编程语言里转义成反斜杠，转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题，这个例子中的正则表达式可以使用r"\\"表示。同样，匹配一个数字的"\\d"可以写成r"\d"。有了原生字符串，你再也不用担心是不是漏写了反斜杠，写出来的表达式也更直观。

1.4. 匹配模式

正则表达式提供了一些可用的匹配模式，比如忽略大小写、多行匹配等，这部分内容将在Pattern类的工厂方法re.compile(pattern[, flags])中一起介绍。

2. re模块

2.1. 开始使用re

Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例，然后使用Pattern实例处理文本并获得匹配结果（一个Match实例），最后使用Match实例获得信息，进行其他的操作。

   
   
   
   
    
    
    
    # encoding: UTF-8 
    
    
    
    import re 
    
    
    
      
    
    
    
    # 将正则表达式编译成Pattern对象 
    
    
    
    pattern = re.compile(r'hello') 
    
    
    
      
    
    
    
    # 使用Pattern匹配文本，获得匹配结果，无法匹配时将返回None 
    
    
    
    match = pattern.match('hello world!') 
    
    
    
      
    
    
    
    if match: 
    
    
    
        # 使用Match获得分组信息 
    
    
    
        print match.group() 
    
    
    
      
    
    
    
    ### 输出 ### 
    
    
    
    # hello

re.compile(strPattern[, flag]):

这个方法是Pattern类的工厂方法，用于将字符串形式的正则表达式编译为Pattern对象。第二个参数flag是匹配模式，取值可以使用按位或运算符'|'表示同时生效，比如re.I | re.M。另外，你也可以在regex字符串中指定模式，比如re.compile('pattern', re.I | re.M)与re.compile('(?im)pattern')是等价的。
可选值有：

re.I(re.IGNORECASE): 忽略大小写（括号内是完整写法，下同）
M(MULTILINE): 多行模式，改变'^'和'$'的行为（参见上图）
S(DOTALL): 点任意匹配模式，改变'.'的行为
L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释。以下两个正则表达式是等价的：

  
  
  
  
   
   
   
   a = re.compile(r"""\d +  # the integral part 
   
   
   
                      \.    # the decimal point 
   
   
   
                      \d *  # some fractional digits""", re.X) 
   
   
   
   b = re.compile(r"\d+\.\d*")

re提供了众多模块方法用于完成正则表达式的功能。这些方法可以使用Pattern实例的相应方法替代，唯一的好处是少写一行re.compile()代码，但同时也无法复用编译后的Pattern对象。这些方法将在Pattern类的实例方法部分一起介绍。如上面这个例子可以简写为：

  
  
  
  
   
   
   
   m = re.match(r'hello', 'hello world!') 
   
   
   
   print m.group()

re模块还提供了一个方法escape(string)，用于将string中的正则表达式元字符如*/+/?等之前加上转义符再返回，在需要大量匹配元字符时有那么一点用。

2.2. Match

Match对象是一次匹配的结果，包含了很多关于此次匹配的信息，可以使用Match提供的可读属性或方法来获取这些信息。

属性：

string: 匹配时使用的文本。
re: 匹配时使用的Pattern对象。
pos: 文本中正则表达式开始搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
endpos: 文本中正则表达式结束搜索的索引。值与Pattern.match()和Pattern.seach()方法的同名参数相同。
lastindex: 最后一个被捕获的分组在文本中的索引。如果没有被捕获的分组，将为None。
lastgroup: 最后一个被捕获的分组的别名。如果这个分组没有别名或者没有被捕获的分组，将为None。

方法：

group([group1, …]):
获得一个或多个分组截获的字符串；指定多个参数时将以元组形式返回。group1可以使用编号也可以使用别名；编号0代表整个匹配的子串；不填写参数时，返回group(0)；没有截获字符串的组返回None；截获了多次的组返回最后一次截获的子串。
groups([default]):
以元组形式返回全部分组截获的字符串。相当于调用group(1,2,…last)。default表示没有截获字符串的组以这个值替代，默认为None。
groupdict([default]):
返回以有别名的组的别名为键、以该组截获的子串为值的字典，没有别名的组不包含在内。default含义同上。
start([group]):
返回指定的组截获的子串在string中的起始索引（子串第一个字符的索引）。group默认值为0。
end([group]):
返回指定的组截获的子串在string中的结束索引（子串最后一个字符的索引+1）。group默认值为0。
span([group]):
返回(start(group), end(group))。
expand(template):
将匹配到的分组代入template中然后返回。template中可以使用\id或\g<id>、 \g<name>引用分组，但不能使用编号0。\id与\g<id>是等价的；但\10将被认为是第10个分组，如果你想表达 \1之后是字符'0'，只能使用\g<1>0。

  
  
  
  
   
   
   
   import re 
   
   
   
   m = re.match(r'(\w+) (\w+)(?P<sign>.*)', 'hello world!') 
   
   
   
     
   
   
   
   print "m.string:", m.string 
   
   
   
   print "m.re:", m.re 
   
   
   
   print "m.pos:", m.pos 
   
   
   
   print "m.endpos:", m.endpos 
   
   
   
   print "m.lastindex:", m.lastindex 
   
   
   
   print "m.lastgroup:", m.lastgroup 
   
   
   
     
   
   
   
   print "m.group(1,2):", m.group(1, 2) 
   
   
   
   print "m.groups():", m.groups() 
   
   
   
   print "m.groupdict():", m.groupdict() 
   
   
   
   print "m.start(2):", m.start(2) 
   
   
   
   print "m.end(2):", m.end(2) 
   
   
   
   print "m.span(2):", m.span(2) 
   
   
   
   print r"m.expand(r'\2 \1\3'):", m.expand(r'\2 \1\3') 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # m.string: hello world! 
   
   
   
   # m.re: <_sre.SRE_Pattern object at 0x016E1A38> 
   
   
   
   # m.pos: 0 
   
   
   
   # m.endpos: 12 
   
   
   
   # m.lastindex: 3 
   
   
   
   # m.lastgroup: sign 
   
   
   
   # m.group(1,2): ('hello', 'world') 
   
   
   
   # m.groups(): ('hello', 'world', '!') 
   
   
   
   # m.groupdict(): {'sign': '!'} 
   
   
   
   # m.start(2): 6 
   
   
   
   # m.end(2): 11 
   
   
   
   # m.span(2): (6, 11) 
   
   
   
   # m.expand(r'\2 \1\3'): world hello!

2.3. Pattern

Pattern对象是一个编译好的正则表达式，通过Pattern提供的一系列方法可以对文本进行匹配查找。

Pattern不能直接实例化，必须使用re.compile()进行构造。

Pattern提供了几个可读属性用于获取表达式的相关信息：

pattern: 编译时用的表达式字符串。
flags: 编译时用的匹配模式。数字形式。
groups: 表达式中分组的数量。
groupindex: 以表达式中有别名的组的别名为键、以该组对应的编号为值的字典，没有别名的组不包含在内。

  
  
  
  
   
   
   
   import re 
   
   
   
   p = re.compile(r'(\w+) (\w+)(?P<sign>.*)', re.DOTALL) 
   
   
   
     
   
   
   
   print "p.pattern:", p.pattern 
   
   
   
   print "p.flags:", p.flags 
   
   
   
   print "p.groups:", p.groups 
   
   
   
   print "p.groupindex:", p.groupindex 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # p.pattern: (\w+) (\w+)(?P<sign>.*) 
   
   
   
   # p.flags: 16 
   
   
   
   # p.groups: 3 
   
   
   
   # p.groupindex: {'sign': 3}

实例方法[ | re模块方法]：

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):
这个方法将从string的pos下标处起尝试匹配pattern；如果pattern结束时仍可匹配，则返回一个Match对象；如果匹配过程中pattern无法匹配，或者匹配未结束就已到达endpos，则返回None。
pos和endpos的默认值分别为0和len(string)；re.match()无法指定这两个参数，参数flags用于编译pattern时指定匹配模式。
注意：这个方法并不是完全匹配。当pattern结束时若string还有剩余字符，仍然视为成功。想要完全匹配，可以在表达式末尾加上边界匹配符'$'。
示例参见2.1小节。
search(string[, pos[, endpos]]) | re.search(pattern, string[, flags]):
这个方法用于查找字符串中可以匹配成功的子串。从string的pos下标处起尝试匹配pattern，如果pattern结束时仍可匹配，则返回一个Match对象；若无法匹配，则将pos加1后重新尝试匹配；直到pos=endpos时仍无法匹配则返回None。
pos和endpos的默认值分别为0和len(string))；re.search()无法指定这两个参数，参数flags用于编译pattern时指定匹配模式。

  
  
  
  
   
   
   
   # encoding: UTF-8 
   
   
   
   import re 
   
   
   
     
   
   
   
   # 将正则表达式编译成Pattern对象 
   
   
   
   pattern = re.compile(r'world') 
   
   
   
     
   
   
   
   # 使用search()查找匹配的子串，不存在能匹配的子串时将返回None 
   
   
   
   # 这个例子中使用match()无法成功匹配 
   
   
   
   match = pattern.search('hello world!') 
   
   
   
     
   
   
   
   if match: 
   
   
   
       # 使用Match获得分组信息 
   
   
   
       print match.group() 
   
   
   
     
   
   
   
   ### 输出 ### 
   
   
   
   # world

3.split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]):
按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数，不指定将全部分割。

  
  
  
  
   
   
   
   import re 
   
   
   
     
   
   
   
   p = re.compile(r'\d+') 
   
   
   
   print p.split('one1two2three3four4') 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # ['one', 'two', 'three', 'four', '']

4.findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]):
搜索string，以列表形式返回全部能匹配的子串。

  
  
  
  
   
   
   
   import re 
   
   
   
     
   
   
   
   p = re.compile(r'\d+') 
   
   
   
   print p.findall('one1two2three3four4') 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # ['1', '2', '3', '4']

5.finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags]):
搜索string，返回一个顺序访问每一个匹配结果（Match对象）的迭代器。

  
  
  
  
   
   
   
   import re 
   
   
   
     
   
   
   
   p = re.compile(r'\d+') 
   
   
   
   for m in p.finditer('one1two2three3four4'): 
   
   
   
       print m.group(), 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # 1 2 3 4

6.sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]):
使用repl替换string中每一个匹配的子串后返回替换后的字符串。
当repl是一个字符串时，可以使用\id或\g<id>、\g<name>引用分组，但不能使用编号0。
当repl是一个方法时，这个方法应当只接受一个参数（Match对象），并返回一个字符串用于替换（返回的字符串中不能再引用分组）。
count用于指定最多替换次数，不指定时全部替换。

  
  
  
  
   
   
   
   import re 
   
   
   
     
   
   
   
   p = re.compile(r'(\w+) (\w+)') 
   
   
   
   s = 'i say, hello world!' 
   
   
   
     
   
   
   
   print p.sub(r'\2 \1', s) 
   
   
   
     
   
   
   
   def func(m): 
   
   
   
       return m.group(1).title() + ' ' + m.group(2).title() 
   
   
   
     
   
   
   
   print p.sub(func, s) 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # say i, world hello! 
   
   
   
   # I Say, Hello World!

7.subn(repl, string[, count]) |re.sub(pattern, repl, string[, count]):
返回 (sub(repl, string[, count]), 替换次数)。

  
  
  
  
   
   
   
   import re 
   
   
   
     
   
   
   
   p = re.compile(r'(\w+) (\w+)') 
   
   
   
   s = 'i say, hello world!' 
   
   
   
     
   
   
   
   print p.subn(r'\2 \1', s) 
   
   
   
     
   
   
   
   def func(m): 
   
   
   
       return m.group(1).title() + ' ' + m.group(2).title() 
   
   
   
     
   
   
   
   print p.subn(func, s) 
   
   
   
     
   
   
   
   ### output ### 
   
   
   
   # ('say i, world hello!', 2) 
   
   
   
   # ('I Say, Hello World!', 2)

以上就是Python对于正则表达式的支持。熟练掌握正则表达式是每一个程序员必须具备的技能，这年头没有不与字符串打交道的程序了。笔者也处于初级阶段，与君共勉，^_^

另外，图中的特殊构造部分没有举出例子，用到这些的正则表达式是具有一定难度的。有兴趣可以思考一下，如何匹配不是以abc开头的单词，^_^

全文结束

新手必看：TikTok卖家中心实用指南，附2025最新TikTok入驻教程菠萝派爱跨境人工智能网络大数据
对于跨境电商来说，TikTok卖家中心是一个强大的工具，它能够帮助卖家轻松管理产品、订单、数据和广告。然而，对于初次接触这个平台的卖家来说，如何入驻并高效使用，成为了一大难题。本篇文章将为您详细讲解TikTok卖家中心的使用方法及最新的入驻教程。一、入驻教程1.入驻前准备（1）TikTok的商业账号。（2）入驻材料：营业执照（或身份证明）、国际收款账户（如Payoneer）、物流和退货地址、产品清
《Stable Diffusion绘画完全指南：从入门到精通的Prompt设计艺术》第一章 Allen-Steven python相关应用 SD 创作实践 stable diffusion prompt 人工智能
第一章：认识StableDiffusion与Prompt设计基础1.1什么是StableDiffusion：生成原理与核心优势一、颠覆性生成逻辑：从噪声到艺术的魔法逆向降噪原理传统AI绘画：直接生成完整像素StableDiffusion：通过潜扩散模型（LDM），在低维潜空间（LatentSpace）逐步去除噪声，最终解码为高清图像类比解释：如同雕塑家从混沌的大理石中凿出形体，AI在噪声中「雕刻」
基于华为云镜像加速器的Docker环境搭建与项目部署指南阿俊仔（摸鱼版）云服务器管理实操华为云 docker 容器服务器
基于华为云镜像加速器的Docker环境搭建与项目部署指南一、安装Docker1.1更新系统包1.2安装必要的依赖包1.3移除原有的Docker仓库配置（如果存在）1.4添加华为云Docker仓库1.5安装DockerCE1.6启动Docker服务1.7验证Docker是否安装成功1.8添加华为云镜像加速器地址二、拉取NginxDocker镜像三、上传项目文件并解压四、启动Docker容器运行项目4
《Stable Diffusion绘画完全指南：从入门到精通的Prompt设计艺术》第三章 Allen-Steven python相关应用 SD 创作实践 stable diffusion prompt 人工智能
第三章：风格化Prompt专题解析3.1写实类：照片级细节的刻画技巧一、物理仿真引擎构建#写实类Prompt标准模板{"主体描述":"精确物种/型号/品牌（如：Mercedes-AMGGTBlackSeries2025款）","材质系统":[ "PBR材质规范（金属度/粗糙度/法线贴图）", "表面瑕疵（划痕0.2级，灰尘密度0.5）"],"光学系统":[ "镜头参数：佳能RF85mmf/1.2L
企业数字化转型：私有化部署办公软件的精选推荐
在数字化办公日益盛行的今天，企业对数据安全、定制化需求及成本控制的要求日益提高，私有化部署成为众多企业的首选。私有化部署不仅能够有效保障企业数据的安全性，还能根据企业的实际业务流程进行深度定制，提升工作效率。同时，在长期使用中，私有化部署在成本控制上可能更具优势。本文将深入探讨适用于私有化部署的办公软件，为企业决策者提供一份精选指南。一、私有化部署办公软件的重要性数据安全数据是企业的核心资产，私有
使用Python爬虫获取淘宝订单商品接口的全面指南 JelenaAPI小小爬虫 API Python python 爬虫数据库
引言淘宝作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于开发者来说，获取淘宝订单商品接口是一个常见的需求。本文将介绍如何使用Python编写爬虫，获取淘宝订单商品信息。一、淘宝订单商品接口概览淘宝提供了多个与订单相关的API接口，以下是几个主要的接口：订单详情API接口：taobao.trade.fullinfo.get：获取订单的详细信息，包括订单状态、支付信息、物流信息等。订单批
利用Java爬虫按图搜索1688商品（拍立淘）：实战案例指南数据小小爬虫 java 爬虫图搜索算法
在电商领域，按图搜索功能（如1688的“拍立淘”）为用户提供了更直观、便捷的购物体验。通过上传图片，用户可以快速找到与图片相似的商品。本文将详细介绍如何利用Java爬虫技术实现按图搜索1688商品，并获取其详情数据。一、为什么选择Java爬虫？Java作为一种广泛使用的编程语言，以其稳健性和跨平台性在企业级应用中占据重要地位。通过Java，我们可以编写爬虫程序，模拟浏览器行为，从网页中提取所需的数
使用爬虫获取按图搜索1688商品（拍立淘）案例指南数据小小爬虫爬虫图搜索算法算法
在电商领域，按图搜索功能（如1688的“拍立淘”）为用户提供了更直观、便捷的购物体验。通过上传图片，用户可以快速找到与图片相似的商品。本文将详细介绍如何利用爬虫技术实现按图搜索1688商品，并获取其详情数据。一、技术背景按图搜索功能通常依赖于图像识别技术和搜索引擎。1688的“拍立淘”功能允许用户上传图片，系统会通过图像识别技术找到与上传图片相似的商品。通过爬虫技术，我们可以模拟这一过程，获取搜索
Spring Boot全局异常处理终极指南：从青铜到王者的实战演进没什么技术 java spring boot 后端 java
一、为什么需要全局异常处理？在用户中心这类核心服务中，优雅的异常处理是系统健壮性的生命线。未处理的异常会导致：服务雪崩：单点异常扩散到整个系统（✖️）信息泄露：暴露敏感堆栈信息（）体验灾难：前端收到不可读的错误格式（）排查困难：缺乏关键错误上下文（）通过全局异常处理器，我们可以实现：✅统一错误响应格式✅集中管理错误码✅自动记录关键日志✅防止敏感信息泄露二、全局异常处理器核心实现1.基础骨架代码解析
C语言——指针基础知识 Hello_O. c语言开发语言
引言指针（Pointer）是C语言中最核心、最强大的特性之一，也是许多初学者的“拦路虎”。它直接操作内存地址的能力，赋予了C语言高效灵活的特性，但也带来了潜在的风险。理解指针的底层逻辑和正确使用方式，是掌握C语言的关键一步。本文将以通俗易懂的方式，结合代码示例，系统讲解指针的基础概念、运算规则、常见应用场景及避坑指南。一、指针是什么？1.内存地址与指针变量内存地址：计算机内存被划分为连续的存储单元
团队领导者指南：如何选择和应用项目管理方法论项目管理软件
项目管理方法论是用于规划、执行和控制项目的系统化框架和流程。不同的方法论适用于不同类型的项目和团队需求。以下是几种常见的项目管理方法论：1.瀑布模型(Waterfall)●特点:线性顺序的项目管理方法，项目分为多个阶段（如需求分析、设计、开发、测试、部署），每个阶段完成后才能进入下一个阶段。●适用场景:需求明确、变更较少的项目，如建筑、制造业等。●优点:结构清晰，易于理解和执行。●缺点:缺乏灵活性
【C++指南】解锁C++ STL：从入门到进阶的技术之旅倔强的石头_ C++指南 c++开发语言
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：《C++指南》期待您的关注目录一、STL是什么二、STL的核心组件2.1容器（Containers）2.2算法（Algorithms）2.3迭代器（Iterators）2.4其他组件三、STL的优势3.1高效开发3.2高性能3.3泛型与可扩展性3.4代码简洁与可维护性3.5跨平台兼容性四、结语一、STL是什么S
kotlin-kapt yzpyzp kotlin android
kotlin-kaptkotlin-kapt是Kotlin的一个插件，专门用于处理注解处理器（AnnotationProcessor）。以下是对该插件的详细解释和指南：kotlin-kapt是什么？kotlin-kapt是Kotlin官方提供的一个插件，用于在Kotlin项目中支持注解处理。KAPT（KotlinAnnotationProcessingTool）是JavaAPT（Annotatio
使用Spring Boot开发后端应用：在IntelliJ IDEA中的实践指南风亦辰739 后端 spring boot java intellij-idea
一、什么是SpringBoot？SpringBoot是一个开源框架，用于简化Java应用的构建过程，尤其是Web应用。它是基于Spring框架的，提供了许多开箱即用的功能，极大地简化了Spring应用的配置和开发过程。SpringBoot让开发者无需关注繁琐的配置，可以专注于业务逻辑的实现。SpringBoot的优势：自动配置：SpringBoot根据项目的依赖自动配置相关功能，避免手动配置繁琐的
Python库房管理系统开发指南 Tech Synapse python 开发语言
在现代仓储管理中，高效、准确的信息系统是提高运营效率的关键。Python作为一种强大且易于学习的编程语言，非常适合用来开发简易而功能齐全的库房管理系统。本文将详细介绍如何使用Python编写一个基本的库房管理系统，包括商品入库、出库、查询库存及生成报表等功能。通过本文，读者不仅能学习到Python编程技巧，还能理解库房管理系统的基本架构和逻辑。一、系统需求分析在开发库房管理系统之前，我们需要明确系
HoRain云--Teledb表分析与碎片处理实战指南：快速提升数据库性能 HoRain云小助手数据库
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
解锁全方位健康生活指南，拥抱元气日常 yy0821yy 生活
在追求美好生活的道路上，健康是我们最坚实的后盾。想要拥有活力满满的人生，就得从生活的各个角落入手，解锁全方位的健康密码。饮食是健康的基石。日常饮食中，要确保食物种类丰富多样，像富含蛋白质的鸡蛋、牛奶，为身体修复和生长提供原料；新鲜的果蔬，比如橙子、西兰花，满满都是维生素和矿物质，帮我们提升免疫力。同时，我们要学会给饮食做减法，拒绝高油、高盐、高糖的食物，比如油炸食品、腌制咸菜、奶茶等，这些食物不仅
Python环境搭建与量化交易开发入门指南量化投资技术量化科普 Python 量化 miniQMT QMT 量化交易量化投资
Python环境搭建与量化交易开发入门指南在量化交易领域，Python因其强大的数据处理能力和丰富的库支持而成为首选编程语言。本文将指导您如何在本地搭建一个适合量化交易的Python环境，并介绍一些常用的代码编辑器和工具。《QMT开通规则分享》更多内容，知识星球搜索：数据与交易Python安装方式一：官网安装（推荐）首先，访问Python官网下载适合的版本。由于xtquant库目前最高支持到Pyt
ES java客户端中关于BucketSortPipelineAggregationBuilder的问题 Sunager ElasticSearch elasticsearch java
es聚合后进行分页（非标准分页，涉及到es底层的检索方式）es桶聚合后排序介绍见ES指南介绍//kibana对聚合后的数据GET/_search{"query":{"bool":{"filter":[{"match":{"question":"好的"}},{"range":{
LLM大模型产品经理学习指南【2025全新版】：极致详细，一篇搞定！大模型入门学习产品经理语言模型人工智能 DeepSeek 大模型学习 LLM
前言·随着人工智能技术的蓬勃发展，尤其是大模型（LargeModel）的强势兴起，越来越多的企业对这一领域愈发重视并加大投入。作为大模型产品经理，需具备一系列跨学科的知识与技能，方能有效地推动产品的开发、优化以及市场化进程。以下是一份详尽的大模型产品经理学习路线，旨在助力你构建所需的知识体系，实现从零基础到精通的蜕变。一、基础知识阶段（一）计算机科学基础数据结构与算法：深入理解基本的数据结构（如数
Day 4：API高级开发指南翻晒时光 DeepSeek python ai
目标：构建高可用、高并发的企业级API服务系统一、流式响应工程化实践1.1流式传输核心机制技术架构对比：传输方式延迟显存占用适用场景标准响应2.1s12GB短文本生成流式响应首包300ms4GB长文档/实时交互Python异步流处理：importasynciofromdeepseekimportAsyncDeepSeekasyncdefstream_response(prompt):client=
DBA | Oracle 数据库体系结构简述! 全栈工程师修炼指南企业IT运维实践数据库 dba oracle
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]前言简述描述：为了对得起作者UP主公众号【全栈工程师修炼指南】中的【全栈】二字，从今天开始作者选择一门自己工作中常常使用的到的以及全球最流行的关系型数据库Oracle来进行学习，并记录学习过程，以供后续的自己复习回顾和帮助各位看友快速上手，从入门到高新，请各位看友一定要关注、订阅【#Oracle学习之路】专栏。上一章，我们简单介绍了ORACLE
如何在生产环境中部署您的Python项目：一步步指南一休哥助手 python python
引言简介：为什么要了解部署？在软件开发的生命周期中，部署是一个至关重要的环节。它涉及将开发完成的应用程序从开发环境移植到生产环境，使其可以为用户提供服务。部署不仅是软件开发过程的延伸，更是确保应用程序高效、安全、可靠运行的关键步骤。部署的重要性正确和高效的部署能够确保软件在生产环境中稳定运行，减少由于配置错误、依赖问题或安全漏洞导致的问题。此外，合适的部署策略还能提高系统的可维护性和扩展性，为后续
warm Agent框架入门指南：构建与编排多智能体系统的利器 aiweker AI应用开发 agent 智能体 openai 人工智能
warmAgent框架入门指南：构建与编排多智能体系统的利器Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性，非常适合处理大量独立的功能和指令。Swarm专注于使代理的协调和执行轻量级、高度可控且易于测试。它通过两个原始抽象：Age
本地运行LangChain项目的完整指南 qq_37836323 langchain python
老铁们，今天我们来聊一聊如何在本地运行LangChain项目并提交你的第一段代码。对于开发容器来说，你可以查看.devcontainer文件夹。咱们的项目是通过Poetryv1.7.1+来管理依赖的。如果你用Conda，记得先创建并激活一个新的Conda环境，例如condacreate-nlangchainpython=3.9。Poetry的安装在安装Poetry之前，老铁们注意，如果你使用Con
Kivy 模块使用python语言编译android可用的apk——Android-for-Python 静候光阴 Kivy编译apk技术全面解析 android python kivy buildozer
将为Android构建的Kivy示例。例子，名词一种可以被模仿或不被模仿的模式平行或非常相似的案例，尤其是作为先例或模型时每个存储库（用户指南除外）都包含一个独立的可运行示例。所有示例都在Android上运行，大多数在桌面上运行，还有一些在iOS上运行。包含buildozer.spec或记录对buildozer.spec所需的修改。一、CloudStorageExamples（云存储示例）概述Fi
《深入了解Unstructured包：在LangChain中使用Unstructured.IO提取干净文本》 cgsayuclv langchain python
引言在现代数据处理和人工智能应用中，解析和清洗文本数据是一个重要的环节。无论是PDF文件、Word文档还是CSV文件，能够高效地提取有用信息对下游任务至关重要。这篇文章将介绍如何使用Unstructured.IO的Unstructured包来从原始文档中提取干净文本，并在LangChain框架中使用它。本文将包含安装与设置指南、详细教程、代码示例、常见问题及解决方案，并提供进一步学习的资源。主要内
三菱PLC大型项目实战指南：从零基础到成功实施 Mountain and sea 三菱plc入门系列学习自动化
三菱PLC大型项目实战指南：从零基础到成功实施作为一名刚入门的电气工程师，想要通过一个大型项目来实践三菱PLC可能会感到有些挑战，但这是一个非常有意义的过程。以下将详细介绍如何从零基础开始，一步步完成一个大型项目，并最终成功实施。一、前期准备学习基础知识了解PLC的基本组成：首先，熟悉三菱PLC的基本结构，包括中央处理单元（CPU）、程序存储器、数据存储器和输入输出端口。掌握Ladder语言：三菱
Python新手成长之路：语法基础与实践指南健胃消食片片片片 python 开发语言
一、Python简介与环境搭建Python是一种解释型、交互式、面向对象的高级程序设计语言。Python的设计哲学强调代码的可读性和简洁性。它提供了高效的高级数据结构，还能简单有效地面向对象编程。Python支持多种编程范式，包括面向对象、命令式、函数式和过程式编程。在学习Python之前，需要先搭建Python开发环境，具体步骤如下：安装Python：从Python官网下载安装包，并安装最新版的
Python爬虫框架Scrapy入门指南健胃消食片片片片 python 爬虫 scrapy
Scrapy是一个高效、灵活、开放的Python爬虫框架，它可以帮助开发者快速地开发出高质量的网络爬虫，而不需要太多的编码工作。以下是对Scrapy的入门指南：一、Scrapy简介Scrapy是一个用于抓取网站和提取结构化数据的应用程序框架，可用于各种有用的应用程序，如数据挖掘、信息处理或历史存档。尽管Scrapy最初是为网络抓取而设计的，但它也可用于使用API提取数据或用作通用网络爬虫。Scra
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p