G皮T

【Python Cookbook】字符串和文本（五）：递归下降分析器

字符串和文本（五）

19.实现一个简单的递归下降分析器
- 19.1 BNF（基础形式）
- 19.2 EBNF（扩展形式）
- 19.3 案例
- 19.4 关键 self 操作解析
- - self.tokens 和 self.tok / self.nexttok
  - self._advance()：移动到下一个 token
  - self._accept(toktype)：尝试匹配并消费 token
  - self._expect(toktype)：强制匹配 token
  - self.expr() / self.term() / self.factor()：递归解析
  - 状态流转示例
  - 总结

19.实现一个简单的递归下降分析器

开始本文的学习前，我们需要首先了解一下什么是 BNF 和 EBNF。

BNF（Backus-Naur Form，巴科斯-诺尔范式）和 EBNF（Extended Backus-Naur Form，扩展巴科斯-诺尔范式）是用于描述编程语言或其他形式语言语法的元语言（描述语言的语言）。它们是编译器设计、文档规范和协议定义中的基础工具。

19.1 BNF（基础形式）

BNF 最初由 John Backus 和 Peter Naur 在 1950-60 年代提出，用于描述 ALGOL 60 语言的语法。

核心组成：

非终结符（Non-terminal）：用 < > 括起，表示需要进一步展开的语法单元。
- 例如：、
终结符（Terminal）：语言中的实际符号（如关键字、运算符等）。
- 例如："if"、"+"、"123"
产生式规则（Production rule）：用 ::= 表示定义。
- 例如： ::= "0" | "1" | ... | "9"

示例（简单算术表达式）：

 ::=  "+"  | 
       ::=  "*"  | 
     ::= "("  ")" | 
     ::=  |  
      ::= "0" | "1" | ... | "9"

19.2 EBNF（扩展形式）

EBNF 在 BNF 基础上添加了更简洁的表达方式，被现代语言规范（如 Python、SQL 标准）广泛使用。

扩展符号：

可选项：用 [ ] 表示。
- 例如："if" "then" [ "else" ]
重复项：用 { } 表示（0 次或多次）。
- 例如： ::= { }
分组：用 ( ) 明确优先级。
- 例如：("+" | "-")
终结符通常不再加引号（依规范而定）。

示例（同上的算术表达式，用 EBNF）：

expression = term { "+" term } ;
term       = factor { "*" factor } ;
factor     = "(" expression ")" | number ;
number     = digit { digit } ;
digit      = "0" | "1" | ... | "9" ;

关键区别

特性	BNF	EBNF
重复	需递归定义（如 `::= \|` ）	直接用 `{ }`（如 `number = digit { digit }`）
可选	需额外规则	用 `[ ]` 表示
可读性	较低（规则更冗长）	更高（接近正则表达式风格）

19.3 案例

你想根据一组语法规则解析文本并执行命令，或者构造一个代表输入的抽象语法树。如果语法非常简单，你可以不去使用一些框架，而是自己写这个解析器。

在这个问题中，我们集中讨论根据特殊语法去解析文本的问题。为了这样做，你首先要以 BNF 或者 EBNF 形式指定一个标准语法。比如，一个简单数学表达式语法可能像下面这样：

expr ::= expr + term
    |   expr - term
    |   term

term ::= term * factor
    |   term / factor
    |   factor

factor ::= ( expr )
    |   NUM

或者，以 EBNF 形式：

expr ::= term { (+|-) term }*

term ::= factor { (*|/) factor }*

factor ::= ( expr )
    |   NUM

在 EBNF 中，被包含在 {...}* 中的规则是可选的。* 代表 0 次或多次重复（跟正则表达式中意义是一样的）。

现在，如果你对 BNF 的工作机制还不是很明白的话，就把它当做是一组左右符号可相互替换的规则。一般来讲，解析的原理就是你利用 BNF 完成多个替换和扩展以匹配输入文本和语法规则。为了演示，假设你正在解析形如 3 + 4 * 5 的表达式。这个表达式先要分解为一组令牌流，结果可能是像下列这样的令牌序列：

NUM + NUM * NUM

在此基础上，解析动作会试着去通过替换操作匹配语法到输入令牌：

expr
expr ::= term { (+|-) term }*
expr ::= factor { (*|/) factor }* { (+|-) term }*
expr ::= NUM { (*|/) factor }* { (+|-) term }*
expr ::= NUM { (+|-) term }*
expr ::= NUM + term { (+|-) term }*
expr ::= NUM + factor { (*|/) factor }* { (+|-) term }*
expr ::= NUM + NUM { (*|/) factor}* { (+|-) term }*
expr ::= NUM + NUM * factor { (*|/) factor }* { (+|-) term }*
expr ::= NUM + NUM * NUM { (*|/) factor }* { (+|-) term }*
expr ::= NUM + NUM * NUM { (+|-) term }*
expr ::= NUM + NUM * NUM

下面所有的解析步骤可能需要花点时间弄明白，但是它们原理都是查找输入并试着去匹配语法规则。第一个输入令牌是 NUM，因此替换首先会匹配那个部分。一旦匹配成功，就会进入下一个令牌 +，以此类推。当已经确定不能匹配下一个令牌的时候，右边的部分（比如 { (*/) factor }* ）就会被清理掉。在一个成功的解析中，整个右边部分会完全展开来匹配输入令牌流。

有了前面的知识背景，下面我们举一个简单示例来展示如何构建一个递归下降表达式求值程序：

#!/usr/bin/env python
# -*- encoding: utf-8 -*-
"""
Topic: 下降解析器
Desc :
"""
import re
import collections

# Token specification
NUM = r'(?P\d+)'        # 匹配数字
PLUS = r'(?P\+)'       # 匹配加号
MINUS = r'(?P-)'      # 匹配减号
TIMES = r'(?P\*)'     # 匹配乘号
DIVIDE = r'(?P/)'    # 匹配除号
LPAREN = r'(?P\()'   # 匹配左括号
RPAREN = r'(?P\))'   # 匹配右括号
WS = r'(?P\s+)'          # 匹配空白字符

# 使用 (?P...) 命名捕获组，方便后续识别 token 类型
master_pat = re.compile('|'.join([NUM, PLUS, MINUS, TIMES,
                                  DIVIDE, LPAREN, RPAREN, WS]))
# Tokenizer
Token = collections.namedtuple('Token', ['type', 'value'])

# 将输入字符串 text 拆分为一系列 Token（包含类型和值）
def generate_tokens(text):
    scanner = master_pat.scanner(text)
    for m in iter(scanner.match, None):
        tok = Token(m.lastgroup, m.group())
        if tok.type != 'WS':
            yield tok


# Parser
class ExpressionEvaluator:
    '''
    Implementation of a recursive descent parser. 
    Each method implements a single grammar rule. 
    Use the ._accept() method to test and accept the current lookahead token. 
    Use the ._expect() method to exactly match and discard the next token on on the input
    (or raise a SyntaxError if it doesn't match).
    '''

    def parse(self, text):
        self.tokens = generate_tokens(text) # 生成 token 流
        self.tok = None                     # 记录当前已消费的 token（即最近处理过的 token）
        self.nexttok = None                 # 保存下一个待处理的 token（即“预读”的 token，用于语法分析中的“向前看”）
        self._advance()                     # 移动到下一个 token
        return self.expr()                  # 从最高优先级规则开始解析  

	# 移动到下一个 token
    def _advance(self):
        self.tok, self.nexttok = self.nexttok, next(self.tokens, None)
	
	# 如果下一个 token 匹配 toktype 则消费它
    def _accept(self, toktype):
        if self.nexttok and self.nexttok.type == toktype:
            self._advance()
            return True
        else:
            return False

	# 必须匹配 toktype，否则报错（用于强制语法规则）
    def _expect(self, toktype):
        if not self._accept(toktype):
            raise SyntaxError('Expected ' + toktype)

    # 处理加减法
    # expression ::= term { ('+'|'-') term }*
    def expr(self):
        exprval = self.term() # 先解析更高优先级的 term
        while self._accept('PLUS') or self._accept('MINUS'):
            op = self.tok.type
            right = self.term() # 解析右侧 term
            if op == 'PLUS':
                exprval += right
            elif op == 'MINUS':
                exprval -= right
        return exprval

	# 处理乘除法
	# term ::= factor { ('*'|'/') factor }*
    def term(self):
        termval = self.factor() # 先解析更高优先级的 factor
        while self._accept('TIMES') or self._accept('DIVIDE'):
            op = self.tok.type
            right = self.factor() # 解析右侧 factor
            if op == 'TIMES':
                termval *= right
            elif op == 'DIVIDE':
                termval /= right
        return termval

	# 处理数字和括号
	# factor ::= NUM | ( expr )
    def factor(self):
        if self._accept('NUM'):
            return int(self.tok.value) # 返回数字值
        elif self._accept('LPAREN'):
            exprval = self.expr()      # 递归解析括号内表达式
            self._expect('RPAREN')     # 必须匹配右括号
            return exprval
        else:
            raise SyntaxError('Expected NUMBER or LPAREN')


def descent_parser():
    e = ExpressionEvaluator()
    print(e.parse('2'))
    print(e.parse('2 + 3'))
    print(e.parse('2 + 3 * 4'))
    print(e.parse('2 + (3 + 4) * 5'))
    # print(e.parse('2 + (3 + * 4)'))
    # Traceback (most recent call last):
    #    File "", line 1, in 
    #    File "exprparse.py", line 40, in parse
    #    return self.expr()
    #    File "exprparse.py", line 67, in expr
    #    right = self.term()
    #    File "exprparse.py", line 77, in term
    #    termval = self.factor()
    #    File "exprparse.py", line 93, in factor
    #    exprval = self.expr()
    #    File "exprparse.py", line 67, in expr
    #    right = self.term()
    #    File "exprparse.py", line 77, in term
    #    termval = self.factor()
    #    File "exprparse.py", line 97, in factor
    #    raise SyntaxError("Expected NUMBER or LPAREN")
    #    SyntaxError: Expected NUMBER or LPAREN


if __name__ == '__main__':
    descent_parser()

以输入 "2 + (3 + 4) * 5" 为例：

词法分析生成 tokens：

[NUM(2), PLUS(+), LPAREN((), NUM(3), PLUS(+), NUM(4), RPAREN()), TIMES(*), NUM(5)]

语法分析过程：
- expr() 调用 term() → factor() → 返回 2
- 遇到 +，解析右侧 term()：
  - 遇到 (，进入新的 expr() 计算 3 + 4 = 7
  - 遇到 *，计算 7 * 5 = 35
- 最终结果：2 + 35 = 37

文本解析是一个很大的主题，一般会占用学生学习编译课程时刚开始的三周时间。如果你在找寻关于语法，解析算法等相关的背景知识的话，你应该去看一下编译器书籍。很显然，关于这方面的内容太多，不可能在这里全部展开。

尽管如此，编写一个递归下降解析器的整体思路是比较简单的。开始的时候，你先获得所有的语法规则，然后将其转换为一个函数或者方法。因此如果你的语法类似这样：

expr ::= term { ('+'|'-') term }*

term ::= factor { ('*'|'/') factor }*

factor ::= '(' expr ')'
    | NUM

你应该首先将它们转换成一组像下面这样的方法：

class ExpressionEvaluator:
    ...
    def expr(self):
    ...
    def term(self):
    ...
    def factor(self):
    ...

每个方法要完成的任务很简单 - 它必须从左至右遍历语法规则的每一部分，处理每个令牌。从某种意义上讲，方法的目的就是要么处理完语法规则，要么产生一个语法错误。为了这样做，需采用下面的这些实现方法：

如果规则中的下个符号是另外一个语法规则的名字（比如 term 或 factor），就简单的调用同名的方法即可。这就是该算法中下降的由来 - 控制下降到另一个语法规则中去。有时候规则会调用已经执行的方法（比如，在 factor ::= '('expr ')' 中对expr的调用）。这就是算法中递归的由来。
如果规则中下一个符号是个特殊符号（比如 ()，你得查找下一个令牌并确认是一个精确匹配）。如果不匹配，就产生一个语法错误。这一节中的 _expect() 方法就是用来做这一步的。
如果规则中下一个符号为一些可能的选择项（比如 + 或 -），你必须对每一种可能情况检查下一个令牌，只有当它匹配一个的时候才能继续。这也是本节示例中 _accept() 方法的目的。它相当于_expect() 方法的弱化版本，因为如果一个匹配找到了它会继续，但是如果没找到，它不会产生错误而是回滚（允许后续的检查继续进行）。
对于有重复部分的规则（比如在规则表达式 ::= term { ('+'|'-') term }* 中），重复动作通过一个 while 循环来实现。循环主体会收集或处理所有的重复元素直到没有其他元素可以找到。
一旦整个语法规则处理完成，每个方法会返回某种结果给调用者。这就是在解析过程中值是怎样累加的原理。比如，在表达式求值程序中，返回值代表表达式解析后的部分结果。最后所有值会在最顶层的语法规则方法中合并起来。

尽管向你演示的是一个简单的例子，递归下降解析器可以用来实现非常复杂的解析。比如，Python 语言本身就是通过一个递归下降解析器去解释的。如果你对此感兴趣，你可以通过查看 Python 源码文件 Grammar/Grammar 来研究下底层语法机制。看完你会发现，通过手动方式去实现一个解析器其实会有很多的局限和不足之处。

其中一个局限就是它们不能被用于包含任何左递归的语法规则中。比如，假如你需要翻译下面这样一个规则：

items ::= items ',' item
    | item

逻辑矛盾：直接按照该规则实现会导致无限递归。
正确理解：该规则的实际含义是 “一个或多个由逗号分隔的 item”，应该用循环而非递归实现。

为了这样做，你可能会像下面这样使用 items() 方法：

def items(self):
    itemsval = self.items()
    if itemsval and self._accept(','):
        itemsval.append(self.item())
    else:
        itemsval = [ self.item() ]

唯一的问题是这个方法根本不能工作，事实上，它会产生一个无限递归错误。

原因：items() 方法内部直接调用了 self.items()，导致无限递归，最终触发 RecursionError。

修复：应该先尝试解析第一个 item，再判断是否有后续的 ',' item。修正后的逻辑：

def items(self):
    itemsval = [self.item()]  # 先解析第一个 item
    while self._accept(','):   # 如果遇到逗号，继续解析后续 item
        itemsval.append(self.item())
    return itemsval

避免递归：原始 BNF 是左递归的（items 在产生式开头调用自身），而递归下降解析器无法处理左递归。

假设输入是 "A, B, C"：

错误版本：会无限递归，直到崩溃。
修正版本：
- 第一次调用：解析 "A" → itemsval = ["A"]
- 遇到 ","，解析 "B" → itemsval = ["A", "B"]
- 遇到 ","，解析 "C" → itemsval = ["A", "B", "C"]
- 返回最终结果 ["A", "B", "C"]

关于语法规则本身你可能也会碰到一些棘手的问题。比如，你可能想知道下面这个简单扼语法是否表述得当：

expr ::= factor { ('+'|'-'|'*'|'/') factor }*

factor ::= '(' expression ')'
    | NUM

这个语法看上去没啥问题，但是它却不能察觉到标准四则运算中的运算符优先级。比如，表达式 "3 + 4 * 5" 会得到 35 而不是期望的 23。分开使用 expr 和 term 规则可以让它正确的工作。

对于复杂的语法，你最好是选择某个解析工具比如 PyParsing 或者是 PLY。下面是使用 PLY 来重写表达式求值程序的代码：

from ply.lex import lex
from ply.yacc import yacc

# Token list
tokens = [ 'NUM', 'PLUS', 'MINUS', 'TIMES', 'DIVIDE', 'LPAREN', 'RPAREN' ]
# Ignored characters
t_ignore = ' \t\n'
# Token specifications (as regexs)
t_PLUS = r'\+'
t_MINUS = r'-'
t_TIMES = r'\*'
t_DIVIDE = r'/'
t_LPAREN = r'\('
t_RPAREN = r'\)'

# Token processing functions
def t_NUM(t):
    r'\d+'
    t.value = int(t.value)
    return t

# Error handler
def t_error(t):
    print('Bad character: {!r}'.format(t.value[0]))
    t.skip(1)

# Build the lexer
lexer = lex()

# Grammar rules and handler functions
def p_expr(p):
    '''
    expr : expr PLUS term
        | expr MINUS term
    '''
    if p[2] == '+':
        p[0] = p[1] + p[3]
    elif p[2] == '-':
        p[0] = p[1] - p[3]


def p_expr_term(p):
    '''
    expr : term
    '''
    p[0] = p[1]


def p_term(p):
    '''
    term : term TIMES factor
    | term DIVIDE factor
    '''
    if p[2] == '*':
        p[0] = p[1] * p[3]
    elif p[2] == '/':
        p[0] = p[1] / p[3]

def p_term_factor(p):
    '''
    term : factor
    '''
    p[0] = p[1]

def p_factor(p):
    '''
    factor : NUM
    '''
    p[0] = p[1]

def p_factor_group(p):
    '''
    factor : LPAREN expr RPAREN
    '''
    p[0] = p[2]

def p_error(p):
    print('Syntax error')

parser = yacc()

这个程序中，所有代码都位于一个比较高的层次。你只需要为令牌写正则表达式和规则匹配时的高阶处理函数即可。而实际的运行解析器，接受令牌等等底层动作已经被库函数实现了。

下面是一个怎样使用得到的解析对象的例子：

>>> parser.parse('2')
2
>>> parser.parse('2+3')
5
>>> parser.parse('2+(3+4)*5')
37
>>>

如果你想在你的编程过程中来点挑战和刺激，编写解析器和编译器是个不错的选择。再次，一本编译器的书籍会包含很多底层的理论知识。不过很多好的资源也可以在网上找到。Python 自己的 ast 模块也值得去看一下。

19.4 关键 self 操作解析

在 Python 类中，self 是一个指向 当前对象实例 的引用，用于访问实例的属性和方法。在上述代码中，self 的用法涉及 词法分析器（Lexer）和语法解析器（Parser）的状态管理。下面我会逐步拆解这些 self 操作的作用：

self.tokens 和 self.tok / self.nexttok

def parse(self, text):
    self.tokens = generate_tokens(text)  # 存储 token 生成器
    self.tok = None       # 当前消费的 token
    self.nexttok = None   # 下一个待处理的 token
    self._advance()       # 初始化：预加载第一个 token

self.tokens: 保存从 generate_tokens() 返回的 token 生成器（一个可迭代对象），用于逐个读取 token。
self.tok: 记录 当前已消费的 token（即最近处理过的 token）。
self.nexttok: 保存 下一个待处理的 token（即 “预读” 的 token，用于语法分析中的 “向前看”）。

self._advance()：移动到下一个 token

def _advance(self):
    self.tok, self.nexttok = self.nexttok, next(self.tokens, None)

作用：
1. 将 self.nexttok 的值赋给 self.tok（表示当前 token 已消费）。
2. 通过 next(self.tokens, None) 读取生成器的 下一个 token，存入 self.nexttok。
3. 如果 token 流结束，next() 返回 None。
示例：假设 tokens 为 [NUM(2), PLUS(+), NUM(3)]：
- 第一次调用 _advance() 后：self.tok = None, self.nexttok = NUM(2)
- 第二次调用后：self.tok = NUM(2), self.nexttok = PLUS(+)
- 第三次调用后：self.tok = PLUS(+), self.nexttok = NUM(3)

self._accept(toktype)：尝试匹配并消费 token

def _accept(self, toktype):
    if self.nexttok and self.nexttok.type == toktype:
        self._advance()  # 消费匹配的 token
        return True
    return False

作用：
- 检查下一个 token (self.nexttok) 是否与 toktype 匹配（如 'PLUS'）。
- 如果匹配，调用 _advance() 消费该 token，并返回 True。
- 否则返回 False。
示例：当前 self.nexttok = PLUS(+)，调用 _accept('PLUS') 会返回 True，并更新 self.tok 和 self.nexttok。

self._expect(toktype)：强制匹配 token

def _expect(self, toktype):
    if not self._accept(toktype):
        raise SyntaxError('Expected ' + toktype)

作用：
- 必须匹配 toktype，否则抛出语法错误。
- 用于处理语法中的强制性规则（如右括号 ) 必须闭合）。

示例：在 factor() 中解析括号表达式时：

if self._accept('LPAREN'):
    exprval = self.expr()  # 解析括号内的表达式
    self._expect('RPAREN')  # 必须遇到右括号

self.expr() / self.term() / self.factor()：递归解析

这些方法通过 self 访问和更新 token 状态，实现表达式的递归下降解析：

def expr(self):
    exprval = self.term()  # 解析高优先级的 term
    while self._accept('PLUS') or self._accept('MINUS'):
        op = self.tok.type  # 当前操作符（通过 self.tok 获取）
        right = self.term()  # 解析右侧 term
        exprval += right if op == 'PLUS' else -right
    return exprval

self.tok：在 _accept() 后存储 最近消费的 token（如操作符 +）。
self.term()：递归调用解析更高优先级的子表达式。

状态流转示例

以解析 "2 + 3" 为例：

初始化：
- self.tokens = 生成器生成 [NUM(2), PLUS(+), NUM(3)]
- self.tok = None, self.nexttok = None
- 调用 _advance() → self.tok = None, self.nexttok = NUM(2)
解析 expr()：
- 调用 term() → 调用 factor() → _accept('NUM') 为 True：
  - 消费 NUM(2)，返回 2
  - 现在 self.tok = NUM(2), self.nexttok = PLUS(+)
- 遇到 while 循环，_accept('PLUS') 为 True：
  - 消费 PLUS(+)，self.tok = PLUS(+), self.nexttok = NUM(3)
  - 解析右侧 term() → 返回 3
- 计算 2 + 3，返回 5

总结

self.tok / self.nexttok：跟踪 token 流的状态，实现 “预读” 和 “消费”。
self._advance()：推进 token 流，更新当前和下一个 token。
self._accept() / self._expect()：控制语法规则的匹配和错误处理。
递归方法：通过 self 共享状态，实现表达式的优先级和嵌套解析。

这种设计是 递归下降解析器 的典型实现，self 用于在方法间传递和维护解析状态。

你可能感兴趣的:(#,Cookbook,python,数据结构,字符串,正则表达式,词法分析,语法解析,编译原理)

目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
MySQL之MVCC实现原理深度解析 AA-代码批发V哥 MySQL mysql 数据库
MySQL之MVCC实现原理深度解析一、MVCC基础：为什么需要多版本控制？1.1并发访问的痛点1.2MVCC的核心目标二、MVCC核心组件：构建多版本世界的基石2.1隐藏字段：数据版本的"身份证"2.2Undo日志：版本回溯的"时间机器"2.2.1Undo日志类型2.2.2Undo日志的生命周期2.3版本链：数据演变的"历史轨迹"2.4ReadView：版本可见性的"过滤器"三、MVCC核心逻辑
Jackson控制多态的注解--JsonTypeInfo,JsonSubTypes,JsonTypeName Amarantine、沐风倩✨ java spring boot spring cloud
JsonTypeInfo.As.EXISTING_PROPERTY：当使用EXISTING_PROPERTY时，类型信息被包含在一个已有的属性中，而不是创建一个新的属性来存储类型信息。在JSON对象中，已有的属性将用于存储类型信息。例如，如果您的数据结构已经包含了一个属性，您可以使用这个属性来存储类型信息。在反序列化时，Jackson会查找已有的属性并将其用作类型信息。JsonTypeInfo.A
GORM深度解析：模型定义与数据库迁移最佳实践 Golang编程笔记数据库 oracle ai
GORM深度解析：模型定义与数据库迁移最佳实践关键词：GORM、模型定义、数据库迁移、最佳实践、Go语言摘要：本文深入探讨了GORM这一强大的Go语言ORM库，详细介绍了模型定义的方法和技巧，以及数据库迁移的最佳实践。通过通俗易懂的语言和丰富的实例，帮助读者理解GORM的核心概念，掌握如何利用GORM高效地进行数据库操作。背景介绍目的和范围在Go语言开发中，与数据库进行交互是一项常见的任务。GOR
Golang数据结构与算法：实现经典算法的Go版本 Golang编程笔记 golang 算法开发语言 ai
Golang数据结构与算法：实现经典算法的Go版本关键词：Golang、数据结构、算法、经典算法、Go实现摘要：本文将带领大家深入探索在Golang中实现经典算法。我们会先介绍一些基础的数据结构和算法概念，然后用生动的故事和例子来解释这些概念，接着给出核心概念之间的关系。通过详细的代码示例，展示如何在Go语言里实现这些经典算法，还会介绍它们的实际应用场景、相关工具和资源，探讨未来的发展趋势与挑战。
[M数学] lc2829. k-avoiding 数组的最小总和(推公式+贪心模拟+好题) Ypuyu LeetCode 算法
文章目录1.题目来源2.题目解析1.题目来源链接：2829.k-avoiding数组的最小总和参考：灵神题解前置题：xxx题单：待补充2.题目解析2025年03月27日00:01:32方法一：贪心模拟依据两数之和的思想，从i=1开始填，总共需要填n个数。如果当前的i不可用，那就一直i++，找到一个可用的i如果k0{form[i]{i++}ifk>i{m[k-i]=true}res+=ii++n--
【Python从零到壹】Python中的标识符和保留字互联网老辛 #Python从零到壹 Python
保留字，也叫关键字，这些关键字是python直接提供给我们使用的，因此，我们在定义标识符的时候，不能用这些保留字。比如教育局就属于官方用的，你开个公司起名就不能叫教育局怎么查看关键字？importkeywordprint(keyword.kwlist)输出结果：E:\Python_demo\vippython\venv\Scripts\python.exeE:/Python_demo/vippyt
Golang学习日志 ━━ 单向链表暂时先用这个名字 Golang go golang
因为转载必须指明原文网址，而本文内容整合了网上多篇技术文章，无法明确其中一条，所以选择了原创。已在最后的参考目录里列出本文所有涉及的文章。定义单向链表（单链表）是链表的一种，是一种链式存取的数据结构，用一组地址任意的存储单元存放线性表中的数据元素。其特点是链表的链接方向是单向的，对链表的访问要通过顺序读取从头部开始；链表是由结点构成，head指针指向第一个成为表头结点，而终止于最后一个指向nuLL
Python中的变量与数据类型難釋懷 python windows 开发语言
一、前言在Python编程中，变量（Variable）和数据类型（DataType）是程序开发中最基本也是最核心的概念。变量用于存储程序运行过程中的各种值，而数据类型则决定了变量可以存储什么样的数据、支持哪些操作。Python作为一门动态类型语言，无需显式声明变量的数据类型，解释器会根据赋给变量的值自动推断其类型。这种特性使得Python更加简洁易用，但也要求开发者对常见数据类型有清晰的认识。本文
Python中的count()方法溪流.ii python 数据库
文章目录Python中的count()方法基本语法在不同数据类型中的使用1.列表(List)中的count()2.元组(Tuple)中的count()3.字符串(String)中的count()高级用法1.指定搜索范围2.统计复杂元素注意事项Python中的count()方法前言：count()是Python中用于序列类型（如列表、元组、字符串等）的内置方法，用于统计某个元素在序列中出现的次数。基
Python中的标识符与保留字難釋懷 python java 数据库
一、前言在学习Python编程语言的过程中，标识符（Identifier）和保留字（Keywords）是两个非常基础但又极其重要的概念。它们是编写程序时必须遵守的语言规则之一。本文将带你深入了解：什么是标识符；标识符的命名规则与规范；Python中有哪些保留字；常见错误与注意事项；实际开发中的命名建议；掌握好这些内容，不仅能帮助你写出更规范、可读性更强的代码，还能避免因使用关键字作为变量名而导致的
C++入门基础语法，并提到希望内容详细且包含实例Demo，我假设你现在想要一个基于C++的人脸考勤系统源码，并且希望代码适合初学者，包含详细注释和说明 zhxup606 C++c++开发语言
C++入门基础语法，并提到希望内容详细且包含实例Demo，我假设你现在想要一个基于C++的人脸考勤系统源码，并且希望代码适合初学者，包含详细注释和说明。根据搜索结果，C++人脸考勤系统通常使用OpenCV库进行人脸检测和识别，这需要一定的库配置和基础知识。以下是一个基于OpenCV的简单人脸考勤系统源码示例，适合初学者理解，代码实现基本功能：捕获摄像头画面、检测人脸、记录考勤信息，并保存到文件。C
Qt的概述和安装、信号与槽、元对象系统、动态属性、字符串QString、容器、窗口部件与布局管理器、顺序容器、UI界面设计、数值输入输出、时间和日期、界面UI组件、模型视图、关联与集合容器、对话框 zhxup606 C++qt ui 开发语言
涵盖Qt的概述和安装、信号与槽、元对象系统、动态属性、字符串QString、容器、窗口部件与布局管理器、顺序容器、UI界面设计、数值输入输出、时间和日期、界面UI组件、模型视图、关联与集合容器、对话框、多窗口开发、绘图、QGraphicsView绘图框架、文件处理、文件读写与事件、补充知识、INI配置文件、JSON文件操作、XML文件读写、和网络编程。每章将包含详细讲解、代码示例（demo），并确
Redis ZSet 数据结构深度解析：原理、实现与实战全揭密！程序猿Mr.wu Redis redis 数据结构缓存
一、前言：为什么要学习ZSet？在Redis的五大基础数据类型中，ZSet（SortedSet，有序集合）是一种非常强大而灵活的数据结构，广泛应用于排行榜、延时队列、权重排名等场景。如果说String是Redis的“最小原子”，那么ZSet就是Redis的“重量级选手”——不仅能存数据，还能排序查询，这正是它的魅力所在！二、ZSet是什么？和Set有啥区别？ZSet=Set+Score+排序！特性
MySQL 中的锁机制详解：原理、实现方式与实战解析！程序猿Mr.wu MySQL mysql 数据库
MySQL中的锁机制详解：原理、实现方式与实战解析！锁的世界，比你想象得更精彩！一、为什么要有锁？在并发环境下，多线程操作数据库的同一份数据时，如果没有锁机制，可能会出现以下问题：脏读：读取了另一个事务未提交的数据。不可重复读：同一事务中多次读取结果不一致。幻读：读取时发现记录“凭空”出现或消失。锁的存在，就是为了保证并发情况下的数据一致性与隔离性。二、MySQL中锁的分类1.按作用范围分类分类说
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
1910. 删除一个字符串中所有出现的给定子字符串 Joyner2018 python 算法 leetcode 开发语言 python
字符串反复删除子串问题的多种解法解析✨题目描述给定两个字符串s和part，我们需要对s执行以下操作，直到s中不再包含任何子串part：每次找到s中最左边出现的part子串，并将其从s中删除。最后，返回所有part都被删除后的最终字符串。注意：子串指的是字符串中连续的字符序列。删除操作是从左到右，每次只删除最左边的一个匹配部分。示例说明示例1：输入：s="daabcbaabcbc",part="ab
利用大数据领域Doris提升企业数据决策效率大数据洞察大数据网络 ai
利用大数据领域Doris提升企业数据决策效率关键词：大数据、Doris、企业数据决策、数据处理、效率提升摘要：本文围绕利用大数据领域的Doris来提升企业数据决策效率展开。首先介绍了背景，包括目的、预期读者、文档结构和相关术语。接着阐述了Doris的核心概念、架构以及与其他系统的联系。详细讲解了Doris的核心算法原理和具体操作步骤，并给出Python代码示例。同时介绍了相关的数学模型和公式。通过
Python爬虫技术实战：高效市场趋势分析与数据采集 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 easyui 汽车
摘要本文将深入探讨如何利用最新的Python爬虫技术进行市场趋势分析，涵盖异步IO、无头浏览器、智能解析等前沿技术，并提供完整可运行的代码示例。文章将系统介绍从基础爬虫到高级反反爬策略的全套解决方案，帮助读者掌握市场数据采集的核心技能。1.市场趋势分析与爬虫技术概述市场趋势分析已成为现代商业决策的核心环节，而数据采集则是分析的基石。根据2024年最新统计，全球83%的企业已将网络爬虫技术纳入其数据
Mysql回表查询：深入解析与实战应用需要重新演唱 mysql mysql 数据库
Mysql回表查询：深入解析与实战应用今天，我们将深入探讨Mysql中的回表查询。回表查询是Mysql索引机制中的一个重要概念，理解它的工作原理和优化方法，对于提升数据库查询性能至关重要。让我们一起揭开回表查询的神秘面纱。1.什么是回表查询？回表查询（LookupQuery）是指在使用非聚集索引（Non-ClusteredIndex）进行查询时，如果需要获取的数据不在索引页中，就需要根据索引页中的
java-数组常用api 远方啊~~ java java javascript git
Java数组相关api数组array中的api1.获取数组长度：arrays.length()在Java中要求一个数组的长度是可以直接用length属性来获取的int[]A={1,2,3};intlen=A.length;在Java中这种方式就可以直接获取到数组的长度。值得注意的是，在Java中还有一个length()方法。这个方法是针对字符串而言的，只能用来求字符串长度。此外还有一个size(
Nuitka打包python脚本 __如风__ python 开发语言
Python脚本打包Python是解释执行语言，需要解释器才能运行代码，这就导致在开发机上编写的代码在别的电脑上无法直接运行，除非目标机器上也安装了Python解释器，有时候还需要额外安装Python第三方包，相当麻烦。事实上Python并不适合干这种事，但有时候确实需要Python编写的程序打包给他人一键运行。思路通常都是分析脚本依赖（所有使用到的模块），然后收集相关资源，为了能在目标机器上正确
燕山大学编译原理期末考试能运行就算成功经验分享
软件工程专业的首先，这一门课无法在三四天内速成（指零基础的）要是有考前才开始学到同学至少要提前一周开始学习（我觉得这都比较紧张，两周才算宽裕），b站上的速成课不全！不全！不全！不要想着完全看速成课，你要非这样我也没办法。考试范围如下：编译程序构成、编译程序与解释程序区别，词法分析、语法分折、语义分折及其任务，文法，语言，句型，句子，短语，推导，归约，句柄，文法、语言二义性，文法分类，有穷自动机、正
燕大《Python机器学习》实验报告：探索机器学习的奥秘温冰礼
燕大《Python机器学习》实验报告：探索机器学习的奥秘【下载地址】燕大Python机器学习实验报告下载这份实验报告是燕山大学软件工程专业的学生在进行机器学习实验时所编写的，内容详实，结构清晰，可以直接下载使用。报告中的实验数据和代码均经过验证，确保下载后可以直接应用于实际项目或作为学习参考项目地址:https://gitcode.com/Open-source-documentation-tut
Python 运用 Matplotlib 绘制动画图的流程 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib 开发语言 ai
Python运用Matplotlib绘制动画图的流程关键词：Python、Matplotlib、动画图、绘制流程、动画原理摘要：本文详细介绍了使用Python的Matplotlib库绘制动画图的完整流程。从背景知识入手，阐述了Matplotlib动画绘制的目的和适用读者群体，接着深入剖析了核心概念，包括动画的基本原理和架构。通过核心算法原理的讲解和Python源代码示例，展示了如何实现动画绘制。同
Python Pandas 如何进行数据分组统计 Python编程之道 Python人工智能与大数据 Python编程之道 python pandas 网络 ai
PythonPandas如何进行数据分组统计关键词：PythonPandas、数据分组、groupby、聚合函数、数据透视表、数据统计、数据分析摘要：本文将深入探讨如何使用PythonPandas库进行高效的数据分组统计操作。我们将从基础概念入手，详细讲解groupby机制的原理和使用方法，介绍各种聚合函数的应用，探讨高级分组技巧，并通过实际案例展示如何解决复杂的数据分析问题。文章还将涵盖性能优化
Python可视化环境：Matplotlib_Seaborn+Conda配置 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib conda ai
Python可视化环境：Matplotlib/Seaborn+Conda配置关键词：Python可视化、Matplotlib、Seaborn、Conda、环境配置摘要：本文主要探讨了如何利用Conda来配置Python可视化所需的Matplotlib和Seaborn环境。首先介绍了Python可视化的背景和重要性，明确目标读者为想要学习Python可视化的初学者和有一定基础的开发者。接着详细解析了
Nuitka 打包Python程序 Humbunklung 学海泛舟 python 开发语言 nuitka
文章目录Nuitka打包Python程序**一、Nuitka核心优势**⚙️**二、环境准备（Windows示例）****三、基础打包命令****单文件脚本打包****带第三方库的项目**️**四、高级配置选项****示例：完整命令**⚠️**五、常见问题与解决****六、Nuitkavs其他工具****七、最佳实践建议****八、使用举例**总结Nuitka打包Python程序需要把Python
python selenium 滚动页面到定位元素我有一个希哥 python selenium 前端
用js语句target=driver.find_element_by_id("id")driver.execute_script("arguments[0].scrollIntoView();",target)或target=WebDriverWait(driver,3).until(expected_conditions.presence_of_element_located((By.ID,"i
go语言interface设计的一点思考
昨天到公司看到有人在群里把go跟java的interface做比较，提出go宣称的“非侵入式”好像也没那么好用，甚至跟java差不多。但实际上go语言的接口设计并不只是语法本身，也包含了开发流程跟思维方式在里面，下面把当时在群里的回答整理一下放出来。其实可以这样来理解：Java语言的开发风格是设计先行，即先定义规范，然后去挨个实现（就是先定义有什么方法，然后再写出来方法体）。而go语言是“先做再说
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include