AkagiSenpai

自动机与形式语言复习：文法，DFA，NFA与正则表达式

前言

自动机与形式语言通过规范化的文法，逻辑地表示某些字符串。此外，通过对串的成分进行分析，同时给出一组状态与对应的状态转移，组成自动机。DFA 和 NFA 是两种自动机，都能够判断某些串是否能够被接收，走到接收状态就算接收。

还有三天。。。考完就可以 run 了，好耶！

~~我只考三门，都觉得复习很吃力，但是别人往往考 10 门，还比我先考，还游刃有余。这令我深刻的认识到：我是啥β~~

原本打算摸了，但是想到不复习真的可能会挂科，就来更新一下复习笔记了。

注：
因为我上了一学期课，从来没有认真听课超过 10 min，作业都是抄别人的
于是这篇复习笔记很可能错漏百出，并且伴有缺内容，缺重点等等问题
⚠ 请谨慎食用 ⚠

文法

通过文法可以规范化的表达某种语言（语言就是串的集合），我们通过四元组来表示一个文法：

$G = (V, T, P, S)$

其中 V 是 variable，表示变量，即状态的集合。

T 是 terminal，终极符，通过一系列的终极符号 T，在不同的变量（V）中进行跳转。比如 V1 可以通过接收字符 T，从而转到 V2 状态。

S 是 start symbol，为文法的开始符号，其中 S 属于状态集合 V

P 为 production，即产生式。产生式告诉我们状态之间的联系，比如一个状态 V 可以产生一个字符 0，那么有：

$\rightarrow 0$

当然也可以递归地进行产生，比如产生的结果中，包含自己：

$\rightarrow 0V$

一个规范化的四元组长这样：

$(\{A,B\}, \ \{0,1\}, \ \{A\rightarrow0,A\rightarrow1A,B\rightarrow0A,B\rightarrow1\}, \ B)$

通过产生式，推出一个字符串产生的过程，叫做推导。例子如下，给出文法 G，写出句子 aaa 的推导过程

$(\{A\}, \ \{a\}, \ \{A\rightarrow a \mid aA \}, \ A)$

推导的过程如下：

$\rightarrow aA, \ 使用产生式 A\rightarrow aA \\ aA \rightarrow aaA, \ 使用产生式 A\rightarrow aA \\ aaA \rightarrow aaa, \ 使用产生式 A\rightarrow a$

归约则是和推导（又称为派生）相反的过程，通过句子推导出文法。

DFA

DFA 即为确定的有穷状体自动机，和文法不同，文法注重描述一个串是如何产生的。而 DFA 则注重于观察该串是否能被某些文法接收。

通过五元组：

$\ 输入字母表, \ 转移函数, \ 起始状态, \ 接收状态集合 )$

来描述一个 DFA。其中落入接收状态的串是能够被 DFA 识别的。比如：

此外，DFA 还应该有陷阱状态，表示当前串无法被接收时，状态就落入陷阱状态。比如有如下的例子，qt 就是陷阱状态，表示读取到不被接受的串：

通过【即时描述】来表达一个自动机接收某个串的过程。即时描述通过状态 q 在串上不停滑动，生动地表示了接收的过程，如下图：

NFA

NFA 意为不确定的有穷状体自动机。DFA 一次只能通过一个输入的字符，跳转到一个单独的状态。而 NFA 则允许通过一个输入的字符，跳转到多个状态。比如下图，q0 接收 0 可以跳转到 q1 或者 q0：

如果说 DFA 是单线程的话，NFA 就是多线程。如果说 DFA 是 DFS（深搜）的话，NFA 就是 BFS（广搜），这样是否容易理解了？

NFA 转换为 DFA

其实 NFA 和 DFA 是等价的，因为 DFA 是一次跳转到一个状态，而 NFA 是一次跳转到一个状态的集合。

如果把 NFA 的状态集合视为 DFA 的一个状态，那么就能实现 NFA 到 DFA 的转换，这个思想叫做子集构造。

比如将如下的 NFA 转为 DFA：

首先根据起始状态 q0，到达两个不同的状态集合，分别是 {q0, q1} 和 {q0, q2}

因为把状态集合看作是 DFA 的状态，那么我们得到了两个新状态，分别是 {q0, q1} 和 {q0, q2}，下图的绿色标记了这两个新状态：

然后来判断新状态 {q0, q1} 的状态转移。因为组合了状态 q0 和 q1 的状态转移，我们将原 NFA 的状态转移结果取并集，作为该状态的新转移（下图红色箭头）。这里只给出接收 0 的箭头，1 的同理，于是又产生了新的状态 {q0, q1, q3} ，如下图：

同理，对 {q0, q2} 如法炮制，我们取原 NFA 的 q0 和 q2 的状态转移结果的并集。产生新状态 {q0, q2, q3}，如下图：

对两个新状态也是如法炮制：

DFA，完成了！

ε-NFA

ε-NFA 允许通过空字符，即 ε 来转移到新的状态。

对于 ε-NFA，可以对其进行空拓展，将其转为一般的 NFA。因为接收到输入字符 a，也可以认为是接收到 aε，aεε，εεa，εa，即多个空字符！而且空字符可以任意地组合在有效字符 a 的前缀或者后缀。

空拓展可以通过 ε 来转移到任意状态，只要 NFA 有对应的边就允许任意输入字符沿着这些 ε 的边进行转移，最终达到一个闭包（即联通分量），下图展示了如何构建一个拓展的空闭包：

其实就是做了一次特殊的 dfs，只要遇到 ε 边，都无脑去搜它就好了。至此，ε-NFA 也可以转为普通的 NFA 了。因为普通 NFA 没有 ε 输入，我们只需要考虑正常的输入，进行 NFA 状态转移（边）的构造。

如下图绿色部分所示，这些是我们关心的状态转移：

正则表达式

注：
这个不是一般编程的正则表达式

正则表达式和文法类似，都是生成串的形式语言。正则表达式主要的操作有三个，分别是加法，连接和闭包。

加法能够将两个东西并行地联系起来，如果用集合来表示，就是并集。比如：

$\ \\ (0+1) \stackrel{表示的语言为}{\longrightarrow} \{0, 1\} \ \\$

通过 0 和 1 取并，生成的语言为 {0, 1}。

然后是连接（或者拼接？）连接运算则是按照顺序将两个表达式产生的串拼接起来，比如：

$\ \\ (01) \stackrel{表示的语言为}{\longrightarrow} \{01\} \ \\$

那么最终表示的语言就只有 01 一个串了，注意顺序！

最后是闭包运算，闭包运算允许我们任意地将集合内的元素自由组合，比如：

$\ \\ (01)^* \stackrel{表示的语言为}{\longrightarrow} \{0,1\} ^* \ \\$

最后贴一张定义：

对应到自动机上，三种规则的构图如下：

如果是 + 运算，那么分为两个分支进行接收
如果是拼接运算，那么按照顺序进行接收
如果是闭包运算，通过环路进行重复接收

下面来看一个例子：

图上作业法

图上作业法用于将一个自动机转换为正则表达式，换句话说，可以通过该方法查找出该自动机接收的串的正则表达式。

图上作业法的核心就算通过消除节点，来产生表达式。比如我们消除下图的 q2 节点，因为我们可以从 q1 通过正则表达式一步到 q3。

因此 q1 到 q3 的过程被我们描述为正则表达式，并且形成一条边。我们对 q2 的每个入度节点都要进行同样的操作（即连接 q2 的入节点和出节点），如下图：

事实上一次完整的图上作业法，第一步应该是虚拟起点和终点。将一个虚拟原点 X 通过空字符 ε 转移到初始状态。此外，将所有的接收状态通过 ε 引导到虚拟终点 Y，如下图：

通过消去 q2 节点，我们得到：

接着消去 q3 和 q4，这里我们得到两条边，我们可以通过加法合并他们：

最后消去 q1，得到最终的表达式：

泵引理

通过泵引理判断一个语言是否是正则语言，思路是反证法。

如果有 n 个状态，接收的串却长度大于 n，那么自动机（图）中必有环路。

先假设它是正则语言，我们沿着环路重复走 i 次，其中 i 可以是任意正整数，如果找到某个 i 使得该语言不被接收，那么就和假设矛盾，该语言就不是正则语言！

比如证明语言：

$\{0^n1^n \mid n \ge 1 \}$
不是正则语言，通过泵引理的思路如下：

注：泵引理只能判断某个东西不是正则语言，不能判断它是正则语言。。。

极小化 DFA 算法

DFA 中可能存在冗余的状态，比如：

明明都是两条一样的路，你偏要分开来，于是 DFA 的极小化算法就算为了解决冗余的 DFA 而生。

首先定义一种状态：可区分。什么是可区分呢？接收相同的输入，却去到了不同的状态。

比如下图，q2 q3 接收 0，一个去到了接收状态，一个去了非接收状态，那么 q2，q3 可区分，因为他们有截然不同的特征：

此外，如果接收同样的输入，却去到了两个【可区分】的状态，那么这两个状态同样可区分。比如下图，q0，q1 接收 1，去到了可区分的 q2，q3，那么 q0，q1 同样是可区分的：

注意对所有的接收字符，都要进行判断，才能判断两个状态是否可区分。同时这个判断是递归进行的。

因为有时接收相同的输入，获得一组新的状态对 qi，qj 我们往往不知道他两是否可区分，于是问题转变为求 qi，qj 是否可区分，这就是递归！

此外，如果接收相同的输入，去到了相同的状态，那么他们不可区分，这意味着他们是等价的：

弄明白了啥可区分，不可区分，就可以开始进行算法了！

算法如下，首先准备一张可区分表。此外，可区分是相对的，ab 可区分意味着 ba 可区分，所以表的有效部分为上三角：

首先进行初始化，已知状态对 qi，qj 其中 qi 是接收状态，而 qj 不是接收状态，那么他们可区分。

{q0, q1} 接收 1 时，前者去到接收状态 {q2, q3}，而 q5 接收 1 去到非接收状态 q5，于是 q0, q5 与 q1, q5 可区分
{q2, q3, q4} 接收 1 时都去到非接受状态 q5，而 {q0, q1} 接收 1 去到接收状态 {q2, q3}，于是他们的 6 个组合，都可区分
{q2,q3,q4} 接收 0 去到接收状态 q4，而 q5 接收 0 去到非接收状态 q5，于是他们的三种组合都可区分

根据上面三个判断，我们可以轻易地画出初始化的表格：

此外，如果接收到同一个输入，去到了相同的状态，那么他们不可区分（他们等价），于是有：

{q2, q3, q4} 接收 0 都去到 q4，接收 1 都去到 q5，于是 q2, q3, q4 都不可区分

通过下图话 × 部分可以表示他们不可区分：

然后遍历表的每一项空缺，并且试图利用递归法判断该状态对是否可区分。这里只用判断 q0，q1 是否可区分。

因为 q0，q1 接收 1 能够到达 {q2, q3} 根据递归，问题转换为求 q2，q3 是否可区分！从表中看出他们不可区分，于是有：

那么有：

[q0, q1] 不可区分
[q2, q3, q4] 不可区分

于是将原来的自动机（图），根据状态（节点）之间是否可区分，将图划分为三个连通分支，分别是：

$q_0, q_1], \ [q_2, q_3,q_4], \ [q_5]$

极小化后的 DFA 将一个连通分支视为单独的状态（或者说节点），根据节点进行转移。于是可以得出极小化后的 DFA：

FA 交集

前面在提及正则表达式的时候，我们可以通过加法（或者说两个单独的分支）来实现 FA 的并操作，这里以一道例题说明如何实现 FA 的交操作：

这里其实 1 不用管，因为满足 2，3 自然满足 1，根据 DFA 交集，我们首先构造满足 2 和 3 的 DFA：

紧接着取交集。从起始状态开始，我们将 1 和 3 状态合一。

在左边的自动机中，状态 1 接收到 1，转移到状态 1
在右边的自动机中，状态 3 接收到 1，转移到状态 4

于是我们起始状态为 13，在接收 1 后，状态转变为 14 了！对于其他的状态组合和输入组合如法炮制，最终得到如下的 DFA：

CFG，二义性与其化简

CFG，context-free grammar 又名上下文免费无关文法，是文法的一种特殊。它的定义是这样的，对于文法：

$G = (V, T, P, S)$

的产生式 P，除了 A → ε 的这种空产生式之外：

$对于任意产生式：\forall \alpha \rightarrow \beta \\$

产生的结果 β 都有如下规律：

$|\beta| \ge |\alpha| \ 且 \ \beta ∈ V$

意义就是对于任意的 A ∈ V，如果有产生式 A→B，无论 A 出现在什么位置，都可以通过将 A 替换成 B，而无需考虑 A 的上下文。

CFG 可以通过派生树来表示句子的生成过程。

可以看作是一颗树，生成树，通过先序遍历其所有叶子节点以获取最终生成的句子。此外，一个句子可能有不同的生成树，这叫做 二义性 。

CFG 可以被化简，因为尽管一个文法符合 CFG 的标准，但是其任然存在一些无关的东西。化简 CFG 的算法通常分为两个步骤：

去除无法终止的变量
去除无法到达的变量

而且这二者的顺序不可交换！证明过程略。

算法听起来有点抽象，那么什么叫无法终止的变量呢？就是无法派生出终极符的变量，比如下面的文法中的 A 变量：

$(\{A,B\}, \{a,b,c\}, \{A \rightarrow aA \}, A)$

可以看到 A 变量能够生成 aA，但是无法终止，因为无论怎么生成，A 都消不掉，即无限递归。此外，如果产生式中没有出现的变量，比如上面文法的 B 变量就没有产生式，这表示一旦有一个 B，文法就会 ”卡死“，因为找不到 B 的产生式！

值得注意的是，一旦发现一个不可消去的变量 X，就要 “顺藤摸瓜” 地回溯，找到所有产生 X 的变量，并且这些产生 X 的变量也是不可消去的。

如图，还没消去的情况，因为 B 消除不掉，我们顺藤摸瓜，将 S→BB ，S→AB， C→ABa 也标记为无法终结的产生式：

红色的叶子表示不可终结的变量 B，我们待消去的产生式如下：

$\rightarrow AB \\ S \rightarrow BB \\ C \rightarrow ABa \\$

消去无法终结的产生式之后的派生：

这里就来到了第二步：消除到达不了的变量。可以看到从 S 变量除法，无法到达 A，B 所以 A B 要被消去，消去之后的文法如下：

至此，CFG 化简完成。

windows中dify本地部署，非docker环境
第一章win11中安装配置Archlinux文章目录第一章win11中安装配置Archlinux一、安装Archlinux1.直接在wsl中安装2.本地镜像安装3.wsl中卸载archlinux二、在Archlinux中创建新用户1.包管理工具升级2.使用useradd创建用户3.设置新用户密码4.测试用户5.删除用户三、其他设置1.wsl的互作性2.systemd支持四、安装vim1.安装前准备
uiautomatorviewer工具在Android 9.0上的应用及优势小馬锅
本文还有配套的精品资源，点击获取简介：uiautomatorviewer是AndroidSDK中的自动化测试和UI分析工具，特别适用于Android9.0版本。它支持扫描和分析应用UI控件，获取关键UI元素信息以编写自动化测试脚本。工具采用XPath定位技术，对于复杂布局中的UI元素精确定位尤为有效。同时，uiautomatorviewer与Appium自动化测试框架在功能上具有重叠，但各有优势。
SpringBoot ThreadLocal 全局动态变量设置 xdscode spring boot java ThreadLocal
需求说明：现有一个游戏后台管理系统，该系统可管理多个大区的数据，但是需要使用大区id实现数据隔离，并且提供了大区选择功能，先择大区后展示对应的数据。需要实现一下几点：1.前端请求时，area_id是必传的1.数据隔离，包括查询及增删改：使用mybatis拦截器实现2.多个用户同时操作互不影响3.非前端调用场景的处理：定时任务、mq1.前端决定area_id为了解决多个用户可以互不影响的使用不同的a
oracle批量插入优化,oracle批量插入优化方案 Eric Q oracle批量插入优化
今天听DBA说如果从一个表批量查询出一批数据之后批量插入另外一张表的优化方案：1)不写归档日志；2)采用独占关于insert/*+append*/我们需要注意以下三点：a、非归档模式下，只需append就能大量减少redo的产生；归档模式下，只有append+nologging才能大量减少redo。b、insert/*+append*/时会对表加锁(排它锁)，会阻塞表上的除了select以外所有D
有效避免 Cannot read property ‘xxx‘ of undefined 这类运行时错误。避免因数据字段缺失导致的报错 @Dream_Chaser vue前端前端 javascript 开发语言
‌hasOwnProperty方法‌是JavaScript对象的内置方法用于检测对象自身（非原型链）是否包含指定属性返回布尔值（true/false）constfetchedData={"order":"21570921","orderType":"1",//其他属性...};constitem={value:"orderType"//我们想检查fetchedData是否有这个属性};if(fet
【网络协议】TCP连接的建立和释放
TCP连接的建立和释放TCP首部格式TCP报文段的前20个字节是固定的，后4N个字节为根据需要可增加的选项首部各字段的意义如下：源端口和目的端口：加上IP首部的源IP地址和目的IP地址，确定唯一的一个TCP连接。另外通过目的端口来确定TCP将数据报交付于哪个应用程序，从而实现功能。序列号：占4个字节，由于TCP是面向字节流的，在TCP中传送的每一个字节都按顺序编号，首部中的序号字段(seq)是指本
【单片机】51单片机练习代码 iFulling 单片机笔记单片机 51单片机嵌入式硬件
【单片机】51单片机练习代码1.端口定义LED灯端口蜂鸣器端口2.独立按键程序编写3.数码管显示4.外部中断初始化5.中断函数程序编写6.串口程序初始化7.LCD602写数据和写命令8.用定时器实现秒表9.流水灯（数组实现）10.花样流水两边往中间（数组实现）11.用定时器编写等宽方波12.用定时器编写非等宽方波1.端口定义LED灯端口#includesbitled0=P1^0;//定义LED灯端
Android开发中的函数式编程应用：什么是函数式编程
我们进行了多年的Android开发，但是面对越来越复杂的业务逻辑和越来越庞大的代码，传统命令式的编程方式已经渐渐无法解决我们的问题了。今天开始我们将探索一种非常强大的编程范式：函数式编程。1.传统编程范式的挑战1.1过程式编程的难题大家日常开发中一定遇到过这些问题：1.1.1返回值不确定//全局计数器变量varcounter=0//返回值依赖于外部状态，每次调用结果不同fungetNextId()
【数据结构】复杂度分析
目录一、算法1.基本概念2.描述方法3.算法效率二、算法的时间复杂度三、算法的空间复杂度一、算法1.基本概念通俗的讲，算法是解决问题的方法，比如在现实生活中一道菜谱，一个安装轮椅的操作指南等。严格的说，算法是对特定问题求解步骤的一种描述，是指令的有限序列。算法具有的基本特性有：（1）有穷性。一个算法必须总是在执行有穷步之后结束，且每一步都在有求时间内完成。（2）确定性。算法中的每一条指令必须有确切
c语言逻辑运算符编程,C语言之逻辑运算符详解湛蓝色的迷惘 c语言逻辑运算符编程
一逻辑运算符：&&：逻辑与，读作并且表达式左右两边都为真，那么结果才为真口诀：一假则假||：逻辑或，读作或者表达式左右两边，有一个为真，那么结果就为真口诀：一真则真!:逻辑非，读作取反表达式的结果如果为假，就变成真，如果为真，就变成假口诀：真变假，假变真二逻辑运算符的短路问题tips:非0为真，0为假短路的情况：&&：左边如果为假，则右边短路(右边不会被执行)||：左边如果为真，则右边短路(右边不
C语言正则表达式使用详解
标准的C和C++都不支持正则表达式，但有正则表达式的函数库提供这功能.C语言处理正则表达式常用的函数有regcomp()、regexec()、regfree()和regerror()。使用正则表达式步骤：1)编译正则表达式regcomp()2)匹配正则表达式regexec()3)释放正则表达式regfree()4)获取regcomp或者regexec产生错误，获取包含错误信息的字符串函数声明如下：
VMware Fusion 13 Mac虚拟机
VMwareFusionPromac不仅能让你在Mac苹果电脑上运行Windows或Linux系统、使用非Mac平台的应用，而且还可以支持各种USB硬件设备。原文地址：VMwareFusion13Mac虚拟机
上位机软件开发深圳市由你创科技上位机开发 c语言
上位机软件开发是指开发用于与下位机（如单片机、PLC、传感器、嵌入式设备等）进行通信、数据交互及控制的计算机端软件。这类软件通常需要实现数据采集、实时监控、参数配置、数据分析及可视化等功能。以下是开发上位机软件的关键步骤和技术要点：一、开发流程需求分析明确功能需求：数据采集频率、通信协议、界面交互、数据存储方式等。确定硬件接口：串口（RS232/RS485）、USB、TCP/IP、CAN总线、Mo
正则表达式基本用法（notepad++）丨封尘绝念斩丨正则表达式
1.启动Notepad++并打开一个文本文件。点击菜单栏的"搜索"，然后选择"查找"或"替换"。2.学习基本的匹配字符："."表示匹配任意字符。"\d"表示匹配数字字符。"\w"表示匹配字母、数字和下划线字符。"\s"表示匹配空白字符。"[abc]"表示匹配字符"a"、"b"或"c"中的任意一个。3.学习特殊字符和量词："^"表示匹配字符串的开头。"$"表示匹配字符串的结尾。"*"表示匹配前面的字
Unity3D 游戏在 iOS 上因为 trampolines 闪退的原因与解决办法耳朵里有只风 ios unity unity3d ios ios闪退
崩溃的情况进入游戏一会儿，神马都不要做，双手离开手机，盯着屏幕看吧，游戏会定时从服务器那儿读取一些数据，时间一长，闪退了。尼玛问题是神马呢？完全没有头绪，不过大体猜测是因为网络请求导致的，那么好，先排查服务器返回结果是否有问题，最终确认每次客户端崩溃的时候，服务器都成功的返回了格式正确的数据，没有任何异常。那么可以确定问题是出在客户端部分了。先检查代码，确认逻辑上没有任何问题之后，也倍感无力啊，问
正则表达式-元字符及描述 dianaixun1635 java scala javascript ViewUI
元字符描述\将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如，“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。^匹配输入字行首。如果设置了RegExp对象的Multiline属性，^也匹配“\n”或“\r”之后的位置。$匹配输入行尾。如果设置了RegExp对象的Multiline属性，$也匹配“\n”
notepad++正则表达式痞子IT 嵌入式开发语言 xml c语言
notepad++正则表达式使用笔记：1.查找空行：^\s*\r\n2.排除以（开头的行：^(?!（).*$3.查找第二行以A-D开头的情况：(\r\n)(^[A-D])4.查找不含有helloworld的行：^(?!.*helloworld).*$5.查找不以com结尾的字符串：^.*?(?|"']|"[^"]*"|'[^']*')*?(?:/>|>.*?)11.查找非换行空白：(\s)(?)及
rk3566开发之rknn npu 部署三十度角阳光的问候 rknn npu rk3566 目标检测
目录NPU使用RKNN模型非RKNN模型RKNN-Toolkit2工具RKNNNPU测试代码如下main.ccssd.cc调用ssd模型进行目标检测测试ssd.hqt中调用rknnnpu接口NPU使用RK3566内置NPU模块。使用该NPU需要下载RKNNSDK，RKNNSDK为带有NPU的RK3566/RK3568芯片平台提供编程接口，能够帮助用户部署使用RKNN-Toolkit2导出的RKNN
基于STM32单片机的考勤打卡系统
文章目录一、系统概述二、项目内容和功能介绍三、效果图四、资料获取一、系统概述基于STM32单片机的考勤打卡系统介绍一、系统概述基于STM32单片机的考勤打卡系统是一种集数据采集、身份识别、记录存储与远程管理于一体的智能化考勤解决方案。该系统以STM32微控制器为核心，通过非接触式识别技术（如RFID、指纹、人脸识别）或传统输入方式（如按键、密码）快速采集员工考勤信息，结合实时时钟模块（RTC）记录
shell编程之sed命令详解
shell编程之sedsed编辑器介绍sed（流编辑器）是一种非交互式文本处理工具，基于预设规则逐行处理数据流（文件或管道输入）。它将当前行存入模式空间，按命令处理后输出到标准输出，不修改原始文件。工作流程读取一行数据到模式空间；按顺序执行编辑命令；输出处理后的行；重复直至所有行处理完毕。命令格式sed[options]'script'[file1file2...]选项：选项描述-escript显
爬虫-数据解析打酱油的； python自动化+爬虫爬虫
1.解析概述特性re(正则表达式)bs4(BeautifulSoup)xpath(lxml)pyquery本质文本模式匹配HTML/XML解析器(DOM树操作)XML路径语言(节点导航)jQuery式CSS选择器(封装lxml)学习曲线陡峭中等中等简单(熟悉jQuery/CSS)灵活性极高(处理任意文本)高(容错好，DOM操作)高(路径、轴、谓词)高(jQuery语法)可读性差(模式复杂时难懂)好
爬虫-正则表达式打酱油的； python自动化+爬虫爬虫 python
在线正则表达式测试OSCHINA.NET在线工具,ostools为开发设计人员提供在线工具，提供jsbin在线CSS、JS调试，在线JavaAPI文档,在线PHPAPI文档,在线Node.jsAPI文档,LessCSS编译器，MarkDown编译器等其他在线工具https://tool.oschina.net/regex/
VMware Fusion 13 Mac虚拟机 fengyun2891 macos mac 虚拟机
VMwareFusionmac不仅能让你在Mac苹果电脑上运行Windows或Linux系统、使用非Mac平台的应用，而且还可以支持各种USB硬件设备。原文地址：VMwareFusion13Mac虚拟机
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD 哪吒搬砖工逆袭Java架构师华为od 算法华为OD机试 2025B卷 java
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、正则表达式第6天、深度优先搜索dfs第7天、深度优先搜索dfs六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605
小架构step系列09：日志量控制秋千码途 java logback 架构后端
1概述当业务运行出问题的时候，需要借助日志来定位问题，下面的情况可能会导致日志量比较大：很多开发人员对日志的作用并不是很理解，大概是把日志当单步调试用，想看看程序是否运行到哪一步就打印个日志，确定程序到哪一步远远不够的，还需要其它信息，这样日志就会越打越多。业务软件运行的时间越长，积攒的日志就越多。日志的存储是要消耗存储空间的，如果不加以控制，量积累到一定程度就有可能会耗光有限的磁盘空间，甚至无法
【无标题】如何定制开发小程序APP
定制开发小程序APP通常需要以下步骤：需求调研与分析-明确目标与定位：确定小程序APP的核心目标，例如是用于电商销售、品牌展示、客户服务还是线上线下业务融合等。-剖析目标受众：深入了解目标受众的特征，包括年龄、性别、职业、消费习惯、地域分布等，以便设计出符合其使用偏好的产品。-开展竞品研究：分析同行业竞品小程序APP的优劣，从功能布局、界面设计、用户体验、营销策略等方面吸取经验，为自身设计提供参考
小架构step系列08：logback.xml的配置秋千码途 logback xml java
1概述logback.xml配置文件的详细配置，很多地方都说得比较细，本文主要从几个重点来看一下原理，了解原理能够帮助确定哪些应该配置，以及如何配置。logback.xml是为打印日志服务的，打印的内容一般打印到控制台(Console)和文件(file)里，在生产环境中主要是打印到文件里，然后用扫描工具汇总到某个地方方便查询(如ELK)。打印的内容要符合一定的格式，提供足够的信息，方便进行日志查询
OSPF３类LSA的更新撤销
首先想清楚一个点：三类LSA是如何来描述路由的？答：一条路由信息，通过一个3类LSA描述（一个3类LSA，只能描述一条路由信息）可以把3类LSA想象成学校里的“通知条”，用「校园通知」的场景来理解这句话：1.把「3类LSA」比作「通知条」假设学校里有“教务处”（骨干区域Area0）和“班级”（非骨干区域，比如二班、三班），3类LSA就像教务处给班级发的「通知条」，专门用来传递“其他班级/区域有啥资
华为网络技术-DHCP和Telnet
DHCP动态主机配置协议把地址从静态配置改为动态获取。一次完整的DHCP工作需要两种角色。DHCP的工作流程：Discover:客户端寻找服务器（广播）Offer:服务器响应客户端（携带了IP地址参数信息），单播。如果有多个服务器响应offer，客户端会选择使用最先收到的offer报文中的地址进行req。Request:客户端请求使用该地址。广播。客户端通告服务器我确定使用你给的地址。客户端通告其
功能安全开发--系统阶段TSC 功能安全er 安全
1.TSC、TSR和系统架构1.1标准定义技术安全概念（TSC）是技术安全要求及其对应的系统架构设计的集合，提供了系统架构设计适合于满足GB/T34590.3（包括考虑非安全要求）中所述活动产生的安全要求和设计约束的依据。技术安全要求规定了功能安全要求在其各自层级上的技术实现；要同时考虑相关项定义和系统架构设计，并述及潜伏失效的探测、故障避免、安全完整性以及运行和服务方面的问题。系统构架设计是由技
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam