weixin_39622084

python实现一个编译器_一个编译器最简前端的python实现（二）

全部代码在这里：

import queue

from typing import Set

grammar = [("startsup", ("start", )),

("start", ("stmt", )),

("stmt", ("if", "(", "C", ")", "S1", "else", "S2")),

]

terminals = ("if", "(", "C", ")", "S1", "else", "S2", '$')

n_terminals = ("startsup", "start", "stmt")

all_symbols = terminals + n_terminals

class Item(object):

"""The Canonical LR(1) Item definition.

:param symbol: str, the left part of production.

:param body: str, the right part of production.

:param dot: int, current position in the item.

:param follow: str, possible input for the current configuration.

"""

def __init__(self, symbol, body, dot, follow):

self.symbol = symbol

self.body = body

self.pos = dot

self.follow = follow

def __str__(self):

p = list(self.body)

p.insert(self.pos, '◆')

pr = ' '.join(p)

return "[{}] {} -> {}".format( self.follow, self.symbol, pr)

def __repr__(self):

return "\n".format(self.__str__())

def __eq__(self, other):

if isinstance(other, Item):

return ((self.symbol == other.symbol) and

(self.body == other.body) and

(self.pos == other.pos) and

(self.follow == other.follow))

else:

return False

def __ne__(self, other):

return not self.__eq__(other)

def __hash__(self):

return hash(self.__str__())

class Closure(object):

def __init__(self, sets: Set[Item], label: int = None):

self.label = label

self.sets = sets

self.goto = dict() # type: dict[str, int]

def __len__(self):

return len(self.sets)

def __iter__(self):

return self.sets.__iter__()

def __str__(self):

return "\n".join([i.__str__() for i in self.sets])

def __repr__(self):

return ":{}\n{}\n\n".format(self.label,

self.__str__())

def __eq__(self, other):

return self.sets == other.sets

def __ne__(self, other):

return not self.__eq__(other)

def __hash__(self):

return hash(self.__str__())

def __contains__(self, item):

return item in self.sets

def isnterm(symbol):

return symbol in n_terminals

def isterm(symbol):

return symbol in terminals

def produce_epsilon(none_terminal):

return 'EPSILON' in [i[1] for i in grammar if i[0] == none_terminal]

def first(symbol):

"""Return the first terminal sets that may occur in the Symbol."""

first_sets = set()

if isterm(symbol):

return set(symbol)

elif produce_epsilon(symbol):

first_sets = first_sets.union('EPSILON')

elif isnterm(symbol):

for i in grammar:

if i[0] == symbol:

body = i[1]

epsilons = True

current = 0

while epsilons is True and current < len(body):

if body[current] != symbol:

first_sets = first_sets.union(first(body[current]))

if not produce_epsilon(body[current]):

epsilons = False

current += 1

return first_sets

def firsts(suffix):

if len(suffix) == 1:

return first(suffix[0])

else:

if not produce_epsilon(suffix[0]):

return first(suffix[0])

else:

return first(suffix[0]).union(firsts(suffix[1:]))

def get_closure(cl: Closure, label: int) -> Closure:

"""get all Item of a Closure from given Items, by adding implied Items.

The implied Items are the productions of the None terminals after the

current position, which put a dot on the head."""

def get_nterm(item):

pos, prod = (item.pos, item.body)

if pos < len(prod):

symbol = prod[pos]

if isnterm(symbol):

return symbol

return None

item_set = set()

q = queue.Queue()

for i in cl.sets:

item_set.add(i)

q.put(i)

while not q.empty():

item = q.get()

symbol = get_nterm(item)

if symbol:

products = [i for i in grammar if i[0] == symbol]

suffix = item.body[item.pos+1:] + tuple(item.follow)

termins = firsts(suffix)

for product in products:

for terminal in termins:

new_item = Item(symbol, product[1], 0, terminal)

if new_item not in item_set:

item_set.add(new_item)

q.put(new_item)

c = Closure(item_set, label)

return c

def goto(clos: Closure, letter: str) -> Closure:

"""a closure that could get from the current closure by input a letter.

:param clos: the current closure.

:param letter: the input letter.

:return: Closure.

"""

item_set = set()

for item in clos.sets:

dot, prod = (item.pos, item.body)

if dot < len(prod) and prod[dot] == letter:

new_item = Item(item.symbol,

item.body,

item.pos + 1,

item.follow)

item_set.add(new_item)

c = Closure(item_set)

return get_closure(c, label=None)

def closure_groups():

def find_label(closure, group):

for i in group:

if closure == i:

return i.label

return None

group = set()

label = 0

start_item = Item('startsup', ('start',), 0, '$')

start = get_closure(Closure({start_item}), label)

q = queue.Queue()

q.put(start)

group.add(start)

while not q.empty():

c = q.get()

for literal in all_symbols: # terminals + n_terminals:

go_clos = goto(c, literal)

if go_clos:

if go_clos not in group:

label += 1

go_clos.label = label

q.put(go_clos)

group.add(go_clos)

c.goto[literal] = label

# print('add closure', go_clos)

else:

go_label = find_label(go_clos, group)

if go_label:

c.goto[literal] = go_label

return group

def get_states_map(closure_group):

def get_state_map(closure):

""" table row like all_symbols list state maps."""

row = ["." for i in all_symbols]

# None terminals GOTO action and Terminals shift action.

for input, goto_label in closure.goto.items():

row_pos = all_symbols.index(input)

for item in closure:

if item.pos < len(item.body): # shape like [A -> ⍺.aβ b]

if item.body[item.pos] == input:

# None terminals GOTO state

if input in n_terminals:

row[row_pos] = str(goto_label)

# Terminals action shift state

elif input in terminals:

row[row_pos] = "s" + str(goto_label)

# Terminals reduce action. shape like [A -> ⍺. a]

for row_pos, input in enumerate(all_symbols):

for item in closure:

if item.pos == len(item.body) and \

item.follow == input and \

item.symbol != 'startsup':

# 'R' should be replaced with start_symbol

#if item.follow != '*':

production_num = grammar.index((item.symbol, item.body))

row[row_pos] = 'r' + str(production_num)

#else:

# pass

# accept condition 'startsup -> start. , $'

acc_item = Item('startsup', ('start',), 1, '$')

if acc_item in closure:

input = '$'

row_pos = all_symbols.index('$')

row[row_pos] = '$'

return row

state_map = [None for i in range(len(closure_group))]

for closure in closure_group:

row = get_state_map(closure)

state_map[closure.label] = row

return state_map

def generate_syntax_table():

g = closure_groups()

state_map = get_states_map(g)

return state_map

看下结果：

from parser import *

n = generate_syntax_table()

state if ( C ) S1 else S2 $ startsup start stmt

0 s1 . . . . . . . . 2 3

1 . s4 . . . . . . . . .

2 . . . . . . . $ . . .

3 . . . . . . . r1 . . .

4 . . s5 . . . . . . . .

5 . . . s6 . . . . . . .

6 . . . . s7 . . . . . .

7 . . . . . s8 . . . . .

8 . . . . . . s9 . . . .

9 . . . . . . . r2 . . .

语法分析和翻译

语法分析

语法分析器在一个状态栈上工作，这个栈存储了移入的状态，它代表了已经输入，尚未规约的词法单元。语法分析器对token_stream(经过词法器解析后的代码)的词法单元逐个进行4种操作。分析器在分析开始前移入状态0。分析器以状态栈上的最后一个状态(栈顶)为当前状态，并且根据输入字符查分析表，来获得当前操作。

四种分析操作：移入，将目标状态移入到状态栈顶。进入下一个词法单元。

规约，规约目标产生式，当前词法单元不变，继续查表进行下一个操作，直到当前词法单状态元被移入。

接受，在含有增广文法开始符号产生式的项 [startsup -> start◆, '\$']，如果当前输入为 '\$'，分析成功进入接受状态，并结束。

错误，目前我们忽略错误处理。

代码如下：

class SDT:

def __init__(self):

self.syntax_table = generate_syntax_table()

self.state_stack = [0]

self.accept = False

def get_action(self, state, literal):

return self.syntax_table[state][all_symbols.index(literal)]

def ahead(self, token):

action = self.get_action(self.state_stack[-1], token.typ)

# shift action push a current state into state_stack

if action[0] == 's':

current_state = int(action[1:])

self.state_stack.append(current_state)

elif action[0] == '$':

self.accept = True # success

# reduce action reduct a production and push

elif action[0] == 'r':

# get the production in grammar

number = int(action[1:])

production = grammar[number]

head, body = production

# pop the states of production body

for _ in body:

self.state_stack.pop()

# push the state of head GOTO(I,X)

state = self.get_action(self.state_stack[-1], head)

self.state_stack.append(int(state))

# reduce actions does not consume a token,

# only when shifting, a token was consume and passed

self.ahead(token)

else:

raise SyntaxError(f"Not a correct token '{token.__str__()}'.")

def parse(self, token_stream):

while True:

try:

token = next(token_stream)

self.ahead(token)

except StopIteration:

# patch "$" in the end of token stream

# to match the augmented grammar

self.ahead(Token("$", "$"))

break

它接受一个词法单元流，并且分析，如果分析成功，accept就设置为True

from tokenizer import tokenizer

token_stream = tokenizer("if (C) S1 else S2")

sdt = SDT()

sdt.parse(token_stream)

sdt.accept

Out[8]: True

翻译方案

翻译方案一般插入到分析过程当中。

每个非终结符号都会形成一个函数，我们这里暂时在代码中预定义好非终结符号的翻译函数。

因为LR分析器是从右到左规约，而在移入的时候并不判断目前在哪个产生式的内部，因此翻译方案用后缀翻译来实现，就是在规约的时候翻译。产生式头部的名称作为函数名，规约的内容作为参数来进行调用，向上返回函数的结果。

建立一个参数栈:

self.arg_stack = []

token在移入的时候作为值移入到栈中。

self.push_arg(token)

规约时，将值移出，作为规约函数的参数。返回的结果，就是非终结符号的值，移入到栈中。

# translations

args = []

for _ in body:

arg = self.arg_stack.pop()

args.insert(0, arg)

translation = globals().get(head).__call__(*args)

self.arg_stack.append(translation)

然而后缀翻译方案只适用于综合属性(S属性)，对于继承属性并不适用。比如 stmt -> if (C) S1 else S2 大致会形成如下翻译方案:

C.code

S1.scode

goto stmt.next

label L1

S2.code

其中，stmt.next 由外部传入，是stmt作为产生式的体时的继承属性，LL分析器通过预测分析表已经获取了头部，所以可以预先分配一个值。这里由于分析器是规约方式的，因此尚不知道继承属性的值。一般采取用一个空产生式来替代翻译内容并先生成继承属性的方法来解决，不过会带来语法分析时的复杂性。

我们在这里采用延迟调用的方法，就是 stmt 规约完成后并不直接返回翻译的字符串值(因为还有一些属性不知道)，而是返回一个函数，通过将未知的内容包装成参数向上返回，在进行规约 start -> stmt 时，再将start 生成的必要值作为参数来调用 stmt 规约的返回值，就可以获得正确的翻译方案了。

def stmt(IF, LPAR, c, RPAR, s1, ELSE, s2):

def call(next_label):

L1 = get_label()

C_code = c.code(f_cond=L1)

S1_code = s1.code()

S2_code = s2.code()

inter_code = """

{}

goto {}

label {}

{}""".format(C_code, S1_code, next_label, L1, S2_code)

return inter_code

return call

添加对结束状态的处理，和一些其他必要动作。这样，分析和翻译方案就变成了：

class SDT:

def __init__(self):

self.syntax_table = generate_syntax_table()

self.state_stack = [0]

self.arg_stack = []

self.accept = False

self.translation = ''

def get_action(self, state, literal):

return self.syntax_table[state][all_symbols.index(literal)]

def ahead(self, token):

action = self.get_action(self.state_stack[-1], token.typ)

# shift action push a current state into state_stack

if action[0] == 's':

current_state = int(action[1:])

self.state_stack.append(current_state)

self.push_arg(token)

elif action[0] == '$':

self.translation = startsup(self.arg_stack[-1])

self.accept = True # success

print('SUCCESS')

print(self.translation)

# reduce action reduct a production and push

elif action[0] == 'r':

# get the production in grammar

number = int(action[1:])

production = grammar[number]

head, body = production

# pop the states of production body

for _ in body:

self.state_stack.pop()

# push the state of head GOTO(I,X)

state = self.get_action(self.state_stack[-1], head)

self.state_stack.append(int(state))

# translations

args = []

for _ in body:

arg = self.arg_stack.pop()

args.insert(0, arg)

translation = globals().get(head).__call__(*args)

self.arg_stack.append(translation)

# reduce actions does not consume a token,

# only when shifting, a token was consume and passed

self.ahead(token)

else:

raise SyntaxError(f"Not a correct token '{token.__str__()}'.")

def parse(self, token_stream):

while True:

try:

token = next(token_stream)

self.ahead(token)

except StopIteration:

# patch "$" in the end of token stream

# to match the augmented grammar

self.ahead(Token("$", "$"))

break

def push_arg(self, token):

if token.typ == 'C':

token.code = lambda f_cond: 'Ccode Cfalse = {}'.format(f_cond)

elif token.typ == 'S1':

token.code = lambda : 'S1code'

elif token.typ == 'S2':

token.code = lambda : 'S2code'

self.arg_stack.append(token)

all_labels = []

def get_label():

n = 'L' + str(len(all_labels))

all_labels.append(n)

return n

def stmt(IF, LPAR, c, RPAR, s1, ELSE, s2):

def call(next_label):

L1 = get_label()

C_code = c.code(f_cond=L1)

S1_code = s1.code()

S2_code = s2.code()

inter_code = """

{}

goto {}

label {}

{}""".format(C_code, S1_code, next_label, L1, S2_code)

return inter_code

return call

def start(stmt):

def call():

L = get_label()

return stmt(L)

return call

def startsup(f):

return f()

运行一下，

from parser import SDT

from tokenizer import tokenizer

token_stream = tokenizer('if (C) S1 else S2')

sdt = SDT()

sdt.parse(token_stream)

成功翻译：

Ccode Cfalse = L1

S1code

goto L0

label L1

S2code

这是个简陋的过程，但是核心功能完整，我们可以在之后的过程中，逐步完善它。

通常，词法规则和语法规则是由单独的文件定义的。所以需要对词法规则和语法规则进行解析的构件，来完成从源文本到python对象的转换。翻译方案通常嵌入到语法规则中。

错误处理可以在适当的情况引入到编译过程当中。

另外，二义性文法，空产生式等情况的转换在语法添加的过程当中会浮现。当然还有为语法规则添加基本的语句，使之逐渐成为一个完善的编译前端。

不论如何，我们已经完成了编译前端从源语言到目标语言的全部流程，是一个成功的开始。

你可能感兴趣的:(python实现一个编译器)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Leetcode 3604. Minimum Time to Reach Destination in Directed Graph Espresso Macchiato leetcode笔记 leetcode 3604 leetcode medium leetcode双周赛160 BFS 广度优先遍历最优路径
Leetcode3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路2.代码实现题目链接：3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路这一题思路上就是一个广度优先遍历，我们不断考察当前时间点以及位置的情况下，下一个点可行的位置，然后考察最近的时间点能够到达的位置，遍历全部可能
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri