在半岛铁盒里

编译原理实验2——自上而下语法分析LL1（包含去消除左递归、消除回溯）

文章目录

- 实验目的
- 实现流程
- - 代码
  - 运行结果
  - - 测试1（含公共因子）
    - 测试2（经典的i+i*i文法，且含左递归）
    - 测试3（识别部分标识符）
- 总结

实验目的

实现自上而下分析的LL1语法分析器，给出分析过程

实现流程

代码

代码逻辑

1.预处理

去除多余空格：如“ S - > aB”，处理成“S-> aB”

拆解候选式：对于某一产生式，若有多个候选式，根据 | 符号拆解为多个产生式。

获取开始符号：默认输入的第一个非终结符为开始符

消除左递归和回溯（公共因子）

获取非终结符和终极符

2.计算first集和follow集
3.检查是否符合LL1文法
4.建立预测分析表
5.对输入串进行LL1分析

import copy
from collections import defaultdict
import pandas as pd


class LL1:
    def __init__(self, input_str_list):
        self.input_str_list = input_str_list
        self.formulas_dict = {}  # 存储产生式 ---dict 形式
        self.S = ""  # 开始符
        self.Vt = []  # 终结符
        self.Vn = []  # 非终结符
        self.first = defaultdict(set)  # 初始化First集合
        self.follow = defaultdict(set)  # 初始化Follow集合
        self.table = {}  # 预测分析表
        self.info = {}

    # 消除直接左递归
    def eliminate_direct_left_recursion(self, grammar, non_terminal):
        productions = grammar[non_terminal]
        recursive_productions = []
        alphabet_list = [chr(i) for i in range(ord('A'), ord('Z') + 1)]  # A-Z，用于给新非终结符命名
        for production in productions:  # 找到含有左递归的候选式
            if production.startswith(non_terminal):
                recursive_productions.append(production)

        if len(recursive_productions) > 0:
            # 命名为A-Z且不与原有存在的非终结符重名
            for ch in alphabet_list:
                if ch not in grammar.keys():
                    new_non_terminal = ch
                    break

            # S = Sab \ Scd \ T \ F
            # 更新原始非终结符的产生式  S = (T\F) S'
            grammar[non_terminal] = [p + new_non_terminal for p in productions if not p.startswith(non_terminal)]

            # 添加新的非终结符的产生式  S'=(ab\cd) S'
            grammar[new_non_terminal] = [p[1:] + new_non_terminal for p in recursive_productions if
                                         p.startswith(non_terminal)]
            grammar[new_non_terminal].append('@')  # S'=(ab\cd)S' \ @

        return grammar

    # 往后预测，看是否会出现间接左递归
    def is_recruse(self, grammar, non_terminals, iidx, cur, pre):
        # print(f"=====cur:{cur}, pre:{pre}=====")
        check = False
        set_front_con = set()  # pre右侧所有可能递归的vn
        for pre_production in grammar[pre]:
            if pre_production[0].isupper():
                set_front_con.add(pre_production[0])
        # print("pre_set:", set_front_con)

        set_back_con = set()
        for i in range(iidx, len(non_terminals)):  # 遍历所有非终结符 curback = cur......最后一个终结符
            cur_back = non_terminals[i]
            # print("cur_back", cur_back)
            if i == len(non_terminals) - 1:  # 若为最后一个终结符，则加入自身
                set_back_con.add(cur_back)
            for cur_back_pro in grammar[cur_back]:  # 遍历当前cur_back的候选式
                if cur_back_pro.startswith(cur):
                    set_back_con.add(cur_back)
        # print("cur_set:", set_back_con)

        if len(set_front_con & set_back_con) != 0:  # 有交集
            check = True

        return check

    # 消除左递归（先间接后直接）
    def eliminate_left_recursion(self, grammar):
        non_terminals = list(grammar.keys())[::-1]  # 逆序，将开始符放到最后
        replaced_vn = []  # 记录被替换代入掉的非终结符
        for i in range(len(non_terminals)):  # 遍历所有非终结符
            cur = non_terminals[i]
            # 间接左递归--》直接左递归
            for j in range(i):  # 遍历 pre1,pre2,pre3.....cur的非终结符（cur前面的终结符）
                pre = non_terminals[j]
                new_productions = []
                for cur_production in grammar[cur]:
                    if cur_production.startswith(pre):  # 在cur的所有候选式中，找到以pre开头的候选式
                        if self.is_recruse(grammar, non_terminals, i, cur, pre):  # 若最终能产生间接左递归，进行代入合并处理
                            rest_str = cur_production.replace(pre, '', 1)  # 截取cur的该候选式去除首字符后的剩余字符
                            replaced_vn.append(pre)
                            for pre_production in grammar[pre]:  # 加入到pre的所有候选式后面
                                if pre_production + rest_str not in new_productions:
                                    new_productions.append(pre_production + rest_str)
                        else:  # 不进行代入合并处理
                            if cur_production not in new_productions:
                                new_productions.append(cur_production)
                    else:
                        if cur_production not in new_productions:
                            new_productions.append(cur_production)
                grammar[cur] = new_productions
            grammar = self.eliminate_direct_left_recursion(grammar, cur)  # 消除当前的直接左递归

        # 消除冗余产生式（那些被替换代入的产生式）
        for vn in replaced_vn:
            del grammar[vn]

        return grammar

    # 消除回溯
    def eliminate_huisu(self, grammar):
        alphabet_list = [chr(i) for i in range(ord('A'), ord('Z') + 1)]  # A-Z，用于给新非终结符命名
        while True:
            grammar_copy = grammar.copy()
            for left, right in grammar_copy.items():
                right = list(right)
                prefixes = []
                # 找所有项目的公共因子
                for i in range(len(right)):
                    for j in range(i + 1, len(right)):
                        str1, str2 = right[i], right[j]
                        index = 0
                        while index < min(len(str1), len(str2)) and str1[index] == str2[index]:
                            index += 1
                        if index >= 1:
                            have = False
                            for pre in prefixes:
                                if pre[0] == str1[0]:
                                    have = True
                            if not have:
                                if str1[:index] not in prefixes:
                                    prefixes.append(str1[:index])

                # =================================================================
                if len(prefixes) == 0:
                    continue
                tmp_match = defaultdict(set)
                tmp_not_match = set()
                # for pre in prefixes:
                #     for r_candidate in right:
                #         if r_candidate.startswith(pre):
                #             tmp_match[pre].add(r_candidate)

                for r_candidate in right:
                    match=False
                    for pre in prefixes:
                        if r_candidate.startswith(pre):
                            tmp_match[pre].add(r_candidate)
                            match=True
                            break
                    if not match:
                        tmp_not_match.add(r_candidate)

                new_ini_pro = set()
                for vn, right in tmp_match.items():
                    new_r_pro = []
                    new_vn = ""
                    for r_candidate in right:
                        for ch in alphabet_list:  # 根据alphabet_list给new_vn命名
                            if ch not in grammar.keys():
                                new_vn = ch
                                break
                        if r_candidate[len(vn):] == "":  # 切片后为空（即只剩一个字符），则新产生式补@
                            if "@" not in new_r_pro:
                                new_r_pro.append('@')
                        else:
                            if r_candidate[len(vn):] not in new_r_pro:
                                new_r_pro.append(r_candidate[len(vn):])
                    grammar[new_vn] = new_r_pro
                    new_ini_pro.add(vn + new_vn)
                grammar[left] = list(new_ini_pro.union(tmp_not_match))
                # print(grammar)
            if grammar_copy == grammar:  # 不再发生改变，则退出while
                break

        return grammar

    # 预处理
    def step1_pre_process(self, grammar_list):
        formulas_dict = {}  # 存储产生式 ---dict 形式
        S = " "  # 开始符
        Vt = []  # 终结符
        Vn = []  # 非终结符
        for production in grammar_list:
            left, right = production.split('->')
            if "|" in right:
                r_list = right.split("|")
                formulas_dict[left] = []
                for r in r_list:
                    if r not in formulas_dict[left]:
                        formulas_dict[left].append(r)
            else:
                if left in formulas_dict.keys():
                    formulas_dict[left].append(right)
                else:
                    formulas_dict[left] = [right]  # 若left不存在，会自动创建 left: 空set

        # 文法开始符
        S = list(formulas_dict.keys())[0]
        # 消除左递归和回溯
        formulas_dict = self.eliminate_left_recursion(formulas_dict)
        formulas_dict = self.eliminate_huisu(formulas_dict)
        print("=========消除左递归和回溯后的产生式=========")
        for left,right in formulas_dict.items():
            print(left+"->"+"".join(right))
        print("=========基本信息=========")
        # 获取终结符和非终结符
        for left, right in formulas_dict.items():
            if left not in Vn:
                Vn.append(left)
            for r_candidate in right:
                for symbol in r_candidate:
                    if not symbol.isupper() and symbol != '@':
                        if symbol not in Vt:
                            Vt.append(symbol)
        # 打印非终结符和终结符
        print("开始符：", S)
        print("非终结符：", Vn)
        print("终结符：", Vt)

        return formulas_dict, Vn, Vt, S

    def cal_symbol_first(self, symbol):
        # 如果是终结符，直接加入到First集合
        if not symbol.isupper():
            self.first[symbol].add(symbol)
        else:
            for r_candidate in self.formulas_dict[symbol]:
                i = 0
                while i < len(r_candidate):
                    next_symbol = r_candidate[i]
                    # 如果是非终结符，递归计算其First集合
                    if next_symbol.isupper():
                        self.cal_symbol_first(next_symbol)
                        self.first[symbol] = self.first[symbol].union(
                            self.first[next_symbol] - {'@'})  # 合并first(next_symbol)/{@}
                        if '@' not in self.first[next_symbol]:
                            break
                    # 如果是终结符，加入到First集合
                    else:
                        self.first[symbol].add(next_symbol)
                        break
                    i += 1
                # 如果所有符号的First集合都包含ε，将ε加入到First集合
                if i == len(r_candidate):
                    self.first[symbol].add('@')

    # 计算First集合
    def step2_cal_first(self, formulas_dict):
        # 计算所有非终结符的First集合
        for vn in formulas_dict.keys():
            self.cal_symbol_first(vn)
        # 计算所有终结符的First集合
        for vt in self.Vt:
            self.cal_symbol_first(vt)
        # 计算ε的First集
        self.cal_symbol_first('@')
        # 打印First集合
        for key, value in self.first.items():
            print(f"First({key}): {value}")

    # 计算Follow集合1——考虑 添加first(Vn后一个非终结符)/{ε}， 而 不考虑 添加follow(left)
    def cal_follow1(self, vn):
        self.follow[vn] = set()
        if vn == self.S:  # 若为开始符，加入#
            self.follow[vn].add('#')
        for left, right in self.formulas_dict.items():  # 遍历所有文法，取出左部单Vn、右部候选式集合
            for r_candidate in right:  # 遍历当前 右部候选式集合
                i = 0
                while i <= len(r_candidate) - 1:  # 遍历当前 右部候选式
                    if r_candidate[i] == vn:  # ch == Vn
                        if i + 1 == len(r_candidate):  # 如果是最后一个字符  >>>>>  S->....V
                            self.follow[vn].add('#')
                            break
                        else:  # 后面还有字符  >>>>> S->...V..
                            while i != len(r_candidate):
                                i += 1
                                if r_candidate[i] == vn:  # 又遇到Vn，回退 >>>>> S->...V..V..
                                    i -= 1
                                    break
                                if r_candidate[i].isupper():  # 非终结符  >>>>> S->...VA..
                                    self.follow[vn] = self.follow[vn].union(self.first[r_candidate[i]] - {'@'})
                                    if '@' in self.first[r_candidate[i]]:  # 能推空  >>>>> S->...VA..  A可推空
                                        if i + 1 == len(r_candidate):  # 是最后一个字符  >>>>> S->...VA  A可推空 可等价为 S->...V
                                            self.follow[vn].add('#')
                                            break
                                    else:  # 不能推空 >>>>> S->...VA..  A不可推空
                                        break
                                else:  # 终结符  >>>>> S->...Va..
                                    self.follow[vn].add(r_candidate[i])
                                    break
                    else:
                        i += 1

    # 计算Follow集合2——考虑 添加follow(left)
    def cal_follow2(self, vn):
        for left, right in self.formulas_dict.items():  # 遍历所有文法，取出左部单Vn、右部候选式集合
            for r_candidate in right:  # 遍历当前 右部候选式集合
                i = 0
                while i <= len(r_candidate) - 1:  # 遍历当前 右部候选式
                    if r_candidate[i] == vn:  # 找到Vn
                        if i == len(r_candidate) - 1:  # 如果当前是最后一个字符，添加 follow(left) >>>>>  S->..V
                            self.follow[vn] = self.follow[vn].union(self.follow[left])
                            break
                        else:  # 看看后面的字符能否推空 >>>>>  S->..V..
                            while i != len(r_candidate):
                                i += 1
                                if '@' in self.first[r_candidate[i]]:  # 能推空  >>>>> S->..VB..  B可推空
                                    if i == len(r_candidate) - 1:  # 且是最后一个字符  >>>>> S->..VB  B可推空
                                        self.follow[vn] = self.follow[vn].union(self.follow[left])
                                        break
                                    else:  # 不是最后一个字符，继续看  >>>>> S->..VBA..  B可推空
                                        continue
                                else:  # 不能推空  >>>>>  S->..VB..  B不可为空
                                    break
                    i += 1

    # 计算所有Follow集合的总长度，用于判断是否还需要继续完善
    def cal_follow_total_Len(self):
        total_Len = 0
        for vn, vn_follow in self.follow.items():
            total_Len += len(vn_follow)
        return total_Len

    def step3_cal_follow(self, formulas_dict):
        # 先用 cal_follow1 算
        for vn in formulas_dict.keys():
            self.cal_follow1(vn)
        # 在循环用 cal_follow2 算， 直到所有follow集总长度不再变化，说明计算完毕
        while True:
            old_len = self.cal_follow_total_Len()
            for vn in formulas_dict.keys():
                self.cal_follow2(vn)
            new_len = self.cal_follow_total_Len()

            if old_len == new_len:
                break
        # 打印Follow集合
        for key, value in self.follow.items():
            print(f"Follow({key}): {value}")

    # 检测是否符合LL(1)文法
    def step4_check_LL1(self, formulas_dict, first, follow):
        # 检查每个产生式右部，多个候选式中每个候选首字符的first集是否相交（回溯）
        for left, right in formulas_dict.items():
            if len(right) >= 2:
                #           print(f"{left}: {right}")
                s = set()
                for r_candidate in right:
                    old_len = len(s)
                    s = s.union(first[r_candidate[0]])
                    new_len = len(s)
                    if old_len == new_len:
                        return False
        # 每个产生式A，若饿ε∈first(A)，则first(A) ∩ follow(A) = 空集
        for left, right in formulas_dict.items():
            if '@' in first[left]:
                if first[left] & follow[left]:  # 有交集
                    return False
        return True

    # 建立LL(1)预测分析表
    def step5_create_table(self, formulas_dict, first, follow):
        tab_dict = {}
        for left, right in formulas_dict.items(): # 对于每一个产生式，求出其每个候选式的first集
            for r_candidate in right:
                idx=0
                cur_can_first = set()
                while True:
                    if r_candidate[idx].isupper():
                        cur_can_first = cur_can_first.union(first[r_candidate[idx]] - {'@'})
                    else:
                        cur_can_first.add(r_candidate[idx])
                    idx += 1
                    if idx >= len(r_candidate) or ('@' not in first[r_candidate[idx-1]]):
                        break

                for fi in cur_can_first:
                    if fi == '@':
                        for fo in follow[left]:
                            tab_dict[(left, fo)] = '@'
                    else:
                        tab_dict[(left, fi)]=r_candidate

        df = pd.DataFrame(list(tab_dict.items()), columns=['Key', 'Value'])
        df['Vn'] = [x[0] for x in df['Key']]
        df['Vt'] = [x[1] for x in df['Key']]
        tab_df = df.pivot(index='Vn', columns='Vt', values='Value')
        print(tab_df)
        return tab_dict, tab_df

    #  LL1分析
    def step6_LL1_analyse(self, s, S, Vn, Vt, table):
        s = list(s)  # 将字符串转为list类型，方便增删
        s.append('#')  # 末尾加入#
        sp = 0  # 字符串指针
        stack = []  # 栈
        stack.append('#')  # 进#
        stack.append(S)  # 进开始符
        msg = ""  # 分析情况
        step = 0  # 步骤数
        info_step, info_stack, info_str, info_msg, info_res = [], [], [], [], ""

        while sp != len(s):
            ch = s[sp]  # 获取当前输入字符
            top = stack[-1]  # 获取栈顶元素
            step += 1
            info_step.append(step)
            info_stack.append(''.join(stack))
            info_str.append(''.join(s[sp:]))
            info_msg.append(msg)

            if top in Vt:  # 栈顶元素是  终结符
                if top == ch:
                    top = stack.pop()  # 栈顶出栈
                    sp += 1  # str指针后移一位
                    msg = f"'{ch}'匹配"
                else:
                    info_res = f"error: 栈顶元素{top} 与 字符{ch} 不匹配!"
                    break
            elif top in Vn:  # 栈顶元素是 非终结符
                if (top, ch) in table.keys():  # table中含有该项
                    top = stack.pop()  # 先出栈
                    stack.extend(reversed(table[(top, ch)]))  # 逆序入栈
                    msg = f"{top}->" + table[(top, ch)]
                else:
                    # tk_show_info += f"error: table找不到匹配的({top},{ch})\n"
                    info_res = f"error: table找不到匹配的({top},{ch})"
                    break
            elif top == '#':  # 栈顶元素是 文法结束符
                if ch == '#':
                    # tk_show_info += f"Success!\n"
                    info_res = f"Success!"
                    break
                else:
                    # tk_show_info += f"error: 栈顶元素{top} 与 字符{ch} 不匹配!\n"
                    info_res = f"error: 栈顶元素{top} 与 字符{ch} 不匹配!"
                    break
            elif top == '@':  # 栈顶元素是 ε
                top = stack.pop()  # 直接出栈ε
                msg = f"'@'出栈"
                continue
        info = {
            "info_step": info_step,
            "info_stack": info_stack,
            "info_str": info_str,
            "info_msg": info_msg,
            "info_res": info_res
        }

        return info

    def init(self):
        self.formulas_dict, self.Vn, self.Vt, self.S = self.step1_pre_process(self.input_str_list)
        print("=========First、Follow=========")
        self.step2_cal_first(self.formulas_dict)
        self.step3_cal_follow(self.formulas_dict)

        check_res = self.step4_check_LL1(self.formulas_dict, self.first, self.follow)
        # =========判断是否合法=========
        if check_res:
            print("\n经过分析，该文法 符合 LL(1)文法\n")
        else:
            print("\n经过分析，该文法 不符合 LL(1)文法\n")
            return
        print("=========预测分析表=========")
        self.table, df_tab = self.step5_create_table(self.formulas_dict, self.first, self.follow)

    def solve(self,s):
        self.info = self.step6_LL1_analyse(s,self.S,self.Vn,self.Vt,self.table)
        print("=========分析过程=========")
        for i in range(len(self.info["info_step"])):
            print("{:<15}  {:<15}  {:<15}  {:<15}".format(str(self.info["info_step"][i]), self.info["info_stack"][i],self.info["info_str"][i], self.info["info_msg"][i]))
        return self.info



if __name__ == "__main__":
    grammar1 = [ # abb、abcbcbcbb等等
        "E->abA|aB|abB|cd|cf",
        "A->cbA|b",
        "B->e"
    ]
    grammar2 = [ # i+i*i、(i+i)*i等等
        "E->E+T|T",
        "T->T*F|F",
        "F->(E)|i"
    ]
    grammar3=[ # 部分标识符文法： 形如aa、a1、aaa、aa1
        "E->LL|LD|LLL|LLD",
        "L->a|b|c",
        "D->0|1|2|3|4|5|6|7|8|9"
    ]
    grammar4=[ # aad、bd、cbd、aacbd等等
        "S->AaS|BbS|d",
        "A->a",
        "B->@|c"
    ]
    ll1 = LL1(grammar3)
    ll1.init()

    analyse_str="ab1"
    ll1.solve(analyse_str)

运行结果

测试1（含公共因子）

输入：
文法：
分析串：

输出：

测试2（经典的i+i*i文法，且含左递归）

输入：
文法：
分析串：

输出：

测试3（识别部分标识符）

输入：
文法：
分析串：

输出：

总结

实现过程中，对于消除左递归、消除回溯、first集、follow集的实现查阅了很多资料，修改了很多次代码，目前来说暂时能适用很多文法了。

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
SpringMVC设置全局异常处理器水岸齐天 java spring
文章目录背景分析使用@ControllerAdvice（@RestControllerAdvice）+@ExceptionHandler实现全局异常全局异常处理-多个处理器匹配顺序存在一个类中存在不同的类中对于过滤器和拦截器中的异常，有两种思路可以考虑背景在项目中我们有需求做一个全局异常处理，来规范所有出去的异常信息。参考：官方文档分析首先ControllerAdvice(RestControll
【算法分析与设计】去除重复字母五敷有你算法分析与设计 java javascript 开发语言算法数据结构
个人主页：五敷有你系列专栏：算法分析与设计⛺️稳中求进，晒太阳题目给你一个字符串s，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例示例1：输入：s="bcabc"输出："abc"示例2：输入：s="cbacdcbc"输出："acdb"思路贪心+单调栈实现【字符串删除一个字符使其字典序最小的贪心策略】：对于两个长度相同的字符串，
数据分析：低代码平台助力大数据时代的飞跃发展快乐非自愿数据分析低代码大数据
随着信息技术的突飞猛进，我们身处于一个数据量空前增长的时代——大数据时代。在这个时代背景下，数据分析已经成为企业决策、政策制定、科学研究等众多领域不可或缺的重要工具。然而，面对海量的数据和日益复杂多变的分析需求，传统的数据分析方法往往捉襟见肘，难以应对。幸运的是，低代码平台的兴起为大数据分析注入了新的活力，成为推动大数据时代发展的重要力量。低代码平台，顾名思义，是一种通过少量甚至无需编写代码，就能
以前开发MFC界面如何快速转成QT界面广州视觉芯软件有限公司 mfc qt c++
将MFC界面快速转换为Qt界面可能需要进行一些手动工作，因为MFC和Qt是两个不同的界面框架，它们具有不同的设计和实现原理。但是，以下步骤可以帮助你快速进行转换：创建一个新的Qt项目：使用QtCreator创建一个新的Qt项目。分析MFC界面：仔细分析你的MFC界面，包括窗口、对话框、控件等的布局、样式和行为。重新设计界面：使用Qt的可视化设计器重新设计界面。在QtCreator的设计器中，你可以
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
[高精度加法和乘法] 阶乘之和 StudyingPanda 算法
题目描述用高精度计算出S=1!+2!+3!+⋯+n!（n≤50）。其中!表示阶乘，定义为n!=n×(n−1)×(n−2)×⋯×1。例如，5!=5×4×3×2×1=120。输入格式一个正整数n。输出格式一个正整数S，表示计算结果。输入输出样例输入#13输出#19解题分析思路很简单，求出阶乘之后再累次求和即可，但是关键在于这个数据量实在是太大了，所以必须封装高精度运算，这里我们创建一个BigInt类，
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
数据管理知识体系指南（第二版）-第五章——数据建模和设计-学习笔记键盘上的五花肉数据治理数据库数据仓库数据治理
目录5.1引言5.1.1业务驱动因素5.1.2目标和原则5.1.3基本概念5.2活动5.2.1规划数据建模5.2.2建立数据模型5.2.3审核数据模型5.2.4维护数据模型5.3工具5.3.1数据建模工具5.3.2数据血缘工具5.3.3数据分析工具5.3.4元数据资料库5.3.5数据模型模式5.3.6行业数据模型5.4方法5.4.1命名约定的最佳实践5.4.2数据库设计中的最佳实践5.5数据建模和
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
Numpy、Pandas库的使用貮叁量化投资分析 python python 数据分析
目录Numpy1、概述2、基础操作2.1生成一个numpy的array数组：2.2自定义一个新的数据类型：np.dtype()3、并行化思想4、量化分析应用4.1索引选取和切片选择4.2数据转换与规整4.3逻辑条件进行数据筛选4.4通用序列函数4.5文件保存与读取Pandas1、简介2、Series和DataFrame的使用2.1Series2.2DataFrame3、量化分析应用3.1形成一个p
数据仓库——事务、快照和累积快照事实表墨染丶eye 背诵数据仓库数据库
事务、快照和累积快照事务事实表跟踪定义业务过程的个体行为，并且支持几种描述这种行为事实。可以提供丰富的分析型能力，时常充当原子数据的粒度化仓库快照事实表周期性地采样状态度量，这些度量与一系列事务的累积效果相当，但是这些事务的格式不易进行研累积快照事实表用来跟踪通过一系列处理步骤的个体项的进展情况，用于研究多数过程中里程碑或者事件的经过时间。这种事实表在单一行中关联多个不同的行为。事务事实表事务事实
Django forms组件在飞行-米龙 Django django python 后端
【一】引入【1】实现登陆验证功能（1）需求分析登陆验证需要前后端交互，采用form表单提交数据对数据进行校验用户名必须以英文大写字母开头密码必须大于三位数反馈给用户错误的信息除了反馈错误的信息还有保留原始输入内容（2）后端代码使用user_info_dict字典每次刷新存储存储前端发送的信息存储后端进行验证的信息defhome(request):#每次后刷新这个信息字典user_info_dict
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

编译原理实验2——自上而下语法分析LL1（包含去消除左递归、消除回溯）

文章目录

实验目的

实现流程

代码

运行结果

测试1（含公共因子）

测试2（经典的i+i*i文法，且含左递归）

测试3（识别部分标识符）

总结

你可能感兴趣的:(编译原理,python,编译原理,LL1分析)