isiqi

来自 Boost 的 Spirit 解析器框架入门

原文：http://www.ibm.com/developerworks/cn/aix/library/au-boost_parser/

本文介绍了 Boost 的高扩展性 Spirit 框架。该解析器生成程序遵循 Extended Backus Naur Form (EBNF) 规范并使用 C++ 语言编写，可以显著缩短开发时间。

C++ 程序员需要面对的最复杂的任务之一就是在一段合理的时间期限内编写一个解析器。在为 SQL 或 C++ 这类成熟的语言开发编译器时，使用 GNU Flex/Bison 或 ANTLR 解析器生成程序通常是不错的选择；但是对于使用更简单的 Backus Naur Form（BNF）的语法，这些工具陡峭的学习曲线并不总是物有所值。另一种替代选择是使用标准 Linux® 发行版附带的正则表达式库或 Boost regex 或 tokenizer 库，但是它们不能根据日渐复杂的语法进行良好扩展。

本文介绍了来自 Boost 的高可扩展性 Spirit 解析器框架。该解析器生成程序遵循 Extended Backus Naur Form (EBNF) 规范并使用 C++ 编写，可以显著缩短开发时间。要进一步阅读，请查看详细的 Spirit 文档。

安装 Spirit

您可以从 Boost 的 Web 站点免费下载 Spirit 框架（参见参考资料小节）。在开始使用 Spirit 进行开发之前，需注意以下事项：

必须在源代码中包含 <spirit.hpp> 头文件。该头文件将大量使用元模板编程和仿函数（functor）。本文的所有代码均使用 g++-3.4.4 进行编译。确保使用支持 C++ 特性的编译器。
部分 Spirit 框架在内部使用来自 Boost 的正则表达式库，在已安装的代码库中检查 regex.h 头文件。
确保 Boost 安装的根目录位于编译器的 include 搜索路径中。
Spirit 是一个只包括头文件的库，因此在链接时不需要任何额外的库。但是 regex 是一个例外。要将 regex 源代码只作为头文件包含，可在代码中使用预处理器指令 define BOOST_SPIRIT_NO_REGEX_LIB 。

第一个 Spirit 项目

如果提供一个随机的单词列表，您的第一个 Spirit 项目将使用 C++ 风格列出列表中 Hello World （即 Hello 和 World 两词在输入流中连在一起出现）出现的次数。参见清单 1；清单 2 显示了输出。

清单 1. 列出单词 Hello World 在输入流中出现的次数

#define  BOOST_SPIRIT_NO_REGEX_LIB




#include "regex.h"


#include "spirit.hpp"


#include "boost/spirit/actor.hpp"


using namespace boost::spirit;




const string input = "This Hello World program using Spirit counts the number of


 Hello World occurrences in the input";




int main ()


  {


  int count = 0;


  parse (input.c_str(),


         *(str_p("Hello World") [ increment_a(count) ]


           |


           anychar_p)


        );


  cout << count >> endl;


  return 0;


  }

Spirit 框架的强大在于它为大量基本类型提供了内置解析器，包括单独的字符、数字和字符串。更复杂的解析器通常都使用这些内置解析器对象创建。在清单 1 中，str_p 和 anychar_p 都是 Spirit 中预定义的解析器 —— str_p 匹配它所提供的字符串（在此为 Hello World ）并成功调用 increment_a 例程将计数加 1。anychar_p 是另一个预定义解析器，它可以匹配任何字符。

让我们看一看 parse 函数，它实际上是 Spirit 框架中最重要的例程。它接受一个输入流和一个语法，并在内部通过语法运行此输入流。在本例中，输入流来自 input.c_str() ，而 str_p 和 anychar_p 为语法提供语义。如果熟悉解析的话，将很快就明白 parse 函数的第二个参数相当于提供了一个 BNF。

其他预定义的 Spirit 解析器

考虑符合以下模式的解析器：<employee name: string> <employee id: int> <employee rating: float> 。您需要根据从该字符串提取的数据填充 Employee 数据结构。下面是一个典型的字符串："Alex 8 9.2 Jim 91 5.6" 。

Spirit 为字符串（alpha_p ）、整数（int_p ）、和实数（real_p ）预定义了解析器。因此，可以认为 parse 例程应该使用以下语法调用：parse(input.c_str(), alpha_p >> int_p >> real_p) 。这里的逻辑是 parse 将在输入流中首先查找一个字符串，然后查找整数，最后查找一个实数。这样可行吗？行不通。清单 2 展示了可以解析数据的可行代码片段。

清单 2. 使用 alpha_p、int_p 和 real_p 预定义解析器

#define  BOOST_SPIRIT_NO_REGEX_LIB




#include "regex.h"


#include "spirit.hpp"


#include "boost/spirit/actor/assign_actor.hpp"




using namespace std;


using namespace boost::spirit;




const string input = "Alex 8 9.2 Jim 91 5.6";




typedef struct {


  string name;


  int    idcode;


  float  rating;


} Employee;




int main ()


  {


  string name;


  int idcode;


  float rating;




  int status = parse (input.c_str(),


                      *((+alpha_p) [assign_a(name)] >> ' ' >> 


                        int_p[assign_a(idcode)] >> ' ' >>


                        real_p[assign_a(rating)] >>  !blank_p)


        ).full;


  cout << status << endl;


  return 0;


  }

初始调用失败有以下几个原因：

alpha_p 解析了单个的字符。要解析字符，必须使用 +alpha_p （这类似于 EBNF + 操作符，表示一个或多个字符，不同的是 Spirit 在前面而不是后面使用它）。
使用空格分隔字符串、整数和实数。必须解释这种行为。可以通过两种方式实现：使用 ' ' ；或者使用 blank_p 预定义解析器，这更好，它同时解释了空格和制表符。

下面是修改后的解析调用：

parse(input.c_str(), *((+alpha_p) >> ' ' >> int_p >> ' ' >> real_p) >> !blank_p);

第二个参数严格匹配一个非字母和数字组成的字符串，该字符串后面依次为空格、整数、另一个空格，最后是一个实数。当解析器达到实数后，它将查找一个空格/制表符，并重新开始匹配序列或终止。! 操作符表示空格/制表符出现了 0 次或 1 次。* 操作符表示该序列出现了 0 次或 1 次，并因此匹配一个空字符串。

显然，第二个字符串与传统解析器使用的潜在语法规则之间存在直接联系。下面是针对当前需求的典型语法规则：

:


S -> (ALPHA INT REAL)*

ALPHA 、INT 和 REAL 通常由 lexer 提供。例如，INT 被定义为 (0-9)+。可以使用 Spirit 合并这些步骤。

如何诊断错误？

如果解析器出现了错误，可以使用几种方法诊断2错误。最简单的检验方法是测试 parse 方法返回的数据结构。返回的数据结构被称为 parse_info ，而 hit 字段表示解析是否成功完成。清单 3 展示了来自 Boost 源代码的 parse_info 结构。

清单 3. 解析方法返回的 parse_info 结构

   template <typename IteratorT = char const*>


   struct parse_info


   {


       IteratorT   stop;  // points to final parse position 


       bool        hit;       // true when parsing is successful 


       bool        full;      // when the parser consumed all the input 


       std::size_t length;  // number of characters consumed by parser




       parse_info(


           IteratorT const& stop_ = IteratorT(),


           bool hit_ = false,


           bool full_ = false,


           std::size_t length_ = 0)


       : stop(stop_)


       , hit(hit_)


       , full(full_)


       , length(length_) {}




       template <typename ParseInfoT>


       parse_info(ParseInfoT const& pi)


       : stop(pi.stop)


       , hit(pi.hit)


       , full(pi.full)


       , length(pi.length) {}


   };

assign_a 是什么？
如果预定义解析器匹配字符串，则需要将结果保存起来。通过使用 assign_a 结构，解析后的字符串将被分配给相应的变量。Spirit 框架中分配/修改变量的通用结构称为 actors ，它位于 boost/spirit/actor 文件夹中。

Spirit 操作符及其语义

Spirit 附带了一些预定义的操作符。表 1 总结了这些操作符及其语义。后面的示例将使用这些操作符。

表 1. Spirit 操作符及其语义

操作符语义 x >> y x | y x & y x – y x ^ y *x +x !x ( x ) x [ function expression ] x % y

匹配 x 然后匹配 y
匹配 x 或 y
匹配 x 和 y
匹配 x 但不匹配 y
匹配 x 或 y，但不同时匹配两者
对 x 匹配 0 次或多次
对 x 匹配 1 次或多次
对 x 匹配 0 次或 1 次
匹配 x；用于基于优先权的分组
如果匹配了 x，执行函数/仿函数
对 x 匹配 1 次或多次，使用 y 分隔

了解到目前为止所开发的内容之后，现在可以开始定义 C 风格的浮点数语法。清单 4 展示了 BNF。

清单 4. 用于浮点数的 BNF

Real-Number :


 Fractional-Part (Exponent-Part)? 


Fractional-Part :


 (DIGIT)* DOT (DIGIT)+ 


                              |


                              (DIGIT)+ DOT


Exponent-Part :


 ('e'|'E') ('+'|'-')? (DIGIT)+


DIGIT :


 ['0'-'9']


DOT :


 '.'

清单 5 提供了等效的 Spirit 语法。

清单 5. 浮点数的 Spirit 语法，与清单 4 的 BNF 等效

Real-Number = Fractional-Part >> ! Exponent-Part


                          |  +digit_p >> Exponent-Part


                          ;




Fractional-Part = *digit_p >> '.' >> +digit_p


                           |  +digit_p >> '.'


                           ;




Exponent-Part =   ('e' | 'E') >> !('+' | '-') >> +digit_p;

可以看到，Spirit 上下文中的 Y = A >> B 与解析器上下文的 Y : A B 相同，其中 A 和 B 可以是末端，也可以是非末端。注意，用户并不需要为此类琐碎的操作定义语法：Spirit 已经提供了预定义的 parser real_p 来解析实数。

Spirit 中的预定义解析器

Spirit 框架的灵活性源于它为常见处理提供了众多预定义解析器。表 2 提供了包含其中一些解析器的列表。

表 2. Spirit 中的一些预定义解析器

解析器语义 ch_p range_p anychar_p str_p blank_p space_p digit_p upper_p nothing_p

匹配一个单个的字符。
匹配从低/高字符对中创建的一组字符中的单个字符。例如，`range_p('a', 'z')` 匹配 a 和 z 之间的所有字符。
匹配任何单个的字符，包括 `NULL` 终端符 `\0` 。
匹配一个字符串：例如 `str_p("mystring")` 匹配字符串 `mystring` 。
匹配空白和制表符组成的连续序列。
类似于 `blank_p` ，但它还匹配返回字符和换行字符。
匹配一个数字。
匹配任何大写字符。
诊断工具；从不匹配任何内容并且总是失败。

Spirit 指令

本节讨论 Spirit 的另一个强大特性 —— 指令。Pascal 和 VHDL 等大小写敏感语言中的 lexer 要复杂一些，因为它们必须解析 begin 和 BEGin 等内容并为解析器生成相同的标记。Spirit 使用 parser directives 解决这个问题。例如，预定义指令 as_lower_d 将输入流转换为小写（参见清单 6）。

清单 6. 使用 as_lower_d 指令进行大小写敏感的解析

#define  BOOST_SPIRIT_NO_REGEX_LIB




#include "regex.h"


#include "spirit.hpp"


#include "boost/spirit/actor/assign_actor.hpp"




using namespace std;


using namespace boost::spirit;




const string input = "THis iS a ranDOm sTRInG";




int main ()


  {


  string val;


  int status = parse (input.c_str(),


                      as_lower_d[str_p ("this is a random string") 


                          [assign_a(val)] ]).full;


  cout << status << endl;


  cout << val << endl;




  return 0;


  }

清单 6 的输出为 1, THis iS a ranDOm sTRInG 。必须理解解析器与解析器指令之间的差异，后者仅修改附带的解析器的行为，实际上扩充了该解析器的策略。

Spirit 提供了其他预定义解析器的指令和一些编写解析器的方法。让我们看一下 longest_d 解析器指令。考虑清单 7 并猜猜它的输出是什么。

清单 7. 使用模糊的语法进行解析

#define  BOOST_SPIRIT_NO_REGEX_LIB




#include "regex.h"


#include "spirit.hpp"


#include "boost/spirit/actor/assign_actor.hpp"




using namespace std;


using namespace boost::spirit;


const string input = "20245.1";




int main ()


  {


  int val;


  int status = parse (input.c_str(), int_p[assign_a(val)] | real_p).full;


  cout << status << " " << val << endl;




  return 0;


  }

清单 7 的输出是 0 20245 。为什么会这样？显然，解析期间整个输入缓冲区都没有被使用，因此 status 为 0 。为了理解这一点，需要注意 Spirit 是如何解析的：为示例规则 S : R1 | R2 | .. | RN 提供多个替代选择，左边的内容获得最大优先权。这类似于 C/C++ 处理条件的方式：在表达式 if (x && y) 中，如果 x 为真，则不计算 y 。这种行为有助于保持工具的处理速度。

在本例中，int_p 匹配 20245 —— 但是在这之后它遇到了一个点字符，并且没有处理它的规则。因此，解析器退出。

解决方法是对语法规则的所有可用的替代内容进行重新分组，但是手动重新分组很容易出错。更好的方法是使用 longest_d 指令，该指令将尝试匹配消耗输入流的最大长度的规则。清单 8 展示了修改后的 parse 例程调用。

清单 8. 使用 longest_d 预定义的解析器指令

  int status = parse (input.c_str(),


                      longest_d [int_p | real_p[assign_a(val)] ] 


        ).full;

通过这一修改，输出现在变为 1 20245.1 。

使用 Spirit 开发完备的语法

本节将讨论使用 Spirit 框架设计一组用户定义的语法规则。要设计自己的语法，Spirit 要求执行以下操作：

创建一个从预定义 grammar 类继承而来的派生类。grammar 类是一个模板类，被其派生类 DerivedT 和上下文类 ContextT 参数化。语法类的声明如下所示：
template<

typename DerivedT,

typename ContextT = parser_context<> >

struct grammar;
您设计的派生类必须有一个名为 definition （可以不修改此名）的嵌套的模板类/结构。definition 类有以下特性：
- 它是类型名为 ScannerT 的模板类。
- 语法规则在其构造函数中定义。构造函数被作为引用传递给实际的语法 self 。
- 必须提供名为 start 的成员函数，它表示 start 规则。

清单 9 展示了用户定义语法的基本框架。

清单 9. 用户定义的语法类的基本框架

    struct my-grammar : public grammar<my-grammar>


    {


        template <typename ScannerT>


        struct definition


        {


            rule<ScannerT>  startRule;


            definition(my-grammar const& self)  { /* define grammar rules here */ }


            rule<ScannerT> const& start() const { return startRule; }


        };


    };

假设您希望支持清单 10 所示的简单语法，该语法部分解析 C/C++ 枚举。

清单 10. C/C++ 枚举的简单语法

enum_specifier : ENUM '{' enumerator_list '}'


       | ENUM IDENTIFIER '{' enumerator_list '}'


       | ENUM IDENTIFIER


       ;




enumerator_list : enumerator


       | enumerator_list ',' enumerator


       ;




enumerator : IDENTIFIER


       ;




ENUM: "enum";


IDENTIFIER: ['a'..'z']+;

清单 11 展示了相应的 Spirit 代码。程序的输出为 1 ，表示成功完成解析。

清单 11. 解析 C/C++ 枚举的 Spirit 代码

#define  BOOST_SPIRIT_NO_REGEX_LIB




#include "regex.h"


#include "spirit.hpp"


#include "boost/spirit/actor/assign_actor.hpp"




using namespace std;


using namespace boost::spirit;




struct my_enum : public grammar<my_enum>


    {


    template <typename ScannerT>


      struct definition


        {


        definition(my_enum const& self)


          {


          enum_specifier = enum_p >> '{' >> enum_list >> '}';


          enum_p = str_p("enum");


          enum_list = +id_p >> *(',' >> +id_p);


          id_p = range_p('a','z');


          }




          rule<ScannerT> enum_specifier, enum_p, enum_list, id_p;


          rule<ScannerT> const& start() const { return enum_specifier; }


        };


    };




string input = "enum { ah, bk  }";




int main ()


  {


  my_enum e;


  int status = parse(input.c_str(), e, space_p).hit;


  cout << status << endl;


  return 0;


  }

结束语

本文介绍了 C/C++ 框架的解析功能。要了解更多信息，请查阅参考资料。

参考资料

学习

您可以参阅本文在 developerWorks 全球站点上的英文原文。
阅读全面的 Spirit 框架文档。
浏览技术书店，阅读有关这些主题和其他技术主题的图书。
AIX and UNIX 专区：developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息，您可以利用它们来扩展自己的 UNIX 技能。
AIX and UNIX 新手入门：访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。
AIX and UNIX 专题汇总：AIX and UNIX 专区已经为您推出了很多的技术专题，为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您，为了方便您的访问，我们在这里为您把本专区的所有专题进行汇总，让您更方便的找到您需要的内容。
开放源码专区：访问 developerWorks 开放源码专区，获得大量的 how-to 信息、工具和项目更新，帮助您使用开源技术进行开发，并与 IBM 产品结合使用。
developerWorks 技术活动和网络广播：关注 developerWorks 技术活动和网络广播。
Podcasts ：收听 Podcast 并了解 IBM 技术专家的最新想法

你可能感兴趣的:(C++,c,框架,C#,AIX)

2.git和github操作：diff链接 MY Daisy 工具 git github
目录1.获取差异链接的核心方法方法1：通过分支/提交比较生成链接（适用于GitHub/GitLab/Bitbucket）方法2：使用单次提交的差异链接（查看某次提交的改动）方法3：通过PullRequest（PR）/MergeRequest（MR）2.快速生成diff链接的步骤Step1.获取提交哈希（或分支名称）Step2.拼接平台URLStep3.直接访问链接3.各平台差异链接格式对照表4.自
Spring相关面试题 kevindanglu 面试 spring java spring boot
目录Spring中常用的注解有哪些SpringBoot中@RestController和@Controller注解有什么区别？Spring的注解@requestBody和@responseBody的区别说说@Bean和@componentscan的区别简单介绍一下springbootSpringBoot有哪些常用的Starter依赖？说说springboot的启动过程Sprintboot自动装配原
Spring 基础框架-- Ruoyi 权限管理架构详解 dazhong2012 开源项目 spring clould springboot spring 架构 java
一、权限管理整体架构若依的权限管理架构基于用户-角色-权限的RBAC模型，并扩展了数据权限控制。核心架构可分为以下四层：数据范围控制用户层角色层权限层数据过滤层菜单/按钮/接口权限角色关联部门/数据范围二、核心模块详解1.基础权限模型（RBAC）用户（sys_user）：通过dept_id关联部门表，支持多角色分配角色（sys_role）：data_scope字段定义数据权限范围（1-全部，2-自
Yolov8训练自己的数据集(脱离ultralytics库) 爱吃肉的鹏 YOLO
最近在整理关于yolov8的相关内容，有个很大的问题，抛开yolov8性能不谈，yolov8代码的使用灵活性不如yolov5，尤其是对于一些新手或者对yolo框架不是很熟悉的人(这也是因人而异，有些人可能会喜欢v8代码的使用方式)。比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢
使用AI python实现将前端angularjs工程转换成vue工程案例银行金融科技前端人工智能 python
以下是一个结合Python和AI技术实现AngularJS到Vue工程迁移的完整案例，包含关键转换策略和代码实现：案例背景目标：将使用AngularJS1.x的电商后台管理系统转换为Vue3工程，主要转换以下部分：模板语法控制器逻辑服务依赖路由配置状态管理原始AngularJS代码片段：javascript//app.jsangular.module('app',['ui.router']).co
【从零开始：如何用Vue3打造响应式个人博客网站】小怪兽9699 vue.js javascript ecmascript
前言在前端开发领域，Vue.js是一个非常流行且强大的框架。本文将详细介绍如何使用Vue3构建一个完整的响应式个人博客网站。无论你是初学者还是有一定经验的开发者，本文都将为你提供详细的步骤和代码示例。1.环境搭建首先，确保你已经安装了Node.js和npm。然后，全局安装VueCLI：npminstall-g@vue/cli2.项目初始化使用VueCLI创建一个新的Vue项目：vuecreatem
React学习笔记20 充气大锤 React学习笔记学习笔记 javascript 前端算法开发语言 react.js
一、React.forward1.1、作用通过ref暴露子组件的DOM1.2、场景说明1.3、语法实现//子组件constInput=forwardRef((props,ref)=>{return})//父组件functionfather_component(){constinputRef=useRef(null)constfocus=(ref)=>{ref.current.focus()}ret
一段注释。 dont__cry c语言
以下是添加了详细注释后的代码解析，方便你更好地理解这段ARM宏汇编代码的功能和逻辑：;********************(C)COPYRIGHT2011STMicroelectronics********************;*FileName:startup_stm32f10x_hd.s;*Author:MCDApplicationTeam;*Version:V3.5.0;*Date:
MybatisPlus+Spring Boot3 分页查询实现新停浊酒杯 spring boot mybatis 后端
目录导入依赖本文的house表直接复制粘贴运行即可MybatisConfig配置文件创建数据库对应的实体类创建mapper层接口在service包下创建xxxService接口controller层创建XXXController类完成分页查询导入依赖com.baomidoumybatis-plus-spring-boot3-starter3.5.5本文的house表直接复制粘贴运行即可/*Navi
HTTPS通信（握手）过程 IT运维成长心得 https 网络协议
HTTPS通信（即超文本传输安全协议）的握手过程是确保通信双方安全交换数据的关键步骤。以下是HTTPS握手过程的详细步骤：客户端发起请求：客户端（通常是浏览器）向服务器发起HTTPS请求。服务器响应：服务器收到请求后，会回应一个数字证书。这个证书是由一个受信任的第三方（证书颁发机构，CA）签发的，包含了服务器的公钥、服务器信息以及CA的签名。客户端验证证书：客户端使用内置的CA证书库来验证服务器的
python反爬虫处理--处理验证码（Tesseract 库）的安装与使用范哥来了 python 爬虫开发语言
处理验证码是反爬虫策略中常见的挑战之一。在Python中，可以采用多种方法来解决这一问题，具体取决于验证码的类型（如文本、图像或滑块验证等）。以下是一些常用的解决方案：对于简单的文字或数字验证码：如果网站使用的是相对简单的验证码形式，您可以尝试使用OCR(OpticalCharacterRecognition,光学字符识别)技术来自动识别这些验证码。Python中有一个叫做Tesseract的库，
python爬虫 Selenium库安装与使用范哥来了 python 爬虫 selenium
Selenium是一个强大的自动化测试工具，它也可以用来进行网页抓取。与传统的请求库（如requests）不同，Selenium可以模拟真实用户的行为，比如点击按钮、填写表单等，这对于那些依赖于JavaScript动态加载内容的网站来说非常有用。安装Selenium首先确保你的环境中已经安装了Python和pip。然后通过pip安装Selenium：pipinstallselenium如果你使用的
python爬虫项目范哥来了 python 爬虫开发语言
项目名称：国家自然科学基金大数据知识管理服务门户爬取项目爬取内容：爬取内容：资助项目爬取链接：HTTP://KD.NSFC.GOV.CN/BASEQUERY/SUPPORTQUERY为了完成“国家自然科学基金大数据知识管理服务门户”的资助项目信息爬取任务，我们需要设计一个网络爬虫。考虑到目标网站的具体情况，我们将采用Python语言结合requests库来处理HTTP请求，以及使用Beautifu
【打卡d5】快速排序归并排序吧啦吧啦吡叭卜排序算法算法 java
快速排序算法模板——模板题AcWing785.快速排序voidquick_sort(intq[],intl,intr){if(l>=r)return;inti=l-1,j=r+1,x=q[(l+r)/2];while(ix);if(i=r)return;intmid=（l+r）>>1;merge_sort(q,l,mid);merge_sort(q,mid+1,r);intk=0,i=l,j=mi
Spring Boot项目如何使用MyBatis实现分页查询 m0_74825003 面试学习路线阿里巴巴 spring boot mybatis 数据库
写在前面：大家好！我是。如果博客中有不足或者的错误的地方欢迎在评论区或者私信我指正，感谢大家的不吝赐教。我的唯一博客更新地址是：https://ac-fun.blog.csdn.net/。非常感谢大家的支持。一起加油，冲鸭！用知识改变命运，用知识成就未来！加油(???o??)?(???o??)?文章目录为什么需要分页查询减少数据库压力减少网络传输数据量提高系统的稳定性提升用户体验原始的实现方式计算
Autoformer 架构详细解释及举例说明 six.学长 autoformer 人工智能
Autoformer架构详细解释上述图片展示了Autoformer架构的工作流程，包含编码器和解码器的结构。我们来详细解析图中的各个组件及其功能：编码器部分（AutoformerEncoder）输入数据（EncoderInput）：输入的是需要预测的时间序列数据。自动相关机制（Auto-Correlation）：这个模块通过检测时间序列中的周期性依赖关系，生成相关矩阵（K,Q,V表示键、查询和值）
手机抓https包安卓7以上ca证书安装方法慕城南风 android
用charles或fiddler抓app包的https接口必须要安装ca证书,才能正常抓包,安卓7之前把ca证书安装到用户证书下即可,但安卓7以上只有系统级证书才能被信任,所以为了能正常抓包,需要把ca证书安装到系统证书下流程:下载OpenSSL制作证书导入到手机准备工作:电脑安装了OpenSSL电脑安装了Charles(其他抓包工具也是一样的原理)一台已root手机(模拟器也可以,但部分app会
KV 缓存简介 dev.null AI 缓存
以下是关于KV缓存（Key-ValueCache）的简介，涵盖其定义、原理、作用及优化意义：1.什么是KV缓存？KV缓存是Transformer架构（如GPT、LLaMA等大模型）在自回归生成任务（如文本生成）中，用于加速推理过程的核心技术。其本质是：在生成序列时，缓存历史token的Key和Value矩阵，避免重复计算，从而显著减少计算量。2.为什么需要KV缓存？传统自注意力计算的问题在生成第t
表格的属性花林似霰f html 前端
表格标签属性实际开发并不使用，仅做了解，实际开发会使用CSS。属性名·属性值描述alignleftcenterrightborder1或""规定表格单元是否有边框，默认为无cellpadding像素值规定单元格与其内容之间的空白，默认1像素cellspacing像素值规定单元格之间的距离width/height像素值或百分比规定表格宽度/高度
react加antd封装表格单、多选组件，支持跨页选择缓存 Cirrod react.js 缓存 javascript
页面效果子组件importReact,{useState,useEffect,forwardRef,useImperativeHandle}from'react';import{Modal,Input,Table,Pagination,Avatar,Select}from'antd';import{UserOutlined}from'@ant-design/icons';importtype{Ta
VSCode PDF Viewer 项目教程卓炯娓
VSCodePDFViewer项目教程vscode-pdfviewerShowPDFpreviewinVSCode.项目地址:https://gitcode.com/gh_mirrors/vs/vscode-pdfviewer1.项目目录结构及介绍vscode-pdfviewer/├──.vscode/│├──extensions.json│└──launch.json├──lib/│├──web
PostgreSQL 数据库简介 dazhong2012 数据库数据库 postgresql
一、PostgreSQL简介PostgreSQL（通常简称为Postgres）是一种功能强大的开源对象关系型数据库系统。它以其高度的可靠性和灵活性而闻名，支持复杂的查询、数据完整性、可扩展性以及对多种数据类型的处理。主要特点：开源和免费：PostgreSQL是完全开源的，采用PostgreSQLLicense，允许用户免费使用、修改和分发。对象关系型数据库：它不仅支持传统的关系型数据库功能，还支持
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型打酱油的葫芦娃时序预测算法时序预测 PatchTST Transformer 预训练微调表征学习
《ATIMESERIESISWORTH64WORDS:LONG-TERMFORECASTINGWITHTRANSFORMERS》的作者团队来自PrincetonUniversity和IBMResearch，发表在ICLR2023会议上。动机Transformer模型因其自注意力机制在处理序列数据方面的优势，在自然语言处理（NLP）、计算机视觉（CV）、语音等多个领域取得了巨大成功。这种机制使得模型
红黑树详解？红黑树设计的背景？ F_windy java
红黑树详解1.红黑树的基本概念红黑树（Red-BlackTree）是一种自平衡的二叉搜索树（BST），通过节点颜色（红或黑）和一组规则来保持近似平衡，确保插入、删除、查找等操作的时间复杂度为O(logn)。它的核心思想是通过颜色标记和旋转操作，减少树的高度差异，从而提升性能。2.红黑树的五大规则红黑树必须满足以下规则：颜色规则：每个节点非红即黑。根节点规则：根节点必须是黑色。叶子节点规则：所有叶子
【设计模式有哪些】 F_windy 设计模式
一、创建型模式（CreationPatterns）1.单例模式（Singleton）核心思想：保证一个类仅有一个实例，并提供全局访问点。实现方式：publicclassSingleton{//1.私有静态实例，volatile保证多线程可见性privatestaticvolatileSingletoninstance;//2.私有构造方法privateSingleton(){}//3.双重检查锁定
如何针对大Excel做文件读取？ F_windy excel
针对大Excel文件（如超过百万行）的读取，传统的一次性加载到内存的方式会导致内存溢出（OOM），需采用流式读取（Streaming）或分块读取（Chunk）的策略。以下是具体方案及优化建议：一、核心解决方案1.使用ApachePOI的SAX模式（事件驱动）适用场景：处理.xlsx文件（不支持.xls），逐行解析避免内存溢出。代码示例（Java）：importorg.apache.poi.open
WebRTC、WebSocket、EasyRTC嵌入式音视频SDK：技术差异与应用场景详细对比 EasyCVR RTC webrtc websocket 音视频 javascript 网络开发语言
WebRTC和WebSocket是两种常用于实时通信的技术，尽管它们都支持实时数据传输，但在设计目标、技术实现和应用场景上存在显著差异。一、概述1）WebRTCWebRTC是一个开源项目，旨在通过简单的API实现浏览器之间的实时音视频通信和数据传输。它支持点对点（P2P）通信，主要应用于音视频通话、屏幕共享、文件传输等场景。2）WebSocketWebSocket是一种基于TCP的通信协议，提供了
Java常用API EmbodiedTech Java架构栈 java dubbo 开发语言
一、今日内容介绍、API概述常用API（全称是ApplicationProgramInterface应用程序接口），说人话就是：别人写好的一些程序，给咱们程序员直接拿去调用。Java官方其实已经给我们写好了很多很多类，每一个类中又提供了一系列方法来解决与这个类相关的问题。比如String类，表示字符串，提供的方法全都是对字符串操作的。比如ArrayList类，表示一个容器，提供的方法都是对容器中的
字符串模板（单文件组件、JSX） By爱分享 vue.js javascript 前端
首先需要了解基本释义：字符串模板就是写在vue中的template中定义的模板，如.vue的单文件组件模板和定义组件时template属性值的模板。此外，字符串模板不会在页面初始化时参与页面的渲染，而是会被vue进行解析编译之后再被浏览器渲染，所以不受限于html结构和标签的命名总的来说，推荐遵循W3C中的自定义组件名(字母全小写且必须包含一个连字符)，这会帮助你避免和当前以及未来的HTML元素相
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &