京东云开发者

UData查询引擎优化-如何让一条SQL性能提升数倍

1 UData-解决数据使用的最后一公里

1.1 背景

在大数据的范畴，我们经历了数据产业化的历程，从各个生产系统将数据收集起来，经过实时和离线的数据处理最终汇集在一起，成为我们的主题域数据，下一步挖掘数据的价值将成为关键。

数据应用直接体现数据的价值，数据应用多种多样，它们使用数据的方式也各不相同，UData作为数据资产和数据应用之间的桥梁，它的第一目标是解决所谓的数据使用的最后一公里问题。

UData平台以数据指标为基本的管理单位，通过四个阶段对于数据使用提供支持，一体化整合数据链路的整个生命周期，接数据、管数据、找数据、用数据。

UData核心聚焦数据应用场景，从数据应用倒推打通数据接入、数据管理、数据查询等环节。各种数据应用对于数据的使用方式，大部分分为两个场景：

应用在线及时访问数据，大多数以接口的形式，UData平台相对应的提供了数据服务的模块；
业务人员通过在线查找自己需要的数据指标（数据指标地图），可视化的进行人工数据分析和展示，UData平台同时提供了数据分析的模块。

1.2 UData功能架构图

上图，UData功能架构自底部向上，包含了数据流转使用的整个过程，平台内的功能模块从数据使用的流程角度，完整的涵盖了数据使用最后一公里的整个生命周期。

1.3 Udata的数据管理

UData对于数据的使用，从物理和逻辑两个层面进行了划分，并且对于多个租户同样进行了资源和计算的隔离。

1.4 Udata目前能做什么？

1.4.1 指标配置化开发管理

UData数据接入可以将外部数据实时或者定时的导入平台，同时平台提供了多种数据源的联邦查询；
在线可视化的创建数据指标，并对数据指标进行打标签；
数据指标地图使业务人员方便的查找自己需要的业务指标；
数据指标的开发，管理，使用，几个阶段相互分离，职责划分更加松耦合，业务注意力更加聚焦；

1.4.2 指标积木式编排和接口服务

UData从底层数据源开始至最上层封装成为数据指标对外提供数据服务；
数据指标在UData中可以像积木一样通过可视化的方式进行任意组合；
UData提供了接口编排能力，可以在指标组合基础之上，实现带有业务逻辑的分支条件判断；

1.4.3 指标及明细交互式关联分析和协同分享

UData可以重用数据视图和数据指标，创建数据集，以此为基础向上进行数据分析；
数据集的配置支持SQL模式和可视化配置模式，分别针对不同SQL水平的分析人员；
面向数据分析应用，以应用场景为单位进行数据和计算函数的管理和组织，场景可共享；
数据在线化实时分析，无需线上导出数据；
在线Excel操作，持久化Excel模式，数据实时刷新，Excel报表在线共享;

2 Udata-查询引擎执行介绍-一条SQL的旅行

2.1 引擎架构

Udata查询引擎基于StarRocks进行了部分改造，由两部分组成FrontEnd(FE),BackEnd(BE)组成。

FE：负责接收和返回客户端的请求，元数据和集群的管理，查询计划的生成和优化，协调BE进行查询。
BE: 主要负责SR表的数据存储和查询，外部表形式连接三方存储，并执行查询计划中的具体节点，例如scan, 投影，聚合等。

执行主流程：

FE收到Sql客户端发起的查询请求，解析sql并制定查询计划；
FE下发执行计划到BE, 并指定一个BE为Coordinator;
各BE按照查询计划中的PlanFragment为执行单位，接收工作，完成工作，并将结果汇聚到Coordinator节点；
Coordinator的BE节点将数据返回给FE;
FE向Sql客户端返回结果；

2.2 从SQL语句到执行的过程

2.2.1 过程概览

用户通过Mysql客户端工具或者JDBC等方式，将需要执行的SQL语句进行输入，输入后的SQL语句经过语法解析，Binder,Transformer,Optimizer等过程，从基础的sql语句，经过语法树，Relation，逻辑计划，分布式物理计划等过程，最终在FE端通过Coordinator发送到BE侧进行执行，并后续收集BE返回的数据，返回给调用客户端。

2.2.2 举例介绍

表结构：

desc remote_mysql_decimal;

SQL:

select count(`decimal`) as sum,`key` from remote_mysql_decimal where id <= 1000 group by `key` order by sum desc limit 10;

2.2.3 执行过程详解

1.解析SQL语句

在这一步骤中，SQL语句会进行语法检查，不符合规范的语句返回错误，之后经过语法解析，会生成一个抽象语法树，上面实例中的SQL语句（语句中有聚合，排序，谓词条件，limit等元素）生成的语法树结构如下：

2.绑定数据表元数据信息-生成Relation

生成语法树之后，只是单纯的SQL语法信息，在SR中FE有一个重要的作用，就是保存数据表的元数据信息（库名，表名，列名，数据类型，对应的外表）等。
在这一步骤中，会将抽象语法树和FE中的元数据信息（Catalog）进行关联，丰富SQL相关的信息，将抽象语法树生成Relation这种数据结构。

3.Transformer - 基于RBO,进行Rewrite生成逻辑执行计划

从Relation到逻辑计划，只是基于一些SQL改写规则，将树中的一些节点转变会逻辑计划节点。

如：

FromClause 会转换为逻辑计划中的LogicalScanOperator这种扫表操作；
WhereClause 会转换成逻辑计划中的LOGICAL_FILTER，指导后续进行进行条件过滤；
OrderByElements 会转换成逻辑计划的LOGICAL_TOPN，指导后续进行排序和limit;
SelectList 会转换为逻辑计划的LogicalProjectOperator，指导后续进行投影操作，减少网络数据传输;

本实例中的SQL会生成如下的逻辑计划：

4.Optimizer - 基于CBO优化

在这一步骤中，会根据上一步生成的逻辑计划，同时结合FE中保存的元数据信息，基于CBO优化执行计划，进行谓词下推，Join order 调整等。
本实例中生成的Optimizer Plan如下：

5.分布式物理计划的生成- BE执行的并行单位（PlanFragment）

BE是分布式的，查询实际执行的时候，会将计划分配给具体的BE。BE之间，BE和FE之间通过RPC通信传输数据，BE执行的最小并行单位是Fragment, 在这一步骤中会生成分布式的物理计划。
本实例SQL生成的分布式物理计划如下：

2.3 数据的输出

2.3.1 PlanFragment在BE侧的映射

物理执行计划切分成PlanFragment之后，会发送到BE侧执行，BE会根据Fragment中的树形结构，生成对应的Node，完成各自的算子逻辑，算子之间通过不停的调用下层算子的get_next()函数，将数据用chunk的形式进行组织并流动起来，chunk的数据结构是一种列式的批结构，非常有利于向量化的执行。

2.3.2 执行模型

1.火山模型/迭代模型（ Volcano Model ）

在这种模型中，每一种操作会抽象成一个Operator, 在执行侧作为一个操作数，从顶到下调用next()接口，数据从底部的scan节点向上传输，但是每次只传输计算一条数据，也叫做（Tuple-at-a-time）,是一种拉取执行模式。
优点：每个Operator可以单独实现逻辑，比较单间，灵活。
缺点：每次传输计算一条数据，导致next()函数调用次数过多，cpu效率低。

2.物化模式/Materialization Model

这种模型的处理方式，仍然是调用自顶向下，数据从底向上，但是每一个操作Operator一次性处理所有的输入，处理完成之后，将结果一次性向上输出。
此模式对于数据量较大的OLAP不太适合，但是比较适合数据量较小的OLTP系统。

3.向量化模式/批处理模型（ Vectorized / Batch Model ）

这种模型和火山模型非常类似，不同之处是每个Operator的next()函数，会返回一批的tuples数据，相当于是一种批处理的模型，这是一种上面两种模型的折中方式。
SR的向量化执行器主要集中在算子向量化，表达式向量化，存储向量化；充分利用SIMD指令优化，CPU Cache友好。

3 Udata查询引擎-联邦查询的增强

3.1 Udata查询引擎发展的三个阶段

3.1.1 社区版FE + 自研JAVA版BE

Udata查询引擎的第一阶段，是参照StarRocks的C++版本BE实现了一个JAVA版本的BE,主要完成了Udata在第一个阶段的进行联邦查询的数据服务的任务，并且在第一个版本基础上，已经实现了聚合计算的下推，同时也经过了618的考验，在执行引擎层面积累了大量的经验，为我们开展引擎改造的第二阶段提供了支持；

3.1.2 原生StarRocks + Udata改进

鉴于StarRocks表的优异性能，我们将查询引擎切换回原生的SR, 同时将之前的积累的优化经验，在原生SR上进行了实现，包括聚合查询和Sort排序的下推，额外支持了外表数据源CK,Jsf,Http，进行了查询函数format等的丰富。

3.1.3 未来探索方向

在下一个阶段，Udata查询引擎将会在SR的基础之上，密切地配合社区，引入新版本的功能，同时进行数据湖的使用探索和高性能的点查实践，以及跨SR集群的联邦查询等。

3.2 计算下推 - 极限压榨底层引擎的计算能力

3.2.1 优化背景

StarRocks在联邦查询方面针对MySQL, ElasticSearch已经有了非常快的性能，StarRocks在联邦查询方面的设计思想是针对不同的查询外部数据源，设计不同的Scan节点，并且尽可能的将谓词下推到Scan节点，在Scan节点查询到数据之后，上层会共用Project节点，Agg节点，TopN等这些节点的算子，基本的查询架构类似下图。

这种设计使StarRocks有非常好的扩展性，可以很容易的扩展到新一种的数据源，也正是这种高度可扩展的设计使我们有机会在联邦查询的细节层面，做进一步的优化，比如将一些算子的计算也尽可能的推到外部表引擎，可以节省一部分网络传输的时间，同时最大程度的压榨底层引擎原生计算能力，通过我们的测试这种计算下推也达到了数倍于原来的性能。

3.2.2 优化范围

在优化之前我们针对底层引擎和算子的特征做了调研，优化的范围包括如下：

针对ES引擎，进行了聚合算子的下推，但是某些特殊算子排除，不支持sum(distinct ), avg(distinct ) 算子下推；
针对MySQL引擎和ClickHouse，进行了聚合算子，TopN算子的下推；
针对新增加的Jsf和Http，进行了查询参数下推，运行时列过滤；

3.2.3 整体优化思路

目前整体的优化思路，主要分为两个部分，FE侧的改造和BE侧的扩充，同时对于原生StarRocks计算方式保持兼容，可以轻易的切换回原来的计算模式。

1）FE 侧改造优化- Optimizer Plan 的转换

执行计划优化流程

目前Udata查询引擎对执行计划进行优化的节点是在原来的Optimizer之后，我们从Scan节点开始对于执行计划，进行了模式匹配，命中模式之后，进行对应的计算下推和投影的合并，同时过滤底层引擎不支持的特殊算子（如ES的sum(distinct) ），最终将转变后的物理计划发送给BE侧进行执行。

模式匹配和计划改写

物理计划的树状封装：

ElasticSearch:

Mysql:

查询树改写：

最终，AggScanOperator 会转变为AggNode,发送到BE进行执行。

2）BE 侧改造优化

针对执行计划进行了改写之后，同样在BE侧我们创建了对应的Node节点，完成计算下推后的执行逻辑，向下对接外部执行引擎，同时向上对接类似join的聚合节点，最终输出结果数据。

3）原生SR兼容

同时执行层面，我们设置了灵活的开关（ set agg_push_down = 0 ），可以非常容易的关闭UData优化。

3.2.4 改造成效-（ 30秒 vs 6秒）

在我们的实际过程中，我们对于计算下推，尤其是多表聚合后关联的场景进行了观察测试，计算性能随着聚合表数目的增加，会有成倍数的效果提升。

3.3 JSF&HTTP&ClickHouse的支持 - 京东生态的对齐

3.3.1 简介

JSF是京东内部的一种RPC调用服务，很多数据分析的场景中，一些维表是在其他服务中用JSF或者Http的方式提供的，或者一些已经计算好的数据指标需要在我们的UData计算引擎中进行关联查询，因此我们增加了对于JSF和Http的支持，来作为京东生态的一个补充。

JSF和HTTP查询的两个关注点是如何将查询参数进行下推和如何将返回的结构化数据映射为表中的列数据，以便在联邦查询中进行数据关联和聚合。

同时，京东内部有不少使用ClickHouse的场景，我们也进行了查询支持，ClickHouse支持TCP协议，http协议，mysql wire协议，目前Udata查询引擎通过Mysql wire协议和ClickHouse进行外表关联。

3.3.2 主要改造点介绍

在FE侧，增加了JSF，HTTP，ClickHouse三种外部表对应的元数据结构，可以持久化外部表查询需要的底层引擎的属性信息；
FE侧RBO改造，对于SQL语法树对应的FromClause转换为对应的逻辑计划，并进一步转换为物理计划节点；
BE侧增加对应的ScanNode，进行数据查询；
对于JSF和HTTP，通过函数，用于从FE侧将查询参数传输到BE侧真实的查询节点，查询参数下推，同时列的过滤条件在获取数据后，在Scan节点运行时过滤；
对于JSF和HTTP，建表中增加Mapping，将返回的JSON数据映射到数据列；
ClickHouse外部表查询节点，可以支持两种模式，普通的scan查询和计算下推的Agg查询；

3.3.3 使用方式及案例展示

1）Jsf外部表使用

Jsf建表语句 ( 表结构+访问JSF必须的元信息 )：

Mapping ( Jsf 返回的json字串与数据表结构的映射 )：

查询Sql语句（查询参数下推和列表达式运行时过滤）：

上面的sql是用来查询Jsf外表的，同样的其他聚合函数都可以用于该Jsf表查询，上面主要有以下需要进行下说明:

列表达式过滤：（ recv_count >= 1000 ) 这种过滤条件用于Scan操作获取到数据之后，在BE节点内运行时进行再次过滤；
查询参数下推： jsfparam函数内置于Udata查询引擎，可以通过此函数，将需要带入到Jsf调用中的参数从调用端一直传递到Jsf服务中，从而减少数据的获取；
联邦查询：Jsf表同其他外表一样可以支持联邦查询，也同样可以支持其他外表支持的聚合等查询操作；

2）Http外部表使用

Http建表语句：

Http的建表语句同上面Jsf表，只是Properties有所变化，变成了http访问的元信息。

查询函数：

httpconfig : 第一个参数是数据表中的某一个列名，后面是一个map, 目前仅支持 httpmethod 表示请求的方式 get/post ;
httpheader : 第一个参数是数据表中的某一个列名，后面是一个map, json结构，解析后，按照key=>value 的配对，放入http请求的 header中去 ;
httpbody : 第一个参数是数据表中的某一个列名，后面是参数，将直接放入http的请求的body中，这里需要注意的是 http请求的方式是 application/json , 还是 x-www-form-urlencoded ，两种方式body中的写法是不一样的，x-www-form-urlencoded 写法是 key1=value&key2=value2 ;

3.4 查询代理-使Udata查询引擎在理论上具备了查询一切的可能性

UData查询引擎目前支持的联邦数据源有Es, Mysql, Ck, StarRocks, Hive, Iceberg, Hudi 等，同时对于UData目前不支持的数据源可以通过代理插件的形式进行扩展，我们提供了Udata Proxy的设计，只要遵循Udata代理提供的接口，实现对应的逻辑，来完成其他三方数据源的读取，便可以集成到UData查询引擎中，并和其他数据源一样可以完成普通查询和联邦关联查询。

3.4.1 批处理 vs 分页流式

Udata查询引擎增加了Proxy scan 节点，Scan节点和Proxy代理之间可以通过Http和RPC两种协议进行通讯；

数据从Proxy传输到Scan节点有两种方式：

批处理：一次性获取proxy返回的全部数据；
分页流式：适合数据量比较大的场景，利用scroll_id的参数，使数据可以分页微批的方式流向scan节点，需要Proxy中逻辑代码也支持滑动查询；

3.4.2 逻辑读插件热插拔

任何异构的数据源可以通过逻辑读插件的形式来支持，Proxy runtime 提供插件的执行环境，并进行并行线程的管理，逻辑读插件可以通过Proxy管理端进行上传和管理，热插拔及时生效；

自猿其说Tech-JDL京东物流技术数据智能部

作者：刘敬斌贺思远

Windows10-ltsc-2019 使用 PowerShell 安装安装TranslucentTB教程（不通过微软商店安装） lkm0522 microsoft TranslucentTB 透明任务栏
Windows10-ltsc-2019使用PowerShell安装安装TranslucentTB教程（不通过微软商店安装）下载v2020.4（最后一个兼容1809的版本）：TranslucentTB安装包(下载不了上面有安装包)安装依赖项（如未安装）：#下载并安装x86版本的VCLibsInvoke-WebRequest-Uri"https://aka.ms/Microsoft.VCLibs.x8
《MyBatis的运行原理》
一.MyBatis是什么？MyBatis是⼀个开源、轻量级的数据持久化框架，是JDBC和Hibernate的替代⽅案，MyBatis内部封装了JDBC，简化了加载驱动、创建连接、创建statement等繁杂的过程，开发者只需要关注SQL语句本身。二.MyBatis执行流程1.MyBatis与JDBC想要学习了解MyBatis，我们首先需要从JDBC入手并立足于JDBC，才能深入的理解MyBatis
composer、GitHub 包版本管理 weylau
包新增了功能可以给包标识一个版本号，可以结合gittag来作为包的版本更新，步骤如下：1、本地git打tag命令：gittag-a1.0.1-m'版本1.0.1'执行gittag可以看到新建的tag查看新建tag推送tag到远程仓库命令：gitpushorigin1.0.1此时，可从GitHub上看到tag回到https://packagist.org自己的包详情页面点击更新ok
怎么调用接口发验证码和通知短信？互亿无线_苍穹
PHP对接验证码短信接口DEMO示例本文为您提供了PHP语言版本的验证码短信接口对接DEMO示例*接口类型：触发短信接口，支持发送验证码短信、订单通知短信等。*账户注册：请通过该地址开通账户http://user.ihuyi.com/?exClaO*注意事项：*（1）调试期间，请使用用系统默认的短信内容：您的验证码是：【变量】。请不要把验证码泄露给其他人。*（2）请使用用户名及APIkey来调用接
hive的sql优化思路-明白底层运行逻辑 ycllycll hive sql hadoop
一、首先要明白底层map、shuffle、reduce的顺序之中服务器hdfs数据文件在内存与存储之中是怎么演变的，因为hive的性能瓶颈基本在内存，具体参考以下他人优秀文章：1.HiveSQL底层执行过程详细剖析2.HiveJOIN性能调优二是要明白hive对应的sql它底层的mapreduce的过程中sql字段的执行顺序，来理解map的key、value会填充什么值，才能深刻理解怎么一步一步的
springboot-mybatis-MySQL-集成张_皮皮 springboot mybatis maven springboot mybatis idea
这也是我第一次搭建springboot-mybatis的项目环境，记录一下。我是用IntelliJIDEA，你可以创建maven项目，也可以直接创建spring项目，最终的项目结构如下，这里说明下，resources下面的mappers里面是存放mybatis的SQL映射文件，static下面存放前端静态资源文件，如js,css等，template下存放前端模板文件，本项目使用的freemarke
Ubuntu 安装 Gitlab Kesling 服务部署 ubuntu gitlab linux
Ubuntu安装Gitlab安装依赖打开终端，运行如下命令：sudoaptupdatesudoaptupgradesudoaptinstallcurlopenssh-serverca-certificatespostfix安装GitLab前往GitLab官网，需要根据服务器系统，搜索需要安装的版本号。根据官网提示下载源文件，执行如命令curl-shttps://packages.gitlab.co
GitLab系列2 GitLab Workhorse weixin_34326558 git 运维前端 ViewUI
GitLabWorkhorse上一回介绍了GitLab的基础功能和架构，但还没具体讲解用户的请求是怎么被处理的，只是将各个组件的功能职责介绍了一遍，本节将简单介绍gitlab-workhorse的功能首先回顾一下：GitLab利用Nginx将前端的http/https请求代理至gitlab-workhorse，gitlab-workhorse再将请求转发至UnicornWeb服务器。默认情况下gi
Android图书借阅系统完整App开发教程(源码+数据库)
本文还有配套的精品资源，点击获取简介：本教程深入介绍了基于Android平台的图书借阅系统App开发过程，涵盖了从UI设计、网络通信到数据库操作的全面实践。项目包含源码和数据库文件，让学生能够通过实际案例学习并掌握Android应用开发的核心技术。本App具有预约借书、书籍评论、图书推荐和逾期提醒等功能，要求开发者熟悉Java语言和Android系统，以及实现后端逻辑和数据存储。此项目是一个宝贵的
题解 | #使用join查询找出没有分类的电影id以及名称# 愤怒的小青春 java
58同城java后端一面凉经主流的哈希算法有哪几种？帮闺蜜们找靠谱男票hc多多光彩积云是什么企业，查不到有用信息太抽象了！培训班装公司招聘阿里巴巴前端暑期实习——无语八面挂怎么写自我介绍|自我介绍保姆级教学灵犀互娱客户端一面面经(求过啊)24找运维实习，这简历可行吗拓竹科技测试开发面经（25届暑期实习）分享一波攒了整个秋招的NLP算法岗面经腾讯广告暑期实习面试1、JVM垃圾回收机制2、syncho
Centos自动扩容centos-root卷空间杭州吉网运维日记 Linux运维自动化运维 centos 运维
原创作者：运维工程师谢晋Centos自动扩容centos-root卷空间因为经常给客户扩容卷空间，所以为了方便编写了个脚本。#viresize_root.sh#!/bin/bash#CentOS7自动扩容centos-root卷空间脚本#需要以root用户运行#检查是否以root用户运行if["$(id-u)"-ne0];thenecho"此脚本必须以root用户运行">&2exit1fi#检查操
虚拟机Ubuntu搭建gitlab服务器，ssh连接 yizhiyu_hh 服务器 ubuntu gitlab
任务：在一台新的计算机上搭建gitlab环境，用于版本管理并使用ssh连接要求：1、要在Windows系统下运行2、gitlab可以在局域网内被任何pc访问3、搭建完后，使用ssh工具管理4、工具要免费SP1：下载安装虚拟机和ubuntu系统虚拟机选择virtualbox，链接https://www.virtualbox.org/wiki/Downloads现在的virtualbox版本都比较高，
框架技术SpringBoot ---SpringBoot集成Mybatis 码农C风 JAVAweb java spring java-ee 数据库
SpringBoot框架内容管理ORM操作MySQLSpringBoot集成Mybaits步骤第一种方式：@Mapper注解第二种方式：@MapperScandao和xml文件分开---yml中配置事务txSpringBoot使用事务业务方法加入@Transactional；同时主启动类加上@TransactionManagerSpringBoot框架整合持久层框架，Mybatis前面已经分享了S
XSS Game Earnestfu xss 前端
hugoserver--bind0.0.0.0--baseURLhttp://192.168.239.128:1313/MaSpaghet!spaghet.innerHTML=(newURL(location).searchParams.get('somebody')||"Somebody")+"TouchaMaSpaghet!"没有什么过滤，直接输入就行payload：http://192.16
监控漏检频发？陌讯YOLOv7实时优化方案召回率提升25% 2501_92489016 目标跟踪人工智能计算机视觉算法目标检测视觉检测智慧城市
一、开篇痛点在安防监控领域，传统目标检测模型面临三重困境：实时性差：1080P视频流处理普遍低于20FPS（VGG16仅15FPS）漏检率高：密集场景下小目标召回率常低于60%（COCO-val实测数据）部署成本高：ResNet-101需8GB显存，难以边缘化部署某智慧园区项目显示：夜间误报率高达34%，运维成本激增300%二、技术解析：陌讯SlimYOLO架构创新针对上述痛点，陌讯视觉算法提出三
Python Django 数据库索引优化 Python编程之道 python django 数据库 ai
PythonDjango数据库索引优化关键词：DjangoORM、数据库索引、查询优化、性能调优、PostgreSQL、MySQL、执行计划摘要：本文深入探讨Django框架中的数据库索引优化策略。我们将从数据库索引的基本原理出发，详细分析DjangoORM如何生成SQL查询，以及如何通过合理的索引设计提升查询性能。文章包含索引类型选择、复合索引优化、Django模型字段索引配置、查询集优化技巧等
你多久没有认真读一本书了我是巴卡
我九岁博览群书，二十岁达到顶峰。我现在都是看社会人文类的书，例如《知音》《故事会》……往前推三百年，往后推三百年，总共六百年没有人超过我。——凤姐引用凤姐的话，没有嘲讽的意思。现在的人，包括我自己，除了刷手机，恐怕连杂志都很少读了，更别说认真读一本书了。1、大数据下，人越读越窄，越读越傻前段时间，埃航波音737MAX8出事，就在网上跟着读了几篇报道。随后的一段时间，基本打开APP都是关于波音和73
github jekyll+chirpy主题搭建博客 handsomestWei 后端 github Jekyll Chirpy GitHub Pages 博客建站
githubjekyll+chirpy主题搭建博客标签：后端、blog、jekyll全文链接本文简要介绍了如何基于GitHubPages、Jekyll及Chirpy主题搭建个人博客的流程和注意事项。主要内容GitHubPages站点简介可免费搭建个人博客，支持自定义域名，适合静态网站部署。Jekyll简介Jekyll是一个静态博客生成工具，无需数据库，适合部署在GitHub上。提供了相关文档和教程
注意力才是我们最值钱的东西心守平凡_王慧超
4月10日晚，罗永浩携手国民神车哈弗品牌完成了第二场带货直播。此次直播共售出11357张2777元的优惠券，预估销售额15.65亿元，创造了汽车直播带货的新纪录。流量时代真的已经来临了，随着互联网的高速发展，越来越多的网络用户增加，我们不得不承认，我们已经进入了一个网络时代，进入了一个流量大数据时代。我们所有想获得的东西都可以通过网络获取，资料、信息、购物，网络正在改变人们的生活方式，正在成为人们
Django `transaction.atomic()` 完整使用指南言之。 python django 数据库 python
目录#概述#基本用法#事务一致性保障机制#破坏一致性的常见场景#高级用法#最佳实践#诊断与调试#附录概述transaction.atomic()是Django提供的数据库事务管理工具，用于确保一系列数据库操作要么全部成功提交，要么全部回滚，维护数据的一致性。基本用法1.作为上下文管理器fromdjango.dbimporttransactiondefview_func(request):witht
Grok网站的后端语言是php和Python2.7 言之。随笔随笔
老马的Grok模型https://grok.com/#subscribephp语法这里还出现了两个bug后端语言能看到是php和python2.7要说卷还是得看中国的程序员啊，天天就是新技术，赶不上别人就35岁毕业退休
许光汉《正港分局》台剧全集【1080p超清韩语中字】网盘提取码（百度云夸克迅雷无删节资源）免费视频在线观看大全全网优惠分享君
《正港分局》作为一部备受瞩目的台湾剧集，自其在Netflix平台上线以来，便以其独特的鬼魅设定、紧凑的剧情、精湛的演员表演以及深刻的主题探讨，吸引了大量观众的关注与喜爱。该剧作为电影《关于我和鬼变成家人的那件事》的衍生影集，不仅延续了母剧的独特风格，更在故事深度和人物塑造上进行了全新的探索与拓展。正港分局全集(尽快保存，随时失效)链接：https://pan.quark.cn/s/dcbd1196
BFS-FloodFill 算法解决最短路问题多源解决拓扑排序 penguin_bark #BFS 算法宽度优先 leetcode
文章目录一、FloodFill算法[733.图像渲染](https://leetcode.cn/problems/flood-fill/description/)2.思路3.代码[200.岛屿数量](https://leetcode.cn/problems/number-of-islands/description/)2.思路3.代码[LCR105.岛屿的最大面积](https://leetcod
【Netty实战】基于Netty+WebSocket的IM通信后台服务代码详解
一、引言二、技术选型与前提条件三、核心代码实现服务的启动类ChatServer初始化器类WSServerInitializer心跳Handler类HeartBeatHandlerOkHttpUtil工具类json实体转换工具类JsonUtils发送消息的类型/动作枚举类MsgTypeEnum消息实体类ChatMsg自定义通信Handler类ChatHandler会话用户id和channel的关联处
Atlas 读写分离子牙
1.AtlasAtlas是由Qihoo360,Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy0.8.2版本的基础上，对其进行了优化，增加了一些新的功能特性。360内部使用Atlas运行的mysql业务，每天承载的读写请求数达几十亿条。下载地址https://github.com/Qihoo360/Atlas/releases注意：1、Atla
六、深度剖析 Hadoop 分布式文件系统（HDFS）的数据存储机制与读写流程
深度剖析Hadoop分布式文件系统（HDFS）的数据存储机制与读写流程在当今大数据领域当中，Hadoop分布式文件系统（HDFS）作为极为关键的核心组件之一，为海量规模的数据的存储以及处理构筑起了坚实无比的根基。本文将会对HDFS的数据存储机制以及读写流程展开全面且深入的探究，通过将原理与实际的实例紧密结合的方式，助力广大读者更加全面地理解HDFS的工作原理以及其具体的应用场景。一、HDFS概述H
MySQL-SQL优化Explain命令以及参数详解只吹45°风 MySQL mysql sql 优化 explain
前言在MySQL优化的众多手段中，EXPLAIN命令扮演着至关重要的角色。它是数据库管理员和开发者手中的利器，用于分析SQL查询的执行计划。通过执行EXPLAIN，MySQL会提供一份详细的查询执行计划报告，这份报告揭示了查询将如何执行，包括数据访问路径、表的连接顺序、使用的索引、预期扫描的行数等关键信息。这些信息对于识别和解决性能瓶颈至关重要。基于EXPLAIN提供的洞察，我们可以采取措施，如优
mysql sql explain_SQL中EXPLAIN命令详解---(转)
在日常工作中，我们会有时会开慢查询去记录一些执行时间比较久的SQL语句，找出这些SQL语句并不意味着完事了，些时我们常常用到explain这个命令来查看一个这些SQL语句的执行计划，查看该SQL语句有没有使用上了索引，有没有做全表扫描，这都可以通过explain命令来查看。所以我们深入了解MySQL的基于开销的优化器，还可以获得很多可能被优化器考虑到的访问策略的细节，以及当运行SQL语句时哪种策略
001双双-文案课第七次作业双双执行力财富流教练
作业要求：竞品分析做一个手机的竞品分析至于选择哪两款产品出于什么目的进行分析，需要按照韩老白老师今天讲的四个步骤来对比机型：iPhoneXvs坚果R1iPhoneXvs坚果R1参考资料：iPhoneX参数：http://product.pconline.com.cn/mobile/apple/1048848_detail.html坚果R1参数：http://product.pconline.com
PostgreSQL数据库集群如何进行自动化性能监测？ TechVision大咖圈数据库 postgresql 自动化性能监测
前言：在这个数据爆炸的时代，PostgreSQL数据库集群就像是我们的"数据宝库"。但是，再好的宝库也需要有专业的"保安"来守护。今天我们就来聊聊如何给PostgreSQL集群配备一套智能的"保安系统"——自动化性能监测。文章目录一、为什么需要自动化监测？二、核心监测指标解析三、监测工具选型指南四、监测架构设计五、实施方案详解六、告警策略配置七、最佳实践总结八、常见问题解答一、为什么需要自动化监测
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

UData查询引擎优化-如何让一条SQL性能提升数倍

1 UData-解决数据使用的最后一公里

2 Udata-查询引擎执行介绍-一条SQL的旅行

3 Udata查询引擎-联邦查询的增强

你可能感兴趣的:(技术分享,数据库,大数据,数据库,运维,sql,http)