智鼎在线IT团队

超详细Apache NIFI同步Mysql (读取binlog)数据变化到Hbase教程

文章目录

受众人群
阅读须知(免责声明)
简介
软件环境
参考内容
操作流程

开启Mysql的binlog
Apache NIFI使用简介

个人理解NIFI使用流程

提供本文模板xml文件

读取Mysql的binlog信息

添加CaptureChangeMySQL Processor
添加DistributedMapCacheServer

路由binlog的操作类型

添加RouteOnAttribute Processor
添加我们第一个Connection

启动CaptureChangeMysql 试一试
整理binlog的数据格式
保证执行顺序
再新建个RouteOnAttribute Processor
新建EvaluateJsonPath Processor(删除操作分支)
新建DeleteHBaseRow Processor(删除操作实现)
新建PutHBaseJSON Processor(insert/update操作对应分支)
启动整个流程测试效果

受众人群

适合对于NIFI使用一脸懵逼的萌新小伙伴.希望根据本文可以帮助大家从懵逼状态过渡到小懵逼状态:P
内容会多图细致指导,NIFI懂得越多看完越会觉得本文很啰嗦.
~~//TODO删除此行:观众:只不过没找到简介明了的说明方法吧.作者:闭嘴!你懂得太多了~~

阅读须知(免责声明)

能力有限,NIFI新手入门所写,希望本篇内容错误少一些,避免误导大家的内容存在.
本文由互联网知识内容汇总实现的功能,步骤流程有不完善或可优化的地方,欢迎讨论指正.也希望这篇可以抛砖引玉,对于同样NIFI的新手提供一些帮助,少走一些弯路.
本文对于作者自身遇到的一些NIFI操作的知识点,会以TIPS作为前缀,属于辅助讲解.根据自身掌握需求情况,有选择性的跳过即可.

简介

使用Apache NIFI通过读取mysql开启的binlog日志,同步数据库变化到Hbase.

软件环境

NIFI 1.9.2
HBASE 2.1.4
mysql 5.7

参考内容

使用NiFi将数据从Mysql导入至HBase
学习这篇内容,可以先实现全量同步mysql到Hbase的操作实现.

Change Data Capture (CDC) with Apache NiFi(1/3)
这个教程共3篇,文章末尾有跳转到下一篇的超链接,将使用NIFI利用binlog同步mysql的设置流程.

Delete Row Key(s) using DeleteHBaseRow processor in NiFi
NIFI根据Rowkey删除Hbase一行内容.

Jolt Transform DemoJolt简易DEMO教学和使用测试

操作流程

开启Mysql的binlog

参考这篇文章linux开启MySQL binlog日志.(这篇文章没有配置binlog_format=row)
稍微介绍下修改my.cfg(linux),my.ini(windows版,在mysql安装目录根目录下)里面的参数
推荐阅读:
binlog之四：mysql中binlog_format模式与配置详解，binlog的日志格式详解

# 服务器ID,多台服务器集群配置这个属性注意不要重复
server_id = 1 
#binlog文件存储路径及文件名前缀(本例前缀是mysql-bin,回头生成binlog文件会有:mysql-bin.index,mysql-bin.000001,mysql-bin000002等)
log-bin=D:\developSetup\mysql-5.7.22-winx64\mysql-bin
#很重要 必须有
#很重要 必须有
#很重要 必须有  因为好根据row级别数据改变内容去修改hbase对应记录.(不清楚其他模式是否可以同步到hbase里)
binlog_format=row
# 哪些数据库启用binlog
binlog_do_db = source1
binlog_do_db = source2
binlog_do_db = source3

Apache NIFI使用简介

个人理解NIFI使用流程

把整个过程拆成一个一个处理功能点,把功能点用有向/且有条件匹配关系进行关联.实现最终功能需求.
功能点对应:NIFI里的各个Processor(即下图里的各种矩形方框).
有向关系:对应NIFI里的Releation,就是下图有向连接线
最后做完像一个流程图.见下图

提供本文模板xml文件

文件地址戳我

读取Mysql的binlog信息

CaptureChangeMySQL是NIFI用于读取Mysql的binlog内容的Processor.

添加CaptureChangeMySQL Processor

拖动一个Processor到工作区域,见下图

之后松开鼠标左边,会有弹窗弹出,见下图.在下图红框里输入cap即可,会根据输入的内容过滤出符合名字的Processor.之后点击右下角ADD,确认添加.

TIPS:processor上有橙色小叹号

鼠标指上去会有弹出提示有何种错误,不解决一般会导致这个Processor无法启动正常工作.见下图,提示我们新添加的Processor没有设置Mysql的hosts

右键我们刚ADD的CaptureChangeMySQL ,选择Configure(配置)

SETTINGS标签:
红框name可以修改这个Processor的名称,可无视.
蓝框设置自动停止的触发关系条件.
SCHEDULING标签:
设置调度模式,按时间或者CRON模式(可配置CRON表达式)
COMMENTS标签:
字面意思,评论,备注之类的描述信息.

压轴的PROPERTIES标签:
配置样例见下图,
配置的Mysql链接的jar包自行下载下,对于配置参数有疑问,可以鼠标指向参数名称后面的小问号,会有提示.
贼关键点!
贼关键点!
贼关键点!
Distributed Map Cache Client一定要设置,我最开始理解错误以为需要依赖第三方的存储来实现这个功能,而且我没有了解到这个配置的重要性.,我手欠的删除了.引发惨痛的教训如下:
不用Distributed Map Cache Client读取到的binlog里的字符串类型信息(数据库名,数据表名,字符串类的字段内容会是null,还会缺失mysql字段名称,后面会举例说明).
点击Distributed Map Cache Client后面空白区域会像下图所示,选择红框内容,并确认

再点击上图界面,CDC MapCache 右边的向右小箭头去配置和启用,见下图界面.
我当前截图是停用状态,这时可以去点齿轮图标进行配置修改,这个地方默认级可以,不需要修改,可以直接点击最右边闪电进行启用.

可以看到图中右上方CaptureChangeMySQL Processor有橙色叹号,是因为我们这个CDC MapCaches属于的这个Processor,但是还不是启用状态导致的.点击右下角ENABEL确认启用.

启用后截图见下图,status列会显示Enabled

TIPS:我们如何快速进入这个NiFi Flow Configuration,去配置这些CONTROLLER SERVICES?
毕竟每次我们设置这些内容,或是开启需要找到对应的 Processor,再进去有些小麻烦.捷径见下图,下图呈现的是选中了CaptureChangeMySQL Processor,左边Operate处显示被选中的Processor

此时,我们可以单击空白处,Operate会变为下图状态,再点击齿轮可以进入NiFi Flow Configuration.

后面依次是
全部启动CONTROLLER SERVICES,
全部禁用CONTROLLER SERVICES,
全部启动工作区域内所有Processor,
全部停用工作区域内所有Processor,
将当前工作区域内的内容存储为模板,
上传一个模板文件(xml格式),
复制,
粘贴,
Group(没用过.不知道干嘛的…),
修改Processor颜色,
删除选中的Processor
TIPS删除Processor前提条件

1不是其余Processor的下游组件(没有上级Processor)
2与其关联的关系(有向线)里不存在数据,如果存在数据可以右键关系,选择Empty queue来清空关系里的队列数据,之后再删除Processor

添加DistributedMapCacheServer

进入NiFi Flow Configuration,选择CONTROLLER SERVICES标签,见下图

我们已经有了上图红框内容,可以看到其类型Type列内容是:
DistributedMapCacheClientService 1.9.2
单词client表明是一个使用的客户端,所以我们还需要添加一个server服务器端,来给client提供服务,也就是需要要添加上图橙色框内容Type类是:
DistributedMapCacheServer
点击上图右上角加号添加,进入下图界面,在文本框里输入DistributedMapCacheServer
选中过滤出来的这个,并点击ADD添加.
之后效果如下图,类似刚才的DistributedMapCacheClient ,不用配置修改什么,直接点击启用就可以.(前提之前的DistributedMapCacheClient 没有做过什么修改也是默认配置,保证端口号之类的属性对应的上)

TIPS清空CaptureChangeMySQL的state

用于测试时,从头读取binlog数据使用,省去我们每次测试再去mysql一顿猛如虎的增删改查操作产生新的binlog.
这是因为正常不清空state状态时,CaptureChangeMySQL会记录读取Mysql binlog的位置,下回(哪怕重启CaptureChangeMySQL Processor)读取时,会读取记录位置后面的内容.这样设计是合理的,避免数据重复读取的问题.但是对于我们测试期间就没有必要性.
所以为了方便测试我们可以清空这个记录的状态,从头读取mysql的binlog记录.
点击下图红框处的Clear state即可.

路由binlog的操作类型

作用说明:
根据binlog中含有的类型参数,把binlog记录的日志操作根据类型进行路由处理,提供给不同的下游分支操作.

添加RouteOnAttribute Processor

还是拖动个
进入工作区,搜索框输入
RouteOnAttribute

并点击右下角ADD.
下一步开始设置
右键这个processor,点击configure.,选择PROPERTIES标签进入下图

Routing Strategy:路由策略用默认的Route toProperty name,根据属性名进行路由.
上图下面一堆内容是点击图中右侧小加号一个一个添加进去的,分别应对Mysql的binglog操作类型,本示例最终只演示对于insert/delete/update的处理其余类型的会被舍弃处理(~~咳咳因为业务没需求使用ddl,begin,commit,所以没研究,还不会~~ ).

PS:为何采集还要带着ddl,begin,commit这些类型数据内容?
因为抄袭的国外那个demo带着,而且后面沿用的流程,会有一个强制保持顺序的processor,后文会详细介绍下.
这个Processor会将读取binlog的所有操作按顺序排序传递给下游其余processor.如果缺失中间的几个binlog操作导致序号无法顺序执行,

添加我们第一个Connection

至此我们新建了2个Processor,当前他们还是彼此孤立无援,而其鼠标指向叹号三角会看到配置不完整的报错提示,表示需要发生点什么关系才行,否则这个Processor是无法正常启动使用的.

所以我们需要将它们连接起来,鼠标指向CaptureChangeMysql Processor,中间会有下图所示的一个箭头图标,鼠标指向这个图标并按住,拖向我们的RouteOnAttribute Processor(并使其边框变绿即可松手)

之后弹出下图,创建连接的配置页面.我们需要关注的是截图For Relationships这里,勾选你希望达成什么关系,才会让数据从上游Processor流到下游Processor.这里我们只有一个success关系可选,在后面会有多种关系可以多选的情况.在这里我们直接点击ADD确认添加一个Conection就好了,有兴趣可以看看SETTINGS标签可以重命名这个Concetion名称,以及队列消息的进出顺序规则,((由于后面选择了强制排序的Processor所以这里没有配置顺序规则也没影响)
如果想配置可以配置如下图所示样子,将规则FirstInFirstOutPriorltizer等拖到下面Selected Prioritizers下方,可以拖动多个规则,越在上面,优先级越高.

TIPS:Prioritizer(优先排序)默认优先规则是什么?

google了下2015年NIFI版本,以效率优先,规则会动态变动,帖子内容戳我
当前(2019年7月份)的规则是以OldestFlowFileFirstPrioritizer规则为默认.点击这里查看官方prioritization介绍
那么问题来了FirstInFirstOutPrioritizer(FIFO) 和OldestFlowFileFirstPrioritizer(OFF)有啥区别哟?
stackoverflow的解答
我个人理解完,解释如下:设想一个数据源,不同数据类型会分几个不同分支来处理数据,处理完最终再次汇总到一个Processor里,那么汇总procssor再向其下游Processor传递数据的Conection关系,可以看出这两类区别
.比如数据内容1,2,3代表3条有顺序数据,数字越大表示数据越新,123交给不同分支处理.如果以312顺序到达汇总后的Conection里,且还没有被发送时,这时候会评定发送给下游的传输顺序
如果是FIFO,那么输出就是312,因为谁先到这个Conection谁先出.
但是如果是OFF,由于1最老最先进入NIFI处理的,所以最后发出顺序是123,简单来说就是尊老不爱幼原则.

启动CaptureChangeMysql 试一试

我们现在已经有2个Processor和一个Conection了,我们已经可以启动CaptureChangeMysql 来试一试效果了.
注意前提

CaptureChangeMysql 没有橙色叹号
确保mysql那边已经有binlog产生
防火墙等限制网络通信情况
让我们来试试吧,右键CaptureChangeMysql ,在弹出菜单里选择Start,静等效果
如果成功会类似下图所示,我们的关系是Success的Conection里堆积了数据,而且CaptureChangeMysql 也显示read/write以及Out里也会有数据大小

当然也有可能报错了,实践的道路上怎能少了这些挫折的调味品!
TIPS:如何查看Processor报错信息?

见下图,鼠标指向processor红色便签图标处,会有详细信息
另外下图说Unknown error 1045,并没有说明是啥错误啊?鉴于我们这个是读取binlog的Processor,所以这里其实是反馈的Mysql的报错代码,百度下mysql 1045就有想要的错误解决方案了.

TIPS:我怎么查看Processor里的数据?

右键选择下面菜单View Data provenance内容,

想看数据可以,点击每条记录最前面的圈i,小图标.
行尾部的两个操作
第一个是查看数据到这里走过了哪些processor流程缩略图,
第二个右箭头,点击会跳到你当前查看的是哪个processor.

根据兴趣查看下新弹出窗口三个标签内容,提及下第二个ATTRIBUTES标签,我标红框的那个地方有个cdc.sequence.id属性.
我个人不负责任猜测理解是:CaptureChangeMysql 读取binlog自己打上的一个序列号.

可以有什么用呢?后文用它最后汇总排序作为一个依据

查看具体一条数据内容点第三个标签CONTENT,点击下面红框里的VIEW可以查看单条binlog数据内容(因为我们binlog是Row格式的所以是单条对应一条数据记录),也可以点击旁边的download 下载这条数据.

点击VIEW后如下图,可以选择下View as的下拉框内容:选择formatted格式化下,否则就是一行代码不好查看.

type:表示是删除操作类型
database:表示来源于哪个数据库名
table_name:数据表名
columns:列信息
columns.id数据表里的第几列(从1开始)
columns.name列名称
columns.column_type:数据类型的对应数字
columns.value:这列的值是多少
columns.last_value: update操作类型会有,记录修改前的值是多少.

TIPS:我怎么查看Concetion里的数据?
右键Conection,选择List queue,类似查看Processor的界面,不再赘述(~~老子懒了,写不动了~~ )

整理binlog的数据格式

NIFI读取的mysql binlog日志是json格式数据,里面会有一些我们不需要的key,value,为了方便给hbase操作使用,需要处理过滤下.
这就涉及到一门语言JOLT(折磨我最久的一个环节…至今还没掌握皮毛)
用于处理JSON数据格式转换为想要的数据格式.
本文开头提到的这个网站使用体验下Jolt
Jolt Transform Demo

本文只是简单把表属性全量的存储进Hbase的一个列簇下,需要取舍字段,根据需求自行研究Jolt语法来转换实现即可.
闲话至此,我们开始操作

先弄个JoltTransformJSON Processor进到工作区.
右键选择菜单configure
在SETTINGS标签可以在左上角Name下面给processor起个名字,右边自动终止关系勾选failure
设置PROPERTIES标签,
Jolt Transformation DSL 默认Chain就好,表示一次可以设置多个jolt操作配置,顺序执行.
其余也是默认值即可.
我们需要改动的就是Jolt Specification这一栏,
但是不着急,我们先点左下角的ADVANCED这个按钮.

会打开如下图Jolt测试界面
上面有红叉子的那个区域Jolt Specification是填写我们的Jolt语句的;
左下方区域JSON Input是输入要被处理前的Json数据.
右下方区域JSON Output是输出Input被jolt语句处理后的结果.
1
Jolt Specification区域输入以下内容

[
  {
    "operation": "shift",
    "spec": {
      "columns": {
        "*": {
          "@(value)": "@(1,name)"
        }
      }
    }
  }, {
    "operation": "modify-default-beta",
    "spec": {
      "apid": "=concat('ap_',@(1,id))"
    }
  }
]

“operation”: “shift”:实现整理出key,value格式
“operation”: “modify-default-beta”:实现拼接了一个带前缀字符串的新字段apid,以及value是字符串ap_拼接id的value值.

PS: 刚才我们Jolt Transformation DSL选择是chain模式,所以支持执行2或多个operation来执行

JSON Input输入以下内容

{
  "type" : "update",
  "timestamp" : 1562211746000,
  "binlog_filename" : "mysql-bin.000006",
  "binlog_position" : 13105,
  "database" : "dataBaseName",
  "table_name" : "tableName",
  "table_id" : 358,
  "columns" : [ {
    "id" : 1,
    "name" : "id",
    "column_type" : -5,
    "last_value" : 195501,
    "value" : 195501
  }, {
    "id" : 2,
    "name" : "somecolumn",
    "column_type" : -5,
    "last_value" : 6103026,
    "value" : 6103026
  } ]
}

最后点击TRANSFORM按钮查看效果

测试没问题,可以复制我们调试好的Jolt Specification内容,返回刚才Jolt Specification这里,贴进去保存配置.

从RouteOnAttribute到JoltTransformJSON建立Conection,关系选择delete,insert,update.

保证执行顺序

拖进来EnforceOrder Processor,第一个SETTINGS标签勾选overtook

之后设置第三个标签SETTINGS

Group Identifier:分组标示,填写一个写死的1(因为本例没有啥分组)
Order Attribute:顺序标示属性cdc.sequence.id(曾记否,上面提到的这个属性,我们的第一个CaptureChangeMySQL processor读取binlog会生成这个属性)
Initial Order:起始顺序 0(因为强制顺序这个会严格按照不长1递增,所以遇到缺失中间顺序号的时候,可以调整下起始顺序,而且这个processor类似 第一个CaptureChangeMySQL Processor是有状态存储的,会记录当前Order Attribute处理到哪个顺序值了.如果记录处理到第100顺序号了,但是没有拿到101这个顺序号数据,101之后的所有数据会进入wati等待状态.
Wait TImeout:出于等待的数据,超过这个设置的时间会进入overtook状态(我们设置的overtook会终止这个processor的运行)
inactive Timeout:如果一个分组在设定的时间(下面图中30min)内没有新的数据来源,会判定为非活动组,会清空该组状态跟数据,导致迟到的数据一致无法匹配被清空的数据状态序号了,最终会等待超时,打到Overtook.
但是如果有需求需要反复重用组(每次重用从0开始),可以设置时间小一些.但是时间不能小于wait Timeout时间,

建立JoltTransformJSON processor到EnforceOrder Processor的Conection;
关系选择success.

建立RouteOnAttribute processor到EnforceOrder Processor的Conection;
关系选择ddl,begin,commit.(由于这几个操作我们最后会舍弃,所以没有像insert,update,delete进行额外处理)

建立EnforceOrder Processor 到自己的Conection
关系选择wait

新建一个LogAttribute processor
建立LogAttribute processor 到EnforceOrder Processor Conection
关系选择failure,skipped.

再新建个RouteOnAttribute Processor

可以直接复制上面那个RouteOnAttribute Processor,这里使用是为了将从EnforceOrder 拿到处理后以及排序好的数据进行再次分支处理.本文称其为RouteOnAttribute2
将EnforceOrder 到这第二个RouteOnAttribute2 Processor建立conection关系是success

新建EvaluateJsonPath Processor(删除操作分支)

配置参考下图,点右上角加号,添加一个属性用于下个hbase删除row时需要的rowkey.用表达式读取我们处理完的$.apid值(就是之前jolt处理新增的value是ap_前缀+id的那个key)

新建RouteOnAttribute2 Processor到EvaluateJsonPath Processor的Conection,关系选择delete.
再建个LogAttribute Processor,称其为LogAttribute2
建立EvaluateJsonPath Processor到LogAttribute2 Processor的Conection,关系选择failure,unmatch(用一个LogAttribute其实也够用了,不过为了方便清晰的分类查看成功或失败的记录,所以会多创建些)

新建DeleteHBaseRow Processor(删除操作实现)

配置参考下图,

主要关注
Hbase Clinet Service(建立一个跟HBbase的链接服务,可复用)
点击后面空白区域,选择下拉create new service,再根据使用的Hbase版本选择合适的下拉框内容(本文用的hbase2,所以选择的Hbase_2_ClientService这个下拉框内容)

之后点击右边小箭头,进行配置,进入下图界面,点后面的齿轮进入配置界面,
配置详情参考如下,也就是配置下hbase的链接信息,根目录之类信息,根据自己情况酌情修改.都配置妥当,别忘了点闪电图标启用.

TableName,对应Hbase下的数据表名称
Row Identifier:删除hbase Row所需要的行键值,写表达式对应读取上一个EvaluateJsonPath Processor里的$.apid的属性key名称rowKey
Row ID LOcation选择FlowFile attributes

更多关于NIFI删除Hbase的操作,参考本文开头介绍的参考文章
Delete Row Key(s) using DeleteHBaseRow processor in NiFi

新建EvaluateJsonPath 到DeleteHBaseRow Processor的Conection,关系选择matched.
新建DeleteHBaseRow Processor 到LogAttribute2 Processor的Concetion,关系选择failure.
新建一个LogAttribute3 Processor
新建DeleteHBaseRow Processor 到LogAttribute3 Processor的Conection,关系选择success.
新建LogAttribute Processor(就是第一个LogAttribute)到LogAttribute3 Processor的Conection.关系选择success

新建PutHBaseJSON Processor(insert/update操作对应分支)

新建完,右键配置,修改PROPETIES,
HBase Client Service选择我们刚才创建好的那个 Hbase_2_ClientServcie(如果没有重命名的话)
Table Name :要写入HBase的数据表名称
Row Identifier Field Name:去json里哪个key作为行主键apid
Row Identifier Encoding Strategy:编码策略,我们是用的String,根据自己情况自行选择
Column Family:把这些json数据存入那个Family(列簇)中,下图是用的result

新建PutHBaseJSON Processor到LogAttribute2 Processor的Conection
关系选择Failure

新建PutHBaseJSON Processor到LogAttribute3 Processor的Conection
关系选择Success

启动整个流程测试效果

如果之前测试过,别忘了清空各个Conections里的队列数据和CaptureChangeMySQL,EnforceOrder的state状态(右键 View State,点clear state)
单击空白区域点击下图的红框里的按钮,启动所有Processor,(也可以点闪电批量启动/停止service,那些需要点闪电启动的那帮家伙门)

TIPS:导出模板到xml文件

在页面右上角点击三道杠菜单,选择Templates
点击行最后面垃圾桶前面的按个按钮,可以导出XML进行备份或分享用.

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
鲲鹏 ARM 架构麒麟 Lylin v10 安装 Nginx (离线) 焚木灵 arm开发架构 nginx 服务器
最近做一个银行的项目，银行的服务器是鲲鹏ARM架构的服务器，并且是麒麟v10的系统，这里记录一下在无法访问外网安装Nginx的方法。其他文章：鲲鹏ARM架构麒麟Lylinv10安装Mysql8.3(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Node和NVM(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Pm2(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装P
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
MySQL事务隔离级别和MVCC 简书徐小耳
MySQL事务隔离级别和MVCC参考：https://mp.weixin.qq.com/s/Jeg8656gGtkPteYWrG5_Nw1.MVCC只对读已提交和可重复的读有效果，而未提交读和串行则无意义。2.每条记录都会有trx_id(事务修改记录的id）和roll_pointer是一个指针指向旧版本的undo日志链表（row_id不是必必要的，如果有主键存在就不需要了）3.版本链的头结点就是记
CentOS7 安装MySQL5.7.44 不要Null了 java centos mysql
1.下载mysql安装包，我放在百度网盘里(下方链接)链接：https://pan.baidu.com/s/1_Mn1XW_1mWdTV4mhnLG66A提取码：s31n2.首先看看以前是否安装过mysqlrpm-qa|grep-imysql如果已经安装过mysql会提示卸载mysqlrpm-emysql-…3.使用FinallShell或者Xftp进行上传放到/usr/local/mysql，没
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
六、全局锁和表锁：给表加个字段怎么有这么多阻碍 nieniemin
数据库锁设计的初衷是处理并发问题。作为多用户共享的资源，当出现并发访问的时候，数据库需要合理地控制资源的访问规则。而锁就是用来实现这些访问规则的重要数据结构。根据加锁的范围，MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类。6.1全局锁全局锁就是对整个数据库实例加锁。MySQL提供了一个加全局读锁的方法，命令是Flushtableswithreadlock(FTWRL)。当你需要让整个库处于
Kubernetes 自定义控制器开发 IT回忆录 Kubenetes kubernetes
目录前言一、CRD二、创建数据库表（Mysql）二、控制器开发1.使用kubernetes的examplecontroller模板2.在controller.go中新增数据表监听方法3.修改tools工具生成资源对象结构体定义这里记录开发k8s控制器的一般方式，controller开发主要使用k8s提供的client-go库进行。前言Controller监听集群内部资源对象的变化，编辑资源对象(增
【K8s】专题十一：Kubernetes 集群证书过期处理方法行者Sun1989 Kubernetes kubernetes 云原生容器
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口Linux专栏|Docker专栏|Kubernetes专栏往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【Docker】MySQL源码构建Docker镜
MySQl篇（SQL - 基本介绍）（持续更新迭代） wclass-zhengge mysql sql 数据库
目录一、简介二、SQL方言（分页查询为例）1.简介2.SQL方言大比拼2.1.Oracle2.1.1.使用ROWNUM实现分页查询2.1.2.使用ROW_NUMBER()实现分页查询2.2.MySQL2.3.PostgreSQL三、语法规范四、注释五、MySQL脚本中的标点符号一、简介1、SQL是结构化查询语言（StructureQueryLanguage），专门用来操作/访问关系型数据库的通用语
跟着黑马学mysql（5）小杜不吃糖 mysql 数据库
17.DQL-聚合函数DQL-聚合函数介绍将一列数据作为一个整体，进行纵向计算。常见聚合函数函数功能count统计数量max最大值min最小值avg平均值sum求和语法SELECT聚合函数(字段列表)FROM表名;注意：所有的null值不参与聚合函数的运算18.DQL-分组查询语法SELECT字段列表FROM表名[WHERE条件]GROUPBY分组字段名[HAVING分组后的过滤条件];where
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
MySQL日志沉着冷静2024 MySQL mysql 数据库
MySQL日志文章目录MySQL日志MySQL三大日志binlog的三种格式redolog和binlog的区别和应用场景为什么崩溃恢复不用binlog而用redolog？redolog如何实现持久化redolog还能做什么？redolog的三种刷盘策略两阶段提交什么是？为什么？两阶段提交过程MySQL三大日志1.undologundolog是InnoDB存储引擎层的日志，实现了事务的原子性，主要用
MySQL锁沉着冷静2024 MySQL mysql 数据库
MySQL锁文章目录MySQL锁MySQL中锁的分类创建索引时会锁表吗线上修改表结构会加什么锁Innodb存储引擎的行级锁有哪些Update语句中，不带where条件，加什么锁？MySQL实现乐观锁MySQL死锁MySQL死锁是怎么发生的？检查死锁如何避免死锁MySQL中锁的分类全局锁：主要用于全库逻辑备份表级锁：表锁、元数据锁、意向锁表锁：通过locktables语句对表进行加锁，它不仅限制其他
Python实现mysql命令行 xu-jssy python mysql adb
一、源码importosimportpymysqldefsql_shell():password=input("EnterPassword:")#访问密码ifpassword.strip()!="yyds":print("Bye")return#清空控制台输出os.system("cls"ifos.name=="nt"else"clear")try:#连接到MySQL数据库conn=pymysql
mysql case 干货 lack倪酱
这是我舍友@某人提供的是为了做酒店时判断每个楼栋有几间空房子的。房间表与数据楼栋表与数据查询楼栋房间总数查询空房间数当时就在想怎么把后一个单列的数据合并到前面那三列的数据里呢？又是百度，又是谷歌，都是什么“unitall”。。表示我要的不是这个。有点难为我小脑瓜，实在是对数据库不了解，只会日常操作。最后是我舍友想出了解决办法直接贴图好了，如果想要了解case是什么，你可以自行查资料。学习查东西也是
计算机毕设Node.js+Vue校园易购二手交易平台（程序+LW+部署） Node程序源码强子 vue.js 课程设计 node.js
项目运行环境配置：Node.js最新版+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
MySQL 源码｜55 - 语法解析(V2)：基础查询语句（query_specification）｜V20240915 长行 MySQL源码 mysql 源码语法解析查询
目录文档：MySQL源码｜源码剖析文档目录源码位置（版本=MySQL8.0.37）：sql/sql_yacc.yy前置文档：MySQL源码｜68-语法解析(V2)：LOCKING子句（锁定读取）｜V20240909MySQL源码｜39-语法解析(V2)：ORDERBY子句｜V20240814｜V20240912（第2版）MySQL源码｜40-语法解析(V2)：GROUPBY子句｜V20240814
老生常谈：MySQL高可用架构我有一头小花驴 mysql 架构数据库
引言“高可用”是互联网一个永恒的话题，先避开MySQL不谈，为了保证各种服务的高可用有几种常用的解决方案。服务冗余：把服务部署多份，当某个节点不可用时，切换到其他节点。服务冗余对于无状态的服务是相对容易的。服务备份：有些服务是无法同时存在多个运行时的，比如说：Nginx的反向代理，一些集群的leader节点。这时可以存在一个备份服务，处于随时待命状态。自动切换：服务冗余之后，当某个节点不可用时，要
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。