u010022051

Impala入门笔记（转载）

问题背景：

1. 初步了解Impala的应用

2. 重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍

写作目的：

1. 了解Impala的安装过程

2. 初步了解Impala的使用

3. 比较Impala与Hive的性能测试

适合阅读对象：

1. 想了解Impala安装的读者

2. 想了解Impala与Hive性能比较的读者

不涉及的内容：

1. 如何安装Hadoop（假设你已经安装好了Hadoop）

2. 如何安装Hive（假设你已经安装好了Hive）

关于Hadoop和Hive的安装，可参考我们公司一位Hadoop牛人写的Hadoop一键安装（里面包含了Hive的安装）

https://github.com/hadoop-deployer/hadoop-deployer

正文：

Impala 号称在性能上比Hive高出3~30倍，甚至预言说在将来的某一天可能会超过Hive的使用率而成为Hadoop上最流行的实时计算平台（也许我这里有点曲解Impala专家的意思，但其诱惑的言辞足以令Hadoop迷不禁有蠢蠢欲试的激动）。毕竟Impala也是人写出来的，是否真的如想象中的快，还得靠客观数据来验证。下面就这两个星期对Impala的认识小记一下，供日后翻阅。（请原谅我没有告诉你Hadoop是个啥东东，因为我这里假设你已经听过这头在海量数据的世界驰骋几个岁月的大象，但不一定要求你是大牛）

以下内容是对Cloudera官网中关于Impala文档（主要是《Installing and Using Cloudera Impala》）一些内容的个人理解，欠妥之处还请不吝赐教：

1. Impala的目的不在于替换现有的MapReduce工具，如Hive，而是提供一个统一的平台用于实时查询。事实上Impala的运行也是依赖Hive的元数据。Impala与其它组件之间的关系如下：

|————————————–

| ODBC Driver |

|————————————–

| | |

| Impala | Meta Store(Hive) |

| | |

—————————————

| | |

| HDFS | HBase |

| | |

—————————————

2. 与Hive类似，Impala也可以直接与HDFS和HBase库直接交互。只不过Hive和其它建立在MapReduce上的框架适合需要长时间运行的批处理任务。例如那些批量提取，转化，加载（ETL）类型的Job。而Impala主要用于实时查询。

3. Impala由以下几块组成：

State Store ：对应进程为 statestored （笔者这里使用的Impala版本为0.4，有些版本的statestore进程名可能不是这样叫的）

用于协调各个运行impalad的实例之间的信息关系，Impala正是通过这些信息去定位查询请求所要的数据。换句话说，state store的作用主要为跟踪各个impalad实例的位置和状态，让各个impalad实例以集群的方式运行起来。

与 HDFS的NameNode不一样，虽然State Store一般只安装一份，但一旦State Store挂掉了，各个impalad实例却仍然会保持集群的方式处理查询请求，只是无法将各自的状态更新到State Store中，如果这个时候新加入一个impalad实例，则新加入的impalad实例不为现有集群中的其他impalad实例所识别（事实上，经笔者测试，如果impalad启动在statestored之后，根本无法正常启动，因为impalad启动时是需要指定statestored的主机信息的）。然而，State Store一旦重启，则所有State Store所服务的各个impalad实例（包括state store挂掉期间新加入的impalad实例）的信息（由impalad实例发给state store）都会进行重建。

Impalad ：对应进程为 impalad（核心进程，数据的计算就靠这个进程来执行）

该进程应运行在DataNode机器上（建议每个DataNode机器运行一个impalad，官方的意思似乎这种建议是必须的），每个impalad实例会接收、规划并调节来自ODBC或Impala Shell等客户端的查询。每个impalad实例会充当一个Worker，处理由其它impalad实例分发出来的查询片段(query fragments)。客户端可以随便连接到任意一个impalad实例，被连接的impalad实例将充当本次查询的协调者（Ordinator)，将查询分发给集群内的其它impalad实例进行并行计算。当所有计算完毕时，其它各个impalad实例将会把各自的计算结果发送给充当 Ordinator的impalad实例，由这个Ordinator实例把结果返回给客户端。每个impalad进程可以处理多个并发请求。

Impala shell ：这是一个客户端工具

该客户端工具提供一个交互接口，供使用者发起数据查询或管理任务，比如连接到impalad。这些查询请求会传给ODBC这个标准查询接口。说白了，就是一个命令行客户端。日后你便是通过它来查询数据的。

4. 安装impala ：

这里介绍使用rpm包安装的方式（需有root或sudo权限），基于源码包安装的方式待后续折腾。

安装前需知：

a). impala能使用的内存无法超过系统的硬件可用内存（GA版，查询需要的内存如果超出硬件内存，则查询将失败），对内存要求高，典型的硬件内存为：32~48G

b). impala（版本0.4）只支持redhat 5.7/centos 5.7或redhat 6.2/centos 6.2以上（好像还要求是64位的，所以建议安装在64位系统上），不支持ubuntu

c). 假设你已经安装了CDH4（即Hadoop 2.0）

d). 假设你已经安装了Hive，并配置一个外部数据库（如MySQL）供Hive存储元数据。可通过执行下面的命令来判断Hive是否安装正常

$ hive

hive> show tables;

Time taken: 2.809 seconds

这里请原谅我没有提到Hadoop和Hive的安装过程，还请尊驾自行搜索。

Impala不支持的特性：

a). 查询流数据

b). 删除数据

c). 索引（至少当前版本不支持）

d). YARN集成（至少当前版本不支持）

e). 全文搜索

f). 不具有像Hive SerDe的可扩展机制

g). 不支持线上查询容错，如果查询出错，如机器宕机，Impala将会丢弃本次查询。

h). 不支持表和列级别的授权

i). impalad实例之间的传输没有加密

j). 不支持Hive UFS

k). beta版尚不支持JDBC，计划GA版支持

安装步骤 ：

a). 下载Impala的yum repository （考虑到内存和性能问题，如果机器数允许，建议Impalad实例不要跟NameNode运行在同一台机，但却需与DataNode安装在同一台机，以免影响Impala整体性能）。因Impala的rpm包比较大（v0.4版约90M），且需要在多部机器上安装，故建议直接下载rpm包，然后通过rpm -ivh的方式安装。这里给出rpm包的地址：

http://beta.cloudera.com/impala/redhat/6/x86_64/impala/0/RPMS/x86_64/

如下（发现Impala的版本已经更新到v0.5了，但本文的测试结果还是基于Impala v0.4的）：

impala-0.5-1.p0.491.el6.x86_64.rpm	01-Feb-2013 20:10	97M
impala-debuginfo-0.5-1.p0.491.el6.x86_64.rpm	01-Feb-2013 20:10	75M
impala-server-0.5-1.p0.491.el6.x86_64.rpm	01-Feb-2013 20:10	4.2K
impala-shell-0.5-1.p0.491.el6.x86_64.rpm	01-Feb-2013 20:10	450K
impala-state-store-0.5-1.p0.491.el6.x86_64.rpm	01-Feb-2013 20:10	4.3K

其中，除了 impala-debuginfo-0.5-1.p0.491.el6.x86_64.rpm 可以不下载之外，其它几个包都是必须的，尤其是 impala-0.5-1.p0.491.el6.x86_64.rpm ，这里对各个包的作用稍微说明一下：

impala-state-store-0.5-1.p0.491.el6.x86_64.rpm 是运行 statestored 实例所需要的包，该包依赖 impala-0.5-1.p0.491.el6.x86_64.rpm （核心包）

impala-0.5-1.p0.491.el6.x86_64.rpm （核心包）和 impala-server-0.5-1.p0.491.el6.x86_64.rpm （扩展包，需首先安装核心包）是运行 impalad 实例所需要的包。

impala-shell-0.5-1.p0.491.el6.x86_64.rpm 是运行 impala-shell 客户端所需要的包

如果你选择用yum的方式来安装，则请将下面的repo文件拷贝到/etc/yum.repos.d/ 目录下

文件：cloudera-impala.repo

—————————–

[cloudera-impala]

name=Impala

baseurl=http://beta.cloudera.com/impala/redhat/6/x86_64/impala/0/

gpgkey = http://beta.cloudera.com/impala/redhat/6/x86_64/impala/RPM-GPG-KEY-cloudera

gpgcheck = 1

—————————–

b). 如果你非要选择yum的方式安装，请执行以下相关命令(这里假设你有sudo权限，不建议用该方式，除非你的repo库是在内网。当然这种方式也有个好处，它会自动安装一些依赖包）：

在DataNode节点安装impalad后台实例：sudo yum install -y impala-server（会自动安装impala核心包）

安装statestored实例：sudo yum install -y impala-state-store（会自动安装impala核心包）

安装impala-shell客户端：sudo yum install -y impala-shell

c). 进入Impala安装目录，默认为/usr/lib/impala（可通过rpm -ql impala查看），创建目录conf如果不存在的话。这里创建conf目录是为了存放impalad的配置文件，impalad的配置文件路径由环境变量IMPALA_CONF_DIR指定，默认为/usr/lib/impala/conf。

d). 拷贝hive-site.xml、core-site.xml、hdfs-site.xml（只需从Hadoop和Hive配置文件目录中拷贝过来）至/usr/lib/impala/conf目录下（假设 impalad的配置文件路径为/usr/lib/impala/conf），并作下面修改（这些修改据官方文档，说是为了优化Impala性能，但具体效果如何，笔者目前尚未测出）：

在core-site.xml文件中添加如下内容（如果不存在的话）：

<name>dfs.client.read.shortcircuit</name>

</property>

<name>dfs.client.read.shortcircuit.skip.checksum</name>

<value>false</value>

</property>

在hdfs-site.xml文件中添加如下内容（如果不存在的话）：

<name>dfs.datanode.data.dir.perm</name>

</property>

<name>dfs.block.local-path-access.user</name>

<value>hadoop</value>

</property>

<name>dfs.datanode.hdfs-blocks-metadata.enabled</name>

</property>

这里需要提一点的是，如果你用的是hadoop 2.0（即CDH4，虽然官方也称Impala必须得CDH4以上）的HA方式配置NameNode，则Impala的core-site.xml（注意，只有Impala的core-site.xml才需作修改，Hadoop的core-site.xml配置文件不用改）还需作以下修改：

将原来（以NameNode的HA方式配置，其中mycluster代表某个NameService）

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

改为（以NameNode非HA方式配置，即指定某个具体的NameNode主机信息）

<name>fs.defaultFS</name>

<value>hdfs://machine1:12900</value>

</property>

这里配置的NameNode主机信息要求与impalad实例启动时指定的-nn=namenode_host -nn_port=namenode_port参数的信息一致。从这里也初步怀疑Impala目前可能尚不支持NameNode的HA配置（到底是不是如此，还请高人赐教）。

e). 下面为笔者安装后的机器（共5台，节点越多，也许越能测出更有价值的性能数字）及服务（安装中发现impalad的启动似乎需要依赖Hive，所以每台启动impalad实例的机器都需安装Hive，这关系有点诡异）：

machine1 192.168.0.1

通过jps命令查看到的服务：

JournalNode

QuorumPeerMain

NodeManager

NameNode

ResourceManager

DataNode

DFSZKFailoverController

其它服务：

Hive

statestored

impalad

machine2 192.168.0.2

通过jps命令查看到的服务：

NameNode

QuorumPeerMain

NodeManager

DFSZKFailoverController

JournalNode

DataNode

其它服务：

Hive

impalad

machine3 192.168.0.3

通过jps命令查看到的服务：

NodeManager

JournalNode

DataNode

QuorumPeerMain

其它服务：

Hive

impalad

machine4 192.168.0.4

通过jps命令查看到的服务：

DataNode

JournalNode

QuorumPeerMain

NodeManager

其它服务：

Hive

impalad

machine 192.168.0.5

通过jps命令查看到的服务：

QuorumPeerMain

JournalNode

DataNode

NodeManager

其它服务：

Hive

impalad

从上面可见，笔者在5台机器中都启动了impalad实例，而只有192.168.0.1那台机器启动了statestored。你可能会问，为何没看到启动impala-shell客户端的机器，那是因为笔者决定impala-shell随便装在那台机器都可以，只要能连接到上面启动impalad实例的机器便可，故这里没列出。

以下为impala服务启动命令：

先启动statestored（默认端口为24000）:

statestored -state_store_port=24000

再启动impalad实例：

HADOOP_CONF_DIR=”/usr/lib/impala/conf” impalad -state_store_host=machine1 -nn=machine1 -nn_port=12900 -hosame=machine5 -ipaddress=192.168.0.5

其中的-hostname和-ipaddress表示当前启动impalad实例所在机器的主机名和ip地址。

注意：

a. 这里需要加上HADOOP_CONF_DIR，否则在impala查询数据，可能会报类似 Wrong FS 。。。expect 。。。的错误

b. 其中的-nn和-nn_port，表示NameNode的主机和端口，因Hadoop 2以上的版本对NameNode采用HA的方式，对外提供NameService而不是某个具体的NameNode，然而这里impalad启动时却依然需要知道某个具体的NameNode的主机和端口，怀疑Impala目前尚不支持Hadoop的NameNode的HA方式。

c. 在第一次启动impalad的时候，你可能会遇到impalad报类似找不到JDBC数据库驱动（假设为MySQL)的问题，其实是因为impalad默认使用的数据库驱动包的位置为：/usr/share/java/mysql-connector-java.jar，该配置默认由/etc/default/impala文件中的MYSQL_CONNECTOR_JAR项指定，读者可在~/.bash_profile文件中修改为自己的驱动文件路径，如下为笔者在~/.bash_profile中添加的项：

export MYSQL_CONNECTOR_JAR=$HOME/hive/lib/mysql-connector-java-5.1.16-bin.jar:$MYSQL_CONNECTOR_JAR，别忘了修改后执行一下source ~/.bash_profile来是修改生效。

关于impala服务的启动参数，请参见下表：

Argument	Description	Notes	Required?
-ipaddress	The IP address for the machine that will host Impalad. While there is a default for this argument, it is important to provide a value other than127.0.0.1 for good performance. To use the local host, provide the local host’s actual IP address.	Default: 127.0.0.1.	Yes
-state_store_host	The Impala state store host name.	Default: 127.0.0.1.	Yes
-state_store_port	The Impala state store port.	Default: 24000.	No
-nn	The HDFS NameNode hostname or IP address.	For example, MyNameNode. Default: 127.0.0.1.	Yes
-nn_port	The NameNode port.	Default: 20500.	Yes
-be_port	Impala’s internal service port.	Default: 22000.	No
-fe_port	Impala’s front end port for external connections.	Default: 21000.	No
-log_filename	The path to and name of the file that impala will use to store logging information.		Yes
-webserver_interface	The network interface the debugging web server uses.	Default: 0.0.0.0.	No
-webserver_port	The port the debugging web server uses.	Default: 25000.	No
-web_log_bytes	The maximum number of bytes to display on a debug web server’s log page.	Default: 1048576	No

=======================================================================================================

hive和impala测试性能比较 （本次测试中，HDFS中存有文件大小为20G，并已装载到了表mytest_impala中，可通过Hive来装载）：

在进入性能测试比较前，先简要介绍一下impala-shell的使用：

首先确保你已经有一台机器安装了impala-shell客户端。

启动impala-shell：

$ impala-shell

得到下面的Welcome信息：

Welcome to the Impala shell. Press TAB twice to see a list of available commands. Copyright (c) 2012 Cloudera, Inc. All rights reserved. (Build version: Impala v0.1 (cf57fd9) built on Thu Sep 27 10:32:13 PDT 2012) [Not connected] >

正如上面提示，可通过敲击两次的TAB键来查看impala-shell目前支持的命令：

connect explain history quit select shell use

describe help insert refresh set show version

[Not connected] >

从中可见，Impala目前尚不支持表的创建（即CREATE TABLE)

连接impalad服务端：

[Not connected] > connect 192.168.0.1:21000

Connected to 192.168.0.1:21000

[192.168.0.1:21000] >

查询数据：

[192.168.0.1:21000] > show tables;

Query: show tables

Query finished, fetching results …

mytest

mytest_2

mytest_impala

Returned 3 row(s) in 0.17s

[192.168.0.1:21000] > select * from mytest_impala limit 1;

Query: select * from mytest_impala limit 1

Query finished, fetching results …

1 2012-06-19 21:18:09 http://book1.sina.cn/prog/wapsite/books/vipchl.php?bid=39922&PHPSESSID=9743b7325413117a25d1efa7975daea7&vt=4&wm=4002

Returned 1 row(s) in 1.57s

[192.168.0.1:21000] >

因Impala支持的SQL语句是Hive的HQL语句的一个子集，也就说Hive中的一些HQL语句在这里同样适用，具体请参考相关文档，这里不再详述。

性能测试：

show tables

—————————-
使用Impala的执行情况：

[192.168.0.2:21000] > show tables;

Query: show tables

Query finished, fetching results …

mytest

mytest_2

mytest_impala

Returned 3 row(s) in 0.01s

使用Hive的执行情况：

第一次执行（刚开始还以为Hive每次show tables都那么慢，当执行第二次时才发现其实不然）：

hive> show tables;

mytest

mytest_2

mytest_impala

Time taken: 2.785 seconds

第二次执行：

hive> show tables;

mytest

mytest_2

mytest_impala

Time taken: 0.103 seconds

select count(*) from mytest_impala

————————————————-

使用Impala的执行情况：

[192.168.0.2:21000] > select count(*) from mytest_impala;

Query: select count(*) from mytest_impala

Query finished, fetching results …

69007188

Returned 1 row(s) in 106.58s

使用Hive的执行情况：
hive> select count(*) from mytest_impala;

这里省略一些输出信息。。。。。

MapReduce Total cumulative CPU time: 4 minutes 16 seconds 100 msec

Ended Job = job_1361238384421_0001

MapReduce Jobs Launched:

Job 0: Map: 44 Reduce: 1 Cumulative CPU: 256.1 sec HDFS Read: 11393427897 HDFS Write: 9 SUCCESS

Total MapReduce CPU Time Spent: 4 minutes 16 seconds 100 msec

69007188

Time taken: 148.285 seconds

select count(*) from mytest_impala where id = ’1205-4721599131-fa2451a7′

————————————————————————————————————–

使用Impala的执行情况：

[192.168.0.2:21000] > select count(*) from mytest_impala where id = ’1205-4721599131-fa2451a7′;

Query: select count(*) from mytest_impala where id = ’1205-4721599131-fa2451a7′

Query finished, fetching results …

Returned 1 row(s) in 96.54s

使用Hive的执行情况：

hive> select count(*) from mytest_impala where id = ’1205-4721599131-fa2451a7′;

这里省略一些输出信息。。。。。

MapReduce Total cumulative CPU time: 4 minutes 55 seconds 90 msec

Ended Job = job_1361238384421_0002

MapReduce Jobs Launched:

Job 0: Map: 44 Reduce: 1 Cumulative CPU: 295.09 sec HDFS Read: 11393427897 HDFS Write: 2 SUCCESS

Total MapReduce CPU Time Spent: 4 minutes 55 seconds 90 msec

Time taken: 107.81 seconds

select count(*) from mytest_impala group by id;

————————————————————————-

使用Impala的执行情况：

[192.168.0.2:21000] > select count(*) from mytest_impala group by id;

Returned 2587674 row(s) in 146.32s

使用Hive的执行情况：

hive> select count(*) from mytest_impala group by id;

这里省略一些输出信息。。。。。

Time taken: 155.724 seconds

对于上面的测试结果我们也觉得有些困惑，为何跟Impala专家号称的比Hive快3~30倍差那么远呢，虽然是快了点，但并没有传说中的神速。到底是我们的测试节点不够呢，还是我们的测试方法欠妥，本文就以该问题做结束，留给你我来共同思考验证，期待高手不吝赐教。。。。。

《如不承诺天长地久，怎会相遇细水长流》文/苏暖人北京大数据苏焕之
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人原创——莫转载粘贴有人选择昙花一现，如大理的花海，有人选择细水长流，如雨夜的浪漫。都说，五分喜欢的人恨不得将他挂在嘴边，十分喜欢的人却只舍得放在心里边了，在爱情眼里，对方说的每一句话都在乎你的感受，TA的眼里也只有你，我想也是这样！说起我的爱情，我也喜欢过一个忧郁的女孩，她喜欢的男孩不喜欢她，于是我成了她倾诉的朋友＋备胎，一年来我们互相推荐伤感的歌曲
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
使用由 Python 编写的 lxml 实现高性能 XML 解析 hunyxv python 笔记 python xml
转载自：文章lxml简介Python从来不出现XML库短缺的情况。从2.0版本开始，它就附带了xml.dom.minidom和相关的pulldom以及SimpleAPIforXML(SAX)模块。从2.4开始，它附带了流行的ElementTreeAPI。此外，很多第三方库可以提供更高级别的或更具有python风格的接口。尽管任何XML库都足够处理简单的DocumentObjectModel(DOM
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
玄幻小说《圣爱》第二十九章梦中有梦（上）碧海潮生2019
作者：极天圣洺欢迎转载！转载注明“作者：极天圣洺”即可。图片发自App圣爱第一部跨世之恋第二十九章梦中有梦（上）有诗为证：“愿得一人心，白首不相离！卿卿月明日，嫦娥低语声！”正文月公主满脸的迟疑之色，双手扶起两人，“你们都是法力通天之人，而我也只是一个籍籍无名之凡人而已，两位前辈，快快请起！”“还是不要叫我月圣了，如果可以，称呼我一声，月公主，即可了！”月公主，满脸款款之笑，让这片黑夜中的虚空，在
Spring Cloud: Hystrix请求队列线程不足 MeazZa
在SpringCloud中，Feign可以实现本地化的微服务API调用，Hystrix可以实现调用失败时的fallback处理。问题描述：在实际生产环境中使用时，我们遇到了这样一个错误："...,stacktrace:[com.netflix.hystrix.exception.HystrixRuntimeException:QueryNodeImpalaBdService#getQueryRes
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
面试题24. 反转链表阿星啊阿星
反转链表题目描述定义一个函数，输入一个链表的头节点，反转该链表并输出反转后链表的头节点示例：输入:1->2->3->4->5->NULL输出:5->4->3->2->1->NULL提示：0<=节点个数<=5000转载来源：力扣（LeetCode）题目分析1→2→3→null初始化时h为1，now为2，h的next设置成null，有：null←1（h） 2（now）→3现在将保存一下now的next
Cisco SD-WAN (Viptela) 20.15.1 发布，新增功能概览 sysin.org CiSCO Cisco SD-WAN Viptela 思科 SDN 软件定义广域网
CiscoSD-WAN(Viptela)version20.15.1ED-软件定义广域网CiscoSD-WANpoweredbyViptela请访问原文链接：https://sysin.org/blog/cisco-sd-wan-20/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.org支持SASE的架构，其集成了面向多云、安全、统一通信和应用优化的各种功能，可用于轻松安全地将任何
史上最全的maven的pom.xml文件详解 Meta999 Maven
注：详解文件中，用红色进行标注的是平常项目中常用的配置节点。要详细学习！转载的，太经典了、、、、欢迎收藏xxxxxxxxxxxx4.0.0xxxxxxjar1.0-SNAPSHOTxxx-mavenhttp://maven.apache.orgAmavenprojecttostudymaven.jirahttp://jira.baidu.com/[email protected]
【网络安全】漏洞挖掘：php代码审计秋说网络安全 php web安全漏洞挖掘
未经许可，不得转载。文章目录正文正文在应用程序中，通过一个JavaScript注释发现了一个备份ZIP文件。解压后，获取了应用程序的代码，其中包含如下代码片段：代码首先检查变量$action是否等于'convert'，如果是，则继续执行。随后对传入的变量$data使用trim()函数去除两端空白字符，并使用eval()函数执行$data的内容。显然，代码对$data没有进行任何过滤或验证，因此可以
【网络安全 | 代码审计】JFinal之DenyAccessJsp绕过秋说网络安全 web安全 java 代码审计漏洞挖掘
未经许可，不得转载。文章目录前言代码审计推理绕过Tomcat解析JSP总结概念验证阐发前言JFinal是一个基于Java的轻量级MVC框架，用于快速构建Web应用程序。它的设计理念是追求极简、灵活、高效，旨在提高开发效率，减少冗余代码的编写，适合中小型项目以及对性能有较高要求的项目。在较新的JFinal版本中，默认情况下无法直接通过浏览器地址栏输入.jsp文件名来访问对应的JSP文件。也就是说，主
“深圳红树林外国语小学”教育戏剧的师资培训我爱教育戏剧
2020年8月17日-18日，骑士教育戏剧为红树林外国语小学的老师们进行了一场师训，这篇文章由红树林外国语小学官方微信公众号撰写，骑士转载，以期更多学校了解教育戏剧走进校园的情况。暑假研修教育戏剧专场2020年8月16日-21日，红树林举行了为期六天的入职研修培训各位教育大咖空降来袭，带来了满满的干货讲座你以为红树林的培训只是听讲座吗？NO！NO！NO！在这里，红树林的培训还是这样的：还有这样的！
在你身边最后的夏（转载） Bojack没有jack
滚烫的晴空万里，蓝天漂浮在温热的河水里，眩惑出如玉的水波，缠绵着水草轻柔荡漾，惊白色的水鸟掠起。酷暑消退在最纯净的午夜，寂静中万物屏息，澄澈的月光涤荡天地，唤起透明的星辰散落这里。夏天到来，令我回忆。清晨的光线竟略带寒意，漫天而过透明的露珠映着天地，絮状的梦如同回到冬季，美的就像，就像记忆。坐在教室里打哈欠的早读，捂着耳朵大声的背书，转转头，悄悄的注视你，静静的睡着。光线正好打在你脸上，柔和的像幼
D83转载转载转载！雨墨2021
点鼻子请帮手晃动手指，然后用自己的食指点对方的手指。再来回点自己的鼻子，只要都能顺利点到对方的手指，就表示没有问题！如果来回几次都点空，甚至当手指停下不动的时候都无法点中，就一定要去医院检查了！当然这个只是我们自己检测的一个手段，因为有的时候脑梗出现的位置不同，导致的症状也不同，从而自测只能作为参考，如果有很明显的身体症状，可以迅速的去医院，做相关的检查。疾病的预防永远大于治疗，如果你不想脑梗到来
朱松纯委员：科研条件越来越好，为何颠覆性科学发现却越来越少？晨起动铮铎
原文链接：https://mp.weixin.qq.com/s/2hzjWGcqjzhV0Yob7RmCsg原文转载自科学网文｜《中国科学报》记者赵广立“为什么近年来世界各国科研人员成倍增长、经费越来越多、科研条件越来越好，却产生不了根本性的科学发现？”近日，全国政协委员，北京通用人工智能研究院院长，北京大学、清华大学讲席教授朱松纯在一次发言中发出上述疑问。在他看来，重大基础性原创性科学成果“难产
Oozie Bundle 规范 weixin_34075268
为什么80%的码农都做不了架构师？>>>文档地址转载于:https://my.oschina.net/sskxyz/blog/756359
1.25-1.26 Coordinator数据集和oozie bundle weixin_30851867
一、Coordinator数据集二、ooziebundle转载于:https://www.cnblogs.com/weiyiming007/p/10881260.html
当大官的大表哥春暖花开cws
所有作品，本人原创，未经允许，不得转载或抄袭，违者必究！图片发自App我有一位大表哥，在上海做大官。这个大表哥，是大舅父的长子。上世纪七十年代，大表哥参了军，在信阳某部队。在自卫反击战中，大表哥参加侦察兵，插入到越军的腹地。有一次，一颗子弹从他的耳边呼啸而过，险而又险。大表哥立了功，加上他人也聪明，所以升职很快。从士兵做起到连级，从连级到营级，从营级到团级，从团级到师级，每一步都稳扎稳打，升职很快
Ubuntu搭建简易Postfix邮箱服务器嫩草终结者邮箱服务
本文转载自https://www.linuxdashen.com/ubuntu%E6%90%AD%E5%BB%BA%E7%AE%80%E6%98%93postfix%E9%82%AE%E7%AE%B1%E6%9C%8D%E5%8A%A1%E5%99%A8Ubuntu搭建简易Postfix邮箱服务器最后更新2016年4月20日分类Ubuntu服务器最新文章邮件服务器标签550mailcontentd
Gerrit审核服务器搭建简易教程(Ubuntu 12.10) LKV_刘言
//**********************************************欢迎转载，转载请注明出处，请尊重作者！http://blog.csdn.net/airk000Email:[email protected]//**********************************************本文将详细记录如何在一个全新的Ubuntu系统中安装及配置Gerri
如何一步步解决 DP 问题顽强的猫尾草
转载自：https://leetcode.com/problems/house-robber/discuss/156523/From-good-to-great.-How-to-approach-most-of-DP-problems./177934例题在这：Leetcode198.HouseRobber这类特定的问题可以用下面的顺序来处理：总结递归关系递归（自顶向下）递归+数组（自顶向下）迭代+
谢谢你，包容我的小任性海隅天玑
转自兰州大学转载人:黄元香作者:双鱼沐小木前几天，我收到了姐姐的一条消息：国庆想去哪里，给我说，我给你钱！就这样简单的一句话，击碎了我那颗故作坚强的心。图片发自App01我出生的那年，姐姐五岁。五岁那年，恰是在父母怀抱里享受温暖的年纪，却因为我的出现，剥夺了那份本该属于她的的权利。我想，姐姐应该会讨厌我吧！是我的出现，让她脱离了父母的怀抱；是我的出现，让她的童年失去了应有的乐趣；是我的出现，让她遭
一个正经的前端学习开源仓库(第1天）掘金-我是哪吒 java vue html css js
低调务实优秀中国好青年(简介)&&附加答案https://github.com/webVueBlog/Leetcode√-“三十年河东，三十年河西，莫欺少年穷”一个☝️正经的前端学习开源仓库，启发来自淘宝大佬@冴羽，初心做一个真正能帮助到大家的仓库。（非常口语化的，手写总结）：我是哪吒：如果你所学的东西处于喜欢才会有强大的动力支撑。交流讨论&&如何学习&&转载声明第一：你可以直接在本仓库阅读即可，
selenium 安装报错问题 weixin_30266829 python
本机装了py2和py3py2安装selenium总是报错找whl文件也没找到后尝试py3安装selenium成功了/(ఠൠఠ)ﾉ很烦/后来因py3的pip下载了selenium-3.11.0-py2.py3-none-any.whl所以py2的pip也找到了该whl文件直接安装成功/§(*￣▽￣*)§转载于:https://www.cnblogs.com/imaye/p/8794388.html
VMware Fusion 13.6 OEM BIOS 2.7 - 在 macOS 中运行 Windows 虚拟机的最佳方式 sysin.org VMware macos windows fusion oem bios 虚拟化 2025
VMwareFusion13.6OEMBIOS2.7-在macOS中运行Windows虚拟机的最佳方式VMwareFusion13原版App中集成OEMBIOS请访问原文链接：https://sysin.cn/blog/vmware-fusion-13-oem/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.org2024-09-03，版本13.6更新，支持macOSSequoia作
【网络安全】漏洞挖掘之CVE-2019-9670+检测工具秋说网络安全 web安全漏洞挖掘 CVE
未经许可，不得转载。文章目录漏洞介绍正文工具漏洞介绍CVE-2019-9670是一个与ZimbraCollaborationSuite(ZCS)相关的严重漏洞。ZCS中的AutoDiscover服务存在不正确的XML解析处理，该漏洞可被利用来注入恶意XML代码（例如外部实体注入（XXE）攻击），从而导致服务器任意文件读取或远程代码执行(RCE)。Zimbra]>
什么是DSL yimi1995 程序员的日常
转载：http://blog.csdn.net/dslztx/article/details/46682889DSL的全称是domain-specificlanguage，它在wiki上的定义如下：Adomain-specificlanguage(DSL)isacomputerlanguagespecializedtoaparticularapplicationdomain.与之相对的是GPL(g
DSL Davisxy kotlin DSL Kotlin okhttp
转载：摘抄自《Kotlin极简教程》-陈光剑DSL是什么DSL(Domain-SpecificLanguage，领域特定语言)指的是专注于特定问题领域的计算机语言(领域专用语言)。不同于通用的计算机语言(GPL)，领域特定语言只用在某些特定的领域。比如用来显示网页的HTML语言，以及Emacs所使用的EmacLISP语言等。更加典型的例子是Gradle，它基于Ant和Maven，使用基于Groov
Spring 源码学习(九) Transaction 事务带鱼真好吃
spring系列转载自掘金VipAugushttps://juejin.cn/user/2348212565601415/postsSpringTransaction事务的使用和实现原理前言业务系统的数据，一般最后都会落入到数据库中，例如MySQL、Oracle等主流数据库，不可避免的，在数据更新时，有可能会遇到错误，这时需要将之前的数据更新操作撤回，避免错误数据。Spring的声明式事务能帮我们
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

Impala入门笔记（转载）

你可能感兴趣的:(Impala入门笔记（转载）)