MyEclipseJAVA2EE

MySql准实时同步数据到HDFS（单机版）

一、方案

MySql->Maxwell->Kafka->Flume->HDFS

按照这个顺序新搭建一套环境。

主要参考地址（感谢）：

https://blog.csdn.net/hyb1234hi/article/details/80424971

二、环境

Linux：CentOS7

下载地址：http://mirrors.aliyun.com/centos/7.8.2003/isos/x86_64/

各个版本的ISO镜像文件说明：

CentOS-7-x86_64-DVD-1708.iso 标准安装版（推荐）

CentOS-7-x86_64-Everything-1708.iso 完整版，集成所有软件（以用来补充系统的软件或者填充本地镜像）

CentOS-7-x86_64-LiveGNOME-1708.iso GNOME桌面版

CentOS-7-x86_64-LiveKDE-1708.iso KDE桌面版

CentOS-7-x86_64-Minimal-1708.iso 精简版，自带的软件最少

CentOS-7-x86_64-NetInstall-1708.iso 网络安装版（从网络安装或者救援系统）

Jdk：jdk-8u181-linux-x64.tar.gz

Zk：apache-zookeeper-3.5.5-bin.tar.gz

下载地址（包含hdfs所用到的所有组件，根据需要下载）：

链接：https://pan.baidu.com/s/1XxBdG8mhkTUnIvlkjbFwnQ

提取码：az2j

Mysql：5.6.26（为了跟我这边生产一致）

下载地址：https://downloads.mysql.com/archives/community/

Maxwell：1.27.0

下载地址：

源码地址：https://gitee.com/mirrors/Maxwell.git

Apache官网（下面三个都是在官网找的下载地址）：https://www.apache.org/

Kafka：2.13-2.5.0

下载地址：https://mirror.bit.edu.cn/apache/kafka/2.5.0/kafka_2.13-2.5.0.tgz

Flume：1.9.0

下载地址：

https://mirror.bit.edu.cn/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz

Hadoop：3.3.0

下载地址：

https://mirror.bit.edu.cn/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz

三、各组件安装

安装之前先配个映射关系吧：

不建议用默认的localhost，可能会与本机windows的localhost冲突，

Vim /etc/hosts

添加映射关系：

上面两个是自带的，下面这个是新加的，ip 对应名称，这个名称自己随便起个就行。然后在修改本机windows的hosts文件，也配置个同样名称和ip的映射关系：

路径：C:\Windows\System32\drivers\etc\hosts

新加一行：

10.39.251.123就是我安装hadoop服务器的ip，这样后面直接访问psb-tt-123就行了。

1、jdk安装

a)、上传

由于安装Kafka和HDFS需要jdk，所以首先给jdk安装上：

在/usr/local/soft/jdk目录下上传jdk8的包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

jdk-8u181-linux-x64.tar.gz

b)、解压

使用解压命令：

tar -zxvf jdk-8u181-linux-x64.tar.gz

c)、配置

解压完成配置环境变量：

vim /etc/profile

添加下面几行：

export JAVA_HOME=/usr/local/soft/jdk/jdk1.8.0_181

export JRE_HOME=$JAVA_HOME/jre

export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:JRE_HOME/bin:$PATH

使配置文件生效：

source /etc/profile

d)、验证

验证安装是否成功：

java -version

2、zookeeper安装

由于kafka需要用到zookeeper，所以先把zookeeper安装上。

a)、上传

在/usr/local/soft/zookeeper目录下上传apache-zookeeper-3.5.5-bin.tar.gz的包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

apache-zookeeper-3.5.5-bin.tar.gz

b)、解压

使用解压命令：

tar -zxvf apache-zookeeper-3.5.5-bin.tar.gz

c)、配置

解压完成配置环境变量：

cd 到conf目录，然后使用cp命令copy一份配置文件，zk默认加载zoo.cfg名称的配置文件：

修改下配置文件里的这个路径：

d)、启动

./zkServer.sh start ../conf/zoo.cfg

使用zkCli.sh登录：

创建一个kafka目录，给下面kafka连接时使用：

使用ls命令查看是否创建成功：

小技巧：所有不清楚命令的，各种输入help来看看命令帮助：

3、Mysql安装

①、在/usr/local/soft/mysql目录下上传msyql的server包和client包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

MySQL-client-5.6.26-1.el7.x86_64.rpm、MySQL-server-5.6.26-1.el7.x86_64.rpm

这两个包，上传完成。

②、卸载MariaDB（CentOS7默认自带）

a)、检查是否安装了mysql

centos7默认是安装的mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb

rpm -qa|grep -i mysql

检查是否安装了mysql

如果有默认安装的mysql，一般是下面这样，最多版本号不同

我的版本是这样的（我CentOS7下载的是精简版的1.0G的大小，连基本的命令都没有的那种）

b)、卸载默认安装的mysql

rpm -e  --nodeps

强制删除mariadb的所有相关软件包

c)、安装client

rpm -ivh MySQL-client-5.6.26-1.el7.x86_64.rpm

d)、安装server

rpm -ivh MySQL-server-5.6.26-1.el7.x86_64.rpm

我这里没有新建mysql用户组和对应的mysql用户，直接使用root用户

报错：FATAL ERROR: please install the following Perl modules before

executing ./scripts/mysql_install_db:

Data::Dumper

解决办法：

yum -y install autoconf

e)、启动

service mysql start

find / -name *localhost.localdomain.*

在全盘搜索localhost.localdomain.err文件

查看错误日志：

less /var/lib/mysql/localhost.localdomain.err
shift + g   #跳到文件最后一行

Can't open and lock privilege tables: Table 'mysql.user' doesn't exist

可能在安装时没有初始化好，使用下面命令初始化一下：

mysql_install_db --user=mysql

初始化完成再次启动：

f)、账户和权限配置

由于安装完成后没有配置用户名和密码，又在本机上，所以直接用msyql登录：

show databases;

查看有哪些数据库：

information_schema:保存关于mysql服务器所维护的所有其他数据库的信息，如数据库名，数据库的表，表栏的数据类型与访问权限等。

performance_schema:用于收集数据库服务器性能参数。

mysql:存储数据库的用户、权限设置、关键字等mysql自己需要使用的控制和管理信息。

test:测试库。

切换数据库：

use mysql

可以使用select * from user\G;查看到root用户都是没有密码的；首先来更新root密码，个人设置为root；

set password for root@localhost = password('root');

然后用exit退出：

此时在直接使用msyql是登录不上了，需要添加密码参数：

mysql -h127.0.0.1 -p3306 -uroot -proot

h: host p:port u:user p:password

切换数据库，创建一个maxwell用户，用户数据同步：

use mysql;

再用select * from user\G;便能看到maxwell用户了。

给maxwell用户授权：

GRANT ALL on maxwell.* to 'maxwell'@'%' identified by 'maxwell';

GRANT ALL on maxwell.* to 'maxwell'@'localhost' identified by 'maxwell';

GRANT SELECT, REPLICATION CLIENT, REPLICATION SLAVE on *.* to 'maxwell'@'%';

GRANT SELECT, REPLICATION CLIENT, REPLICATION SLAVE on *.* to 'maxwell'@'localhost';

刷新权限：

flush privileges;

背景：mysql中删除又想重建maxwell用户，但是执行创建命令报错。

解决方法：

drop user maxwell@localhost;

flush privileges;

create user maxwell@localhost identified by 'maxwell';

g)、创建表

创建一个需要同步数据的表，切换数据库：

use test;

创建表：

CREATE TABLE tbox_location_info (

`id` INT (32) NOT NULL AUTO_INCREMENT COMMENT '自增ID',

`terminal_phone` VARCHAR (15) DEFAULT NULL COMMENT '终端手机号',

`latitude` VARCHAR (10) DEFAULT NULL COMMENT '纬度',

`longitude` VARCHAR (10) DEFAULT NULL COMMENT '经度',

`ls_time` datetime NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '位置所属时间',

`total_mileage` VARCHAR (10) DEFAULT NULL COMMENT '当前位置车辆累计行驶里程(km)',

`created_time` TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',

PRIMARY KEY (`id`, `ls_time`),

KEY `terminalPhone_idx` (`terminal_phone`) USING BTREE,

KEY `lsTime_idx` (`ls_time`) USING BTREE

) ENGINE = INNODB AUTO_INCREMENT = 1 DEFAULT CHARSET = utf8;

查询一下这个表：

h)、mysql配置

先关闭msyql：

service mysql stop

全路径搜索msyql配置文件：

find / -name *my.cnf*

添加配置：

vim /usr/my.cnf

server-id=1

log-bin=master

binlog_format=row

binlog_row_image=FULL

esc -> :wq 保存

重新启动：

service mysql start

解释：

log-bin=master --开启binlog，binlog日志文件名称前缀为master，实际文件名是:master.000001这种

binlog_format=row --binlog格式为row

3、Maxwell安装

a)、上传

在/usr/local/soft/maxwell目录下上传maxwell的maxwell-1.26.1.tar.g包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

maxwell-1.26.1.tar.gz包，上传完成。

b)、解压：

tar -zxvf maxwell-1.26.1.tar.gz

解压完成：

c)、启动

Maxwell存储在MySQL服务器本身所需要的所有状态，在schema_database选项指定的数据库中。默认情况下, 数据库被命名为maxwell。

默认是本机msyql，可以查看maxwell下的config目录下的

这个文件：

应该可以修改配置文件，然后启动加载指定的配置文件就能连到其他服务器上的mysql，我没试过，因为我搭建的都是在一台服务器上。

启动maxwell：

./maxwell --user='maxwell' --password='maxwell' --host='127.0.0.1' --port='3306' --producer=stdout

d)、测试

在mysql里插入一条数据，查看日志：

可以看到maxwell日志里已经有了mysql插入的那条数据，好了maxwell能连上mysql了。注意看created_time字段同步过来的少了8个小时，这是因为maxwell的问题。

参考地址：https://github.com/zendesk/maxwell/issues/903

下面自己clone maxwell源码修改下源码后重新编译打包：

给个码云的地址（github的太慢而且下载到90%的时候卡住后下载失败）：

https://gitee.com/mirrors/Maxwell.git

clone到本地后（目前是1.27.0版本）,idea导入，修改pom文件：

（我注释了profile下kafka版本不是1.0.0的所有其他版本，因为它报错了）

对应的java类也是从这里下载的，版本不同，需要稍微修改下：

类：

修改的地方：

下面两个类是新增：

把项目压缩成zip上传到linux服务器，然后unzip解压，cd进入到项目根路径，然后执行mvn clean , mvn compile(可选)， mvn -Dmaven.test.skip=true package,打成的包在target目录下，cd到target目录下，copy出maxwell-1.27.0.tar.gz到maxwell下，然后tar -zxvf maxwell-1.27.0.tar.gz，在cd到maxwell-1.27.0下的bin目录下，chmod 777 maxwell maxwell-benchmark maxwell-bootstrap maxwell-docker 赋予权限，执行sed -i 's/\r$//' maxwell，替换windows与linux的换行符不同差异（linux：结尾是\n，windows：结尾是\n\r）

（不执行替换命令直接执行maxwell命令可能会出现：/bin/bash^M: 坏的解释器: 没有那个文件或目录，参考地址：https://blog.csdn.net/mingzznet/article/details/12524527）

再执行：

./maxwell --user='maxwell' --password='maxwell' --host='127.0.0.1' --port='3306' --producer=stdout

在mysql插入一条数据：

附一条插入sql：insert into tbox_location_info(terminal_phone,latitude,longitude,ls_time,total_mileage,created_time)values('010090452566','36.287276','120.3644','2020-09-10 11:26:59','4525.26','2020-09-10 11:27:09');

maxwell窗口查看：

ok，时间对了，上面给的maxwell1.27.0的包是我已经修改好的了，直接解压就能用。

3、Kafka安装

a)、上传

在/usr/local/soft/kafka目录下上传kafka的kafka_2.13-2.5.0.tgz包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

kafka_2.13-2.5.0.tgz，上传完成。

b)、解压

解压：

tar -zxvf kafka_2.13-2.5.0.tgz

c)、配置

三个地方，其他默认就好：

ps:如果没配置好，就启动然后在zk留下记录后，需要重新配置然后删除如下目录：

的所有文件，然后在重启。（kafka默认使用的是zk的根目录）

查看topic：

常规命令：

#常规模式启动kafka
bin/kafka-server-start.sh config/server.properties

#进程守护模式启动kafka
nohup bin/kafka-server-start.sh config/server.properties >/dev/null 2>&1 &

#Kafka关闭命令(备注：先进入kafka目录)
bin/kafka-server-stop.sh

#创建topic
bin/kafka-topics.sh --create --zookeeper 127.0.0.1:2181/kafka --replication-factor 1 --partitions 5 --topic maxwell

#删除topic
bin/kafka-topics.sh --zookeeper 127.0.0.1:2181/kafka --delete --topic maxwell

#查看topic列表
bin/kafka-topics.sh --list --zookeeper=127.0.0.1:2181/kafka

#查询topic内容：
#bin/kafka-console-consumer.sh --bootstrap-server 127.0.0.1:9092 --topic maxwell --from-beginning

d)、启动

常规模式启动（ctrl+z退出后服务关闭）：

./kafka-server-start.sh ../config/server.properties

后台进程启动（ctrl+z退出后服务还在）：

nohup ./kafka-server-start.sh ../config/server.properties &

可以使用tail -200f nohup.out查看启动日志。

能正常启动，有可能启动会报错：

内存不足（由于我虚拟机就给了1个G，可能内存不足了），修改kafka-server-start.sh文件配置：

vim kafka-server-start.sh

这里本来默认是1G的，调小点。在启动，如果还内存不足，调整为128m试试。

e)、测试前准备

创建一个topic：

./kafka-topics.sh --create --zookeeper 127.0.0.1:2181/kafka --replication-factor 1 --partitions 5 --topic maxwell

查看topic：

./kafka-topics.sh --describe --zookeeper 127.0.0.1:2181/kafka --topic maxwell

然后停止maxwell，重新启动，maxwell订阅kafka的topic（进入maxwell的bin目录）：

后台进程启动：

nohup ./maxwell --user='maxwell' --password='maxwell' --host='127.0.0.1' --port='3306' --producer=kafka --kafka.bootstrap.servers=127.0.0.1:9092 --kafka_topic=maxwell &

不知道为何我重启后出现了maxwell记录的同步position和mysql的binlog位置不一致：

经过一番查找，发现maxwell有个启动参数(正常启动不需要带上)：

--init_position=master.000001:0:0，指定当次启动从哪个binlog的哪一行同步。在maxwell包的下有一个config.md文件，里面有参数说明：

这里还有个quickstart.md，里面有关于mysql、maxwell、kafka、redis等配置：

使用后台进程守护模式启动：

nohup ./maxwell --user='maxwell' --password='maxwell' --host='127.0.0.1' --port='3306' --producer=kafka --kafka.bootstrap.servers=127.0.0.1:9092 --kafka_topic=maxwell --init_position=master.000001:0:0 &

因为是测试环境init_position具体文件位置都是随便填的，这个参数看情况加不加，加的话具体position位置需确定。

f)、测试

①、mysql插入一条数据：

查看kafka的窗口：

Kafka已经有mysql的插入数据了。

②、mysql更新一条数据：

③、mysql删除一条数据：

4、flume安装

参考地址：

https://www.cnblogs.com/zxf330301/p/8317371.html

https://www.cnblogs.com/Gxiaobai/p/13213303.html

https://blog.csdn.net/weixin_38963816/article/details/80358273

a)、上传

在/usr/local/soft/flume目录下上传flume的apache-flume-1.9.0-bin.tar.gz包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

apache-flume-1.9.0-bin.tar.gz，上传完成。

b)、解压

解压：

tar -zxvf apache-flume-1.9.0-bin.tar.gz

c)、配置

首先查看下版本号，看是否安装成功：

copy一份配置文件并重命名：

编辑该配置文件：

vim flume-conf.properties

上面是修改前，下面是修改后：

增加内容：

#定义别名
#对channel而言，相当于生产者，通过接收各种格式数据发送给channel进行传输
a1.sources=r1
#相当于数据缓冲区，接收source数据发送给sink
a1.channels=c1
#对channel而言，相当于消费者，通过接收channel数据通过指定数据类型发送到指定位置
a1.sinks=k1

# 配置sources
#配置flume自定义过滤器，com.zw.cn.flume.MyInterceptor是自定义的过滤器类
#a1.sources.r1.interceptors = i1
#a1.sources.r1.interceptors.i1.type = com.zw.cn.flume.MyInterceptor$Builder
#定义消息源类型
a1.sources.r1.type = org.apache.flume.source.kafka.KafkaSource
#kafka地址
a1.sources.r1.kafka.bootstrap.servers = 127.0.0.1:9092
#定义kafka所在zk的地址
a1.sources.r1.kafka.zookeeperConnect = 127.0.0.1:2181
#配置消费的kafka topic，可以使用正则匹配
#a1.sources.r1.kafka.topics.regex = ^topic_app_.*$
a1.sources.r1.kafka.topics = maxwell

# 配置channel
# channel类型，内存类型
a1.channels.c1.type=memory
# channel存储的事件容量
a1.channels.c1.capacity=10000
# 事务容量
a1.channels.c1.transactionCapacity=1000

# 配置sinks
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = /test/%Y%m%d
a1.sinks.k1.hdfs.path = /tbox/%Y%m%d
a1.sinks.k1.hdfs.filePrefix = tbox_location_info
#基于时间间隔来进行文件滚动，默认是30，即每隔30秒滚动一个文件。0就是不使用这个策略。
a1.sinks.k1.hdfs.rollInterval = 0
## 触发滚动文件大小(byte)  如果记录的文件大于104857600字节（100M）时切换一次
#基于文件大小进行文件滚动，默认是1024，即当文件大于1024个字节时，关闭当前文件，创建新的文件。0就是不使用这个策略。
a1.sinks.k1.hdfs.rollSize = 104857600
#基于event数量进行文件滚动。默认是10，即event个数达到10时进行文件滚动。0就是不使用这个策略。
a1.sinks.k1.hdfs.rollCount = 0
#闲置N秒后，关闭当前文件（去掉.tmp后缀）。
a1.sinks.k1.hdfs.idleTimeout = 0
## 使用本地时间戳
a1.sinks.k1.hdfs.useLocalTimeStamp = true
#生成的文件类型，默认是Sequencefile，可用DataStream：为普通文本
a1.sinks.k1.hdfs.fileType = DataStream

# 绑定channel-source, channel-sink
a1.sources.r1.channels = c1
a1.sinks.k1.channel= c1

后台启动（bin目录）：

nohup ./flume-ng agent --conf /usr/local/soft/flume/apache-flume-1.9.0-bin/conf --conf-file /usr/local/soft/flume/apache-flume-1.9.0-bin/conf/flume-conf.properties --name a1 -Dflume.root.logger=INFO,console &

Mysql插入一条数据，发现flume报错如下：

看这情况就是jar包冲突了，是flume依赖的guava.jar与hadoop里依赖的jar版本不一致，因为我提前安装了hadoop，所以用hadoop里依赖的guava包替换掉flume安装的guava.jar。

上面的替换下面的。

rm -rf /usr/local/soft/flume/apache-flume-1.9.0-bin/lib/guava-11.0.2.jar

cp /usr/local/soft/hadoop/hadoop-3.3.0/share/hadoop/common/lib/guava-27.0-jre.jar /usr/local/soft/flume/apache-flume-1.9.0-bin/lib/

参考地址：https://blog.csdn.net/GQB1226/article/details/102555820

已经替换掉了，再重启下，mysql在插入一条数据：

可以看到已经有数据过来，只不过我没启动hadoop，连接hadoop没连接上报错了，湖面有安装hadoop。

d)、flume自定义过滤器

参考地址：

把这两行放开注释。

随意新建个maven项目，引入基本的spring的jar包，在引入下面这个包：

新建类实现上面包的Interceptor接口：

整个类内容：

package com.zw.cn.flume;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import org.apache.flume.Context;
import org.apache.flume.Event;
import org.apache.flume.interceptor.Interceptor;
import org.eclipse.jetty.util.StringUtil;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.util.List;

/**
 * @Description: 自定义flume拦截器类型
 * @Author: zhaowei
 * @Date: 2020/7/29
 * @Time: 14:46
 */
public class MyInterceptor implements Interceptor {

    private static final Logger logger = LoggerFactory.getLogger(MyInterceptor.class);

    /**
     * 初始化放在，最开始执行一次
     * 把配置的数据初始化到map中，方便后面调用
     */
    @Override
    public void initialize() {

    }

    /**
     * 具体的处理逻辑
     * @param event
     * @return
     */
    @Override
    public Event intercept(Event event) {
        try{
            String origBody = new String(event.getBody());
            logger.info("origBody:{}", origBody);
            if(StringUtil.isNotBlank(origBody)){
                String newBody = JSON.toJSONString(JSONObject.parseObject(origBody).get("data"));;
                event.setBody(newBody.getBytes());
                logger.info("newBody:{}", newBody);
            }
        }catch (Exception e){
            logger.error("拦截器处理失败!:", e);
        }
        return event;
    }

    public static class Builder implements Interceptor.Builder {
        @Override
        public Interceptor build() {
            return new MyInterceptor();
        }
        @Override
        public void configure(Context context) {
        }
    }

    @Override
    public List intercept(List list) {
        for (Event event : list) {
            intercept(event);
        }
        return list;
    }

    @Override
    public void close() {

    }
}

把该文件打包成jar包，放在flume的lib文件下：

rz 上传，打包成的jar文件：myInterceptor.jar

然后重启flume，mysql插入一条数据测试：

flume查看：

可以看到我们自定义的拦截器里打印的日志，已经获取到我们想要的data里的数据了。

5、hadoop安装

有些系统上需要关闭防火墙，我这边是安装的精简版没有防火墙。

a)、上传

在/usr/local/soft/hadoop目录下上传hadoop的hadoop-3.3.0.tar.gz包（路径根据自己喜好设置；如果跟本文一致，对应的路径没有则创建）

使用rz命令，弹窗-> 选择

hadoop-3.3.0.tar.gz，上传完成。

b)、解压

解压：

tar -zxvf hadoop-3.3.0.tar.gz

c)、配置

$ vim /etc/profile      # 添加hadoop_home,以及/bin;/sbin路径
export HADOOP_HOME=/usr/local/soft/hadoop/hadoop-3.3.0   #hadoop安装目录，就是解压后的目录
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/jre/bin:$PATH
$ source /etc/profile   # 使环境变量生效

查看是否安装成功

[root@new-frame-251 hadoop]# hadoop version
Hadoop 3.3.0
Source code repository https://gitbox.apache.org/repos/asf/hadoop.git -r aa96f1871bfd858f9bac59cf2a81ec470da649af
Compiled by brahma on 2020-07-06T18:44Z
Compiled with protoc 3.7.1
From source with checksum 5dc29b802d6ccd77b262ef9d04d19c4
This command was run using /usr/local/soft/hadoop/hadoop-3.3.0/share/hadoop/common/hadoop-common-3.3.0.jar

①、/usr/local/soft/hadoop/hadoop-3.3.0目录下新建一个tmp目录，tmp目录下新建data和name两个目录（注意两个目录的文件权限）

②、修改/usr/local/soft/hadoop/hadoop-3.3.0/etc/hadoop目录下core-site.xml文件




      fs.defaultFS

      hdfs://psb-tt-123:9000







      hadoop.tmp.dir

      /usr/local/soft/hadoop/hadoop-3.3.0/tmp

③、修改/usr/local/soft/hadoop/hadoop-3.3.0/etc/hadoop目录下hdfs-site.xml文件



    dfs.replication

    1





    dfs.namenode.name.dir

    /usr/local/soft/hadoop/hadoop-3.3.0/tmp/name





    dfs.datanode.data.dir

    /usr/local/soft/hadoop/hadoop-3.3.0/tmp/data

④、修改/usr/local/soft/hadoop/hadoop-3.3.0/etc/hadoop目录下hadoop-env.sh文件

JAVA_HOME=/opt/jdk1.8.0_211

d)、SSH免密登录

cd ~/.ssh/  #若没有该目录,请先执行一次ssh localhost ssh-keygen -t rsa 会有提示，都按回车就可以

cat id_rsa.pub >> authorized_keys             #加入授权

chmod 600 ./authorized_keys          #修改文件权限

e)、启动

第一次启动前需要格式化一下： ./hadoop namenode -format

然后：start-dfs.sh

可能报错：

解决办法：

在Hadoop安装目录下找到sbin文件夹，在里面修改2个文件

对于start-dfs.sh和stop-dfs.sh文件，添加下列参数：

#!/usr/bin/env bash

HDFS_DATANODE_USER=root

HDFS_NAMENODE_USER=root

HDFS_SECONDARYNAMENODE_USER=root

重新start-dfs.sh启动，检测是否启动成功: jps

f)、测试

Mysql插入两条数据：

查看flume窗口：

hadoop命令查看该文件内容：

在访问hadoop的web页面：

http://psb-tt-123:9870(已经配置好的映射关系),这里浏览器可能还需要设置下跨域访问，我用的谷歌浏览器，网上跨域一大堆。

已经有对应的目录了，点进去：

在随便点击一个然后可以查看文件部分内容，也可以下载下来：

我这里已经设置过过滤器了，如果没设置，数据有了，但是我们可能只想要data里的json，原有结构如下：

其他的信息是库、表、数据类型（增删改）等。看实际需求，如果需要过滤，则需要修改下flume，自定义一个过滤器，请看下flume模块的自定义过滤器。

此次用到的命令，其实只需要看help就行了：

hadoop shell 命令官网：http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html

hadoop学习地址：https://blog.csdn.net/anaitudou/category_9276477.html

put上传命令：

hadoop fs -put /usr/local/soft/jdk8/jdk-8u181-linux-x64.tar.gz hdfs://192.168.217.100:9000/jdk

登录上后查看根目录（逐级查看）：

hadoop fs -ls -R /

单级目录创建

hadoop fs -mkdir path

多级目录创建(包括文件)

hadoop fs -mkdir -p path/path/t1.txt

命令help：

hadoop fs -help

你可能感兴趣的:(java学习,hdfs,hadoop)

Spark集群架构介绍 olifchou Spark spark apache spark 大数据分布式
Spark之YARN介绍一、导语二、Spark及其特性三、Spark架构总览一、导语ApacheSpark(后续简称为Spark)是一款正在点燃大数据世界的开源集群计算框架。据SparkCertifiedExperts显示，在内存中运行时，Sparks性能要比Hadoop快一百倍，在磁盘上运行，Sparks比Hadoop快达十倍。在本篇博客中，我将会为你简单介绍一下Spark的底层基础架构。二、S
Spark Standalone集群架构 htfenght spark spark
北风网spark学习笔记SparkStandalone集群架构SparkStandalone集群集群管理器，clustermanager：Master进程，工作节点：Worker进程搭建了一套Hadoop集群（HDFS+YARN）HDFS：NameNode、DataNode、SecondaryNameNodeYARN：ResourceManager、NodeManagerSpark集群（Spark
Hadoop--NameSpace（名称空间） Cynthiaaaaalxy hadoop 大数据分布式
1.名称空间的定义 HDFS的名称空间是一个逻辑上的文件系统目录树，类似于传统文件系统的目录结构。组成目录：用于组织文件的逻辑容器。文件：存储在HDFS中的实际数据单元。元数据：包括文件名、权限、所有者、文件大小、创建时间、修改时间等信息。2.名称空间的作用名称空间的主要作用是：组织文件通过目录树的形式组织文件，方便用户管理和访问。维护元数据记录文件和目录的元数据信息（如权限、所有者、大小等）。
RESTful（REST风格）是什么？（Java学习笔记） L葵-阳S Spring MVC java restful 学习
RESTful（REST风格）是一种当前比较流行的互联网软件架构模式，它充分并正确地利用HTTP协议的特性，为我们规定了一套统一的资源获取方式，以实现不同终端之间（客户端与服务端）的数据访问与交互。RESTREST:RepresentationStateTransfer的缩写,中文意思就是：表现层资源表诉状态转移。Resource（资源）当我们把Web工程部署到服务器中，那么工程中的所有的内容都可
spark程序提交到集群上_Spark集群模式&Spark程序提交毫无特色 spark程序提交到集群上
Spark集群模式&Spark程序提交1.集群管理器Spark当前支持三种集群管理方式Standalone—Spark自带的一种集群管理方式，易于构建集群。ApacheMesos—通用的集群管理，可以在其上运行HadoopMapReduce和一些服务应用。HadoopYARN—Hadoop2中的资源管理器。Tip1:在集群不是特别大，并且没有mapReduce和Spark同时运行的需求的情况下，用
Java学习笔记——单元测试，面试必备 m0_64867152 程序员面试 java 后端
assertEquals(“这是错误信息2”,12,m.getArea(3,4));}}@Test注解的方法每个@Test对应一个方法，这个方法会被识别为一个测试方法一个测试类里面可以有多个@Test，但是每个@Test对应的测试方法只会被执行一次通常我们会在@Test测试方法中使用assertEquals断言语句，来判断方法是否能够正常运行并且输出我们希望的结果assertEquals（“错误信
Hadoop--Secondary NameNode工作机制，作用及与NameNode HA的区别 Cynthiaaaaalxy hadoop 大数据分布式
SecondaryNameNode主要用于辅助NameNode进行元数据的管理和检查点（Checkpoint）的生成。1.SecondaryNameNode的工作机制详解SecondaryNameNode的工作机制可以分为以下步骤：①SecondaryNameNode询问NameNode是否需要CheckpointSecondaryNameNode会定期（由dfs.namenode.check
Hadoop之jdk的安装快来削我吖云存储 hadoop jdk centos
【实验目的】1.安装配置JDK1.五台独立PC机或虚拟机主机之间有有效的网络连接2.每台主机内存2G以上，磁盘剩余空间500M以上所有主机上已安装CentOS7.4操作系统3.所有主机已完成网络属性配置1.卸载原有JDK该项的所有操作步骤需要使用root用户进行。并且在集群中每台主机操作一次，发现没有，不必卸载因为我的查看没有jdk，所以不需要卸载原有的，只需直接安装即可。2.安装此项的所有操作步
Hadoop HDFS基准测试 Yvonne978 大数据 hadoop hdfs 大数据
一、测试写入速度确保HDFS集群和YARN集群成功启动hadoopjar/export/server/hadoop-3.1.4/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.4-tests.jarTestDFSIO-write-nrFiles10-fileSize10MB说明：向HDFS文件系统中写入数据,10个文件,每个
jmeter 与大数据生态圈中的服务进行集成小赖同学啊 jmeter专栏 jmeter 大数据
以下为你详细介绍JMeter与大数据生态圈中几种常见服务（HadoopHDFS、Spark、Kafka、Elasticsearch）集成的方法：与HadoopHDFS集成实现思路HDFS是Hadoop的分布式文件系统，JMeter可模拟客户端对HDFS进行文件读写操作，通常借助HDFS的JavaAPI编写自定义JMeter采样器。步骤添加依赖：将Hadoop的客户端JAR包添加到JMeter的li
数据质量管理工具（Trifacta Wrangler） deepdata_cn 数据质量数据质量
2012年4月：JoeHellerstein、JeffreyHeer和SeanKandel创立Trifacta公司。2015年10月：正式推出TrifactaWrangler，让非技术用户也能通过直观的可视化工作流程来探索、转换和丰富数据，同时其旗舰产品、专注于Hadoop的Trifacta数据处理解决方案更名为TrifactaWranglerEnterprise。2022年2月Alteryx宣布
Hadoop常用操作命令 hzw0510 hadoop 大数据分布式
在NameNode节点格式化集群初始化集群hdfsnamenode-format启动HDFSsbin/start-dfs.sh启动yarnsbin/start-yarn.sh启动NodeManageryarn-daemon.shstartnodemanager启动DataNodehadoop-daemon.shstartdatanode启动SecondaryNameNodehadoop-daemo
【Python爬虫(45)】Python爬虫新境界：分布式与大数据框架的融合之旅奔跑吧邓邓子 Python爬虫 python 爬虫分布式开发语言大数据框架
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、大数据处理框架初印象1.1Hadoop：大数据处理的基石1.2
HDFS分布式文件系统的架构及特点互联网上的猪 Hadoop hdfs 架构 hadoop
一、HDFS架构HDFS采用的是主从（Master/Slave）架构，即一个HDFS通常是由一个Master和多个Slave组成。Master为NameNode主要用于管理HDFSSlave为DataNode主要用于存储文件SecondaryNode用于辅助NameNodeHDFS架构1.1BlockBlock是HDFS文件系统中最小的存储单位，通常称为数据块。在HDFS文件系统中存储的文件会被拆
hive运维花泽啸 Hive hive
hive锁相关showlocks;查看锁unlocktable表名;释放锁发现释放不了锁，执行下面sethive.support.concurrency=false;sethive.txn.manager=org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager;然后在unlock还是不行的的话：select*fromHIVE_LOCKS;关闭hivese
Hadoop~HDFS的Block块飞Link Hadoop框架 hadoop hdfs 大数据
一、HDFS的block块1.介绍block块是HDFS的最小存储单位，每个256MB(可以修改)2.文件在HDFS中的存储方式文件分成多个block块，block块分三份存入对应服务器，每个block块都有2个(可修改)备份，每个副本都复制到其他服务器一份，每个block块都有两个备份在其他服务器上，这使得安全性极大提高3.修改默认文件上传到HDFS中的副本数量hdfs-site.xml默认为3
基于Hadoop的天气数据分析系统的设计与实现-计算机毕业设计源码+LW文档 qq_375279829 hadoop 课程设计 eclipse 毕业设计毕设
摘要随着全球气候变化的日益严峻，精准的天气数据分析和预测变得至关重要。Hadoop作为大数据处理领域的领军技术，其分布式计算框架和海量数据存储能力为天气数据分析提供了强大的支持。该系统能够收集、整合并分析来自全球各地的气象数据，通过挖掘数据中的潜在规律，提高天气预报的准确性和时效性。此外，该系统还有助于发现气候变化的趋势，为政府决策、农业生产、交通运输等领域提供科学依据。因此，基于Hadoop的天
深入HBase——核心组件黄雪超大数据基础 #深入HBase hbase 数据库数据结构
引入通过上一篇对HBase核心算法和数据结构的梳理，我们对于其底层设计有了更多理解。现在我们从引入篇里面提到的HBase架构出发，去看看其中不同组件是如何设计与实现。核心组件首先，需要提到的就是HBase架构中会依赖到的Zookeeper和HDFS。对于HDFS看过深入HDFS的小伙伴，应该都不陌生，它提供了高可靠的海量数据存储和读写能力；而对于Zookeeper，它是一个分布式协调存储服务，主要
大数据-257 离线数仓 - 数据质量监控监控方法 Griffin架构 m0_74823705 面试学习路线阿里巴巴大数据架构
点一下关注吧！！！非常感谢！！持续更新！！！Java篇开始了！目前开始更新MyBatis，一起深入浅出！目前已经更新到了：Hadoop（已更完）HDFS（已更完）MapReduce（已更完）Hive（已更完）Flume（已更完）Sqoop（已更完）Zookeeper（已更完）HBase（已更完）Redis（已更完）Kafka（已更完）Spark（已更完）Flink（已更完）ClickHouse（已
计算机毕业设计吊炸天Python+Spark地铁客流数据分析与预测系统地铁大数据地铁流量预测 qq_80213251 java javaweb 大数据课程设计 python
开发技术SparkHadoopPython爬虫Vue.jsSpringBoot机器学习/深度学习人工智能创新点Spark大屏可视化爬虫预测算法功能1、登录注册界面，用户登录注册，修改信息2、管理员用户：（1）查看用户信息；（2）出行高峰期的10个时间段；（3）地铁限流的10个时间段；（4）地铁限流的前10个站点；（6）可视化大屏实时显示人流量信息。3、普通用户：（1）出行高峰期的10（5）可视化大
Python 的 WebSocket 实现详解王子良. 经验分享 python websocket 网络协议网络
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
【Java学习】多态 Brookty java 学习
目录一、方法相同二、方法重写1.概念2.条件三、向上转型1.概念2.方式四、方法绑定五、多态一、方法相同方法相同要求方法名相同、参数列表相同、返回值类型相同(与两方法修饰的访问限定符相不相同、静态非静态状态相不相同无关)，而且在子类与父类相同的方法中，子类那边方法的访问权限必须大于等于父类那边方法的访问权限二、方法重写1.概念重写是由子类类变量引用赋给父类类变量引用后父类类变量引用里对原子类类变量
Spark源码分析 – Shuffle weixin_34292924 大数据
参考详细探究Spark的shuffle实现,写的很清楚,当前设计的来龙去脉HadoopHadoop的思路是,在mapper端每次当memorybuffer中的数据快满的时候,先将memory中的数据,按partition进行划分,然后各自存成小文件,这样当buffer不断的spill的时候,就会产生大量的小文件所以Hadoop后面直到reduce之前做的所有的事情其实就是不断的merge,基于文件
学习VC中所得的点点技术心得 fang_xp null 输入法 scripting path listview mfc
1toolbar默认位图左上角那个点的颜色是透明色，不喜欢的话可以自己改。2VC++中WM_QUERYENDSESSIONWM_ENDSESSION为系统关机消息。3Java学习书推荐：《java编程思想》4在VC下执行DOS命令a.system("mdc://12");b.WinExec("Cmd.exe/Cmdc://12",SW_HIDE);c.ShellExecuteShellExecut
【Hadoop】使用Docker容器搭建伪分布式集群慕青Voyager 分布式 hadoop docker
使用Docker容器搭建Hadoop伪分布式集群1、编写docker-compose.yaml文件配置集群version:"3"services:namenode:image:apache/hadoop:3.3.6hostname:namenodecommand:["hdfs","namenode"]ports:-9870:9870env_file:-./configenvironment:ENS
HDFS分布文件系统（Hadoop Distributed File System）柿子小头 hdfs hadoop 大数据
目录一.HDFS的本质二.HDFS的架构与原理三、HDFS特性四.HDFS的常用命令1.显示HDFS指定路径下的所有文件2.在HDFS上创建文件夹3.上传本地文件到HDFS4.查看文件5.删除HDFS上的文件或者目录6.修改指定文件的权限信息（读、写、执行）一般语法：chmod[可选项]五、HDFS实战应用六、总结一.HDFS的本质HadoopDistributedFileSystem（HDFS）
java学习pdf文档,PDFBox创建PDF文档灰机锅 java学习pdf文档
本篇文章帮大家学习PDFBox创建PDF文档，包含了PDFBox创建PDF文档使用方法、操作技巧、实例演示和注意事项，有一定的学习价值，大家可以用来参考。现在让我们了解如何使用PDFBox库创建PDF文档。创建一个空的PDF文档可以通过实例化PDDocument类来创建一个空的PDF文档。使用这个类的Save()方法将文档保存在所需的位置。以下是创建一个空的PDF文档的步骤。第1步:创建空白文档o
org.apache.hadoop.hdfs.server.datanode.DataNode: Block pool ID needed, but service not yet registere @菜鸟进阶记@ hadoop hadoop
启动hadoop集群，发现datanode没有启动，查看日志报错，如图：//日志文件2020-03-2416:40:55,608WARNorg.apache.hadoop.hdfs.server.common.Storage:Failedtoaddstoragedirectory[DISK]file:/opt/module/hadoop-2.8.4/data/tmp/dfs/data/java.i
Hadoop之HDFS的使用想要变瘦的小码头 hadoop hdfs 大数据
HDFS是什么：HDFS是一个分布式的文件系统，是个网盘，HDFS是一种适合大文件存储的分布式文件系统HDFS的Shell操作1、查看hdfs根目录下的内容-lshdfsdfs-lshdfs://hadoop01:9000/url在使用时默认是可以省略的，因为hdfs在执行的时候会根据HDOOP_HOME自动识别配置文件中的fs.defaultFS属性可以写成：hdfsdfs-ls/还有一版旧版写
RHEL 安装 Hadoop 服务器 XhClojure hadoop 服务器大数据
在这篇文章中，我们将探讨如何在RedHatEnterpriseLinux(RHEL)上安装和配置Hadoop服务器。Hadoop是一个开源的分布式数据处理框架，用于处理大规模数据集。以下是在RHEL上安装Hadoop的详细步骤。步骤1：安装Java在安装Hadoop之前，我们需要确保系统上安装了JavaDevelopmentKit(JDK)。执行以下命令安装JDK：sudoyuminstallja
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，