一半@java

离线分析：Flume+Kafka+HBase+Hadoop通话数据统计

文章目录

项目背景
项目架构
系统环境
系统配置
框架安装
- JDK
- Hadoop
- Zookeeper
- Kafka
- Flume
- HBase
项目实现
- 项目结构
- 表设计
- - HBase
  - Mysql
- 功能编写
- - 公共服务
  - 生产日志服务
  - 数据存储服务
  - 协处理器服务
  - 数据分析服务
  - Web端接口服务
  - Web界面服务
- 项目启动/部署
- - 协处理器
  - 生产日志
  - 数据存储
  - 数据分析
  - Web接口服务
- 功能浏览
资源地址

项目背景

通信运营商每时每刻会产生大量的通信数据，例如通话记录，短信记录，彩信记录，第三方服务资费等等繁多信息。数据量如此巨大，除了要满足用户的实时查询和展示之外，还需要定时定期的对已有数据进行离线的分析处理。例如，当日话单，月度话单，季度话单，年度话单，通话详情，通话记录等等+。我们以此为背景，寻找一个切入点，学习其中的方法论。

当前我们的需求是：统计每天、每月以及每年的每个人的通话次数及时长。

项目架构

说明：

1、用户通过时，通过应用服务生成主叫、被叫、通话时间、通话时长等日志信息，日志信息打印到日志文件中。

2、Flume监听日志文件，读取通话相关的日志通过Kafka的log主题发送到Kafka中。

3、日志消费服务通过log主题获取Kafka中的数据，并调用HBase的api，将数据信息存入HBase、文件信息存入HDFS中。

4、编写的MapReduce任务定时去从HBase读数据，以各个维度进行数据分析。并将分析结果写入Mysql中。

5、用户查询通话记录报表时，请求分析服务获取数据，然后数据在界面中以图表形式展示。

系统环境

系统	版本
Windows	10
CentOS	7.9.2009

工具	版本
IDEA	2020.1.3
Maven	3.5.4
JDK	1.8
MySQL	5.6.50

框架	版本
Flume	1.9.0
Kafka	2.12-2.8.0
Zookeeper	3.6.3
Hadoop	2.10.1
HBase	2.2.6
Hutool	5.6.4
SpringBoot	2.4.5
MybatisPlus	3.4.2

系统配置

在CentOS中添加hosts:

vim /etc/hosts

添加内容：

192.168.1.43 linuxserver

192.168.1.43为本机CentOS的IP。

在network中添加HOSTNAME：

vim /etc/sysconfig/network

添加内容：

HOSTNAME=linuxserver

需要重启系统。

在windows中添加hosts:

修改C:\Windows\System32\drivers\etc\hosts文件，追加内容：

192.168.1.43	linuxserver

分别在windows中和centos中执行ping命令，查看hostname是否被解析：

ping linuxserver

框架安装

所有框架在配置好环境变量后，均可直接使用命令，不用加路径，文中是为了展示其位置而加上全路径。

注意开放外部访问相关端口，否则会拒绝连接引起启动异常。centos开放端口可参考文章《CentOS7 中端口命令》。

JDK

JDK下载链接

下载jdk-8u281-linux-x64.tar.gz压缩包，并解压缩到hadoop用户的家目录的jvm文件夹

cd ~
mkdir jvm
tar -zxf jdk-8u281-linux-x64.tar.gz -C jvm

编辑环境变量：

vim ~/.bashrc

添加JAVA_HOME：

export JAVA_HOME=/home/hadoop/jvm/jdk1.8.0_281
export PATH=$JAVA_HOME/bin

让环境变量生效：

source ~/.bashrc

查看java版本：

java -version

Hadoop

通过wget下载：

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable2/hadoop-2.10.1.tar.gz

解压到用户家目录：

tar -zxf hadoop-2.10.1.tar.gz -C ~

重命名：

mv hadoop-2.10.1 hadoop

修改环境变量：

vi ~/.bashrc

增加以下内容：

# Hadoop Environment Variables
export HADOOP_HOME=/home/hadoop/hadoop
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

注意，如果以前有PATH变量，请将以前的配置和此PATH合并即可。

使文件生效：

source ~/.bashrc

修改core-site.xml：

vim ~/hadoop/etc/hadoop/core-site.xml

替换为以下内容：

<configuration>
    <property>
        <name>hadoop.tmp.dirname>
        <value>file:/home/hadoop/hadoop/tmpvalue>
        <description>Abase for other temporary directories.description>
    property>
    <property>
        <name>fs.defaultFSname>
        <value>hdfs://linuxserver:9000value>
    property>
configuration>

修改hdfs-site.xml：

vim ~/hadoop/etc/hadoop/hdfs-site.xml

替换为以下内容：

<configuration>
    <property>
        <name>dfs.replicationname>
        <value>1value>
    property>
    <property>
        <name>dfs.namenode.name.dirname>
        <value>file:/home/hadoop/hadoop/tmp/dfs/namevalue>
    property>
    <property>
        <name>dfs.datanode.data.dirname>
        <value>file:/home/hadoop/hadoop/tmp/dfs/datavalue>
    property>
configuration>

第一次使用时执行NameNode初始化，后续无需执行：

/home/hadoop/hadoop/bin/hdfs namenode -format

启动hdfs文件系统：

/home/hadoop/hadoop/sbin/start-dfs.sh

修改mapred-site.xml：

cd /home/hadoop/hadoop/etc/hadoop  #进入配置文件的文件夹
mv ./mapred-site.xml.template ./mapred-site.xml  #重命名
vim ./mapred-site.xml  #编辑文件

替换为以下内容：

<configuration>
    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>
configuration>

修改yarn-site.xml：

cd /home/hadoop/hadoop/etc/hadoop  #进入配置文件的文件夹
vim ./yarn-site.xml  #编辑文件

替换为以下内容：

<configuration>
    <property>
        <name>yarn.nodemanager.aux-servicesname>
        <value>mapreduce_shufflevalue>
        property>
configuration>

启动资源管理器YARN：

/home/hadoop/hadoop/sbin/start-yarn.sh

启动历史服务器：

/home/hadoop/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver

如果需要关闭hdfs，执行命令：

/home/hadoop/hadoop/sbin/stop-dfs.sh

如果需要关闭yarn，执行命令：

/home/hadoop/hadoop/sbin/stop-yarn.sh

如果需要关闭历史服务器，执行命令：

/home/hadoop/hadoop/sbin/mr-jobhistory-daemon.sh stop historyserver

启动成功后，可通过ip+8088/cluster访问hadoop历史服务：

相关安装博客可以查看《分布式处理框架Hadoop的安装与使用》。

Zookeeper

通过wget下载安装包：

wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.6.3/apache-zookeeper-3.6.3-bin.tar.gz

解压到用户家目录：

tar -zxf apache-zookeeper-3.6.3-bin.tar.gz -C ~

重命名：

mv apache-zookeeper-3.6.3-bin zookeeper

进入zookeeper文件中创建文件夹：

cd zookeeper
mkdir tmp

复制模板配置文件并修改：

cp ./conf/zoo-sample.cfg ./conf/zoo.cfg
vim ./conf/zoo.cfg

修改内容：

dataDir=/home/hadoop/zookeeper/tmp

修改环境变量：

vi ~/.bashrc

增加以下内容：

# Zookeeper Environment Variables
export ZOOKEEPER_HOME=/home/hadoop/zookeeper
export PATH=$PATH:$ZOOKEEPER_HOME/bin

注意，如果以前有PATH变量，请将以前的配置和此PATH合并即可。

使文件生效：

source ~/.bashrc

启动zookeeper：

./bin/zkServer.sh start

如果需要停止zookeeper，可以通过stop命令停止：

./bin/zkServer.sh stop

Kafka

通过wget下载安装包：

wget https://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.8.0/kafka_2.12-2.8.0.tgz

解压到家目录：

tar -zxf kafka_2.12-2.8.0.tgz -C ~

重命名：

mv kafka_2.12-2.8.0.tgz kafka

进入kafka目录：

cd kafka

修改kafka配置：

vim config/server.properties

listeners=PLAINTEXT://:9092
advertised.listeners=PLAINTEXT://linuxserver:9092
zookeeper.connect=linuxserver:2181

启动kafka（在zookeeper启动之后）：

bin/kafka-server-start.sh -daemon ./config/server.properties

创建log主题：

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic log

如果需要关闭kafka，执行：

bin/kafka-server-stop.sh

Flume

通过wget下载flume安装包:

wget https://mirrors.tuna.tsinghua.edu.cn/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz

解压到家目录:

tar -zxf apache-flume-1.9.0-bin.tar.gz -C ~

重命名：

mv apache-flume-1.9.0-bin flume

在flume的conf目录下新建log-telecom-customer-service.properties，内容为：

agent.sources = exectail
agent.channels = memoryChannel
agent.sinks = kafkasink

# For each one of the sources, the type is defined
agent.sources.exectail.type = exec
# 下面这个路径是需要收集日志的绝对路径，改为自己的日志目录
agent.sources.exectail.command = tail -F /home/hadoop/applogs/telecomCustomerServiceLog/telecomCustomerService.log
agent.sources.exectail.interceptors=i1
agent.sources.exectail.interceptors.i1.type=regex_filter
# 定义日志过滤前缀的正则
agent.sources.exectail.interceptors.i1.regex=.+TELECOM_CUSTOMER_SERVICE.+
# The channel can be defined as follows.
agent.sources.exectail.channels = memoryChannel

# Each sink's type must be defined
agent.sinks.kafkasink.type = org.apache.flume.sink.kafka.KafkaSink
agent.sinks.kafkasink.kafka.topic = log
agent.sinks.kafkasink.kafka.bootstrap.servers = linuxserver:9092
agent.sinks.kafkasink.kafka.producer.acks = 1
agent.sinks.kafkasink.kafka.flumeBatchSize = 20

#Specify the channel the sink should use
agent.sinks.kafkasink.channel = memoryChannel

# Each channel's type is defined.
agent.channels.memoryChannel.type = memory

# Other config values specific to each type of channel(sink or source)
# can be defined as well
# In this case, it specifies the capacity of the memory channel
agent.channels.memoryChannel.capacity = 10000

表示通过命令tail -F /home/hadoop/applogs/telecomCustomerServiceLog/telecomCustomerService.log监听日志文件，并通过表达式.+TELECOM_CUSTOMER_SERVICE.+进行正则匹配，将结果通过log主题发送到linuxserver:9092的Kafka中。

启动Flume：

./bin/flume-ng agent -c ./conf/ -f ./conf/log-telecom-customer-service.properties -n agent -Dflume.root.logger=INFO,console

HBase

通过wget下载：

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hbase/2.2.6/hbase-2.2.6-bin.tar.gz

解压到用户家目录：

tar -zxf hbase-2.2.6-bin -C ~

重命名：

mv hbase-2.2.6-bin hbase

修改/home/hadoop/hbase/conf/hbase-env.sh中的下列配置：

export JAVA_HOME=/home/hadoop/jvm/jdk1.8.0_281
export HBASE_CLASSPATH=/home/hadoop/hbase/conf 
export HBASE_MANAGES_ZK=false

修改/home/hadoop/hbase/conf/hbase-site.xml配置，替换为以下内容：

<configuration>
	<property>
        <name>hbase.rootdirname>
        <value>hdfs://linuxserver:9000/hbasevalue>
    property>
    <property>
        <name>hbase.cluster.distributedname>
        <value>truevalue>
    property>
	<property>
        <name>hbase.master.info.portname>
    	<value>16010value> 
    property>
	<property>
        <name>hbase.mastername>
        <value>linuxserver:16000value>
    property>
	<property>
     	<name>zookeeper.znode.parentname>
     	<value>/hbase/mastervalue>
	 property>
	<property>
		<name>hbase.zookeeper.quorumname>
		<value>linuxserver:2181value>
	property> 
configuration>

修改/home/hadoop/hbase/conf/regionservers，增加以下内容：

linuxserver

修改环境变量：

vi ~/.bashrc

增加以下内容：

# HBase Environment Variables
export HBASE_HOME=/home/hadoop/hbase
export PATH=$PATH:$HBASE_HOME/bin

注意，如果以前有PATH变量，请将以前的配置和此PATH合并即可。

使文件生效：

source ~/.bashrc

启动HBase（需要先启动HDFS与Zookeeper）：

/home/hadoop/hbase/bin/start-hbase.sh

如果需要关闭HBase，执行命令：

/home/hadoop/hbase/bin/stop-hbase.sh

HBase依赖与HDFS存储文件，依赖Zookeeper存储节点信息，所以启动前需要先启动HDFS与Zookeeper。

更多安装详情可以查看《分布式数据库HBase实践指南》。

项目实现

项目结构

TelecomCustomerService
├── tcs-analysis #数据分析服务
├── tcs-api #web端接口服务
├── tcs-common #公共服务
├── tcs-consumer #数据存储服务
├── tcs-consumer-coprocessor #HBase协处理器服务
├── tcs-producer #生产日志服务
└── tcs-web #web界面服务

项目全局引入Hutool5.6.4工具类。

表设计

HBase

数据表call_record：

列族	列	说明
active	call1	通话号码1
active	call2	通话号码2
active	date_time	通话建立时间，格式为yyyyMMddHHmmss
active	duration	通话时长，格式为0000
active	flag	标志位，主叫为1，被叫为0
passive	call1	通话号码1
passive	call2	通话号码2
passive	date_time	通话建立时间，格式为yyyyMMddHHmmss
passive	duration	通话时长，格式为0000
passive	flag	标志位，主叫为1，被叫为0
passive	date_time_ts	通话时长时间戳

列族active为主叫记录，列族passive为被叫记录。

行键规则为call1_date_time_call2_flag_duration。

Mysql

tb_contacts 联系人表

名称	数据类型	约束	说明
id	int(11)	AUTO_INCREMENT， PRIMARY KEY	自增id
telephone	varchar(255)	NOT NULL	手机号码
name	varchar(255)	NOT NULL	联系人姓名

tb_dimension_date 时间维度表

名称	数据类型	约束	说明
id	int(11)	AUTO_INCREMENT， PRIMARY KEY	自增id
year	varchar(4)	NOT NULL	当前通话信息所在年
month	varchar(2)	NOT NULL	当前通话信息所在月
day	varchar(2)	NOT NULL	当前通话信息所在日

tb_call 通话统计表

名称	数据类型	约束	说明
id_date_contact	varchar(255)	NOT NULL， PRIMARY KEY	复合主键（联系人id，时间维度id）
id_date_dimension	int(11)	NOT NULL	时间维度id
id_contact	int(11)	NOT NULL	查询人id
call_sum	int(11)	NOT NULL	通话次数总和
call_duration_sum	int(11)	NOT NULL	通话时长总和

功能编写

公共服务

用于编写一些公用的工具。

引入Mysql、HBase、Log4j依赖：

<properties>
    <log4j.version>1.2.17log4j.version>
    <slf4j.version>1.7.22slf4j.version>
    <java.version>1.8java.version>
properties>

<dependencies>
    
    <dependency>
        <groupId>log4jgroupId>
        <artifactId>log4jartifactId>
        <version>${log4j.version}version>
    dependency>
    <dependency>
        <groupId>org.slf4jgroupId>
        <artifactId>slf4j-apiartifactId>
        <version>${slf4j.version}version>
    dependency>
    <dependency>
        <groupId>org.slf4jgroupId>
        <artifactId>slf4j-log4j12artifactId>
        <version>${slf4j.version}version>
    dependency>

    <dependency>
        <groupId>org.apache.hbasegroupId>
        <artifactId>hbase-clientartifactId>
        <version>${hbase.version}version>
    dependency>

    <dependency>
        <groupId>org.apache.hbasegroupId>
        <artifactId>hbase-serverartifactId>
        <version>${hbase.version}version>
    dependency>

    <dependency>
        <groupId>org.apache.hbasegroupId>
        <artifactId>hbase-mapreduceartifactId>
        <version>${hbase.version}version>
    dependency>

    <dependency>
        <groupId>mysqlgroupId>
        <artifactId>mysql-connector-javaartifactId>
        <version>${mysql.java.version}version>
    dependency>
dependencies>

NameConstant

列族名称常量。

package cn.javayuli.common.constants;

/**
 * 名称常量
 *
 * @author hanguilin
 */
public interface NameConstant {

    /**
     * 主叫
     */
    String ACTIVE = "active";

    /**
     * 被叫
     */
    String PASSIVE = "passive";
}

StateConstant

主被叫常量。

package cn.javayuli.common.constants;

/**
 * 状态常量
 *
 * @author hanguilin
 */
public interface StateConstant {

    /**
     * 主叫
     */
    String ACTIVE = "1";

    /**
     * 被叫
     */
    String PASSIVE = "0";
}

HBaseDao

HBase表操作类。

package cn.javayuli.common.dao;

import cn.hutool.core.collection.CollUtil;
import com.google.common.collect.Lists;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.IOException;
import java.util.Collections;
import java.util.List;
import java.util.stream.Collectors;

/**
 * HBase 工具类
 *
 * @author hanguilin
 */
public class HBaseDao {

    public static Configuration conf;
    
    private static final Logger LOGGER = LoggerFactory.getLogger(HBaseDao.class);

    static {
        conf = HBaseConfiguration.create();
    }

    /**
     * 表是否存在
     *
     * @param tableName 表名
     * @return
     */
    public boolean isExistTable(String tableName) {
        TableName table = TableName.valueOf(tableName);
        try (
                Connection conn = ConnectionFactory.createConnection(conf);
                Admin admin = conn.getAdmin()
        ) {
            return admin.tableExists(table);
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
            return true;
        }
    }

    /**
     * 创建表
     *
     * @param tableName    表明
     * @param columnFamily 列族
     */
    public void createTable(String tableName, List<String> columnFamily) {
        TableName table = TableName.valueOf(tableName);
        try (
                Connection conn = ConnectionFactory.createConnection(conf);
                Admin admin = conn.getAdmin()
        ) {
            // 判断表是否已存在
            if (admin.tableExists(table)) {
                LOGGER.info("表{}已存在", tableName);
                return;
            }
            TableDescriptorBuilder tableDescriptorBuilder = TableDescriptorBuilder.newBuilder(table);
            // 添加协处理器
            CoprocessorDescriptor coprocessor = CoprocessorDescriptorBuilder
                    // 协处理器类
                    .newBuilder("cn.javayuli.coprocessor.observer.CalleeWriteObserver")
                    // 协处理器jar包的位置
                    .setJarPath("hdfs://linuxserver:9000/user/hadoop/hbase/coprocessor/tcs-consumer-coprocessor-1.0.jar")
                    .setPriority(Coprocessor.PRIORITY_USER)
                    .build();
            tableDescriptorBuilder.setCoprocessor(coprocessor);
            if (CollUtil.isNotEmpty(columnFamily)) {
                columnFamily.forEach(column -> {
                    ColumnFamilyDescriptor columnFamilyDescriptor = ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes(column)).build();
                    tableDescriptorBuilder.setColumnFamily(columnFamilyDescriptor);
                });
            }
            admin.createTable(tableDescriptorBuilder.build());
            LOGGER.info("创建表{}成功", tableName);
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
        }
    }

    /**
     * 删除表
     *
     * @param tableName 表名称
     */
    public void deleteTable(String tableName) {
        TableName table = TableName.valueOf(tableName);
        try (
                Connection conn = ConnectionFactory.createConnection(conf);
                Admin admin = conn.getAdmin()
        ) {
            if (admin.tableExists(table)) {
                // 弃用表
                admin.disableTable(table);
                // 删除表
                admin.deleteTable(table);
                LOGGER.info("删除表{}成功", tableName);
            }
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
        }
    }

    /**
     * 获取所有表
     */
    public List<String> listTable() {
        try (
                Connection conn = ConnectionFactory.createConnection(conf);
                Admin admin = conn.getAdmin()
        ) {
            List<TableDescriptor> tableDescriptors = admin.listTableDescriptors();
            return tableDescriptors.stream().map(o -> o.getTableName().getNameAsString()).collect(Collectors.toList());
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
            return Collections.emptyList();
        }
    }

    /**
     * 插入行数据
     *
     * @param tableName 表名称
     * @param put put对象
     */
    public void insertRow(String tableName, Put put) {
        try (
                Connection conn = ConnectionFactory.createConnection(conf)
        ) {
            Table table = conn.getTable(TableName.valueOf(tableName));
            table.put(put);
            table.close();
            LOGGER.info("向表{}插入数据成功", tableName);
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
        }
    }

    /**
     * 删除行数据
     *
     * @param tableName 表名称
     * @param rowKey    行键
     * @param colFamily 列族
     * @param col       列名称
     */
    public void deleteRow(String tableName, String rowKey, String colFamily, String col) {
        try (
                Connection conn = ConnectionFactory.createConnection(conf)
        ) {
            Table table = conn.getTable(TableName.valueOf(tableName));
            Delete delete = new Delete(rowKey.getBytes());
            delete.addColumn(colFamily.getBytes(), col.getBytes());
            table.delete(delete);
            System.out.println("删除数据成功");
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
        }
    }

    /**
     * 获取行数据
     *
     * @param tableName 表名称
     * @param rowKey    行键
     * @param colFamily 列族
     * @param col       列名称
     */
    public void getRow(String tableName, String rowKey, String colFamily, String col) {
        try (
                Connection conn = ConnectionFactory.createConnection(conf)
        ) {
            Table table = conn.getTable(TableName.valueOf(tableName));
            Get get = new Get(rowKey.getBytes());
            get.addColumn(colFamily.getBytes(), col.getBytes());
            Result result = table.get(get);
            Cell[] rawCells = result.rawCells();
            for (Cell cell : rawCells) {
                System.out.println("RowName:" + new String(CellUtil.cloneRow(cell)) + " ");
                System.out.println("Timetamp:" + cell.getTimestamp() + " ");
                System.out.println("column Family:" + new String(CellUtil.cloneFamily(cell)) + " ");
                System.out.println("row Name:" + new String(CellUtil.cloneQualifier(cell)) + " ");
                System.out.println("value:" + new String(CellUtil.cloneValue(cell)) + " ");
            }
            table.close();
        } catch (IOException e) {
            LOGGER.error(e.getMessage(), e);
        }
    }

}

HBaseUtil

HBase工具类。

package cn.javayuli.common.utils;

import cn.hutool.setting.dialect.Props;

/**
 * HBase工具类
 * @author hanguilin
 */
public class HBaseUtil {

    private static final Props HBASE_PROPS = new Props("classpath://hbase.properties");

    /**
     * 生成行键
     *
     * @param call1
     * @param call2
     * @param dateTime
     * @param flag
     * @param duration
     * @return
     */
    public static String genRowKey (String call1, String dateTime, String call2, String flag, String duration) {
        return call1 + "_" + dateTime + "_" + call2 + "_" + flag + "_" + duration;
    }

    /**
     * 获取配置的hbase属性
     *
     * @param key 键
     * @return
     */
    public static String getHBaseProperties(String key) {
       return HBASE_PROPS.getStr(key);
    }
}

JDBCUtil

JDBC工具类。

package cn.javayuli.common.utils;


import java.sql.Connection;
import java.sql.DriverManager;

/**
 * @author hanguilin
 * JDBC工具类
 */
public class JDBCUtil {

    private static final String MYSQL_DRIVER_CLASS = "com.mysql.jdbc.Driver";
    private static final String MYSQL_URL = "jdbc:mysql://192.168.1.39:3306/telecom?useUnicode=true&characterEncoding=UTF-8";
    private static final String MYSQL_USERNAME = "root";
    private static final String MYSQL_PASSWORD = "root";

    public static Connection getConnection() {
        Connection conn = null;
        try {
            Class.forName(MYSQL_DRIVER_CLASS);
            conn = DriverManager.getConnection(MYSQL_URL, MYSQL_USERNAME, MYSQL_PASSWORD);
        } catch (Exception e) {
            e.printStackTrace();
        }

        return conn;

    }
}

TimeFormatUtil

时间格式化工具。

package cn.javayuli.common.utils;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.text.ParseException;
import java.text.SimpleDateFormat;

/**
 * 时间工具类
 *
 * @author hanguilin
 */
public class TimeFormatUtil {

    private static final SimpleDateFormat SDF = new SimpleDateFormat("yyyyMMddHHmmss");

    private static final Logger LOGGER = LoggerFactory.getLogger(TimeFormatUtil.class);

    /**
     * 格式化日期转换为时间戳
     *
     * @param formatString 格式化日期
     * @return
     * @throws ParseException
     */
    public static String toTS(String formatString) {
        try {
            return String.valueOf(SDF.parse(formatString).getTime());
        } catch (ParseException e) {
            LOGGER.error(e.getMessage(), e);
            return null;
        }
    }
}

resources文件夹下需要hbase.properties、hbase-site.xml、log4j.properties。

hbase.properties

用于HBaseUtil中获取操作的数据表的名称

tableName=call_record

hbase-site.xml

将hbase中配置好的hbase-site.xml复制过来，在hbase-client的源码中，会加载此路径下的hbase-site.xml配置文件。

log4j.properties

log4j.rootLogger=info, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%5L)  :  %m%n

生产日志服务

引入依赖：

<dependency>
    <groupId>cn.javayuligroupId>
    <artifactId>tcs-commonartifactId>
    <version>1.0version>
dependency>

设置打包时把用到的jar包都打进来：

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.pluginsgroupId>
            <artifactId>maven-assembly-pluginartifactId>
            <version>3.0.0version>
            <configuration>
                <descriptorRefs>
                    <descriptorRef>jar-with-dependenciesdescriptorRef>
                descriptorRefs>
            configuration>
            <executions>
                <execution>
                    <id>make-assemblyid>
                    <phase>packagephase>
                    <goals>
                        <goal>singlegoal>
                    goals>
                execution>
            executions>
        plugin>
    plugins>
build>

ProduceLog

生产日志主类。

package cn.javayuli.producer;

import cn.javayuli.common.utils.JDBCUtil;
import com.google.common.collect.Lists;
import com.google.common.collect.Maps;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.text.DecimalFormat;
import java.time.Duration;
import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.time.temporal.ChronoUnit;
import java.util.Collections;
import java.util.HashMap;
import java.util.Map;
import java.util.Random;
import java.util.stream.Collectors;

/**
 * @author hanguilin
 *
 * 模拟生成日志信息
 */
public class ProduceLog {

    /**
     * 用户与手机号映射关系
     */
    private static final Map<String, String> USER_PHONE_MAP;

    private static final DateTimeFormatter DATE_TIME_FORMATTER = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss");

    private static final DateTimeFormatter OUTPUT_DATE_TIME_FORMATTER = DateTimeFormatter.ofPattern("yyyyMMddHHmmss");

    private static final Logger LOGGER = LoggerFactory.getLogger(ProduceLog.class);

    private static final String LOG_PREFIX = "TELECOM_CUSTOMER_SERVICE:";

    static {
        HashMap<String, String> contacts = Maps.newHashMap();
        Connection connection = JDBCUtil.getConnection();
        try (PreparedStatement preparedStatement = connection.prepareStatement("select telephone, name from tb_contacts")) {
            ResultSet resultSet = preparedStatement.executeQuery();
            while (resultSet.next()) {
                String telephone = resultSet.getString(1);
                String name = resultSet.getString(2);
                // 从数据库处查询联系人信息
                contacts.put(telephone, name);
            }
        } catch (SQLException e) {
            e.printStackTrace();
        }
        USER_PHONE_MAP = Collections.unmodifiableMap(contacts);
    }

    /**
     * 在时间区间内随机选择一个时间
     *
     * @param startDate 开始时间
     * @param endDate 结束时间
     * @return
     */
    private static String randomDate(String startDate, String endDate) {
        LocalDateTime start = LocalDateTime.parse(startDate, DATE_TIME_FORMATTER);
        LocalDateTime end = LocalDateTime.parse(endDate, DATE_TIME_FORMATTER);
        long duration = Duration.between(start, end).toMillis();
        LocalDateTime plus = start.plus((long) (Math.random() * duration), ChronoUnit.MILLIS);
        return plus.format(OUTPUT_DATE_TIME_FORMATTER);
    }

    /**
     * 产生单条日志
     *
     * @return
     */
    private static String produceRecord() {
        int size = USER_PHONE_MAP.size();
        // 获取一个[0, size)的随机数
        int fromIdx = new Random().nextInt(size);
        // 通过随机跳过[0, size)个元素随机获取map中的一个key
        String callFrom = USER_PHONE_MAP.entrySet().stream().skip(fromIdx).findFirst().get().getKey();
        // 当被叫人与主叫人相同时则重新随机挑选被叫人
        int toIdx;
        do {
            toIdx = new Random().nextInt(size);
        } while (toIdx == fromIdx);
        String callTo = USER_PHONE_MAP.entrySet().stream().skip(toIdx).findFirst().get().getKey();
        // 随机生成30分钟内的通话时长
        int duration = new Random().nextInt(30 * 60) + 1;
        String durationString = new DecimalFormat("0000").format(duration);
        // 建立通话时间
        String startDate = randomDate("2020-01-01 00:00:00", "2020-12-31 00:00:00");
        // 将信息用逗号拼接
        String log = Lists.newArrayList(callFrom, callTo, startDate, durationString).stream().collect(Collectors.joining(","));
        return log;
    }

    public static void main(String[] args) {
        // 生产日志信息
        while (true) {
            LOGGER.info(LOG_PREFIX + produceRecord());
        }
    }
}

log4j.properties

log4j配置，将日志数据输出到/home/hadoop/applogs/telecomCustomerServiceLog/telecomCustomerService.log文件中。

log4j.rootLogger=info, stdout, file
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%20t]  %-40c(line:%5L)  :  %m%n

log4j.appender.file = org.apache.log4j.FileAppender
log4j.appender.file.File = /home/hadoop/applogs/telecomCustomerServiceLog/telecomCustomerService.log
log4j.appender.file.Encoding=UTF-8
log4j.appender.file.layout=org.apache.log4j.PatternLayout
log4j.appender.file.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%20t]  %-40c(line:%5L)  :  %m%n
log4j.appender.file.append = true

打印日志截图：

输出日志格式为：

TELECOM_CUSTOMER_SERVICE:15064972307,17519874292,20200222131726,1216

“TELECOM_CUSTOMER_SERVICE:”

固定前缀，方便Flume收集时过滤有效信息。

15064972307,17519874292

第一个号码为主叫号码，第二个号码为被叫号码。

20200222131726

建立随机通话时间，格式为yyyyMMddHHmmss。

1216

随机通话时间，单位为秒，随机数在30分钟内，不满四位数则补0。

数据存储服务

日志生产服务产生日志文件后，Flume就会对增加的日志进行正则过滤，然后将日志信息通过log主题写入到kafka，数据消费服务订阅log主题，并消费log中的数据。

引入依赖：

<dependency>
    <groupId>cn.javayuligroupId>
    <artifactId>tcs-commonartifactId>
    <version>1.0version>
dependency>
<dependency>
    <groupId>org.apache.kafkagroupId>
    <artifactId>kafka-clientsartifactId>
    <version>2.8.0version>
dependency>

HBaseConsumer

消费Kafka消息，存储到HBase中。

package cn.javayuli.consumer;

import cn.hutool.setting.dialect.Props;
import cn.javayuli.common.constants.NameConstant;
import cn.javayuli.common.constants.StateConstant;
import cn.javayuli.common.dao.HBaseDao;
import cn.javayuli.common.utils.HBaseUtil;
import com.google.common.collect.Lists;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.time.Duration;
import java.util.Collections;

/**
 * kafka消费者
 *
 * @author hanguilin
 */
public class HBaseConsumer {

    private static final String LOG_PREFIX = "TELECOM_CUSTOMER_SERVICE:";

    public static void main(String[] args) {
        Props kafkaProps = new Props("classpath://kafka.properties");
        KafkaConsumer<String, String> kafkaConsumer = new KafkaConsumer<>(kafkaProps);
        kafkaConsumer.subscribe(Collections.singletonList(kafkaProps.getStr("kafka.topic")));
        HBaseDao hBaseDao = new HBaseDao();
        // 创建表
        String tableName = HBaseUtil.getHBaseProperties("tableName");
        hBaseDao.createTable(tableName, Lists.newArrayList(NameConstant.ACTIVE, NameConstant.PASSIVE));
        byte[] ACTIVE = Bytes.toBytes(NameConstant.ACTIVE);
        byte[] FLAG = Bytes.toBytes(StateConstant.ACTIVE);
        while (true) {
            ConsumerRecords<String, String> records = kafkaConsumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord<String, String> record : records) {
                // 15490732767,19335715448,20200505161114,0271
                String value = record.value().split(LOG_PREFIX)[1].trim();
                String[] split = value.split(",");
                String rowKey = HBaseUtil.genRowKey(split[0], split[2], split[1], StateConstant.ACTIVE, split[3]);
                Put put = new Put(Bytes.toBytes(rowKey));
                put.addColumn(ACTIVE, Bytes.toBytes("call1"), Bytes.toBytes(split[0]));
                put.addColumn(ACTIVE, Bytes.toBytes("call2"), Bytes.toBytes(split[1]));
                put.addColumn(ACTIVE, Bytes.toBytes("date_time"), Bytes.toBytes(split[2]));
                put.addColumn(ACTIVE, Bytes.toBytes("duration"), Bytes.toBytes(split[3]));
                put.addColumn(ACTIVE, Bytes.toBytes("flag"), FLAG);
                hBaseDao.insertRow(tableName, put);
            }
        }
    }
}

resources文件夹下需要kafka.properties、log4j.properties。

kafka.properties

kafka配置文件。

bootstrap.servers=linuxserver:9092
key.deserializer=org.apache.kafka.common.serialization.StringDeserializer
value.deserializer=org.apache.kafka.common.serialization.StringDeserializer
group.id=telecomCustomerServiceGroup
auto.offset.reset=latest
enable.auto.commit=false

kafka.topic=log

log4j.properties

log4j.rootLogger=info, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%5L)  :  %m%n

协处理器服务

HBase中协处理器概念

简而言之跟java中的拦截器类似，可以在各个状态时进行事件处理。

注意HBase1.x与HBase2.x协处理器实现方法的区别。

官方文档：http://hbase.apache.org/2.2/book.html#cp

在本文中的应用为在列族active中插入一条主叫数据之后，协处理器在列族passive中新增加一条被叫数据。

引入依赖：

<dependency>
    <groupId>cn.javayuligroupId>
    <artifactId>tcs-commonartifactId>
    <version>1.0version>
dependency>

设置打包时把用到的jar包都打进来：

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.pluginsgroupId>
            <artifactId>maven-assembly-pluginartifactId>
            <version>3.0.0version>
            <configuration>
                <descriptorRefs>
                    <descriptorRef>jar-with-dependenciesdescriptorRef>
                descriptorRefs>
            configuration>
            <executions>
                <execution>
                    <id>make-assemblyid>
                    <phase>packagephase>
                    <goals>
                        <goal>singlegoal>
                    goals>
                execution>
            executions>
        plugin>
    plugins>
build>

CalleeWriteObserver

package cn.javayuli.coprocessor.observer;

import cn.hutool.core.util.StrUtil;
import cn.hutool.setting.dialect.Props;
import cn.javayuli.common.constants.NameConstant;
import cn.javayuli.common.constants.StateConstant;
import cn.javayuli.common.dao.HBaseDao;
import cn.javayuli.common.utils.HBaseUtil;
import cn.javayuli.common.utils.TimeFormatUtil;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Durability;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Table;
import org.apache.hadoop.hbase.coprocessor.ObserverContext;
import org.apache.hadoop.hbase.coprocessor.RegionCoprocessor;
import org.apache.hadoop.hbase.coprocessor.RegionCoprocessorEnvironment;
import org.apache.hadoop.hbase.coprocessor.RegionObserver;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.hbase.wal.WALEdit;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.IOException;
import java.util.Optional;

/**
 * HBase协处理器，用于实现主叫日志插入成功后，同时插入一条被叫日志
 *
 * @author hanguilin
 */
public class CalleeWriteObserver implements RegionObserver, RegionCoprocessor {

    private static final Logger LOGGER = LoggerFactory.getLogger(CalleeWriteObserver.class);

    private static final byte[] PASSIVE = Bytes.toBytes(NameConstant.PASSIVE);

    private static final byte[] FLAG = Bytes.toBytes(StateConstant.PASSIVE);

    private static final String TABLE = HBaseUtil.getHBaseProperties("tableName");

    /**
     * hbase 2.x需要重写的方法
     *
     * @return
     */
    @Override
    public Optional<RegionObserver> getRegionObserver() {
        return Optional.of(this);
    }

    /**
     * put数据之后执行的操作
     *
     * @param c
     * @param put
     * @param edit
     * @param durability
     * @throws IOException
     */
    @Override
    public void postPut(ObserverContext<RegionCoprocessorEnvironment> c, Put put, WALEdit edit, Durability durability) {
       try {
           String currentTableName = c.getEnvironment().getRegionInfo().getTable().getNameAsString();

           if (!StrUtil.equals(currentTableName, TABLE)) {
               return;
           }
           // 15870580719_20210512142802_18323797211_1_0600
           String originRowKey = Bytes.toString(put.getRow());
           String[] splits = originRowKey.split("_");
           String flag = splits[3];
           if (!StrUtil.equals(StateConstant.ACTIVE, flag)) {
               return;
           }
           String rowKey = HBaseUtil.genRowKey(splits[2], splits[1], splits[0], StateConstant.PASSIVE, splits[4]);
           Put newPut = new Put(rowKey.getBytes());

           newPut.addColumn(PASSIVE, Bytes.toBytes("call1"), Bytes.toBytes(splits[2]));
           newPut.addColumn(PASSIVE, Bytes.toBytes("call2"), Bytes.toBytes(splits[0]));
           newPut.addColumn(PASSIVE, Bytes.toBytes("date_time"), Bytes.toBytes(splits[1]));
           newPut.addColumn(PASSIVE, Bytes.toBytes("duration"), Bytes.toBytes(splits[4]));
           newPut.addColumn(PASSIVE, Bytes.toBytes("flag"), FLAG);
           newPut.addColumn(PASSIVE, Bytes.toBytes("date_time_ts"), Bytes.toBytes(TimeFormatUtil.toTS(splits[1])));
           Table table = c.getEnvironment().getConnection().getTable(TableName.valueOf(TABLE));
           table.put(newPut);
           table.close();
       } catch (IOException e) {
           LOGGER.error(e.getMessage(), e);
       }
    }
}

在resources中添加日志配置文件：

log4j.properties

log4j.rootLogger=info, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%50t]  %-80c(line:%5L)  :  %m%n

数据分析服务

使用MapReduce进行数据离线分析。先从HBase中读取数据，将数据进行计算后存入Mysql表中。

引入依赖：

<dependency>
    <groupId>cn.javayuligroupId>
    <artifactId>tcs-commonartifactId>
    <version>1.0version>
dependency>
<dependency>
    <groupId>org.apache.hadoopgroupId>
    <artifactId>hadoop-mapreduce-client-commonartifactId>
    <version>2.10.1version>
dependency>

AnalysisKey

定义自己的key。

package cn.javayuli.analysis.kv;

import org.apache.hadoop.io.WritableComparable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

/**
 * @author hanguilin
 *
 * 自定义分析数据Key
 */
public class AnalysisKey implements WritableComparable<AnalysisKey> {

    /**
     * 电话
     */
    private String telephone;
    /**
     * 日期
     */
    private String date;

    public AnalysisKey() {
    }

    public AnalysisKey(String telephone, String date) {
        this.telephone = telephone;
        this.date = date;
    }

    public String getTelephone() {
        return telephone;
    }

    public void setTelephone(String telephone) {
        this.telephone = telephone;
    }

    public String getDate() {
        return date;
    }

    public void setDate(String date) {
        this.date = date;
    }

    @Override
    public int compareTo(AnalysisKey o) {
        int result = telephone.compareTo(o.getTelephone());
        if (result == 0) {
            result = date.compareTo(o.getDate());
        }
        return result;
    }

    @Override
    public void write(DataOutput dataOutput) throws IOException {
        dataOutput.writeUTF(telephone);
        dataOutput.writeUTF(date);
    }

    @Override
    public void readFields(DataInput dataInput) throws IOException {
        telephone = dataInput.readUTF();
        date = dataInput.readUTF();
    }
}

AnalysisValue

定义自己的value。

package cn.javayuli.analysis.kv;

import org.apache.hadoop.io.Writable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

/**
 * @author hanguilin
 *
 * 自定义分析数据value
 */
public class AnalysisValue implements Writable {

    /**
     * 通话次数求和
     */
    private String callSum;

    /**
     * 通话时间求和
     */
    private String callDurationSum;

    public AnalysisValue() {
    }

    public AnalysisValue(String callSum, String callDurationSum) {
        this.callSum = callSum;
        this.callDurationSum = callDurationSum;
    }

    public String getCallSum() {
        return callSum;
    }

    public void setCallSum(String callSum) {
        this.callSum = callSum;
    }

    public String getCallDurationSum() {
        return callDurationSum;
    }

    public void setCallDurationSum(String callDurationSum) {
        this.callDurationSum = callDurationSum;
    }

    @Override
    public void write(DataOutput dataOutput) throws IOException {
        dataOutput.writeUTF(callSum);
        dataOutput.writeUTF(callDurationSum);
    }

    @Override
    public void readFields(DataInput dataInput) throws IOException {
        callSum = dataInput.readUTF();
        callDurationSum = dataInput.readUTF();
    }
}

AnalysisMapper

MapReduce中定义的Mapper。

package cn.javayuli.analysis.mapper;

import cn.javayuli.analysis.kv.AnalysisKey;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;

import java.io.IOException;

/**
 * Mapper
 *
 * @author hanguilin
 */
public class AnalysisMapper extends TableMapper<AnalysisKey, Text> {

    @Override
    protected void map(ImmutableBytesWritable key, Result value, Context context) throws IOException, InterruptedException {
        // 19920860202_20201226131016_18503558939_0_1451
        String rowKey = Bytes.toString(key.get());
        String[] split = rowKey.split("_");

        String call1 = split[0];
        String dateTime = split[1];
        String call2 = split[2];
        String duration = split[4];

        String year = dateTime.substring(0, 4);
        String month = dateTime.substring(0, 6);
        String date = dateTime.substring(0, 8);

        // 主叫用户 - 年
        context.write(new AnalysisKey(call1, year), new Text(duration));
        // 主叫用户 - 月
        context.write(new AnalysisKey(call1, month), new Text(duration));
        // 主叫用户 - 日
        context.write(new AnalysisKey(call1, date), new Text(duration));

        // 被叫用户 - 年
        context.write(new AnalysisKey(call2, year), new Text(duration));
        // 被叫用户 - 月
        context.write(new AnalysisKey(call2, month), new Text(duration));
        // 被叫用户 - 日
        context.write(new AnalysisKey(call2, date), new Text(duration));
    }
}

AnalysisReducer

MapReduce中定义的Reducer。

package cn.javayuli.analysis.reducer;

import cn.javayuli.analysis.kv.AnalysisKey;
import cn.javayuli.analysis.kv.AnalysisValue;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

/**
 * @author hanguilin
 *
 * 分析数据Reducer
 */
public class AnalysisReducer extends Reducer<AnalysisKey, Text, AnalysisKey, AnalysisValue> {

    @Override
    protected void reduce(AnalysisKey key, Iterable<Text> values, Context context) throws IOException, InterruptedException {
        int sumCall = 0;
        int sumDuration = 0;
        for (Text value: values) {
            sumCall ++;
            sumDuration += Integer.valueOf(value.toString());
        }

        context.write(key, new AnalysisValue(sumCall + "", sumDuration + ""));
    }
}

AnalysisTool

定义MapReduce工作的配置。

package cn.javayuli.analysis.tool;

import cn.javayuli.analysis.format.MysqlOutputFormat;
import cn.javayuli.analysis.kv.AnalysisKey;
import cn.javayuli.analysis.kv.AnalysisValue;
import cn.javayuli.analysis.mapper.AnalysisMapper;
import cn.javayuli.analysis.reducer.AnalysisReducer;
import cn.javayuli.common.constants.NameConstant;
import cn.javayuli.common.utils.HBaseUtil;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.JobStatus;
import org.apache.hadoop.util.Tool;

/**
 * 分析数据的工具类
 *
 * @author hanguilin
 */
public class AnalysisTool implements Tool {

    private static final String TABLE = HBaseUtil.getHBaseProperties("tableName");

    @Override
    public int run(String[] strings) throws Exception {
        Job job = Job.getInstance();
        job.setJarByClass(this.getClass());
        Scan scan = new Scan();
        scan.addFamily(Bytes.toBytes(NameConstant.ACTIVE));
        // mapper
        TableMapReduceUtil.initTableMapperJob(TABLE, scan, AnalysisMapper.class, AnalysisKey.class, Text.class, job);
        // reducer
        job.setReducerClass(AnalysisReducer.class);
        job.setOutputKeyClass(AnalysisKey.class);
        job.setOutputValueClass(AnalysisValue.class);
        // outputFormat
        job.setOutputFormatClass(MysqlOutputFormat.class);
        return job.waitForCompletion(true) ? JobStatus.State.SUCCEEDED.getValue() : JobStatus.State.FAILED.getValue();
    }

    @Override
    public void setConf(Configuration configuration) {

    }

    @Override
    public Configuration getConf() {
        return null;
    }
}

MysqlOutputFormat

输出到Mysql的实现类。

package cn.javayuli.analysis.format;

import cn.javayuli.analysis.kv.AnalysisKey;
import cn.javayuli.analysis.kv.AnalysisValue;
import cn.javayuli.common.utils.JDBCUtil;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.mapreduce.*;
import org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;
import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.util.HashMap;
import java.util.Map;
import java.util.Optional;

/**
 * 输出到mysql
 *
 * @author hanguilin
 */
public class MysqlOutputFormat extends OutputFormat<AnalysisKey, AnalysisValue> {

    private FileOutputCommitter committer = null;

    protected static class MysqlRecordWriter extends RecordWriter<AnalysisKey, AnalysisValue> {

        /**
         * Mysql连接
         */
        private Connection connection;
        /**
         * 用户信息Map
         */
        private Map<String, Integer> userMap = new HashMap();
        /**
         * 时间维度Map
         */
        private Map<String, Integer> dateMap = new HashMap();

        public MysqlRecordWriter() {
            connection = JDBCUtil.getConnection();
            try (PreparedStatement contactStatement = connection.prepareStatement("select id, telephone from tb_contacts");
                 PreparedStatement dateStatement = connection.prepareStatement("select id, year, month, day from tb_dimension_date")){
                ResultSet contactRs = contactStatement.executeQuery();
                while (contactRs.next()) {
                    Integer id = contactRs.getInt(1);
                    String telephone = contactRs.getString(2);
                    userMap.put(telephone, id);
                }
                ResultSet dateRs = dateStatement.executeQuery();
                while (dateRs.next()) {
                    Integer id = dateRs.getInt(1);
                    String year = dateRs.getString(2);
                    String month = dateRs.getString(3);
                    String day = dateRs.getString(4);
                    if (month.length() == 1) {
                        month = "0" + month;
                    }
                    if (day.length() == 1) {
                        day = "0" + day;
                    }
                    dateMap.put(year + month + day, id);
                }
            } catch (SQLException e) {
                e.printStackTrace();
            }
        }

        @Override
        public void write(AnalysisKey analysisKey, AnalysisValue analysisValue) {
            try (PreparedStatement preparedStatement = connection.prepareStatement("insert into tb_call (id_date_contact, id_date_dimension, id_contact, call_sum, call_duration_sum) values (?, ?, ?, ?, ?)")) {
                Integer idDateDimension = dateMap.get(analysisKey.getDate());
                Integer idContact = userMap.get(analysisKey.getTelephone());
                Integer callSum = Integer.valueOf(analysisValue.getCallSum());
                Integer callDurationSum = Integer.valueOf(analysisValue.getCallDurationSum());
                preparedStatement.setString(1, idDateDimension + "_" + idContact);
                preparedStatement.setInt(2, idDateDimension);
                preparedStatement.setInt(3, idContact);
                preparedStatement.setInt(4, callSum);
                preparedStatement.setInt(5, callDurationSum);
                preparedStatement.executeUpdate();
            } catch (SQLException e) {
                e.printStackTrace();
            }
        }

        @Override
        public void close(TaskAttemptContext taskAttemptContext) {
            if (connection != null) {
                try {
                    connection.close();
                } catch (SQLException e) {
                    e.printStackTrace();
                }
            }
        }
    }

    @Override
    public RecordWriter getRecordWriter(TaskAttemptContext taskAttemptContext) {
        return new MysqlRecordWriter();
    }

    @Override
    public void checkOutputSpecs(JobContext jobContext) {

    }

    public static Path getOutputPath(JobContext job) {
        String name = job.getConfiguration().get(FileOutputFormat.OUTDIR);
        return name == null ? null : new Path(name);
    }

    @Override
    public OutputCommitter getOutputCommitter(TaskAttemptContext taskAttemptContext) {
        return Optional.ofNullable(committer).orElseGet(() -> {
            Path outputPath = getOutputPath(taskAttemptContext);
            FileOutputCommitter fileOutputCommitter = null;
            try {
                fileOutputCommitter = new FileOutputCommitter(outputPath, taskAttemptContext);
            } catch (IOException e) {
                e.printStackTrace();
            }
            return fileOutputCommitter;
        });
    }
}

AnalysisApplication

执行入口。

package cn.javayuli.analysis;

import cn.javayuli.analysis.tool.AnalysisTool;
import org.apache.hadoop.util.ToolRunner;

/**
 * @author hanguilin
 *
 * 分析类执行器
 */
public class AnalysisApplication {

    public static void main(String[] args) throws Exception {
        ToolRunner.run(new AnalysisTool(), args);
    }
}

Web端接口服务

获取mysql中的分析数据，以rest接口暴露给外部。

引入依赖：

<dependencyManagement>
    <dependencies>
        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-dependenciesartifactId>
            <version>2.4.5version>
            <type>pomtype>
            <scope>importscope>
        dependency>
    dependencies>
dependencyManagement>
<dependencies>
    <dependency>
        <groupId>org.springframework.bootgroupId>
        <artifactId>spring-boot-starter-webartifactId>
    dependency>

    <dependency>
        <groupId>com.baomidougroupId>
        <artifactId>mybatis-plus-boot-starterartifactId>
        <version>3.4.2version>
    dependency>

    <dependency>
        <groupId>mysqlgroupId>
        <artifactId>mysql-connector-javaartifactId>
        <version>5.1.21version>
    dependency>

dependencies>

项目结构：

WebMvcConfig

跨域配置。

package cn.javayuli.api.config;

import org.springframework.context.annotation.Configuration;
import org.springframework.web.servlet.config.annotation.CorsRegistry;
import org.springframework.web.servlet.config.annotation.WebMvcConfigurer;

/**
 * @author hanguilin
 *
 * mvc配置
 */
@Configuration
public class WebMvcConfig implements WebMvcConfigurer {

    @Override
    public void addCorsMappings(CorsRegistry registry) {
        registry.addMapping("/**")
                .allowedOrigins("*")
                .allowedMethods("*")
                .allowedHeaders("*")
                .allowCredentials(false);
    }
}

DataOut

值传递类，用于包装返回数据项。

package cn.javayuli.api.vo;

/**
 * @author hanguilin
 *
 * 输出的数据
 */
public class DataOut {

    /**
     * 日期
     */
    private String date;

    /**
     * 通话次数
     */
    private Integer callSum;

    /**
     * 通话总数
     */
    private Integer callDurationSum;

    public String getDate() {
        return date;
    }

    public void setDate(String date) {
        this.date = date;
    }

    public Integer getCallSum() {
        return callSum;
    }

    public void setCallSum(Integer callSum) {
        this.callSum = callSum;
    }

    public Integer getCallDurationSum() {
        return callDurationSum;
    }

    public void setCallDurationSum(Integer callDurationSum) {
        this.callDurationSum = callDurationSum;
    }
}

DataOutWrapper

值传递类，用于包装返回数据项，是对DataOut的进一步封装。

package cn.javayuli.api.vo;

import java.util.List;

/**
 * @author hanguilin
 *
 * 值对象类
 */
public class DataOutWrapper {

    /**
     * 数据
     */
    List<DataOut> data;

    /**
     * 用户名
     */
    String name;

    public DataOutWrapper() {
    }

    public DataOutWrapper(List<DataOut> data, String name) {
        this.data = data;
        this.name = name;
    }

    public List<DataOut> getData() {
        return data;
    }

    public void setData(List<DataOut> data) {
        this.data = data;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }
}

Call

表tb_call对应的实体。

package cn.javayuli.api.entity;

import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;

/**
 * @author hanguilin
 *
 * 通话信息
 */
@TableName("tb_call")
public class Call {

    /**
     * 复合主键（联系人维度id，时间维度id）
     */
    @TableId
    private String idDateContact;

    /**
     * 时间维度id
     */
    private Integer idDateDimension;

    /**
     * 查询人的id
     */
    private Integer idContact;

    /**
     * 通话次数总和
     */
    private Integer callSum;

    /**
     * 通话时长总和
     */
    private Integer callDurationSum;

    public String getIdDateContact() {
        return idDateContact;
    }

    public void setIdDateContact(String idDateContact) {
        this.idDateContact = idDateContact;
    }

    public Integer getIdDateDimension() {
        return idDateDimension;
    }

    public void setIdDateDimension(Integer idDateDimension) {
        this.idDateDimension = idDateDimension;
    }

    public Integer getIdContact() {
        return idContact;
    }

    public void setIdContact(Integer idContact) {
        this.idContact = idContact;
    }

    public Integer getCallSum() {
        return callSum;
    }

    public void setCallSum(Integer callSum) {
        this.callSum = callSum;
    }

    public Integer getCallDurationSum() {
        return callDurationSum;
    }

    public void setCallDurationSum(Integer callDurationSum) {
        this.callDurationSum = callDurationSum;
    }
}

Contacts

表tb_contacts对应的实体。

package cn.javayuli.api.entity;

import com.baomidou.mybatisplus.annotation.IdType;
import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;

/**
 * @author hanguilin
 *
 * 联系人信息
 */
@TableName("tb_contacts")
public class Contacts {

    /**
     * 自增id
     */
    @TableId(type = IdType.AUTO)
    private Integer id;

    /**
     * 号码
     */
    private String telephone;

    /**
     * 用户名
     */
    private String name;

    public Integer getId() {
        return id;
    }

    public void setId(Integer id) {
        this.id = id;
    }

    public String getTelephone() {
        return telephone;
    }

    public void setTelephone(String telephone) {
        this.telephone = telephone;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }
}

DimensionDate

表tb_dimension_date对应的实体。

package cn.javayuli.api.entity;

import cn.hutool.core.collection.CollUtil;
import cn.hutool.core.util.StrUtil;
import com.baomidou.mybatisplus.annotation.IdType;
import com.baomidou.mybatisplus.annotation.TableId;
import com.baomidou.mybatisplus.annotation.TableName;

import java.util.stream.Collectors;

/**
 * @author hanguilin
 *
 * 时间维度
 */
@TableName("tb_dimension_date")
public class DimensionDate {

    /**
     * 自增id
     */
    @TableId(type = IdType.AUTO)
    private Integer id;

    /**
     * 年
     */
    private String year;

    /**
     * 月
     */
    private String month;

    /**
     * 日
     */
    private String day;

    public Integer getId() {
        return id;
    }

    public void setId(Integer id) {
        this.id = id;
    }

    public String getYear() {
        return year;
    }

    public void setYear(String year) {
        this.year = year;
    }

    public String getMonth() {
        return month;
    }

    public void setMonth(String month) {
        this.month = month;
    }

    public String getDay() {
        return day;
    }

    public void setDay(String day) {
        this.day = day;
    }

    /**
     * 获取格式化的日期
     *
     * @return
     */
    public String getFormatDate() {
        if (month.length() == 1) {
            month = "0" + month;
        }
        if (day.length() == 1) {
            day = "0" + day;
        }
       return CollUtil.newArrayList(year, month, day).stream().filter(StrUtil::isNotEmpty).collect(Collectors.joining("-"));
    }
}

CallDao

Call实体对应的dao层接口。

package cn.javayuli.api.dao;

import cn.javayuli.api.entity.Call;
import com.baomidou.mybatisplus.core.mapper.BaseMapper;

/**
 * @author hanguilin
 *
 * 通话信息
 */
public interface CallDao extends BaseMapper<Call> {
}

ContactsDao

Contacts实体对应的dao层接口。

package cn.javayuli.api.dao;

import cn.javayuli.api.entity.Contacts;
import com.baomidou.mybatisplus.core.mapper.BaseMapper;

/**
 * @author hanguilin
 *
 * 联系人信息
 */
public interface ContactsDao extends BaseMapper<Contacts> {
}

DimensionDateDao

DimensionDate实体对应的dao层接口。

package cn.javayuli.api.dao;

import cn.javayuli.api.entity.DimensionDate;
import com.baomidou.mybatisplus.core.mapper.BaseMapper;

/**
 * @author hanguilin
 *
 * 时间维度
 */
public interface DimensionDateDao extends BaseMapper<DimensionDate> {
}

CallService

Call实体对应的业务接口类。

package cn.javayuli.api.service;

import cn.javayuli.api.entity.Call;
import com.baomidou.mybatisplus.extension.service.IService;

/**
 * @author hanguilin
 *
 * 通话信息
 */
public interface CallService extends IService<Call> {
}

ContactsService

Contacts实体对应的业务接口类。

package cn.javayuli.api.service;

import cn.javayuli.api.entity.Contacts;
import com.baomidou.mybatisplus.extension.service.IService;

/**
 * @author hanguilin
 *
 * 联系人信息
 */
public interface ContactsService extends IService<Contacts> {
}

DimensionDateService

DimensionDate实体对应的业务接口类。

package cn.javayuli.api.service;

import cn.javayuli.api.entity.DimensionDate;
import com.baomidou.mybatisplus.extension.service.IService;

/**
 * @author hanguilin
 *
 * 时间维度
 */
public interface DimensionDateService extends IService<DimensionDate> {
}

CallServiceImpl

Call实体对应的业务接口实现类。

package cn.javayuli.api.service.impl;

import cn.javayuli.api.dao.CallDao;
import cn.javayuli.api.entity.Call;
import cn.javayuli.api.service.CallService;
import com.baomidou.mybatisplus.extension.service.impl.ServiceImpl;
import org.springframework.stereotype.Service;

/**
 * @author hanguilin
 *
 * 通话信息
 */
@Service
public class CallServiceImpl extends ServiceImpl<CallDao, Call> implements CallService {
}

ContactsServiceImpl

Contacts实体对应的业务接口实现类。

package cn.javayuli.api.service.impl;

import cn.javayuli.api.dao.ContactsDao;
import cn.javayuli.api.entity.Contacts;
import cn.javayuli.api.service.ContactsService;
import com.baomidou.mybatisplus.extension.service.impl.ServiceImpl;
import org.springframework.stereotype.Service;

/**
 * @author hanguilin
 *
 * 联系人信息
 */
@Service
public class ContactsServiceImpl extends ServiceImpl<ContactsDao, Contacts> implements ContactsService {
}

DimensionDateServiceImpl

DimensionDate实体对应的业务接口实现类。

package cn.javayuli.api.service.impl;

import cn.javayuli.api.dao.DimensionDateDao;
import cn.javayuli.api.entity.DimensionDate;
import cn.javayuli.api.service.DimensionDateService;
import com.baomidou.mybatisplus.extension.service.impl.ServiceImpl;
import org.springframework.stereotype.Service;

/**
 * @author hanguilin
 *
 * 时间维度
 */
@Service
public class DimensionDateServiceImpl extends ServiceImpl<DimensionDateDao, DimensionDate> implements DimensionDateService {
}

EchartsController

接口类。

package cn.javayuli.api.controller;

import cn.javayuli.api.entity.Call;
import cn.javayuli.api.entity.Contacts;
import cn.javayuli.api.entity.DimensionDate;
import cn.javayuli.api.service.CallService;
import cn.javayuli.api.service.ContactsService;
import cn.javayuli.api.service.DimensionDateService;
import cn.javayuli.api.vo.DataOut;
import cn.javayuli.api.vo.DataOutWrapper;
import com.baomidou.mybatisplus.core.toolkit.Wrappers;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.function.Function;
import java.util.stream.Collectors;

/**
 * @author hanguilin
 *
 * 控制器
 */
@RestController
@RequestMapping("/web")
public class EchartsController {

    @Autowired
    private DimensionDateService dimensionDateService;

    @Autowired
    private CallService callService;

    @Autowired
    private ContactsService contactsService;

    /**
     * 根据用户和日期维度查询数据
     *
     * @param type 类型
     * @param phone 用户号码
     * @return
     */
    @GetMapping("/data/{type}/{phone}")
    public DataOutWrapper getData(@PathVariable String type, @PathVariable String phone) {
        Contacts contacts = contactsService.getOne(Wrappers.lambdaQuery(Contacts.class).eq(Contacts::getTelephone, phone));
        if (contacts == null) {
            return null;
        }
        List<DimensionDate> dimensionDates;
        // 根据type去查询dimensionDate表中的数据
        switch (type) {
            case "year":
                dimensionDates = dimensionDateService.list(Wrappers.lambdaQuery(DimensionDate.class).eq(DimensionDate::getMonth, "").eq(DimensionDate::getDay, ""));
                break;
            case "month":
                dimensionDates = dimensionDateService.list(Wrappers.lambdaQuery(DimensionDate.class).ne(DimensionDate::getMonth, "").eq(DimensionDate::getDay, ""));
                break;
            case "day":
                dimensionDates = dimensionDateService.list(Wrappers.lambdaQuery(DimensionDate.class).ne(DimensionDate::getMonth, "").ne(DimensionDate::getDay, ""));
                break;
            default:
                throw new RuntimeException("no type to query");
        }
        // 将DimensionDate数据转为key为DimensionDate记录的id,value为DimensionDate的map
        Map<Integer, DimensionDate> dimensionDateMap = dimensionDates.stream().collect(Collectors.toMap(DimensionDate::getId, Function.identity()));
        Integer contactsId = contacts.getId();
        // 将DimensionDate的id拼接contactsId
        List<String> callIdList = dimensionDateMap.keySet().stream().map(o -> o + "_" + contactsId).collect(Collectors.toList());
        // 查找call数据
        List<Call> callList = callService.list(Wrappers.lambdaQuery(Call.class).in(Call::getIdDateContact, callIdList));
        List<DataOut> dataOuts = callList.stream().map(o -> {
            DimensionDate dimensionDate = dimensionDateMap.get(o.getIdDateDimension());
            DataOut dataOut = new DataOut();
            dataOut.setDate(dimensionDate.getFormatDate());
            dataOut.setCallSum(o.getCallSum());
            dataOut.setCallDurationSum(o.getCallDurationSum());
            return dataOut;
        }).sorted(Comparator.comparing(DataOut::getDate)).collect(Collectors.toList());
        return new DataOutWrapper(dataOuts, contacts.getName());
    }

    /**
     * 获取所有用户
     *
     * @return
     */
    @GetMapping("/data/contacts")
    public List<Contacts> getContacts(){
        return contactsService.list();
    }
}

WebApplication

SpringBoot项目启动类。

package cn.javayuli.api;

import org.mybatis.spring.annotation.MapperScan;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;

/**
 * @author hanguilin
 *
 * 启动类
 */
@SpringBootApplication
@MapperScan({"cn.javayuli.api.dao"})
public class WebApplication {

    public static void main(String[] args) {
        SpringApplication.run(WebApplication.class, args);
    }
}

Web界面服务

实现简单的查询和报表功能。使用Vue+ElementUI+Echarts+Axios。

index.html

<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>电信客服title>
    
    <script src="https://unpkg.com/vue/dist/vue.js">script>
    
    <script src="https://unpkg.com/axios/dist/axios.min.js">script>
    
    <link rel="stylesheet" href="https://unpkg.com/element-ui/lib/theme-chalk/index.css">
    
    <script src="https://unpkg.com/element-ui/lib/index.js">script>
    
    <script src="https://cdn.bootcdn.net/ajax/libs/echarts/5.1.0/echarts.js">script>
    <style>
        #my-echarts {
            margin-top: 10vh;
        }
        .el-select {
            width: 90%
        }
        #echarts,
        #echarts2 {
            margin: 20px 0;
            height: 300px;
        }
    style>
head>

<body>
    <div id="my-echarts">
        <el-row>
            <el-col :span="8" :offset=8>
                <el-form ref="form" :model="form">
                    <el-row>
                        <el-col :span="10">
                            <el-select v-model="form.type" placeholder="请选择时间维度">
                                <el-option v-for="item in optionsType" :key="item.value" :label="item.label"
                                    :value="item.value">el-option>
                            el-select>
                        el-col>
                        <el-col :span="10">
                            <el-select v-model="form.phone" filterable placeholder="请选择查询用户">
                                <el-option v-for="item in optionsContacts" :key="item.value" :label="item.label"
                                    :value="item.value">el-option>
                            el-select>
                        el-col>
                        <el-col :span="4">
                            <el-button type="primary" icon="el-icon-search" @click="request">搜索el-button>
                        el-col>
                    el-row>
                    <el-row>
                        <el-col :span=24>
                            <div id="echarts">div>
                            <div id="echarts2">div>
                        el-col>
                    el-row>
                el-form>
            el-col>
        el-row>
    div>

    <script>
        new Vue({
            el: '#my-echarts',
            data() {
                return {
                    form: {
                        type: 'month',
                        phone: '18944239644'
                    },
                    optionsContacts: [],
                    optionsType: [{
                        label: '年',
                        value: 'year'
                    }, {
                        label: '月',
                        value: 'month'
                    }, {
                        label: '日',
                        value: 'day'
                    }]
                }
            },
            mounted() {
                this.request()
                this.requestContacts()
            },
            methods: {
                initEcharts(id, xData, data, title, name) {
                    var chartDom = document.getElementById(id);
                    var myChart = echarts.init(chartDom);
                    var option;

                    option = {
                        title: {
                            text: title,
                            left: "left",
                            textStyle: {
                                fontSize: 20
                            }
                        },
                        dataZoom: [
                            {
                                id: 'dataZoomX',
                                type: 'slider',
                                xAxisIndex: [0],
                                filterMode: 'filter'
                            }
                        ],
                        xAxis: {
                            type: 'category',
                            data: xData
                        },
                        yAxis: {
                            name: name,
                            type: 'value'
                        },
                        tooltip: {
                            show: true,
                            trigger: 'axis'
                        },
                        series: [{
                            data: data,
                            type: 'line',
                            smooth: true,
                            name: name
                        }]
                    };

                    option && myChart.setOption(option);
                },
                request() {
                    axios.get(`http://localhost:8000/web/data/${this.form.type}/${this.form.phone}`).then(({ data }) => {
                        let dateArr = data.data.map(o => o.date)
                        let callSumArr = data.data.map(o => o.callSum)
                        let callSumDurationArr = data.data.map(o => o.callDurationSum)
                        this.initEcharts('echarts', dateArr, callSumArr, '通话次数统计', '次数')
                        this.initEcharts('echarts2', dateArr, callSumDurationArr, '通话时长统计', '秒数')
                    })
                },
                requestContacts() {
                    axios.get(`http://localhost:8000/web/data/contacts`).then(({ data }) => {
                        this.optionsContacts = data.map(e => {
                            return {
                                label: e.telephone + ' ' + e.name,
                                value: e.telephone
                            }
                        })
                    })
                }
            }
        })
    script>
body>

html>

项目启动/部署

在安装过程中，我们用到的框架（Hadoop、Zookeeper、kafka、Flume、HBase）都已经启动起来了。

由于本例中Flume监听的是本地文件系统中的日志文件，所以生产日志服务需要和Flume在同一个服务器。

协处理器

1、将tcs-consumer-coprocessor项目打成jar包

2、将tcs-consumer-coprocessor-1.0-jar-with-dependencies.jar上传至centos服务器中, 并重命名

mv tcs-consumer-coprocessor-1.0-jar-with-dependencies.jar tcs-consumer-coprocessor-1.0.jar

3、创建hdfs中菜单

hdfs dfs -mkdir -p /user/hadoop/hbase/coprocessor

4、将jar包放入hdfs文件系统中

hdfs dfs -put tcs-consumer-coprocessor-1.0.jar /user/hadoop/hbase/coprocessor

生产日志

1、将tcs-producer项目打成jar包

2、将tcs-producer-1.0-jar-with-dependencies.jar上传至centos服务器中

3、运行程序

java -cp tcs-producer-1.0-jar-with-dependencies.jar 'cn.javayuli.producer.ProduceLog'

由于程序中是死循环，所以控制台会源源不断的打印日志。

运行此程序后，Flume通过监听日志文件就可以将日志发送到Kafka。

数据存储

tcs-consumer可以直接在本地运行，直接运行main函数即可。

或者打成jar包上传至服务器，然后使用java -cp命令运行即可。

运行此程序后，会将Kafka中的消息经过处理后存入HBase。

此处向HBase插入数据容易出错，分享两篇对我很有帮助的文章：

1、HBase2.X的修复工具hbck2《Hbase HBCK2》

2、HBase中的Shell命令《HBase Shell命令大全》

数据分析

tcs-analysis可以在本地windows中运行，也可以打包到centos中使用java -cp运行。本例为了方便调试，所以直接在widows的idea中运行。在windwos中运行MapReduce程序，需要一些配置：

1、将hadoop-2.10.1.tar.gz下载到windows中并解压

2、下载winutils，解压后如图：

本例中hadoop版本为2.10.1，此处winutils中对应的最近的只有2.8.1版本的插件，但是经测试无问题。

将hadoop-2.8.1中的winutils.exe与hadoop.dll文件复制到hadoop-2.10.1/bin中。

3、配置环境变量

新增HADOOP_HOME，值为Hadoop解压的文件夹，即hadoop-2.10.1文件夹，并在path中添加%HADOOP_HOME%\bin。

重启你的编辑器（IDEA/Eclipse/***），并运行AnalysisApplication类中的main函数，此时就会将Hadoop中的数据经过MapReduce计算后存入到Mysql中。

Web接口服务

tcs-api服务可以直接在编辑器中运行WebApplication类来启动服务，或者打成jar包之后使用java -jar命令来运行。

功能浏览

浏览器tcs-web/index.html打开。可以通过时间维度、用户维度查询通话次数统计及通话时长统计。

资源地址

GitHub：https://github.com/hanguilin/big-data/tree/main/TelecomCustomerService

Gitee：https://gitee.com/hanguilin/big-data/tree/main/TelecomCustomerService

你可能感兴趣的:(大数据,flume,kafka,hbase,hadoop,mapreduce)

Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
Hive简介
文章目录Hive简介Hive特点Hive和RDBMS的对比Hive的架构Hive的数据组织Hive数据类型Hive简介1、Hive由Facebook实现并开源2、是基于Hadoop的一个数据仓库工具3、可以将结构化的数据映射为一张数据库表4、并提供HQL(HiveSQL)查询功能5、底层数据是存储在HDFS上6、Hive的本质是将SQL语句转换为MapReduce任务运行7、使不熟悉MapRedu
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
HIVE（二） 2301_78012738 hive 数据仓库
目录访问HIVE的三种方式DDLDML数据操作向表中装载数据数据导出常用函数Like和RLike分组Join排序分区表和分桶表访问HIVE的三种方式启动Hive命令，CtrlC退出客户端，执行测试语句，与sql一致[wyc@hadoop102hive]$bin/hive经验小结：在hive中执行语句报错：ExecutionError,returncode2fromorg.apache.hadoop
如何通过YashanDB优化企业大数据处理流程数据库
在当今数据驱动的商业环境中，企业面临着巨大的数据处理挑战。性能瓶颈、数据一致性问题和可扩展性需求使得大数据处理成为一项复杂任务。作为一种新兴的数据库管理系统，YashanDB以其独特的架构设计和强大的数据处理能力，在解决这些挑战方面提供了有效的手段。本文旨在探讨如何利用YashanDB优化大数据处理流程，为企业提供高效、可靠的解决方案。YashanDB的体系架构与部署形态YashanDB支持多种部
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
Kafka系列之：安装具有安全认证的kafka-2.8.2分布式集群快乐骑行^_^ 大数据 Kafka系列安全认证 kafka-2.8.2 分布式集群
Kafka系列之：安装具有安全认证的kafka-2.8.2分布式集群一、下载Zookeeper3.7.1和Kafka2.8.2二、解压Zookeeper3.7.1和Kafka2.8.2三、安装Zookeeper3.7.1详细步骤1.修改zookeeper配置文件2.创建zookeeper数据目录3.zookeeper创建myid4.设置zookeeper访问kafka认证5.拷贝zookeeper
rdkafka线程过多_我是如何处理大并发量订单处理的 KafKa部署总结 weixin_39574928 rdkafka线程过多
今天要介绍的是消息中间件KafKa，应该说是一个很牛的中间件吧，背靠Apache与很多有名的中间件搭配起来用效果更好哦，为什么不用RabbitMQ，因为公司需要它。网上已经有很多怎么用和用到哪的内容，但结果很多人都倒在了入门第一步环境都搭不起来，可谓是从了解到放弃，所以在此特记录如何在linux环境搭建，windows中配置一样，只是启动运行bat文件。想要用它就先必须了解它能做什么及能做到什么程
【Kafka】Failed to send data to Kafka: Expiring 30 record(s) for xxx 732453 ms has passed since last 九师兄 kafka big data zookeeper
文章目录1.美图2.背景2.尝试方案13.尝试解决24.场景再现25.场景46.场景57.场景78.场景8M.拓展本文为博主九师兄（QQ:541711153欢迎来探讨技术）原创文章，未经允许博主不允许转载。1.美图问题与【Flink】Flink写入kafka报错FailedtosenddatatoKafka:Expiring4record(s)for20001mshaspassed重复了。2.背景
【Flink】flink Kafka报错 : Failed to send data to Kafka: This server is not the leader for that topic-pa 九师兄 flink kafka 大数据
1.背景出现这个问题的背景请参考：【Kafka】FailedtosenddatatoKafka:Expiring30record(s)forxxx732453mshaspassedsincelast[2020-09-0513:16:09
如何通过YashanDB提升客户体验数据库
如何优化查询速度？这是许多企业在使用数据库技术时常常会遇到的问题。查询速度的快慢直接影响到用户的体验，尤其是在大数据量和高并发的使用场景中。顾客期望迅速获取信息，若响应时间过长，可能导致客户流失。因此，优化数据库的性能成为提升客户体验的关键举措之一。YashanDB作为一种高性能的数据库技术架构，提供了多种优化机制，以提升系统的查询速度和整体处理能力。多种部署架构YashanDB支持多种部署架构，
如何通过YashanDB数据库实现企业级数据分区管理？数据库
在当今大数据时代，企业面临着海量数据的管理和优化访问的问题。如何有效地组织和划分庞大的数据集，以提升查询性能和运维效率，成为数据库系统设计的核心挑战。数据分区技术作为解决大规模数据处理的关键手段，能够显著减少无关数据的访问，优化资源利用率。本文聚焦于YashanDB数据库，详细解析其数据分区管理的实现机制及应用，为企业级应用提供高效、灵活的数据分区解决方案。YashanDB中的数据分区基础Yash
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后