TUJC

出行大数据项目一

出行大数据一

1、项目概述

随着人们对出行的需求日益增加，出行的安全问题，出行的便捷问题等问题日益突出，特别是安全出行是我们每个人都迫切需要的，为了增加出行的编辑，提高出行的安全，对我们乘车的细节以及发生点我们迫切的需要及时知道，为此特地通过大数据的手段来处理我们海量的出行数据。
做到：
- 订单的实时监控，
- 乘车轨迹的的细节回放，
- 虚拟车站的科学制定，
- 出行迁途的细节过程，
- 订单报表的大屏展示，
- 用户乘车行为统计
- 用户画像等功能，
实现用户的出行统计，制定用户的的“杀熟”策略等。

2、技术架构选型

数据主要分为两部分：

第一部分为日志数据，主要是司机端APP每隔一定时间上报经纬度坐标信息，以日志数据的形式进行打印到日志服务器。
第二部分数据为业务库数据，主要是存储在mysql，通过分库的形式将各个不同城市的数据存储在不同的业务库里面。

2.1、数据采集功能如何技术选型

数据采集框架很多，包括sqoop, datax, flume, logstash, maxwell, canal等各种数据采集框架适用场景不同，功能描述如以下表格。

采集框架名称	主要功能
Sqoop	大数据平台和关系型数据库的导入导出
datax	大数据平台和关系型数据库的导入导出
flume	擅长日志数据的采集和解析
logstash	擅长日志数据的采集和解析
maxwell	常用作实时解析mysql的binlog数据
canal	常用作实时解析mysql的binlog数据

2.2、消息中间件的技术选型

市面上成熟的消息中间件技术框架也有很多，主要有以下各种消息中间件

开源MQ	概述
1.RabbitMQ	LShift 用Erlang实现，支持多协议，broker架构，重量级
2.ZeroMQ	AMQP最初设计者iMatix公司实现，轻量消息内核，无broker设计。C++实现
3.Jafka/Kafka	LinkedIn用Scala语言实现，支持hadoop数据并行加载
4.ActiveMQ	Apach的一种JMS具体实现，支持代理和p2p部署。支持多协议。Java实现
5.Redis	Key-value NoSQL数据库，有MQ的功能
6.MemcacheQ	国人利用memcache缓冲队列协议开发的消息队列,C/C++实现

2.3、实时流式处理技术选型

流式处理技术已经非常成熟，且各大框架都有提供很多种选择，以下是各种流式处理技术选型技术对比

框架名称	框架介绍
Storm	Twitter公司开源提供，早期的流失计算框架，基本已经退出大数据的舞台
SparkStreaming	当下最火热的流失处理技术之一
Flink	流式计算
Blink 流式计算	阿里二次开发的Flink框架

2.4、数据永久存储技术框架选型

数据永久存储框架也有很多，比较常见的例如Hbase，kudu，HDFS等

框架名称	主要用途
HDFS	分布式文件存储系统
Hbase	Key，value对的nosql数据库
Kudu	Cloudera公司开源提供的类似于Hbase的数据存储

2.5、数据离线计算框架技术选型

离线统计的框架也非常多，主要就是基于各种OLAP场景的应用计算

框架名称	基本介绍
MapReduce	最早期的分布式文件计算系统
hive	基于MR的数据仓库工具
impala	号称当前大数据领域最快的sql on hadoop框架，内存消耗特别大
SparkSQL	基于spark，一站式解决批流处理问题
FlinkSQL	基于flink，一站式解决批流处理问题
druid	针对时间序列数据提供低延迟的数据写入以及快速交互式查询的分布式OLAP数据库
kylin	基于Hbase实现的预计算
presto	分布式SQL查询引擎，用于查询分布在一个或多个不同数据源中的大数据集
clickHouse	俄罗斯开源提供的一个OLAP分析框架

3、日志数据格式说明
现在主要用到成都数据以及海口数据，针对成都以及海口数据字段说明如下
成都轨迹数据格式说明：一共5个字段
一共五个字段，字段详情参见下表，字段之间使用逗号隔开。

注意：上区域的中所体现的OD数据是相比全城是很小的量，不能反映全城的供需情况
目前得到的轨迹数据中可以看到时间不是按照递增的方式进行排列，在进行数据处理时需要先对数据按照时间进行升序排列(轨迹点的产生的时间是递增的，从时间的角度才能看出轨迹的运行规律),排序后便于在地图上进行轨迹的呈现.

海口订单数据格式说明：一共24个字段
海口订单数据一共24个字段，字段之间使用\t制表符分开，字段详情参见下表

开放城市：海口
开放范围：2017年5月1日 - 2017年10月31日
数据内容：上述时间范围内的海口市每天订单数据，包含订单的起终点经纬度以及订单类型、出行品类、乘车人数的订单属性数据。其中所有涉及个人信息的数据都经过了匿名化处理。

保留起终点经纬度小数点后四位，可能导致与真实环境坐标存在偏差，误差范围大概在十几米到几十米左右。

针对独门独户上下车点进行技术脱敏处理，将上下车点漂移到小区门口或街道上。

4、项目构建

1、构建父工程travel项目
- 第一步：创建maven父工程travel,
  创建maven顶级父工程travel，并导入jar包
2、构建子模块travel_common模块，用于存放工具类
- 第一步：创建common模块，用于存放工具类
- 第二步：travel_common模块添加maven依赖坐标
  在travel_common模块下添加坐标依赖
- 第三步：travel_common模块添加相应工具类
  将java以及scala以及config.properties等相应工具类拷贝到travel_common模块当中去
- 第四步：更改config.properties当中的IP地址
  将config.properties当中的IP地址全部更改替换成为自己的对应的IP地址
3、构建travel-web模块
继续构建我们的travel-web模块用于展示我们的web界面
- 第一步：在父工程下面添加子模块travel_web
  在travel父工程下面构建travel_web子模块
- 第二步：添加pom.xml坐标
- 第三步：拷贝资源文件以及web模块代码
  将我们附件当中的资源文件以及web模块的代码拷贝到工程当中来
  将我们的静态资源页面拷贝到resources路径下
- 第四步：启动travel_web项目并访问
  构建好的travel_web项目主要是用于我们的数据界面展示，我们可以启动web模块，并访问页面
4、构建travel_spark模块
- 构建travel_spark子模块，用于实现首页概览，订单监控，轨迹监控，虚拟车站，用户数据，热力图等功能模块的开发
- 第一步：在父工程travel下面添加子模块travel_spark
- 第二步：添加pom.xml坐标依赖
- 第三步：拷贝资源文件夹以及scala和java辅助代码
  - 将我们的辅助代码拷贝到对应的目录下，将对应的java代码，scala代码以及对应的目录下

5、日志数据回放模块

通过回放我们的成都以及海口数据，使用flume采集我们的日志数据，然后将数据放入到kafka当中去，通过sparkStreaming消费我们的kafka当中的数据，然后将数据保存到hbase，并且将海口数据保存到redis当中去，实现实时轨迹监控以及历史轨迹回放的功能

为了模拟数据的实时生成，我们可以通过数据回放程序来实现订单数据的回放功能，主要数据参见课件当中的数据，我们这里主要使用到了成都以及海口的数据来实现数据的回放

第一步：上传数据到服务器

将海口数据上传到node01服务器的/kkb/datas/sourcefile这个路径下
node01执行以下命令创建文件夹，然后上传数据

mkdir -p /kkb/datas/sourcefile

将成都数据上传到node02服务器的/kkb/datas/sorucefile这个路径下
node02执行以下命令创建文件夹，然后上传数据

mkdir -p /kkb/datas/sourcefile

第二步：通过脚本回放数据

使用课件当中的FileOperate-1.0-SNAPSHOT-jar-with-dependencies.jar这个jar包来实现数据的读取然后写入到另外一个文件当中去
将FileOperate-1.0-SNAPSHOT-jar-with-dependencies.jar 这个jar包上传到node01服务器的/home/hadoop路径下去

在node01服务器的/home/hadoop/bin路径下创建shell脚本，用于数据的回放

cd /home/hadoop/bin
vim start_stop_generate_data.sh

#!/bin/bash
scp /home/hadoop/FileOperate-1.0-SNAPSHOT-jar-with-dependencies.jar  node02:/home/hadoop/
#休眠时间控制
sleepTime=1000

if [ ! -n "$2" ];then
 echo ""
 else
 sleepTime=$2
fi
case $1 in
"start" ){
 for i in  node01 node02
  do
    echo "-----------$i启动数据回放--------------"
      ssh $i "source /etc/profile;nohup java -jar /home/hadoop/FileOperate-1.0-SNAPSHOT-jar-with-dependencies.jar /kkb/datas/sourcefile /kkb/datas/destfile $2   > /dev/null 2>&1 & "
   
  done
};;
"stop"){
  for i in node02 node01
    do
      echo "-----------停止 $i 数据回放-------------"
      ssh $i "source /etc/profile; ps -ef | grep FileOperate-1.0-SNAPSHOT-jar | grep -v grep |awk '{print \$2}' | xargs kill"
    done
};;
esac
给脚本赋予执行权限
cd /home/hadoop/bin
chmod 777 start_stop_generate_data.sh

第三步：通过flume来采集数据

node01开发flume的配置文件

cd /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf/
vim flume_client.conf

a1.sources = r1
a1.sinks = k1
a1.channels = c1
# Describe/configure the source
#配置source
a1.sources.r1.type = taildir
a1.sources.r1.positionFile = /kkb/datas/flume_temp/flume_posit/haikou.json
a1.sources.r1.filegroups = f1
a1.sources.r1.filegroups.f1 = /kkb/datas/destfile/part.+
a1.sources.r1.fileHeader = true
a1.sources.r1.channels = c1
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = static
##  static拦截器的功能就是往采集到的数据的header中插入自己定## 义的key-value对
a1.sources.r1.interceptors.i1.key = type
a1.sources.r1.interceptors.i1.value = hai_kou_gps_topic
#flume监听轨迹文件内容的变化 tuch gps
#配置sink
#a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
#flume监听的文件数据发送到此kafka的主题当中
#a1.sinks.k1.topic = hai_kou_gps_topic
#a1.sinks.k1.brokerList= node01:9092,node02:9092,node03:9092
#a1.sinks.k1.batchSize = 20
#a1.sinks.k1.requiredAcks = 1
#a1.sinks.k1.producer.linger.ms = 1

#配置sink

a1.sinks.k1.type = avro
a1.sinks.k1.hostname = node03
a1.sinks.k1.port = 41414
#配置channel
a1.channels.c1.type = file
#检查点文件目录
a1.channels.c1.checkpointDir=/kkb/datas/flume_temp/flume_check
#缓存数据文件夹
a1.channels.c1.dataDirs=/kkb/datas/flume_temp/flume_cache
# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

node02开发flume的配置文件

cd /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf/
vim flume_client.conf

a1.sources = r1
a1.sinks = k1
a1.channels = c1
# Describe/configure the source
#配置source
a1.sources.r1.type = taildir
a1.sources.r1.positionFile = /kkb/datas/flume_temp/flume_posit/chengdu.json
a1.sources.r1.filegroups = f1
a1.sources.r1.filegroups.f1 = /kkb/datas/destfile/part.+
a1.sources.r1.fileHeader = true
a1.sources.r1.channels = c1
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = static
##  static拦截器的功能就是往采集到的数据的header中插入自己定## 义的key-value对
a1.sources.r1.interceptors.i1.key = type
a1.sources.r1.interceptors.i1.value = cheng_du_gps_topic
#flume监听轨迹文件内容的变化 tuch gps
#配置sink
#a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
#flume监听的文件数据发送到此kafka的主题当中
#a1.sinks.k1.topic = cheng_du_gps_topic
#a1.sinks.k1.brokerList= node01:9092,node02:9092,node03:9092
#a1.sinks.k1.batchSize = 20
#a1.sinks.k1.requiredAcks = 1
#a1.sinks.k1.producer.linger.ms = 1

a1.sinks.k1.type = avro
a1.sinks.k1.hostname = node03
a1.sinks.k1.port = 41414

#配置channel
a1.channels.c1.type = file
#检查点文件目录
a1.channels.c1.checkpointDir=/kkb/datas/flume_temp/flume_check
#缓存数据文件夹
a1.channels.c1.dataDirs=/kkb/datas/flume_temp/flume_cache

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

node03开发flume的配置文件

cd /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf/
vim flume2kafka.conf

a1.sources = r1
a1.sinks = k1
a1.channels = c1
#定义source
a1.sources.r1.type = avro
a1.sources.r1.bind = node03
a1.sources.r1.port =41414
#添加时间拦截器
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = org.apache.flume.interceptor.TimestampInterceptor$Builder
#定义channels
#配置channel
a1.channels.c1.type = file
#检查点文件目录
a1.channels.c1.checkpointDir=/kkb/datas/flume_temp/flume_check
#缓存数据文件夹
a1.channels.c1.dataDirs=/kkb/datas/flume_temp/flume_cache
#定义sink
#flume监听轨迹文件内容的变化 tuch gps
#配置sink
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
flume监听的文件数据发送到此kafka的主题当中
a1.sinks.k1.topic = %{type}
a1.sinks.k1.brokerList= node01:9092,node02:9092,node03:9092
a1.sinks.k1.batchSize = 20
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.producer.linger.ms = 1
#组装source、channel、sink
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

第四步：开发flume启动停止脚本

node01执行以下命令开发flume的启动停止脚本

cd /home/hadoop/bin/
vim flume_start_stop.sh

#!/bin/bash
case $1 in 
"start" ){
 for i in node03 node02 node01
  do
    echo "-----------启动 $i 采集flume-------------"
    if [ "node03" = $i ];then
      ssh $i "source /etc/profile;nohup /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/bin/flume-ng agent -n a1 -c /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf -f /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf/flume2kafka.conf -Dflume.root.logger=info,console > /dev/null 2>&1 & "
    else 
      ssh $i "source /etc/profile;nohup /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/bin/flume-ng agent -n a1 -c /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf -f /kkb/install/apache-flume-1.6.0-cdh5.14.2-bin/conf/flume_client.conf -Dflume.root.logger=info,console > /dev/null 2>&1 &  "
    fi
  done
};;
"stop"){
  for i in node03 node02 node01
    do
      echo "-----------停止 $i 采集flume-------------"
      ssh $i "source /etc/profile; ps -ef | grep flume | grep -v grep |awk '{print \$2}' | xargs kill"
    done
};;
esac

chmod 777  flume_start_stop.sh

第五步：创建kafka的topic

node01执行以下命令创建kafka的topic

cd /kkb/install/kafka_2.11-1.1.0/
bin/kafka-topics.sh --create --zookeeper node01:2181 --replication-factor 2 --partitions 9 --topic cheng_du_gps_topic
bin/kafka-topics.sh --create --zookeeper node01:2181 --replication-factor 2 --partitions 9 --topic hai_kou_gps_topic

第六步：启动订单回放脚本以及fume采集脚本

node01执行以下命令启动订单回放脚本

cd /home/hadoop/bin/
sh start_stop_generate_data.sh start 3000

node01启动flume采集数据脚本

cd /home/hadoop/bin/
sh flume_start_stop.sh start

第七步：消费kafka数据，验证数据进入到kafka当中

node01执行以下命令消费kafka当中的数据

cd /kkb/install/kafka_2.11-1.1.0/
bin/kafka-console-consumer.sh --topic cheng_du_gps_topic  --zookeeper node01:2181,node02:2181,node03:2181

bin/kafka-console-consumer.sh --topic hai_kou_gps_topic  --zookeeper node01:2181,node02:2181,node03:2181

6、轨迹监控模块

轨迹监控模块业务说明：对于正在出行的订单，我们需要将数据保存起来，实时的实现订单轨迹的监控回放。

数据处理过程：

通过sparkStreaming实现消费kafka当中的数据，然后将海口以及成都数据全部都保存到Hbase对应的表当中去。
将海口数据的GPS位置经纬度信息保存到redis当中去，实现实时轨迹监控以及历史轨迹回放等功能。
通过Hbase的海口数据，实现虚拟车站的统计功能。
自主维护sparkStreaming消费kafka的offset值。

6.1、开发轨迹监控模块

通过sparkStreaming程序消费kafak当中的成都以及海口的数据，并将数据保存到redis和hbase当中去，实现实时轨迹监控模块的功能。

在travel_spark模块的scala下面的com.travel.programApp这个package下面，创建scala的object代码StreamingKafka


import com.travel.common.{ConfigUtil, Constants, HBaseUtil, JedisUtil}
import com.travel.loggings.Logging
import com.travel.utils.HbaseTools
import org.apache.hadoop.hbase.client.{Admin, Connection}
import org.apache.hadoop.hbase.{HColumnDescriptor, HTableDescriptor, TableName}
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.common.serialization.StringDeserializer
import org.apache.spark.sql.SparkSession
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.kafka010.{HasOffsetRanges, OffsetRange}
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.{SparkConf, SparkContext}
import redis.clients.jedis.Jedis

object StreamingKafka  extends Logging{

  def main(args: Array[String]): Unit = {
    val brokers = ConfigUtil.getConfig(Constants.KAFKA_BOOTSTRAP_SERVERS)
    val topics = Array(ConfigUtil.getConfig(Constants.CHENG_DU_GPS_TOPIC),ConfigUtil.getConfig(Constants.HAI_KOU_GPS_TOPIC))
    val conf = new SparkConf().setMaster("local[1]").setAppName("sparkKafka")
    val group:String = "gps_consum_group"
    val kafkaParams = Map[String, Object](
      "bootstrap.servers" -> brokers,
      "key.deserializer" -> classOf[StringDeserializer],
      "value.deserializer" -> classOf[StringDeserializer],
      "group.id" -> group,
      "auto.offset.reset" -> "latest",// earliest,latest,和none
      "enable.auto.commit" -> (false: java.lang.Boolean)
    )
    val sparkSession: SparkSession = SparkSession.builder().config(conf).getOrCreate()
    val context: SparkContext = sparkSession.sparkContext
    context.setLogLevel("WARN")
   // val streamingContext = new StreamingContext(conf,Seconds(5))
    //获取streamingContext
    val streamingContext: StreamingContext =  new StreamingContext(context,Seconds(1))
    val result: InputDStream[ConsumerRecord[String, String]] = HbaseTools.getStreamingContextFromHBase(streamingContext,kafkaParams,topics,group,"(.*)gps_topic")
    /**
      * 将数据保存到HBase当中去，以及将成都的数据，保存到redis里面去
      */
    result.foreachRDD(eachRdd =>{
      if(!eachRdd.isEmpty()){
        eachRdd.foreachPartition(eachPartition =>{
          val connection: Connection = HBaseUtil.getConnection
          val jedis: Jedis = JedisUtil.getJedis
          //判断表是否存在，如果不存在就进行创建
          val admin: Admin = connection.getAdmin
          if(!admin.tableExists(TableName.valueOf(Constants.HTAB_GPS))){
            val htabgps = new HTableDescriptor(TableName.valueOf(Constants.HTAB_GPS))
            htabgps.addFamily(new HColumnDescriptor(Constants.DEFAULT_FAMILY))
            admin.createTable(htabgps)
          }
          if(!admin.tableExists(TableName.valueOf(Constants.HTAB_HAIKOU_ORDER))){
            val htabgps = new HTableDescriptor(TableName.valueOf(Constants.HTAB_HAIKOU_ORDER))
            htabgps.addFamily(new HColumnDescriptor(Constants.DEFAULT_FAMILY))
            admin.createTable(htabgps)
          }
          eachPartition.foreach(record =>{
            //保存到HBase和redis
            val consumerRecords: ConsumerRecord[String, String] = HbaseTools.saveToHBaseAndRedis(connection,jedis, record)
          })
          JedisUtil.returnJedis(jedis)
          connection.close()
        })

        //更新offset
        val offsetRanges: Array[OffsetRange] = eachRdd.asInstanceOf[HasOffsetRanges].offsetRanges
        //result.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)  //将offset提交到默认的kafka的topic里面去保存
        for(eachrange <-  offsetRanges){
          val startOffset: Long = eachrange.fromOffset  //起始offset
          val endOffset: Long = eachrange.untilOffset  //结束offset
          val topic: String = eachrange.topic
          val partition: Int = eachrange.partition
          HbaseTools.saveBatchOffset(group,topic,partition+"",endOffset)
        }
      }
    })
    streamingContext.start()
    streamingContext.awaitTermination()
  }
}

6.2、浏览器界面访问轨迹监控模块

以上代码将成都以及海口数据保存到了Hbase当中去，并且将海口数据的经纬度数据保存到了redis当中去，我们就可以通过浏览器web界面访问轨迹回放模块，查看轨迹监控的功能模块。

7、虚拟车站功能模块

先来熟悉两个关于地理单词的用法

longitude：经度，范围值。经度0°——180°（东行,标注E）0°——180°（西行,标注W）
latitude：维度 0°——90°N、0°——90°S

通过经纬度可以用来干什么：可以通过经纬度推断出地址，可以通过地址推断出经纬度，而且可以通过经纬度进行电子地图划分。
http://www.gpsspg.com/maps.htm

7.1、虚拟车站实现思路

1.虚拟车站如何实现？
最终要在界面上显示的车站位置重要的信息就是经纬度，而我们拿到的订单数据中包含核心数据(订单ID，起始经纬度)。

2.可以把乘客经常上车的位置作为虚拟车站，比如一个十字路口，上车的人比较多(也就是起点经纬度在十字路口比较集中，比如在十字路口乘车订单数在10个以上，或者20个以上时)，那我们就可以在这个十字路口设置一个虚拟车站位置。按照这样的思路是可以实现功能的，但会有个问题是如何统计哪些位置的起点经纬度比较集中并且数量达到一个基数(业务中判定一个地点作为虚拟车站的条件)。

3.对于起点比较集中的位置我们可以把地图划分为无数相等的格子，比如划分成大正方形(长X宽都是10米范围内，并且这个范围内的起点表多，那么我们就可以在这个格子中设置一个虚拟车站，可以取格子中经度和维度最小或者最大的点作为虚拟车站最后在界面上显示)，这是geohash的做法

但是geohash一类的矩形算法，有以下两个显著的缺陷:

1、在不同纬度的地区会出现地理单元单位面积差异较大的情况。

2、在常用的地理范围查询中，基于矩形的查询方法，存在8邻域到中心网格的距离不相等的问题。

3.针对以上第二点，我们可以使用uber公司开源的h3算法可以解决我们的业务问题.

uber h3算法介绍
http://www.sohu.com/a/294377304_326074
https://uber.github.io/h3/#/
https://www.jianshu.com/p/e42d903dce38

H3,是一个六边形分层索引网格系统，也是最近几年实现数据聚合的主要趋势，在h3出现之前大部分情况采用的是geohash算法，墨卡托投影，还有一些其他投影技术，比如google s2.地理索引

六边形网格与周围网格的距离有且仅有一个，而四边形存在两类距离，三角形有三类距离：

7.2、如何实现虚拟车站的统计

7.3、相关代码

package com.travel.programApp
import com.travel.common.{Constants, District}
import com.travel.utils.{HbaseTools, SparkUtils}
import org.apache.hadoop.conf.Configuration
import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.spark.SparkConf
import org.apache.spark.broadcast.Broadcast
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{DataFrame, Row, SparkSession}
import org.locationtech.jts.geom.{Point, Polygon}
import org.locationtech.jts.io.WKTReader

import scala.collection.mutable

object SparkSQLVirtualStation {

  def main(args: Array[String]): Unit = {
    val conf = new SparkConf
    conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
    conf.setMaster("local[1]").setAppName("sparkHbase")
    val sparkSession: SparkSession = SparkSession.builder().config(conf).getOrCreate()
    //设置日志级别，避免出现太多日志信息
    sparkSession.sparkContext.setLogLevel("WARN")
    //hbase配置
    val hconf: Configuration = HBaseConfiguration.create()
    hconf.set("hbase.zookeeper.quorum", "node01,node02,node03")
    hconf.set("hbase.zookeeper.property.clientPort", "2181")
    hconf.setInt("hbase.client.operation.timeout", 3000)
    val hbaseFrame: DataFrame = HbaseTools.loadHBaseData(sparkSession,hconf)
    //将dataFrame注册成为一张表
    hbaseFrame.createOrReplaceTempView("order_df")
    //获取虚拟车站，每个虚拟车站里面所有的经纬度坐标点只取一个最小的
    val virtual_rdd: RDD[Row] = SparkUtils.getVirtualFrame(sparkSession)
    //广播每个区域的经纬度边界
    val districtsBroadcastVar: Broadcast[java.util.ArrayList[District]] = SparkUtils.broadCastDistrictValue(sparkSession)
    //将每个区域的边界转换成为一个多边形，使用Polygon这个对象来表示，返回一个元组（每一个区域封装对象District，多边形Polygon）
    //判断每个虚拟车站，是属于哪一个区里面的
    val finalSaveRow: RDD[mutable.Buffer[Row]] = virtual_rdd.mapPartitions(eachPartition => {
      //使用JTS-Tools来通过多个经纬度，画出多边形
      import org.geotools.geometry.jts.JTSFactoryFinder
      val geometryFactory = JTSFactoryFinder.getGeometryFactory(null)
      var reader = new WKTReader(geometryFactory)
      //将哪一个区的，哪一个边界求出来
      val wktPolygons: mutable.Buffer[(District, Polygon)] = SparkUtils.changeDistictToPolygon(districtsBroadcastVar, reader)
      eachPartition.map(row => {
        val lng = row.getAs[String]("starting_lng")
        val lat = row.getAs[String]("starting_lat")
        val wktPoint = "POINT(" + lng + " " + lat + ")";
        val point: Point = reader.read(wktPoint).asInstanceOf[Point];

        val rows: mutable.Buffer[Row] = wktPolygons.map(polygon => {
          if (polygon._2.contains(point)) {
            val fields = row.toSeq.toArray ++ Seq(polygon._1.getName)
            Row.fromSeq(fields)
          } else {
            null
          }
        }).filter(null != _)
        rows
      })
    })
    //将我们的数据压平，然后转换成为DF
    val rowRdd: RDD[Row] = finalSaveRow.flatMap(x =>x)
    //将数据保存到HBase里面去
    HbaseTools.saveOrWriteData(hconf,rowRdd,Constants.VIRTUAL_STATION)
  }
}

7.4、运行代码，查看hbase当中出现表

将虚拟车站的数据，都保存到了Hbase的VIRTUAL_STATIONS这个表当中去，然后将该表当中的数据通过phoenix来进行映射，使用javaWeb程序去查询phoenix当中的数据

7.5、使用phoenix映射Hbase当中的表

node02进入phoenix客户端，然后创建Hbase当中的表映射

cd /kkb/install/apache-phoenix-4.14.0-cdh5.14.2-bin/
bin/sqlline.py node01:2181

create view VIRTUAL_STATIONS(
   "ROWKEY" varchar primary key ,  
   "f1"."CITY_ID"  varchar,
   "f1"."DISTRICT_NAME" varchar,
  "f1"."STARTING_LNG" varchar,
  "f1"."STARTING_LAT" varchar
) as select * from VIRTUAL_STATIONS;

8、业务数据库功能模块

前面我们已经通过flume采集日志数据，包括订单日志数据，以及经纬度上报信息数据。

先，将数据接入到kafka当中去，通过sparStreaming来消费kafka的数据，实现将数据保存到Hbase以及redis当中，实现了数据的实时处理，

然后，对hbase当中的数据，通过spark程序读取，并进行处理，计算我们的虚拟车站结果。

到此为止，已经实现了日志数据的采集和处理等功能模块，

那么，接下来通过业务库实时解析数据，实现订单的实时解析。

8.1、涉及到的业务数据库表介绍

这里我们主要涉及到四张数据库表，分别是司机表，乘客表，订单表以及司管方表，我们的数据分析主要以这四张表为基础，对业务库当中的数据进行脱敏之后对我们的数据进行分析。
司机表driver_info具体字段以及字段含义见下表

乘客表renter_info具体字段以及字段含义见下表

订单表order_info_201907具体字段以及字段含义见下表

司管方表opt_alliance_business具体字段以及字段含义见下表

8.2、业务库订单数据回放

实现实时binlog进入kafka

通过模拟订单数据回放，实现我们的订单数据实时解析，参见课件资料当中的业务库数据资料，实现业务库当中的数据回放功能，通过maxwell实现解析binlog，并将binlog数据接入到kafka当中去。

第一步：开发maxwell配置
node03执行以下命令开发maxwell配置文件

cd /kkb/install/maxwell-1.22.1
vim travel.properties

log_level=INFO
producer=kafka
kafka.bootstrap.servers=node01:9092,node02:9092,node03:9092
host=node03.kaikeba.com
user=maxwell
password=123456
producer_ack_timeout = 600000
port=3306
######### output format stuff ###############
output_binlog_position=ture
output_server_id=true
output_thread_id=ture
output_commit_info=true
output_row_query=true
output_ddl=false
output_nulls=true
output_xoffset=true
output_schema_id=true
######### output format stuff ###############
kafka_topic= veche
kafka_partition_hash=murmur3
kafka_key_format=hash
kafka.compression.type=snappy
kafka.retries=5
kafka.acks=all
producer_partition_by=primary_key
############ kafka stuff #############
############## misc stuff ###########
bootstrapper=async
############## misc stuff ##########
############## filter ###############
filter=exclude:*.*, include: travel.order_info_201904,include: travel.order_info_201905,include: travel.order_info_201906,include: travel.order_info_201907,include: travel.order_info_201908,include: travel.order_info_201906,include: travel.order_info_201910,include: travel.order_info_201911,include: travel.order_info_201912,include: travel.renter_info,include: travel.driver_info ,include: travel.opt_alliance_business
############## filter ###############

第二步：创建kafka的topic
node01执行以下命令创建kafka的topic

cd /kkb/install/kafka_2.11-1.0.1/
bin/kafka-topics.sh  --create  --topic veche --partitions  3 --replication-factor 1 --zookeeper node01:2181,node02:2181,node03:2181

第三步：将数据上传到mysql所在机器

由于我的mysql安装在node03服务器，所以我将数据资料上传到node03服务器的/kkb/datas/dbdatas 这个路径下（mysql安装在哪一台，就将数据上传到哪一台服务器的/kkb/datas/dbdatas这个路径下）

mkdir -p /kkb/datas/dbdatas

第四步：开发maxwell以及数据回放脚本

在mysql所在的集群的/home/hadoop/bin路径下创建数据回放脚本，由于我的mysql安装在node03服务器，所以我这个脚本也在node03服务器上面执行

mkdir -p /home/hadoop/bin/
cd /home/hadoop/bin/
vim maxOrder.sh

#!/bin/bash
case $1 in 
"start" ){
 nohup /kkb/install/maxwell-1.21.1/bin/maxwell --daemon --config /kkb/install/maxwell-1.21.1/travel.properties 2>&1 >> /kkb/install/maxwell-1.21.1/maxwell.log &
echo $#
/usr/bin/mysql -h$2  -u$3 -p$4 < /kkb/datas/dbdatas/createdb.sql

if [ $# -lt  6 ];
then
    echo "请分别传入启动还是停止，mysql连接主机名，mysql连接用户名，mysql连接密码，数据路径,插入数据休眠时间（毫秒值）"
    exit
fi
source /etc/profile
nohup java -jar /kkb/datas/dbdatas/db.jar $2 $3 $4 $5 $6 >/dev/null 2>&1 &
};;
"stop"){
  ps -ef | grep Maxwell | grep -v grep |awk '{print $2}' | xargs kill 
  ps -ef | grep db.jar | grep -v grep |awk '{print $2}' | xargs kill 
};;
esac

第五步：启动数据回放脚本以及kafka消费端，确认数据进入kafka

node03执行以下命令启动数据回放脚本

cd /home/hadoop/bin/
sh maxOrder.sh  start localhost root 123456 /kkb/datas/dbdatas 3000

如果需要停止maxwell以及数据插入，执行以下命令即可

cd /home/hadoop/bin/
sh maxOrder.sh stop

node01执行以下命令启动kafka的消费者

cd /kkb/install/kafka_2.11-1.0.1
bin/kafka-console-consumer.sh --topic veche --zookeeper node01:2181

8.3、提前创建Hbase表

通过解析kafka当中的binlog数据，将所有的表数据保存到对应的Hbase表当中去，我们需要考虑到Hbase表的预分区的操作，提前创建hbase的对应的表，并考虑我们的rowkey的设计，实现数据的均匀的分区，避免Hbase数据的倾斜。

在travel_spark模块下src/main/java路径下，创建java文件CreateHbaseTableInit.java来实现Hbase表的提前创建

package com.travel.hbase;

import com.travel.common.Constants;
import com.travel.utils.HbaseTools;
import org.apache.commons.lang3.StringUtils;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Admin;
import org.apache.hadoop.hbase.client.Connection;
import org.apache.hadoop.hbase.util.Bytes;
import java.io.IOException;

public class CreateHbaseTableInit {
    public static void main(String[] args) throws Exception {
        Connection hbaseConn = HbaseTools.getHbaseConn();
        CreateHbaseTableInit createHbaseTableInit = new CreateHbaseTableInit();
        /**
         * syn.table.order_info="order_info"
         * syn.table.renter_info="renter_info"
         * syn.table.driver_info="driver_info"
         * syn.table.opt_alliance_business="opt_alliance_business"
         */
        String[] tableNames = new String[]{"order_info","renter_info","driver_info","opt_alliance_business"};
        for (String tableName : tableNames) {
            createHbaseTableInit.createTable(hbaseConn,Constants.DEFAULT_REGION_NUM,tableName);
        }
        hbaseConn.close();
    }

    public void createTable(Connection connection,int regionNum,String tableName) throws IOException {
        Admin admin = connection.getAdmin();
        if(admin.tableExists(TableName.valueOf(tableName))){
            admin.disableTable(TableName.valueOf(tableName));
            admin.deleteTable(TableName.valueOf(tableName));
        }
         /*  //HBase自带的分区工具类，自动帮我们进行分区
            //获取到的是16进制的字符串
            RegionSplitter.HexStringSplit spliter = new RegionSplitter.HexStringSplit();
            byte[][] split = spliter.split(8);
            //适合rowkey经过hash或者md5之后的字符串
            RegionSplitter.UniformSplit uniformSplit = new RegionSplitter.UniformSplit();
            byte[][] split1 = uniformSplit.split(8);*/
        HTableDescriptor hTableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));
        HColumnDescriptor hColumnDescriptor = new HColumnDescriptor(Constants.DEFAULT_DB_FAMILY);
        hTableDescriptor.addFamily(hColumnDescriptor);
        byte[][] splitKey = getSplitKey(regionNum);
        admin.createTable(hTableDescriptor,splitKey);
        admin.close();
    }

    public byte[][] getSplitKey(int regionNum){
        byte[][] byteNum = new byte[regionNum][];
        for(int i =0;i<regionNum;i++){
            String leftPad = StringUtils.leftPad(i+"",4,"0");
            byteNum[i] = Bytes.toBytes(leftPad + "|");
        }
        return byteNum;
    }
}

8.4、通过sparkStreaming来解析kafka数据进入hbase

通过maxwell来解析mysql的binlog日志，实现了实时捕获mysql数据库当中的数据到kafka当中，然后我们就可以通过sparkStreaming程序来实现
在travel_spark模块下的src/main/scala路径下，创建package
com.travel.programApp，然后在这个package下面创建scala的object文件StreamingMaxwellKafka.

用于实现解析kafka当中的json格式的数据，保存到Hbase当中去。

import com.travel.common.{ConfigUtil, Constants}
import com.travel.utils.{HbaseTools, JsonParse}
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.common.serialization.StringDeserializer
import org.apache.spark.sql.SparkSession
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.kafka010.{CanCommitOffsets, HasOffsetRanges, OffsetRange}
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.{SparkConf, SparkContext}

import scala.util.Try

object StreamingMaxwellKafka {

  def main(args: Array[String]): Unit = {
    val brokers = ConfigUtil.getConfig(Constants.KAFKA_BOOTSTRAP_SERVERS)
    val topics = Array(Constants.VECHE)
    val conf = new SparkConf().setMaster("local[4]").setAppName("sparkMaxwell")
    val group_id:String = "vech_group"
    val kafkaParams = Map[String, Object](
      "bootstrap.servers" -> brokers,
      "key.deserializer" -> classOf[StringDeserializer],
      "value.deserializer" -> classOf[StringDeserializer],
      "group.id" -> group_id,
      "auto.offset.reset" -> "earliest",// earliest,latest,和none
      "enable.auto.commit" -> (false: java.lang.Boolean)
    )
    val sparkSession: SparkSession = SparkSession.builder().config(conf).getOrCreate()
    val context: SparkContext = sparkSession.sparkContext
    context.setLogLevel("WARN")
    // val streamingContext = new StreamingContext(conf,Seconds(5))
    //获取streamingContext
    val ssc: StreamingContext =  new StreamingContext(context,Seconds(1))
    val getDataFromKafka: InputDStream[ConsumerRecord[String, String]] = HbaseTools.getStreamingContextFromHBase(ssc,kafkaParams,topics,group_id,"veche")

    getDataFromKafka.foreachRDD(eachRdd =>{
      if(!eachRdd.isEmpty()){
        val catchResult =   Try{
          eachRdd.foreachPartition(eachPartition =>{
            //每个分区获取一次连接
            val conn = HbaseTools.getHbaseConn
            eachPartition.foreach(eachLine =>{
              //获取到每条数据
              val jsonStr: String = eachLine.value()
              //（表名称 ， bean）
              val parse: (String, Any) = JsonParse.parse(jsonStr)
              HbaseTools.saveBusinessDatas(parse._1,parse,conn)
            })
            HbaseTools.closeConn(conn)
          })
        }
        //每个分区更新数据
      /*  eachRdd.foreachPartition(eachPartition =>{
          val list: List[ConsumerRecord[String, String]] = eachPartition.toList
          val finalResult: ConsumerRecord[String, String] = list(list.size - 1)
          val endOffset: Long = finalResult.offset()  //结束offset
          val topic: String = finalResult.topic
          val partition: Int = finalResult.partition
          HbaseTools.saveBatchOffset(group_id,topic,partition+"",endOffset)
        })*/
        //更新offset
        val offsetRanges: Array[OffsetRange] = eachRdd.asInstanceOf[HasOffsetRanges].offsetRanges
        getDataFromKafka.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)  //将offset提交到默认的kafka的topic里面去保存
        for(eachrange <-  offsetRanges){
          val startOffset: Long = eachrange.fromOffset  //起始offset
          val endOffset: Long = eachrange.untilOffset  //结束offset
          val topic: String = eachrange.topic
          val partition: Int = eachrange.partition
          HbaseTools.saveBatchOffset(group_id,topic,partition+"",endOffset)
        }
      }
    })
    ssc.start()
    ssc.awaitTermination()
  }
}

你可能感兴趣的:(实战案例)

Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
如何在Windows系统下使用Dockerfile构建Docker镜像：完整指南 996蹲坑 windows docker 容器
前言Docker作为当前最流行的容器化技术，已经成为开发、测试和运维的必备工具。本文将详细介绍在Windows系统下使用Dockerfile构建Docker镜像的完整流程，包括两种镜像构建方式的对比、Dockerfile核心指令详解、实战案例演示以及Windows系统下的特殊注意事项。一、Docker镜像构建的两种方式1.容器转为镜像（不推荐）这种方式适合临时保存容器状态，但不适合生产环境使用：#
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
多模态模型在RagFlow中的创新应用与实战案例 AGI大模型老王人工智能 DeepSeek 产品经理学习 AI 大模型大模型教学
在RagFlow的最新版本中（0.19.0）中，为了提升对文档中各类图片的解析效果，也尝试引入了多模态模型（image2text）对图片内容进行增强解析。我们来详细分析一下相关的过程。首先需要在当前租户下配置一个image2text的模型（这里有个坑，后面会讲到），在RagFlow的文档解析过程中主要有三个场景使用到这个image2text模型，我们一一来看下：PDF文档内容提取如果配置了imag
探索 Golang 与 Docker 集成的无限可能 Golang编程笔记 golang docker 开发语言 ai
探索Golang与Docker集成的无限可能关键词：Golang、Docker、容器化、微服务、云原生、镜像优化、CI/CD摘要：本文将带你走进Golang与Docker集成的奇妙世界。我们会从“为什么需要这对组合”讲起，用生活故事类比核心概念，拆解Go静态编译与Docker容器化的“天作之合”，通过实战案例演示如何用Docker高效打包Go应用，并探讨它们在云原生时代的无限可能。无论你是Go开发
网络安全核心技术解析：权限提升（Privilege Escalation）攻防全景
引言在网络安全攻防对抗中，权限提升（PrivilegeEscalation）是攻击链条中关键的「破局点」。攻击者通过突破系统权限壁垒，往往能以有限权限为跳板，最终掌控整个系统控制权。本文将从攻击原理、技术路径、实战案例到防御体系，全方位解析这一网络空间的「钥匙窃取」艺术。一、权限提升的本质与分类1.1核心定义权限提升指攻击者通过技术手段，将当前运行进程或用户的权限等级突破系统预设的访问控制机制，获
95%程序员不知道的JVM调优技巧：让GC时间从2秒降到50ms的实战案例小筱在线 jvm 测试工具
前言：为什么JVM调优如此重要？在现代Java应用开发中，JVM调优是提升应用性能的关键环节。一个经过精心调优的JVM可以显著减少垃圾回收(GC)停顿时间，提高吞吐量，从而为用户提供更流畅的体验。本文将分享一个真实案例，展示如何通过系统化的调优方法，将GC时间从2秒降低到50ms，提升近40倍的性能表现。第一章：理解JVM内存结构与GC机制1.1JVM内存结构详解（JDK1.8）Java虚拟机内存
深入浅出 Python Asynchronous I/O：从 asyncio 入门到实战
在现代软件开发中，性能是一个永恒的话题。特别是在处理网络请求、文件读写等I/O密集型任务时，传统的同步编程模型可能会因为等待而浪费大量时间。为了解决这个问题，异步编程应运而生。Python通过内置的asyncio库，为开发者提供了强大而优雅的异步编程能力。[1][2]本文将带你从零开始，逐步深入asyncio的世界，理解其核心概念，并最终通过实战案例掌握其用法。1.什么是异步编程？为什么要用它？想
HarmonyOS从入门到精通：动画设计与实现之二 - 属性动画深度实践与场景落地
属性动画作为鸿蒙系统中最基础也最常用的动画类型，其核心价值在于通过属性值的渐进式变化实现流畅的视觉过渡。相比其他动画类型，属性动画具有接入成本低、适用范围广、与业务逻辑耦合度低等优势，是开发者打造生动界面的首选工具。本文将从基础原理出发，通过实战案例详解属性动画的进阶用法、性能优化及典型场景落地，帮助开发者掌握属性动画的核心技巧。一、属性动画的工作原理与核心特性属性动画的本质是**“数据驱动视觉变
万字长文详解YOLOv8 yaml 文件，结合模型输出的网络结构图分析Parameters /backbone/head以及三者的数学关联 YOLO大师 YOLO 论文阅读
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例之前写过一篇YOLOv8yaml配置文件逐层的解析：结合YOLOv8源码逐层解读yaml文件的配置，本文主要从整体的角度去解析yaml。YOLOv8模型YOLOv8提供了非常多的模型，详见：https:
Java编程从入门到精通：全栈学习路径与实战案例指南 AI编程员 001AI传统＆编程语言 002AI编程工具汇总 003AI编程作品汇总人工智能深度学习 AI编程知识图谱需求分析
Java编程从入门到精通：全栈学习路径与实战案例指南一、入门基础：环境搭建与核心语法1.1开发环境配置（2025最新版）JDK17LTS：长期支持版本，提供模块化系统（JPMS）和文本块等新特性开发工具：IntelliJIDEA（智能代码补全）或VSCode+Java扩展包环境验证：java-version#输出：openjdk17.0.101.2基础语法精要数据类型与运算符：//文本块（Java
Python协程深度解析：与生成器的差异与实战应用清水白石008 Python题库 python 开发语言 python 服务器前端
Python协程深度解析：与生成器的差异与实战应用一、引言在Python编程领域，协程（Coroutines）和生成器（Generators）是两个非常重要的概念。虽然它们在某些方面相似，但各自拥有独特的用途和特性。本文将深入探讨Python协程的基本概念、特性以及它们与生成器之间的区别，并通过实战案例展示协程的实用性。二、协程的概念与特性2.1协程的定义协程是一种用户态的轻量级线程，它允许程序在
用Python的Chartify库，商业数据可视化效率提升13倍！忆愿 Python编程的脉动之声 python opencv 人工智能计算机视觉深度学习神经网络机器学习
文章目录为啥要用Chartify？安装那些事儿从零开始画图基础柱状图进阶折线图散点图与气泡图专业数据分析必备技能多维度分析时间序列分析高级可视化技巧自定义主题交互式特性批量图表生成性能优化技巧大数据集处理内存优化实战案例：销售数据分析系统数据可视化这事儿，搞过的都知道有多费劲。用matplotlib画个图要调半天参数，才能让图表看起来稍微顺眼一点；seaborn虽然画出来的图确实好看，但是配置项太
HarmonyOS UIAbility组件间交互：解锁鸿蒙应用开发的秘密通道大雨淅淅 #HarmonyOS开发 harmonyos 交互华为
目录一、引言：HarmonyOS的奇妙世界二、UIAbility组件：基础入门（一）什么是UIAbility组件（二）UIAbility组件的结构与特点三、交互方式大揭秘（一）应用内UIAbility的启动与参数传递（二）启动并获取返回结果（三）不同模块UIAbility的拉起（四）通过EventHub实现交互（HarmonyOSNEXT）四、实战案例：打造支付功能（一）场景设定（二）具体实现步骤
量化价值投资中的深度学习技术：TensorFlow实战
量化价值投资中的深度学习技术：TensorFlow实战关键词：量化价值投资,深度学习,TensorFlow,股票预测,因子模型,LSTM神经网络,量化策略摘要：本文将带你走进"量化价值投资"与"深度学习"的交叉地带，用小学生都能听懂的语言解释复杂概念，再通过手把手的TensorFlow实战案例，教你如何用AI技术挖掘股票市场中的价值宝藏。我们会从传统价值投资的痛点出发，揭示深度学习如何像"超级分析
心理健康语音分析AI模型：开启心理评估新时代 AI大模型应用实战人工智能语音识别 ai
心理健康语音分析AI模型：开启心理评估新时代关键词：心理健康评估、语音信号处理、情感计算、AI模型、多模态融合摘要：传统心理评估依赖量表问卷和人工观察，存在主观性强、效率低、难以实时监测等局限。本文将带您走进“心理健康语音分析AI模型”的世界，从基础概念到核心技术，从算法原理到实战案例，揭秘AI如何通过“听声音”读懂心理状态，开启心理评估的智能化新时代。背景介绍目的和范围心理健康问题已成为全球公共
Python 领域 pytest 的测试用例的可维护性设计
Python领域pytest的测试用例的可维护性设计关键词：pytest、测试用例、可维护性、测试框架、自动化测试、测试设计模式、重构摘要：本文深入探讨了如何在Python测试框架pytest中设计可维护的测试用例。我们将从测试用例可维护性的核心原则出发，分析pytest的特性和最佳实践，介绍多种提高测试代码可维护性的设计模式和技巧。文章包含实际代码示例、项目实战案例以及可维护性评估指标，帮助开发
深入企业内部的MCP知识（二）：FastMCP客户端三大核心能力深度解析：资源、工具与提示的全场景实践炼丹上岸大模型 #MCP microsoft 人工智能 python 交互 mcp
引言：MCP协议交互的“三驾马车”在ModelContextProtocol（MCP）的技术生态中，资源（Resources）、工具（Tools）与提示（Prompts）构成了客户端与服务器交互的核心支柱。FastMCP通过统一的API设计，将这三者转化为可直接调用的编程接口，既隐藏了底层协议的复杂性，又保留了高度的灵活性。本文将从技术原理、实战案例到性能优化，系统拆解这三大能力的使用方法与协同逻
Multisim示波器使用指南：从入门到精通（电路调试必看） matrixmind8 其他
文章目录前言一、示波器位置速查二、基础操作四步法1.设备连接（关键！）2.参数设置（图解版）3.运行秘籍4.波形测量（必杀技）三、实战案例：RC滤波电路调试调试步骤：实测数据对比表：四、高手都在用的隐藏功能避坑指南结语前言作为电子仿真界的扛把子（划重点），Multisim里的虚拟示波器简直是调试电路的灵魂伴侣！但很多萌新第一次打开软件时，看着满屏的按钮和波形图直接懵圈（别问我怎么知道的）。今天我们
基于python的api扫描器系统的设计与实现
博主介绍：✌在职Java研发工程师、专注于程序设计、源码分享、技术交流、专注于Java技术领域和毕业设计✌温馨提示：文末有CSDN平台官方提供的老师Wechat/QQ名片:)Java精品实战案例《700套》2025最新毕业设计选题推荐：最热的500个选题o(￣▽￣)ｄ介绍在当今数字化社会，网络安全问题日益突出，为了有效识别和防范网络威胁，开发一款全面的Web应用渗透测试系统至关重要。本研究基于Py
嵌入式C语言中void*的妙用与实战隐身模式 C/C++c语言开发语言
嵌入式C语言中void*的工程应用详解在嵌入式开发中，void*指针无处不在，理解它的使用场景和注意事项，是写好通用接口和系统模块的关键。目录嵌入式C语言中`void*`的工程应用详解✳️一、什么是`void*`二、典型应用场景1.通用参数传递2.通用回调机制3.通用数据结构（链表、队列）4.封装模块接口（如SDK、HAL）⚠️三、使用`void*`的注意事项✅建议实践：四、实战案例：事件处理机制
Python元类基础知识示例深度剖析，从新手小白成为Python编程高手只存在于虚拟的King python 开发语言深度学习学习经验分享计算机网络程序人生
文章目录引言一、什么是元类？二、元类的工作原理三、如何定义元类四、元类的应用场景五、元类的注意事项六、结论关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包+项目源码合集①Python工具包②Python实战案例③Python小游戏源码五、面试资料六、Python兼职渠道引言Python是一种强大的编程语言，一部
SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
操作系统领域的新宠儿：鸿蒙应用深度剖析操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
操作系统领域的新宠儿：鸿蒙应用深度剖析关键词：鸿蒙操作系统、微内核架构、分布式软总线、ArkUI框架、DevEcoStudio、跨设备开发、全场景生态摘要：本文深度剖析华为鸿蒙操作系统的核心技术架构与应用开发体系，从微内核设计、分布式协同技术、UI框架创新到全场景开发工具链展开分析。通过数学模型解析分布式一致性算法，结合Python代码演示核心调度逻辑，并以实战案例演示跨设备应用开发流程。探讨鸿蒙
数据库表结构设计实战：从基础到商品三级分类实现 Code季风 GORM从入门到精通数据库 sql 微服务 golang 学习前端
数据库表结构设计是后端开发的基石，良好的设计能提升系统性能、降低维护成本。本文将从基础概念讲起，结合商品三级分类的实战案例，详解表结构设计的核心思路与最佳实践。一、数据库表结构设计基础1.关系数据库的核心约束与索引（1）列约束：保证数据完整性主键约束（PRIMARYKEY）：唯一标识表中每条记录，不可重复且非空。通常用id字段，如idINT32PRIMARYKEYAUTO_INCREMENT。外键
【C++】状态模式 OpenC++ 设计模式 c++状态模式设计模式
目录一、模式核心概念与结构二、C++实现示例：自动售货机状态管理三、状态模式的关键特性四、应用场景五、状态模式与其他设计模式的关系六、C++标准库中的状态模式应用七、优缺点分析八、实战案例：TCP连接状态管理九、实现注意事项如果这篇文章对你有所帮助，渴望获得你的一个点赞！状态模式（StatePattern）是一种【行为型】设计模式，它允许对象在其内部状态发生变化时改变其行为，看起来就像该对象改变了
游戏引擎开发与实战案例喜欢编程就关注我游戏引擎开发实战实战案例代码
游戏引擎开发与实战案例摘要本文聚焦游戏引擎开发，涵盖核心架构、关键技术及实战案例。通过剖析引擎架构、物理引擎、图形渲染、资源管理等，结合C++与SDL、LibGDX等框架的代码示例，助力开发者掌握引擎开发精髓，提升实战能力。关键词：游戏引擎开发；物理引擎；图形渲染；资源管理一、引言游戏引擎作为游戏开发的核心工具，对游戏性能、画面表现及开发效率起着决定性作用。掌握游戏引擎开发技术，能使开发者更自由地
使用美团NoCode生成应用-实战案例（一）零代码探险家 AI编程人工智能数据库 react.js reactjs sql
一、概要通过NoCode搭建的值班管理神器，可以支持人员信息批量导入、自定义排班周期，一键生成规则化值班表，适配多角色分工，更可实时导出表格，彻底告别手动排班烦恼！二、实现路径拆解需求输入：明确值班表内容（如日期、人员、岗位）及预设排班规则（如工作日与非工作日所需值班人数）。迭代优化：针对初版人员识别偏差，重构输入逻辑（如多人员批量导入格式优化），通过差异分析精准定位问题。功能完善：新增名单导入模
《深入浅出 React 19：AI 视角下的源码解析与进阶》- JSX 与 React Element
如果你对React源码解析感兴趣，欢迎访问我的个人博客：深入浅出React19：AI视角下的源码解析与进阶或者我的微信公众号-前端小卒在我的博客和公众号中，你可以找到：完整的React源码解析电子书-从基础概念到高级实现，全面覆盖React18的核心机制系统化的学习路径-按照React的执行流程，循序渐进地深入每个模块实战案例分析-结合真实场景，理解React设计思想和最佳实践最新技术动态-持续更
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS