leon.yan1994

了解物联网架构之Hadoop

一、认识大数据

1.1 大数据定义

指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的巨量数据集合
需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产数据

1.2 大数据特点

数据体量巨大。数据量大是大数据的显著特点，按目前的发展趋势看，大数据的体量已经达到 PB 甚至 EB级。
大数据的数据类型多样，以非结构化数据为主。如：网络日志、音频、视频、图片、地理位置信息、交易数据、社交数据等。
价值密度低。有价值的数据仅占到数据总量相当小的一部分。比如一段监控视频中真正有价值的画面可能只有几秒钟。
产生和要求处理速度快。这是大数据区分于传统数据挖掘最显著的特征。

1.3 常见大数据处理系统

名称	类型	说明
Hadoop	开源	Apache 基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序，为本门课程重点讲解的系统
Spark	开源	类似 Hadoop MapReduce 的并行框架
Stom	开源	实时的、分布式以及具备高容错的计算系统
MongoDB	开源	面向文档的 NoSql 数据库
IBM PureData	商用	基于 Hadoop，属于 IBM 专家集成系统 PureSystem家族中的组成部分，主要面向大数据应用
Oracle Exadata	商用	Oracle 的新一代数据库云服务器
SAP Hana	商用	提供高性能的数据查询功能，用户可以直接对大量实时业务数据进行查询和分析
Teradata AsterData	商用	非结构化数据解决方案
EMC GreenPlum	商用	采用了大规模并行处理，支持 50PB 级海量存储与管理
HP Vertica	商用	列式大数据分析数据库

二、了解Hadoop

2.1 Hadoop简介

Hadoop 源自于 Google 在 2003 到 2004 年公布的关于 GFS （ Google File System）、MapReduce 和 BigTable 三篇论文，创始人是 Doug Cutting。Hadoop 现在是 Apache 基金会顶级项目，“Hadoop”是一个虚构的名字，由 Doug Cutting 的孩子为其黄色玩具大象所命名。
Hadoop是Apache基金会旗下的分布式系统基础架构
用户可以在不了解分布式底层细节的情况下，开发分布式程序
充分利用集群的威力进行高速运算和存储

2.2 Hadoop特点

高可靠性
高扩展性
高效性
高容错性
低成本
可构建在廉价机器上

2.3 Hadoop运行模式

单机模式：无须配置， Hadoop 被视为一个非分布式模式运行的独立 Java进程
伪分布式模式：只有一个节点的集群，这个节点既是 Master（主节点、主服务器）也是 Slave（从节点、从服务器），可在此单节点上以不同的 Java 进程模拟分布式中的各类节点
完全分布式模式：对于 Hadoop，不同的系统会有不同的节点划分方式。在 HDFS 看来分为 NameNode（管理者）和 DataNode（工作者），其中 NameNode只有一个，DataNode 可有多个；在 MapReduce 看来节点又分为 JobTracker （作业调度者）和 TaskTracker（任务执行者），其中 JobTracker 只有一个， TaskTracker 可以有多个。NameNode 和 JobTracker 可以部署在不同的机器上，也可以部署在同一机器上。部署 NameNode 和 JobTracker 的机器是Master，其余的机器都是 Slave

2.4 Hadoop 体系结构

Hadoop框架的核心构成
- 分布式文件系统（HDFS）
- 分布式计算系统（MapReduce）
- 分布式资源管理系统（YARN）
Hadoop 生态圈
- HDFS：分布式文件系统，是整个 Hadoop 体系的基石。
- MapReduce/YARN：并行编程模型。YARN 是下一代的 MapReduce 框架。从 Hadoop 0.23.01 版本后， MapReduce 被重构。通常 YARN 也称为MapReduceV2，老版本 MapReduce 称为 MapReduce V1。
- Hive：建立在 Hadoop 上的数据仓库。提供类似 SQL 语言的查询方式查询Hadoop 中的数据。
- Pig：一个对大型数据集进行分析、评估的平台。主要作用类似于数据库里的存储过程。
- HBase：全称 Hadoop Database。Hadoop 分布式、面向列的数据库来源于Google 关于 BigTable 的论文，主要用于需要随机访问、实时读写的大数据。在后面章节还会详细介绍。
- ZooKeeper：是一个为分布式应用所设计的协调服务。主要为用户提供同步、配置管理、分组和命名等服务，减轻分布式应用程序所承担的协调任务。
- Sqoop：主要用于 Hadoop 与传统数据库（MySQL 等）间的数据传递。
- Flume：日志采集系统。
- Spark：前面提过，是一个相对独立于 Hadoop 的大数据处理系统，可单独进行分布式处理。在这里列出来是因为它可以和 HDFS 很好的结合。
- Oozie：可以将多个 MapReduce 作业组合到一个逻辑工作单元中，进行工作计划的安排，类似于工作流管理引擎。
- Ambari：支持 Hadoop 集群管理、监控的 Web 工具。

三、分布式文件系统 HDFS

3.1 HDFS定义

是一个主/从体系结构的、以分布式进行存储的分布式文件系统
主要负责群集数据的存储与读取

3.2 HDFS优缺点

优点

存储超大文件
标准流式访问
可构建在廉价机器上
缺点

不适合低延迟数据访问
不适合小文件存取
不适合并发写入，文件随机修改

3.3 HDFS体系结构

HDFS群集组成一个NameNode节点多个DateNode节点
HDFS集群数据读写流程

数据读流程：
1.由客户端向NameNode请求访问某个文件，NameNode返回该文件所在DataNode，然后客户端向DataNode读取数据
数据写流程：
1.客户端向NameNode发出文件写请求，NameNode告诉客户该向哪个DataNode写入文件
2.客户将文件写入该DataNode节点
3.DataNode将自动复制数据到其它DataNode节点上，默认3份拷贝

3.4 HDFS相关基础概念

元数据节点（NameNode） 负责管理文件系统的命名空间将所有文件和文件夹的元数据保存至一个文件系统树中
元数据存放目录 NameNode节点的hadoop/dfs/name/current目录中由hdfs-site.xml中的dfs.namenode.name.dir属性指定
目录中包括具体文件类型 fsimage_*、edits_*VERSION、...
数据节点（DateNode） 文件系统中真正存储数据的地方一个文件被拆分成多个数据块后，分别存储至对应的数据节点上
数据存储目录 DateNode节点的hadoop/dfs/data目录中由hdfs-site.xml中的dfs.datanode.data.dir属性指定
目录中包括具体文件类型 blk_、blk_.meta、...
从元数据节点（Secondary NameNode） 1.用于周期性备份NameNode节点上的元数据 2.可以用来恢复NameNode节点，但不能作为备用节点 3.为了防止宕机，通常是将Secondary NameNode和NameNode设置为不同的主机 4.使用hdfs-site.xml中配置的dfs.namenode.secondary.http-address属性值可以通过浏览器查看Secondary NameNode运行状态

四、分布式计算系统 MapReduce

4.1MapReduce介绍

Hadoop 的 MapReduce 框架源自于 Google 的 MapReduce 论文。在 Google 发表论文时，MapReduce 最大成就是重写了Google 的索引文件系统。现在，MapReduce被广泛地应用于日志分析、海量数据排序、在海量数据中查找特定模式等场景中。
MapReduce是一个实现了并行计算编程模型，用以进行大数据量的计算
MapReduce包括 map（映射）：map负责把任务分解成多个任务 reduce（归约）：负责把分解后多任务的处理结果进行汇总
MapReduce框架设计包括

执行MapReduce 作业的机器也有两个角色：JobTracker 和 TaskTracker。
- JobTracker：是一个 Master 服务，用于作业（ Job）的管理和调度工作。一个 Hadoop 集群中只有一台 JobTracker。一般情况下，应该把它部署在单独的机器上。JobTracker 负责创建、调度作业中的每一个子任务（ MapTask 或 ReduceTask）运行于 TaskTracker 上，并监控它们。如果发现有失败的任务就重新运行它。
- TaskTracker ：是运行于多个节点上的 Slave 服务，用于执行任务。TaskTracker 需要运行在 HDFS 的 DataNode 上。

4.2 MapReduce工作原理

input：由 JobTracker 创建该 Job，并根据 Job 的输入计算输入分片（Input Split）。这里要求待处理的数据集必须可以分解成许多小的数据集，且每一个小的数据集都可以完全并行地进行处理。输入目录中文件的数量决定了分片的数量，如果对于单个文件超过 HDFS 默认块大小（64MB），将按块大小进行分割。
split：作业调度器获取 Job 的输入分片信息，对输入分片中的记录按照一定规则解析成键值对，“键”（key）是每一行的起始位置，以字节为单位，“值”（value）是本行文本内容。最后每个分片创建一个 MapTask 并分配到某个 TaskTracker。
map：TaskTracker 开始执行 MapTask，处理输入的每一个键值对。如何处理取决于在该阶段的程序代码，处理完成后产生新的键值对，保存在本地。
shuffle：混洗。将 MapTask 的输出有效地作为 ReduceTask 的输入过程。从图中可以看出该过程会在各 TaskTracker Node 之间进行数据交换，按照 key 进行分组。
reduce：读取 Shufflling 阶段的输出，开始执行 ReduceTask，处理输入的每一个键值对。同样，如何处理取决于该阶段的程序代码。最后输出最终结果。

4.3 MapReduce 作业在 MapReduce 框架中的工作原理

编写 MapReduce 程序。包括 Mapper 处理、Reducer 处理以及为执行这些处理而定义的作业，首先将所有这些程序打包后运行作业。
获取作业 ID。
复制作业资源。
提交作业资源。
初始化作业。
获取输入分片。
心跳通信。TaskTracker 运行一个简单的循环来定期发送“心跳”给JobTracker，表明 TaskTracker 是否还存活，同时也充当两者之间的消息通道。
获取作业资源。
分配任务。
运行任务 MapTask 或 ReduceTask，最后输出 MapReduce 任务处理结果。

五、部署Hadoop系统

基础环境

修改主机名

 hostnamectl set-hostname node1
 hostnamectl set-hostname node2
 hostnamectl set-hostname node3

所有节点添加hosts解析

 cat >> /etc/hosts << EOF
 172.16.10.10 node1
 172.16.10.11 node2
 172.16.10.12 node3
 EOF

关闭防火墙

 systemctl stop firewalld
 systemctl disable firewalld

关闭内核安全机制

 sed -i "s/.*SELINUX=.\*/SELINUX=disabled/g" /etc/selinux/config

时间同步

 yum -y install chrony
 systemctl start chronyd
 chronyc sources -v

5.1 创建用户和组

所有node节点都需要执行

 # 创建Hadoop组
 groupadd hadoop
 
 # 创建hduser用户
 useradd -g hadoop hduser
 
 # 为hduser用户设置密码
 passwd hduser
 更改用户 hduser 的密码 。
 新的 密码：
 无效的密码： 密码少于 8 个字符
 重新输入新的密码：
 passwd：所有的身份验证令牌已经成功更新。
 
 # 为hduser用户添加sudo权限
 vim /etc/sudoers
 在 root  ALL=(ALL)  ALL 下面添加如下内容：
 hduser ALL=(ALL)  NOPASSWD:ALL
 ## 保存是需要使用 :wq!

5.2 部署JDK环境

所有node节点都需要执行

 # 上传安装包并安装
 rpm -ivh jdk-8u171-linux-x64.rpm
 
 # 配置环境变量
 echo 'export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64' >> /etc/profile
 echo 'export CLASSPATH=$JAVA_HOME/lib:$CLASSPATH' >> /etc/profile
 echo 'export PATH=$JAVA_HOME/bin:$PATH' >> /etc/profile
 # 刷新环境变量
 source /etc/profile
 # 查看Java版本
  java -version

5.3 配置免密登录

仅在node1节点执行

 ssh-keygen
 ssh-copy-id node1
 ssh-copy-id node2
 ssh-copy-id node3

5.4 部署Hadoop

5.4.1 安装配置Hadoop

所有node节点都需要执行

 # 安装Hadoop
 tar zxf hadoop-2.6.5.tar.gz -C /home/hduser/
 # 修改目录名
 mv /home/hduser/hadoop-2.6.5/ /home/hduser/hadoop
 # 配置环境变量
 cat >> /etc/profile << 'EOF'
 export HADOOP_HOME=/home/hduser/hadoop
 export PATH=$HADOOP_HOME/bin:$PATH
 EOF
 # 刷新环境变量
 source /etc/profile

5.4.2 修改Hadoop相关配置文件

 # 编辑/home/hduser/hadoop/etc/hadoop/hadoop-env.sh 文件
 vim /home/hduser/hadoop/etc/hadoop/hadoop-env.sh 
 # 注释掉原本的export JAVA_HOME，然后再添加下面内容：
 export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
 
 # 编辑/home/hduser/hadoop/etc/hadoop/yarn-env.sh 文件
 vim /home/hduser/hadoop/etc/hadoop/yarn-env.sh 
 # 添加下面内容：
 export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
 
 # 编辑/home/hduser/hadoop/etc/hadoop/slaves 文件
 vim /home/hduser/hadoop/etc/hadoop/slaves 
 ##清空原内容，然后输入如下内容
 node2
 node3
 
 # 编辑/home/hduser/hadoop/etc/hadoop/core-site.xml
 ##该文件是 Hadoop 全局配置
 vim /home/hduser/hadoop/etc/hadoop/core-site.xml 
 # 末行添加：
 
     
         fs.defaultFS
         hdfs://node1:9000
     
     
         hadoop.tmp.dir
         file:/home/hduser/hadoop/tmp
     
 
 
 # 编辑/home/hduser/hadoop/etc/hadoop/hdfs-site.xml
 ##该文件是 HDFS 的配置
 vim /home/hduser/hadoop/etc/hadoop/hdfs-site.xml
 # 末行添加：
 
     
         dfs.namenode.secondary.http-address
         node1:50090
     
     
         dfs.namenode.name.dir
         file:/home/hduser/hadoop/dfs/name
     
     
         dfs.datanode.data.dir
          file:/home/hduser/hadoop/dfs/data
     
     
         dfs.replication
         2
     
     
         dfs.webhdfs.enabled
         true
     
 
 
 # 编辑/home/hduser/hadoop/etc/hadoop/mapred-site.xml
 ##该文件是 MapReduce的配置，可从模板文件 mapred-site.xml.template 复制
 cp  /home/hduser/hadoop/etc/hadoop/mapred-site.xml.template  /home/hduser/hadoop/etc/hadoop/mapred-site.xml
 vim /home/hduser/hadoop/etc/hadoop/mapred-site.xml
 # 末行添加：
 
     
         mapreduce.framework.name
         yarn
     
     
         mapreduce.jobhistory.address
         node1:10020
     
     
         mapreduce.jobhistory.webapp.address
         node1:19888
     
 
 
 # 编辑/home/hduser/hadoop/etc/hadoop/yarn-site.xml
 ##如果在 mapred-site.xml配置了使用YARN框架，那么YARN框架使用此文件中的配置
 vim /home/hduser/hadoop/etc/hadoop/yarn-site.xml 
 # 末行添加：
 
     
         yarn.nodemanager.aux-services
         mapreduce_shuffle
     
     
         yarn.nodemanager.aux-services.mapreduce.shuffle.class
         org.apache.hadoop.mapred.ShuffleHandler
     
     
         yarn.resourcemanager.address
         node1:8032
     
     
         yarn.resourcemanager.scheduler.address
         node1:8030
     
     
         yarn.resourcemanager.resource-tracker.address
         node1:8035
     
     
         yarn.resourcemanager.admin.address
         node1:8033
     
     
         yarn.resourcemanager.webapp.address
         node1:8088
     
 
 
 
 ## 将修改完的配置文件推送分别到node2、node3节点
 scp -r /home/hduser/hadoop/* node2:/home/hduser/
 scp -r /home/hduser/hadoop/* node3:/home/hduser/

5.5 Hadoop相关管理

 # 切换到Hadoop安装目录下
 cd /home/hduser/hadoop/
 # 格式化，必须要做的！！
 bin/hdfs namenode -format
 # 启动hdfs
 sbin/start-dfs.sh
 # 启动yarn
 sbin/start-yarn.sh
 # 也可以使用start-all.sh全部启动
 sbin/start-all.sh
 # 全部停止 
 sbin/stop-all.sh 
 # 查看集群状态
 bin/hdfs dfsadmin -report
 # 查看Java进程
 jps
 # 查看50070端口
 netstat -nlpt | grep 50070

5.6 运行Hadoop 的WordCount 程序

5.6.1 在/home/hduser/file 目录下创建 file1.txt、file2.txt

 # 在/home/hduser/file 目录下创建 file1.txt、file2.txt
 mkdir /home/hduser/file
 echo "Hello World hi HADOOP" > /home/hduser/file/file1.txt
 echo "Hello hadoop hi CHINA" > /home/hduser/file/file2.tx

5.6.2 将 file1.txt、file2.txt 保存到 HDFS 中

 # 创建 HDFS 目录/input2
 bin/hadoop fs -mkdir /input2
 bin/hadoop fs -ls /
 # 将 file1.txt、file2.txt 上传到 HDFS 中
 bin/hadoop fs -put /home/hduser/file/file* /input2
 # 查看
 bin/hadoop fs -ls /input2
 bin/hadoop fs -cat /input2/*

5.6.3 执行 WordCount 程序并查看结果

 # 执行 WordCount 程序
 bin/hadoop jar /home/hduser/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar  wordcount /input2/ /output2/wordcount1
 # 查看执行结果
 bin/hadoop fs -ls /
 bin/hadoop fs -ls /output2
 bin/hadoop fs -cat /output2/wordcount1/*

数据权限访问控制（Apache Sentry） deepdata_cn 权限管理 apache sentry
ApacheSentry最初由Cloudera公司内部开发，针对Hadoop系统中的数据（主要是HDFS、Hive的数据）进行细粒度控制，对HDFS、Hive以及Impala有着良好的支持性。2013年Sentry成为Apache的孵化项目，为Hadoop集群元数据和数据存储提供集中、细粒度的访问控制。其架构包括DataEngine、Plugin、Policymetadata等部分，Plugin负
Mongodb配置分片服务器 czw0723 mongodb 数据库服务器
mongodb的sharding集群由以下3个服务组成：ShardsServer:每个shard由一个或多个mongod进程组成，用于存储数据ConfigServer:用于存储集群的Metadata信息，包括每个Shard的信息和chunks信息RouteServer:用于提供路由服务，由Client连接，使整个Cluster看起来像单个DB服务器另外，Chunks是指MongoDB中一段连续的数
01.什么是MQTT？墨先森 NodeMCU与MQTT 物联网
目录00_前言01_简述02_特性03_MQTT运行机制00_前言本系列博客是基于NodeMCU平台来完成的一个物联网小项目，目的在于了解并学习MQTT协议，掌握MQTT协议的作用机制。以上。01_简述以下摘自百度百科MQTT(消息队列遥测传输)是ISO标准(ISO/IECPRF20922)下基于发布/订阅范式的消息协议。它工作在TCP/IP协议族上，是为硬件性能低下的远程设备以及网络状况糟糕的情
python 利用pandas实现从CSV导出并格式化后写入.jsonl文件风_流沙 python工具备忘录 python pandas 开发语言
你可以使用pandas库来读取CSV文件，然后通过一些格式化操作将数据转换为JSONL格式并写入文件。JSONL（JSONLines）格式是一种每行一个JSON对象的文件格式。下面是一个示例，演示了如何使用pandas读取CSV文件，处理数据并将其导出到JSONL文件中：示例代码：importpandasaspdimportjson#读取CSV文件df=pd.read_csv('data.csv'
spring +kotlin 配置redis 和redis的常用方法 LCY133 spring后端 spring java 后端
在SpringBoot+Kotlin项目中，可以同时使用RedissonClient（提供分布式对象和高级功能）和RedisTemplate（SpringDataRedis的标准操作）。以下是完整配置和用法示例：1.添加依赖在build.gradle.kts中引入依赖：dependencies{//SpringDataRedisimplementation("org.springframework
4G核心网的演变与创新：从传统到虚拟化的跨越爱浦路 IPLOOK 4G核心网核心网
4G核心网随着移动通信技术的不断发展，4G核心网已经经历了从传统的硬件密集型架构到现代化、虚拟化网络架构的重大转型。这一演变不仅提升了网络的灵活性和可扩展性，也为未来的5G、物联网（LOT）和边缘计算等技术的发展奠定了基础。本文将探讨4G核心网的演变过程，重点分析虚拟化技术在其中的作用，并结合我们公司IPLOOK的创新产品和解决方案，展望未来核心网的发展趋势。传统4G核心网：硬件依赖与功能分离在4
SGP.31/.32 规范以及它将如何影响物联网 SofterICer eSIM 物联网
去年，GSMA发布了适用于物联网设备的新eSIM远程配置标准的架构和要求、SGP.31eSIM物联网架构和网络受限和/或用户界面(UI)受限物联网设备中eUICC远程配置的要求。自SGP.31获得批准以来，业界一直在等待GSMA发布SGP.31的技术实施规范SGP.32。5月26日，GSMASGP.32eSIM物联网技术规范发布，为设备制造商开始受益于新标准并扩展其物联网项目铺平了道路。据物联网专
《Operating System Concepts》阅读笔记：p408-p448 codists 读书笔记操作系统
《OperatingSystemConcepts》学习第34天，p408-p448总结，总计41页。一、技术总结2.page-replacementalgorithmInmemorymanagement,thealgorithmthatchooseswhichvictimframeofphysicalmemorywillbereplacedbyaneedednewframeofdata.(1)FI
【操作系统概念】【恐龙书】笔记六——第六章进程同步我岂是非人哉计算机操作系统
Chapter6:ProcessSynchronization问题的提出：彼此合作的进程之间可以用共享逻辑地址空间的方式来实现，共享逻辑地址空间，也就是共享代码区和数据区，会导致数据不一致，所以介绍一些避免数据不一致的机制。6.1BackgroundConcurrentaccesstoshareddatamayresultindatainconsistencyMaintainingdatacons
hbase表无法删除，命令行卡住问题处理 spring208208 大数据组件线上问题分析 hbase 数据库大数据
问题现象hbase表无法删除，命令行卡住1.activemaster日志出现超时WARNorg.apache.hadoop.hbase.master.procedure.TruncateTableProcedure:Retriableerrortryingtotruncatetable=xxxstate=TRUNCATE_TABLE_PRE_OPERATIONorg.apache.hadoop.h
物联网（IoT）系统中，数据采集器拿来即用小赖同学啊人工智能智能硬件物联网
在物联网（IoT）系统中，数据采集器（也称为网关或数据集中器）扮演着至关重要的角色，主要负责从各种传感器和设备中收集数据，并将其转换为统一的格式后传输到云端或本地服务器进行处理和分析。以下是关于数据采集器的设计要点、功能需求以及实现方案：一、数据采集器的核心功能数据中转：从传感器、设备或其他数据源收集数据。将数据转发到云端、本地服务器或其他目标系统。数据格式统一化：将不同协议、不同格式的数据转换为
嵌入式Linux网络编程实战：基于libcurl实现Gitee文件上传银河码 Linux网络编程 linux 网络 gitee c语言 vscode tcp/ip 服务器
嵌入式Linux网络编程实战：基于libcurl实现Gitee文件上传【本文代码已在立创·泰山派平台验证通过，可直接用于物联网设备数据上报场景】一、功能概述与实现效果1.1核心功能本地文件读取：支持任意二进制/文本文件Base64编码转换：符合RFC4648标准HTTP传输：通过libcurl实现，也可以使用HTTPS加密通信GiteeAPI对接：自动创建/更新仓库文件1.2运行效果演示#上传本地
springCloud集成tdengine(原生和mapper方式) 其一张小娟 spring cloud tdengine mybatis
第一种mapper方式，原生方式在主页看第二章一、添加pom文件com.zaxxerHikariCPcom.taosdata.jdbctaos-jdbcdriver3.5.3二、在nacos中配置好数据库连接spring:datasource:url:jdbc:TAOS://localhost:6030/testusername:rootpassword:yourPassWorddriver-cl
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
springCloud集成tdengine(原生和mapper方式) 其二原生篇张小娟 spring cloud tdengine spring
mapper篇请看另一篇文章一、引入pom文件com.taosdata.jdbctaos-jdbcdriver3.5.3二、在nacos中填写数据库各种value值tdengine:datasource:location:yourLocationusername:rootpassword:yourPassword三、编写TDengineUtil文件下方util文件里面，包含创建database的方
使用Docker部署RabbitMQ 九思x docker rabbitmq 容器
第一步：安装RabbitMQ#1.拉取镜像dockerpullrabbitmq:3.12.0-management#2.启动容器（开放端口+数据持久化）dockerrun-d\--name=share_rabbitmq\-p5672:5672\#AMQP协议端口-p15672:15672\#管理界面端口-v/opt/rabbitmq/data:/var/lib/rabbitmq\#数据持久化目录r
Appdata\Local Roaming LocalLow文件夹 ynchyong 系统运维 local Roaming LocalLow
自Vista及Win7开始，微软更改了原有的应用程序存储目录结构，（XP是ApplicationData）C\用户\用户名\Appdata,并分为Roaming,Local,及LocalLow三个文件夹.更改原因如下:优化登录速度根据使用安全级别分别访问不同文件夹Windows使用Local及LocalLow文件夹存放非漫游的应用程序数据（类似注册表Local_machine）及一些空间占用大无法
20190626_二次开发BarTender打印机_C#代码_一边读取TID_一边打印_打印机POSTEK weixin_30784141 c/c++数据库
demo代码如下:privatevoidbtnPrint_Click(objectsender,EventArgse){if(this.btnPrint.Text=="停止打印"){SetBtnPrintUIEnable();return;}//禁用界面上的相关按钮SetBtnPrintUIDisable();vardt=newDataTable();newTask(()=>{///开始的打印//
CI/CD(三) 安装nfs并指定k8s默认storageClass qq_41369135 kubernetes ci/cd docker nfs storageClass
一、NFS服务端安装（主节点10.60.0.20）1.安装NFS服务端sudoaptupdatesudoaptinstall-ynfs-kernel-server2.创建共享目录并配置权限sudomkdir-p/data/k8ssudochownnobody:nogroup/data/k8s#允许匿名访问sudochmod777/data/k8s3.配置NFS导出规则编辑/etc/exports文
学习Video.js 前端熊猫 Video Player 学习
查阅官方文档，学习video.js相关属性、回调与方法：播放器选项设置①标准的video标签属性②data-setup属性传递JSON③创建播放器实例以第二个参数配置videojs('my-player',{controls:true,autoplay:false,preload:'auto'});//修改选项varplayer=videojs('my-player');player.option
SAP-ABAP：SAP BW模块架构与实战应用详解爱喝水的鱼丶 ABAP开发之必须知道的 VIP详情查看专栏 SAP-ABAP开发基础详解开发语言 SAP ABAP ERP 开发运维
SAPBW模块架构与实战应用详解—##一、核心架构分层设计###1.数据仓库层（DataWarehousingLayer）|组件|功能说明|典型对象||-------------------|--------------------------------------------------------------------------|-----------------------------
SAP-ABAP：ABAP内存和SAP内存详细对比爱喝水的鱼丶 VIP详情查看专栏 SAP-ABAP开发基础详解 ABAP开发之必须知道的 SAP 运维 ABAP ERP
在SAPABAP中，内存数据（MemoryData）是一种临时存储机制，允许在同一会话或程序之间共享数据。内存数据存储在ABAP内存（ABAPMemory）或SAP内存（SAPMemory）中，具体取决于数据的生命周期和共享范围。以下是关于如何在SAP中保存和使用内存数据的详细说明：—##1.ABAP内存vsSAP内存###ABAP内存-作用范围:仅在当前内部会话（InternalSession）
基于Redis分布锁+事务补偿解决数据不一致性问题 yiridancan 并发编程 Redis 分布式 redis 数据库缓存
基于Redis的分布式设备库存服务设计与实现概述本文介绍一个基于Redis实现的分布式设备库存服务方案，通过分布式锁、重试机制和事务补偿等关键技术，保证在并发场景下库存操作的原子性和一致性。该方案适用于物联网设备管理、分布式资源调度等场景。代码实现importjava.util.HashMap;importjava.util.Map;importorg.slf4j.Logger;importorg
一些工程实践中的tips litvm 经验分享经验分享
1，简单方法实现四舍五入实际项目中，经常会出现需要四舍五入的地方，比如采集温度temp，如果直接把float类型保存为小数点后1位。它会直接舍后面多余的位数，这样可能偏差会比较大。我们可以通过+0.5来实现四舍五入。比如：floattemp=30.6;//假设我们是扩大10倍保存//直接保存uint16_tmodbus_data.temp=temp*10;//结果就是30//+0.5uint16_
微服务即时通讯系统的实现（客户端）----（2） Smile丶凉轩项目微服务架构云原生
目录1.将protobuf引入项目当中2.前后端交互接口定义2.1核心PB类2.2HTTP接口定义2.3websocket接口定义3.核心数据结构和PB之间的转换4.设计数据中心DataCenter类5.网络通信5.1定义NetClient类5.2引入HTTP5.3引入websocket6.小结7.搭建测试服务器7.1创建项目7.2服务器引入http7.3服务器引入websocket7.4服务器引
数据结构-----队列磨十三数据结构算法 linux
顺序队列（Queue）一、队列核心概念1.基本特性先进先出（FIFO）：最早入队的元素最先出队操作限制：队尾（Rear）：唯一允许插入的位置队头（Front）：唯一允许删除的位置2.顺序队列结构typedefintDATATYPE;typedefstructqueue{DATATYPE*ptr;//存储空间基地址inttlen;//队列总容量inthead;//队头索引inttail;//队尾索引
Cesium实践（1）—— Hello World 迦南giser WebGIS #Cesium webgis cesium
文章目录前言Cesium是什么Cesium核心类ViewerSceneEntityDataSourceCollection创建第一个Cesium应用工程搭建Cesium版helloworld总结前言工作大半年来主要的技术栈是mapbox-gl和threejs，但是作为一名GIS专业毕业生，一直对Cesium充满兴趣。Cesium不仅保持了threejs的三维绘制能力，而且内置大量渲染地理数据的AP
uni-app的滚动加载 uni-load-more组件使用 weixin_42885875
手机端的滚动加载其实就是PC端的分页，触底之后页数加一调用接口，将返回的数据连接在原来的数据后面，就大致完成了。使用组件https://ext.dcloud.net.cn/plugin?id=29exportdefault{data(){return{ifBottomRefresh:false,loadmore:'more',contentText:{"contentdown":"加载更多数据",
access读取EXCEL文件,并根据动态生成表，完成报表的导入 MES先生 ACCESS VBA access
OptionCompareDatabasePublicsheetidAsString'报表IDPublictempAsString'获取年月时分秒PublictmpIAsInteger'对应EXCEL行PublictmpJAsInteger'对应EXCEL列PublicXlsAppAsObjectPublicXlsWorkbookAsObjectPublicXlsWorkSheetAsObject
ESP32-C6助力设备互联互通，Wi-Fi6无线通信方案，物联网交互联动深圳启明云端科技 WiFi6 ESP32-C6 乐鑫物联网无线方案
在物联网飞速发展的今天，连接技术的革新成为推动行业进步的关键力量。Wi-Fi6技术的出现，犹如一颗璀璨的新星，为物联网设备带来了前所未有的高效与低耗体验。乐鑫推出的ESP32-C6作为首款支持Wi-Fi6的SoC，集成了2.4GHzWi-Fi6、Bluetooth5(LE)和802.15.4协议，这一组合使其具备了行业领先的射频性能。其支持的上行、下行正交频分多址（OFDMA）接入和下行多用户多输
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

了解物联网架构之Hadoop

一、认识大数据

1.1 大数据定义

1.2 大数据特点

1.3 常见大数据处理系统

二、了解Hadoop

2.1 Hadoop简介

2.2 Hadoop特点

2.3 Hadoop运行模式

2.4 Hadoop 体系结构

三、分布式文件系统 HDFS

3.1 HDFS定义

3.2 HDFS优缺点

3.3 HDFS体系结构

3.4 HDFS相关基础概念

四、分布式计算系统 MapReduce

4.1MapReduce介绍

4.2 MapReduce工作原理

4.3 MapReduce 作业在 MapReduce 框架中的工作原理

五、部署Hadoop系统

5.1 创建用户和组

5.2 部署JDK环境

5.3 配置免密登录

5.4 部署Hadoop

5.4.1 安装配置Hadoop

5.4.2 修改Hadoop相关配置文件

5.5 Hadoop相关管理

5.6 运行Hadoop 的WordCount 程序

5.6.1 在/home/hduser/file 目录下创建 file1.txt、file2.txt

5.6.2 将 file1.txt、file2.txt 保存到 HDFS 中

5.6.3 执行 WordCount 程序并查看结果

你可能感兴趣的:(hadoop,big,data,物联网)