淵_ken

【课程笔记】华为 HCIA-Big Data 大数据总结

HDFS分布式文件系统

ZooKeeper分布式应用程序协调服务

HBase非关系型分布式数据库

Hive分布式数据仓库

ClickHouse列式数据库管理系统

MapReduce分布式计算框架

Yarn资源管理调度器

Spark分布式计算框架

Flink分布式计算框架

Flume日志采集工具

Kafka分布式消息队列

本课程主要围绕以下几个服务展开：

HDFS(Hadoop分布式文件系统)

ZooKeeper(分布式应用程序协调服务)

HBase(非关系型分布式数据库)

Hive(分布式数据仓库)

ClickHouse(列式数据库管理系统)

MapReduce(分布式计算框架)

Yarn(资源管理调度器)

Spark(分布式计算框架)

Flink(分布式计算框架)

Flume(日志采集工具)

Kafka(分布式消息队列)

它们之间的关系可以用下面这个图来进行总结概况：

（1）OLAP：联机分析处理 OLTP：联机事务处理，同时成功或失败

（2）文件系统：由文件名、元数据Metadata、数据块Block组成

HDFS分布式文件系统

（1）Client：提供类似shell命令行访问HDFS中数据

（2）NameNode名称节点：存放元数据Metadata，负责管理命名空间Namespace(包含目录、文件和块)，保存了Fslmage(NameNode启动会先加载到内存，而内存就是它)和EditLog(记录加载内存后文件的增删改查)

（3）DataNode数据节点：存放数据，以数据块Block存储

（4）ZooKeeper保障HDFS中NameNode的高可用性，传输心跳

（5）ZKFC监测Active节点是否正常，如果挂了能切换到Stand by节点

（6）Distributed FileSystem分布式文件系统

（7）FSData OutputStream和FSData IntputStream是流连接

ZooKeeper分布式应用程序协调服务

（1）安全认证依赖于KerberOS+LdapServer=令牌

（2）ZooKeeper集群由一组Server节点组成。Server节点由一个Leader节点(接受到数据变更请求，先写磁盘再写内存)和多个Follow节点组成

HBase非关系型分布式数据库

（1）HBase是分布式存储系统，利用HDFS作为其文件存储系统，提供分布式数据系统，而ZooKeeper是协同服务

（2）HBase数据模型(由表构成、列存储)，有行键Row Key、列族、列、单元格cell、时间戳，数据类型是字节数组byte[ ]（anchor(列族)：aa.com(列)）

（3）HMaster负责协调，只有一个。ZooKeeper会避免单点失效

（4）HRegionServer负责存，有多个。而HBase最基本单元就是Region(列族)

（5）HLog预写日志

（6）HRegion是工作节点，里面有MemStore(当数据刚存入或刚被读取会被当做热点数据存在"内存"，为了高效)和StoreFile(数据持久化在磁盘，里面还有HFile用于对接HDFS，实际数据存储在HDFS)

（7）HBase有一个自己维护的meta表(包含Meta Region和User Region)

（8）Namespace命名空间包含Table表，再包含Region，再包含Store，再包含MemStore和StoreFile，而StoreFile包含Block对接HDFS

（9）Compaction机制减少同一个Region中同一个Column Family列族下的HFile数目。分Minor Compaction(小范围HFile合并)和Major Compaction(全局HFile合并)

（10）OpenScanner(读取过程会创建)，分读取内存数据MemStore的为MemStoreScanner和读取磁盘数据HFile的StoreFileScanner

（11）BloomFilter用于查询数据是否存在。相当于在大表里查询某一格是否存在，若该格不存在则一定为空，若该格存在可能有误差，存的是别的数据，概率小

（12）Hindex二级索引，华为开发支持列索引，一般HBase是行

Hive分布式数据仓库

（1）Hive封装了MapReduce，可以用SQL调用它。数据存储在HDFS上

（2）ETL(提取、转换、加载数据到目标数据仓库)

（3）支持Tez、Spark等多种计算引擎

（4）Hive是离线数仓，不支持实时

（5）HiveServer是Hive的工作节点，并使用MetaStore存储元数据

（6）Hive的架构：接口层(Beeline、JDBC、Thrift、ODBC)，访问层(Web Interface Web方式访问、Thrift Server 第三方方式访问)，Driver层(Compiler编译、Optimizer自动优化、Executor执行，并由MetaStore作元数据管理)，执行层(Tez、MapReduce、Spark计算引擎)

（7）Hive数据存储模型，存储在HDFS上：数据库database，在HDFS上是目录 -> 表，目录中的目录(分为托管表MANAGED_TABLE元数据和数据会被一起删除和外部表EXTERNAL_TABLE只删除元数据) -> 分区，表目录中的目录 -> 桶，文件 -> 倾斜数据和正常数据

（8）UDF(输入一条返回一条，都是用户自定义函数，内置函数也算)

（9）DDL数据定义语言(建表、修改表、删表、分区、数据类型)，DML数据管理语言(数据导入、数据导出)，DQL数据查询语言(简单查询、复杂查询)

ClickHouse列式数据库管理系统

（1）是OLAP(联机分析处理)的列式数据库，查询速度特别快，特别基于大宽表。支持SQL查询，主要引擎式MergeTree

（2）DBMS是数据库+管理系统

（3）ClickHouse应用场景分离线数据湖、实时数据湖、逻辑数据湖。CDC(增量数据采集)、Redis(非关系型数据库，流处理批处理都可以)、DLC(元数据管理)、ES(谷歌百度底层查询服务)

（4）ClickHouse架构有CLI(ClickHouseClient)客户端TCP访问、JDBC Driver(BalancedClickHouseDataSource)HTTPS访问、ClickHouseBalancer负载、ClickHouse Server工作节点、ZooKeeper的ZNodes提供冗余

（5）常见表引擎：TinyLog(小日志文件)、Memory(内存)、MergeTree(树型结构)、Replacing MergeTree(复制聚合树，支持副本机制)、Summing MergeTree(摘要聚合树)

（6）TTL(Time to Live，数据的存活时间到期自动删除)，Data Skipping Index(二级索引，跳级索引，偏移量)

（7）分片：数据量很大时切分存储，数据不同；副本：复制了一份，数据完全相同

（8）原子性：Block数据块数据全部写入成功或失败；唯一性：避免重复写入，依靠Hash信息摘要

（9）分片机制：将一张表的数据水平切分到多个节点，不同节点之间数据不重复shard；分布式表：用于查询分片数据，通过分布式表进行查询。Replicate副本

（10）CV(用"，"分隔数据，支持表格打开)

MapReduce分布式计算框架

（1）Map是分而治，Reduce把处理完的结果进行统计合并

（2）用于大规模数据集的并行计算和离线计算

（3）Job计算任务

（4）Map阶段：数据所在计算，在一堆杂乱无章的数据提取key和value，也就是特征。(提取)会先将待处理文件分片，而每一分片就是一个数据块Block。Map()完后会放入环形内存缓冲区，并达到80%发生Spill溢写，溢出前会有Map Phase(partition分区、sort排序、combine合并可选、Merge归并)

（5）Shuffle一定规则放入=Map Shuffle+Reduce Shuffle，从环形内存缓冲区到Reduce归约之间都是Shuffle

（6）Reduce阶段：数据是以key后跟着的value来组织的，这些value是有相关性。(合并)Map()（Map Tesk）后成为MOF文件到本地磁盘，再对其进行排序和合并处理再给Reduce，这个过程Reduce Phase(Copy复制到缓存，Merge归并到磁盘，Reduce进行归约)

（7）WordCount就是Map Phase过程，最后Reduce主动找Map拉取数据

Yarn资源管理调度器

（1）ResourceManager主管理节点

（2）NodeManager从管理节点，每个都可以设置分配的内存和CPU。每个机器可以打标签

（3）ApplicationMaster运行程序的管理者，在从管理节点中，负责向调度器申请、释放资源

（4）Container容器，是Yarn资源抽象，任务最终跑的地方，一个容器只能运行一个Job

（5）Yarn的高可用通过引入ZooKeeper，对ResourceManager主管理节点进行解决单点失效，有一个Active和多个Stand by(HDFS的NameNode同样)

（6）Yarn APPMaster容错机制，是失败重启机制，重新启动ApplicationMaster来调度容器

（7）Scheduler调度器负责给应用分配资源，有FIFO Scheduler(先进先出调度器)、Capacity Scheduler(容器调度器)、Fair Scheduler(公平竞争调度器)。以队列为单位划分资源

Spark分布式计算框架

（1）应用场景：离线批处理、实时流处理、交互式查询

（2）ETL(抽取、转换、加载)

（3）Spark比MapReduce可以处理更大数据量，因为是基于内存计算

（4）RDD弹性分布式数据集，只可读不可修改，默认存储在内存，内存不足溢写到磁盘。具有血统机制Lineage，会溯源到源头重新计算，当数据丢失可快速进行数据恢复

（5）RDD的依赖关系：窄依赖每个父RDD的Partition分区最多被子RDD的一个Partition使用。没有数据交换，没有数据在网络间传输。宽依赖多个子RDD的Partition会依赖同一个父RDD的Partition，有数据交换，有数据在网络间传输，往往对应有shuffle操作

（6）RDD的Stage阶段划分，根据宽依赖划分

（7）RDD的操作类型(创建操作、转换操作只定义逻辑不执行、控制操作、行为操作)

（8）DataFrame也是弹性分布式数据集，只可读不可修改，底层是RDD。但它支持记录数据的结构信息即schema类似二维表格，还支持通过Spark Catalyst Optimiser进行默认优化

（9）DataSet，DataFrame是DataSet的特例为DataFrame=DataSet[ROW]，有Dataset[Row]、Dataset[Car]、Dataset[Person]。是强类型

（10）Spark体系架构：①核心是Spark Core(RDD)；②可以跑在Standalone、YARN、Mesos上面；③上层可以进行应用有Spark SQL(调用SQL，一般与Hive对比)、Structured Streaming(流式计算结构处理)、Spark Streaming(小批量流处理)、MLlib、GraphX(图论)、SparkR

（11）Spark SQL用于结构化数据处理的模型，可以无缝使用SQL语句或DataFrame API(Table API)对结构化数据进行查询

（12）Structured Streaming是构建在Spark SQL(当流式数据不断的产生时，Spark SQL将会增量的、持续不断处理数据，并将结构更新到数据集)引擎上的流式数据处理引擎

（13）Spark Streaming将实时输入数据流以时间片(秒级)为单位进行拆分，然后经Spark引擎以类似批处理的方式处理每个时间片数据(对一个时间段内的数据收集起来作为一个RDD再处理)。返回的数据类型时DStream。并有窗口在DStream滑动，并合并和操作落入窗口内的RDDs，产生窗口化的RDDs(窗口间隔和滑动间隔)。Spark Streaming经常与Storm(来一条数据处理一条数据)对比。Spark Streaming支持Checkpoint容错

Flink分布式计算框架

（1）Flink支持高吞吐和exactly-once语义(仅有一次，不多也不少)的实时计算

（2）Flink核心理念状态(之前计算的计算结构，因为是流计算，数据源源不断，需要用"状态"传递)状态管理(Flink内置了状态，不需要把它存储在外部系统)

（3）Flink Runtime流处理引擎整体架构：①APIs(DataStream API Stream Processing流处理、DataSet API Batch Processing批处理、对于关系型数据可以使用Table API和SQL查询)；②Corn(Runtime Distributed Streaming DataFlow架构)；③Deploy部署模式(Local Single JVM本地、Cluster Standalone，Yarn集群、Cloud，GCE EC2云)；④Libraries应用(CEP Event Processing复杂编程、Table Relational关系型表计算、Flink ML Machine Learning机器学习、Gelly Graph Processing图论计算、Table Relational基于批处理表计算)

（4）Flink中用DataStream表示流数据(含有重复数据的不可修改集合)和DataSet表示批处理

（5）Flink程序由Source(负责数据读取)、Transformation(负责对数据转换)、Sink(负责最终数据输出)，各部分之间流转的数据为流Stream

（6）Flink程序运行(计算角度)：JobManager主节点，负责调度，也是作业管理器；TaskManager从节点，负责管理计算，也是任务管理器(还有资源管理器、分发器)；Task Slot负责计算；Task最终运行的地方，在Task Slot里。(物理角度)：主节点是master，工作节点(从)是worker

（7）JobClient是Flink程序和JobManager交互的桥梁

（8）在Flink有三类Operator分别为Source Operator(数据源操作)、Transformation Operator(数据转换操作)、Sink Operator(数据存储操作)。都是逻辑

（9）Flink基本数据模型是数据流。流是无边界的无限流，即流处理；流是有边界的有限流，即批处理(批处理是流处理的一种特殊情况)

（10）无状态处理：如果处理一个事件(或一条数据)的结果只跟事件本身的内容有关；有状态处理：如果还和之前处理过的事件有关联

（11）无界流：有定义流的开始，没有定义流的结束，必须持续处理；有界流：有定义流的开始，也定义流的结束，可以读取所有数据后再进行计算

（12）在事件流数据中，我们需要用key将事件分组，并且每隔一段时间就针对每一个key对应的事件计数

（13）processing time作为某个事件的时间，与数据无关，是系统时间。即事件被系统处理的时间

（14）event time是数据事件。即事件发生时的时间。携带TimeStamp时间戳

（15）ingestion time是Flume维护的数据时间。即事件到达流处理系统的时间

（16）Window是切割无限数据为有限块进行处理的手段。它将无限的stream拆分成有限大小的buckets桶

（17）Window类型：分为Count Window(数据驱动，计数与时间无关)和Time Window(时间驱动，按照时间生成Window)

（18）Time Window根据窗口分为：Tumbling Window滚动窗口(头对尾)、Sliding Window滑动窗口(头不对尾)、Session Window会话窗口

（19）乱序问题：流处理从事件产生流经source再到operator中间由于网络会导致乱序，导致Flink接收到的事件不是按照Event Time

（20）Watermark保证等一定时间发车，但算子如果延迟太久也不会被接收

（21）Watermark能保证基于event-time的窗口被销毁时已处理完所有数据。Watermark会携带一个单调递增的时间戳t，Watermark(t)表示所有时间戳不大于t的数据已经到来，未来小于等于t的数据不会再来，可以放心销毁窗口(Watermark策略是定期生成的)

（22）延迟事件：是乱序事件的特例，超过了水位线Watermark的预计，导致窗口在它们到达之前已经关闭

（23）延迟事件处理机制：重新激活已经关闭的窗口并重新计算以修正结果、将延迟事件收集起来另外处理、将延迟事件视为错误消息并丢弃。Flink默认的处理方式是第三种，其他两种分别使用Side Output和Allowed Lateness

（24）Side Output机制可以将延迟事件单独放入一个数据流分支，作为Window计算结果的副产品，以便用户获取并对其特殊处理。Allowed Lateness机制允许用户设置最大延迟时间，Flink会在窗口关闭后一直保存窗口状态直至超过允许延迟时间，这期间的延迟事件不会被丢弃而是默认触发窗口重新计算

（25）设置Allowed Lateness之后迟来的数据同样可以触发窗口，进行输出。再利用Side Output获取这些延迟的数据

（26）Flink提供三层API分别是DataStream API、DataSet API、Table API(类SQL)

（27）Checkpoint保证Flink的excatly-once，相当于快照，在出现故障时将系统重置回正确状态

（28）Flink会在输入的数据集上间隔性生成checkpoint barrier，通过栅栏(barrier)将间隔时间段内的数据划分到相应checkpoint中

（29）外部检查点：将状态数据保存在外部系统

（30）exactly-once：有且仅有一次。保证端到端数据一致性，数据要求高，不允许出现数据丢失和数据重复

（31）at-least-once：至少有一次。会一直发数据直至被接收，数据可能重复，适合时延和吞吐量要求高但对数据一致性要求不高的场景

（32）Savapoint也是保存数据，靠checkpoint实现。区别是checkpoint是自动恢复开始永远不停，由Flink自动触发并管理。而Savapoint是手动停止手动恢复，开始后可以停止升级或修改

（33）State Backend：用DataStream API编写的程序会以各种形式保存状态，在启动checkpoint机制时，状态会随着checkpoint而持久化，但状态内部的存储格式和状态存储在哪取决于State Backend 状态后端

（34）MemoryStateBackend存储基于内存

（35）FsStateBackend基于文件存储

（36）RocksDBStateBackend基于数据库RocksDB(内存+磁盘)存储

Flume日志采集工具

（1）本地文件spooling directory source从目录里采集新的文件内数据

（2）实时日志taildir从目录或文件中采集增量数据，exec执行Linux命令的结果被采集

（3）级联：多个Flume对接起来，合并数据的能力，用于远端本端

（4）Flume架构，节点Agent=Source+Channel+Sink

（5）在Flume传递的数据叫事件events，且为事务管理方式

（6）Source：负责接收events或通过特殊机制产生events，并将events批量放到一个或多个Channels，Source必须至少和一个Channel关联。驱动型Source(外部主动发送数据给Flume，驱动Flume接受数据)；轮询Source(是Flume周期性主动去获取数据)

（7）Channel：作用类似队列，用于临时缓存进来的events，当Sink成功将events发送到下一跳的Channel或最终目的，events会从Channel移除。Memory Channel(不会持久化数据但最快、不安全)；File Channel(基于WAL预写式日志Write-Ahead Log实现)对数据持久化，但需要配置数据目录和checkpoint目录，不同FileChannel均要配置一个checkpoint；JDBC Channel(基于嵌入式Database实现，可以简单取代File Channel)对数据持久化

（8）Sink：将events传输到下一跳或最终目的，成功完成后将events从Channel移除。Sink必须作用于一个确切的Channel

（9）多路复制：将数据复制了两份

（10）Flume支持使用MRS(MapReduce)服务监控

Kafka分布式消息队列

（1）Kafka强依赖ZooKeeper

（2）分布式消息队列：基于可靠的消息队列，在客户端应用和消息系统之间异步传递消息。分为点对点传递模式和发布-订阅模式

（3）点对点消息传递模式(一条消息只能被消费一次，被消费后会在队列中删除，该模式即使有多个消费者同时消费数据也能保证数据处理的顺序)

（4）发布-订阅消息传递模式(消息持久化到topic，消费者可以订阅一个或多个topic，消费者可以消费topic中所有数据，同一条数据可以被多个消费者消费，数据被消费后不会立马删除。消息生产者叫发布者，消费者叫订阅者)

（5）O(1)：常量，不会随数据量变大导致处理时间变小

（6）Broker：Kafka的服务实例，可以动态添加(里有多个Partition)

（7）Topic：每条发布到Kafka集群的消息都要有类别、主题(里面是消息)

（8）Partition：Kafka把Topic分成一个或多个Partition分区，每个分区物理上对应文件夹

（9）Producer生产者：负责发布消息到Kafka Broker

（10）Consumer消费者：记录offset

（11）Consumer Group：每个消费者属于一个特定的Consumer Group，组内消费者对于数据是竞争的，组间消费者对于数据是共享

（12）offset偏移量：每条消息在文件夹中的位置

（13）offset存储机制：Consumer从Broker读取数据后可以选择commit，该操作会在Kafka保存该消费者在该Partition中读取的消息offset，在该消费者下次再读该Partition时会从下一条开始读，避免重复消费数据

（14）Replica：是Partition的副本，保障Partition分区的高可用

（15）Leader和Follow：在既有分区又有副本的情况下，对外提供服务只有一个。两者都是"Replica"的角色。Leader负责跟Producer和Consumer交互，而Follow从Leader复制数据。(拉取高水位线)

（16）Controller：Kafka集群中的服务器，用来对Leader的选举

（17）Partition里有一个或多个Replication副本，会分布在不同Broker，Partition分区的每个Replication副本在逻辑上抽象为一个日志Log对象，是一一对应的

（18）Broker挂了，这个Broker的分区不可以被消费，同时Producer不能写入

（19）ISR同步副本机制队列：如果Leader挂了，哪个Follow与主相同会优先变成Leader

（20）At most once 最多一次：消息可能丢失，消息不会重复发送和处理；At Least once 最少一次：消息不会丢失，消息可能会重复发送和处理；Exactly once 仅有一次：消息不会丢失，消息仅被处理一次

（21）幂等性：被执行多次造成的影响和只执行一次造成的影响一样。每发送给Kafka的消息都含有一个序列号，Broker使用这个序列号来删除重复数据。这个序列号被持久化到副本日志，即使分区的"Leader"挂了，其他Broker接管了Leader，新Leader仍可以判断重复发送的是否重复

（22）acks机制：Producer生产者需要Server接收到信号后返回确认信号，此项配置指Producer需要多少个这样的确认信号。acks=0，Producer不需要信号；acks=1，等Leader将数据写入本地Log，但没等所有Follow写入；acks=-1或all，Leader等所有备份都成功写入日志

（23）Kafka集群默认保留所有消息，存储168小时，因磁盘有限过了就删

（24）Kafka把Topic中的一个Partition分区从大文件拆成多个小文件段，通过多个小文件段就容易定期清除或删除已经消费完的文件，减少磁盘占用

（25）一批数据有".index"数据的偏移量和".log"是实际数据

（26）日志清理方式有两种：delete和compact(压缩，旧数据删除，key相同留下最大的values)

（27）清除的阈值有两种：过期的时间和分区内总日志大小

（28）Kafka不支持消息随机读取

你可能感兴趣的:(华为,HCIA-Big,Data,大数据,大数据)

el-table合并行+数据按照相同名称排序+相同名称内的数据在排序 Web·强 elementui 遇到的问题前端 java javascript
项目场景：项目需求：后端给我返回的数据：原因分析：后端数据所有的内容排列是无顺序的相同名称的不一定靠在一起图片只是巧合，如果按照后端返回的格式直接赋给表格的tabledata那么顺序就不是我们想要的，所以我们首先要把数据处理成我们想要的数据格式。①根据需求首先把数据里的相同名称进行排序然后在将相同名称里的版本从高到低排序②将名称相同的合并成一行并将序号也进行合并解决方案：需求①：this.tabl
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
解锁阿里云E-MapReduce：大数据处理的超能力秘籍云资源服务商阿里云云计算人工智能云原生
一、引言在数字化浪潮汹涌澎湃的当下，大数据已然成为推动各行业创新发展的核心驱动力。从电商平台精准的个性化推荐，到金融机构严密的风险评估，再到医疗领域高效的疾病预测，大数据的应用场景无处不在，深刻地改变着我们的生活与工作方式。在这片充满机遇与挑战的大数据领域中，阿里云E-MapReduce宛如一颗璀璨的明星，占据着举足轻重的地位。它凭借强大的大数据处理能力、卓越的性能表现以及丰富的功能特性，为企业和
C51 中断+主程序读写全局变量遇到的问题及解决摘录上帝木偶
在开发C51单片机时，如果你使用中断+主程序一起读写全局变量时，有机会遇到各种奇怪的现象，怎么调都发现数值是不对的，这时候你应该检查一下以下几点：1、中断函数是否采用了usingX?如无必要，尽量不要使用using寄存器组，我被这个问题弄了2天。2、全局变量如果定义时采用了DATA、XDATA之类的修饰，那么在使用指针引用全局变量时，也要加上这些修饰符。
小程序 rich-text 标签解析图片过大的问题解决無名356 小程序 css3 前端 css
产生问题的原因就是通过此标签的样式不能使用css样式。因为数据直接解析，那么我们可以修改或者处理这个数据来解决问题解决方法，通过修改数据中的文本内容中的img标签的内联样式来实现formatGoodsData(data){letcontent=data.goods_contentcontent=content.replace(/\vue3 添加onShow,每次显示都执行萧大侠jdeps 前端 vue.js javascript
vue3的生命周期没有onShow,uniapp有提供onShow.有时候我们希望用户离开在回到页面时，把他最关心的可能变化比较平繁的数据刷新出来。constonShow=()=>{//这里执行刷新}onMounted(()=>{initData();document.addEventListener('visibilitychange',onShow);});onUnmounted(()=>{d
如何在 ArcGIS 中使用 Microsoft Excel 文件_20250614 Lauren_Lu arcgis microsoft excel
如何在ArcGIS中使用MicrosoftExcel文件软件版本：win11;ArcGIS10.8;Office20241.确认ArcGIS10.8对.xlsx文件的支持ArcGIS10.8支持.xlsx文件（Excel2007及以上格式），但需要安装MicrosoftAccessDatabaseEngine驱动程序来读取这些文件。ArcGIS10.8是一个32位应用程序，因此需要32位的驱动程序
微信小程序＜rich-text＞支持里面图片点击放大二豆是富婆微信小程序小程序
使用渲染类似下面的html代码：宠物友好xxx提供宠物友好服务，具体请见下图wxml：js放大图片方法：//富文本图片点击预览showImg(e){letcontentimg=e.target.dataset.nodes;letimgs=contentimg.match(/]+>/g);//把img所有节点的图片选择出来letarrImg=[];//遍历标签拼拿到你的图片的src里面的内容放在我们
荣耀手机应用使用时间查看方法详解游戏开发爱好者8 http udp https websocket 网络安全网络协议 tcp/ip
荣耀手机如何查看应用使用时间想要了解荣耀手机中各个应用的使用时间吗？接下来，我们将为您详细介绍如何查看这些信息。一、引言在当下智能手机广泛应用的时代，手机应用已然成为我们生活中不可或缺的助手。荣耀手机，作为华为旗下的出色品牌，凭借其出色的性能与丰富的功能，赢得了众多用户的青睐。为了更有效地管理手机使用时间，洞悉个人的应用使用习惯，掌握查看应用使用时间的技巧显得尤为关键。接下来，我们将一步步引导您了
Mariadb-Server的二进制安装 linux土老帽 linux土老帽 mariadb linux centos
搭建环境：OS:centos7.6版本mariadb:mariadb-10.2.25-linux-x86_64.tar.gz#下载地址：DownloadMariaDBServer-MariaDB.org1.创建用户组useradd-r-s/sbin/nologin-d/data/mysqlmysql#创建用户-r系统账户-s指定shell/sbin/nologin-d指定家目录但是不创建原因是系统
windows mysql主从备份_windows下mysql主从备份设置韩山云客 windows mysql主从备份
Windowsserver2008mysql主从数据设置步骤：一、安装MySQL说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL5.5.22二、配置MySQL主服务器(192.168.21.169)mysql-uroot-p#进入MySQL控制台createdatabaseosyunweidb;#建立数据库osyunweidb
使用Docker部署mysql8 小莫分享 docker adb 容器
1、拉取mysql8的镜像：1[root@i-zgn6som8~]#dockerpullmysql:8.02、创建配置和数据文件夹并修改权限：1234mkdir-p/data/mysql8/confmkdir-p/data/mysql8/datachmod-R755/data/mysql8/3、配置一个自定义的配置文件my.cnf:1vim/data/mysql8/conf/my.cnf文件内容如
【游戏技术分享第41期】鸿蒙游戏调用queryProducts接口返回报错1001860001，系统内部错误游戏技术分享鸿蒙游戏-技术分享 harmonyos 游戏华为
关键词IAPkit，鸿蒙，商品查询问题描述游戏集成了鸿蒙应用内支付服务，商品已在AGC后台配置，调用queryProducts接口返回系统内部错误：问题分析使用hdchilog>D:\hilog.txt命令行抓取系统全量日志，搜索IAPNAPI看到错误描述“notsupportiap”：看描述是不支持iap服务，优先从以下几点排查：agc后台是否打开应用内支付开关和激活支付协议；测试使用的华为账号
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
SnowConvert：自动化数据迁移的技术解析与最佳实践 weixin_30777913 迁移学习数据库运维
SnowConvert是Snowflake生态系统的关键迁移工具，专为将传统数据仓库（如Oracle、Teradata、SQLServer等）的代码资产高效、准确地转换为Snowflake原生语法而设计。以下基于官方文档对其技术原理、工作流程及最佳实践进行深入分析：一、SnowConvert核心技术解析精准的语法映射引擎语言支持：深度解析源系统特有语法（OraclePL/SQL,TeradataB
鸿蒙 ArkTS 开发知识点全体系（HarmonyOS NEXT 架构）码农乐园 harmonyos 架构华为
一、基础知识：ArkTS语言与项目结构1.ArkTS基础语法（华为增强TypeScript）类型声明与推导函数与箭头函数类、接口、枚举、泛型模块导入与导出装饰器语法（@Entry、@Component等）异步编程（async/await）2.DevEcoStudio开发环境项目创建与构建模拟器配置与真机调试工程结构（entry、pages、resources、common、config.json）
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
华为云welink考试试题_华为内部开启WeLink项目，华为云是这样考虑的-通信/网络-与非网... weixin_39820437 华为云welink考试试题
协同办公市场竞争激烈华为云WeLink是华为旗下智能工作平台，它融合消息，邮件，会议、音视频、云空间、小程序等服务，可助力用户随时、随地、通过各类终端设备等实现协作办公。华为还宣布携手合作伙伴成立华为云WeLink生态联盟，金山办公、中软国际、致远互联、罗技、华为商旅、红圈营销、合思费控、Coremail论客、芯盾集团、视源股份、喜马拉雅等成为首批生态伙伴。IDC曾发布了《2018年下半年中国企业
大数据面试必备：Kafka性能优化 Producer与Consumer配置指南
Kafka面试题-在Kafka中，如何通过配置优化Producer和Consumer的性能?回答重点在Kafka中，通过优化Producer和Consumer的配置，可以显著提高性能。以下是一些关键配置项和策略：1、Producer端优化:batch.size：批处理大小。增大batch.size可以使Producer每次发送更多的消息，但要注意不能无限制增大，否则会导致内存占用过多。linger
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
uniapp中表格固定列（Vue） ᥬ 小月亮小程序+H5 uni-app vue.js javascript
一、编写表格：主要是使用了position:sticky;进行固定，不要忘记写top/left/right/bottom的数值哦~表头1表头2表头3表头4表头5表头6操作{{item.data1}}{{item.data2}}{{item.data3}}{{item.data4}}{{item.data5}}{{item.data6}}详情exportdefault{data(){return{t
【Python常用模块】_Pandas模块3-DataFrame对象失心疯_2023 Python常用模块数据分析 pandas 数据挖掘 python 数据统计数据处理
课程推荐我的个人主页：失心疯的个人主页入门教程推荐：Python零基础入门教程合集虚拟环境搭建：Python项目虚拟环境(超详细讲解)PyQt5系列教程：PythonGUI(PyQt5)教程合集Oracle数据库教程：Oracle数据库教程合集MySQL数据库教程：MySQL数据库教程合集优质资源下载：资源下载合集
【Pandas】pandas DataFrame resample liuweidong0802 DataFrame pandas
Pandas2.2DataFrameTimeSeries-related方法描述DataFrame.asfreq(freq[,method,how,…])用于**将时间序列数据转换为指定频率（resampletofrequency）**的方法DataFrame.asof(where[,subset])用于查找时间序列中最接近指定时间点的非NaN值的方法DataFrame.shift([period
【Pandas】pandas DataFrame max liuweidong0802 DataFrame pandas python 数据挖掘
Pandas2.2DataFrameComputationsdescriptivestats方法描述DataFrame.abs()用于返回DataFrame中每个元素的绝对值DataFrame.all([axis,bool_only,skipna])用于判断DataFrame中是否所有元素在指定轴上都为TrueDataFrame.any(*[,axis,bool_only,skipna])用于判断
微信小程序封装loading 修改 -嘻嘻哈哈~ 微信小程序小程序
1.custom-loading.vue{{text}}{{dots}}exportdefault{props:{visible:Boolean,text:{type:String,default:'加载中'}},data(){return{dots:'',timer:null}},mounted(){this.startAnimation()},beforeDestroy(){clearInte
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
2025年6月 CANN Ascend C算子开发能力认证（中级）环境(ascend910b)与代码红目香薰华为Could API人工智能系列 c语言开发语言
前言证书开头，并且我要说明的是我一周多的时间，各种参考，各种学习，各种填坑，终于搞出来了。可以在证书上看到我是6月5日通过的，但是我开始的时候是在5月27日。真心的不容易，终于在6月5日当天搞定了AscendC::Div函数的使用，最终通过了考试。目录前言环境说明心得分享1、环境踩坑2、加载一个特殊的文件3、修改文件列表4、基础代码5、核心代码（密）6、给予权限总结环境说明我这里使用的是华为的Mo
Excel数据导出小记焚城记录总结 EXCEL插件 excel .net
文章目录前言一、DataTable=>EXCEL二、DBReader=>Excel（NPOI）三、分页查询DbReader=>Excel(MiniExcel)总结：前言最近经历了一次数据量比较大的导出，也做了各种优化尝试，这里稍记录一下一、DataTable=>EXCELusingSystem;usingSystem.Collections.Generic;usingSystem.IO;using
vue el-date-picker 直接赋值时控件失效梓暮 IT vue.js 前端 elementui
项目场景：前端vueel-date-picker控件无故失效问题描述本人是主打后端，新进的公司要求前后端全干，然后又因为前端做得少，所以经常碰到一些奇怪的问题，比如以下操作，是给vue前端el-date-picker这个时间控件赋值，但是发现，数据是赋值上去了，但是控件失效了，怎么点都没用if(resData.batchEntity.manage_scene_start_time!=null&&r
uniapp内嵌的webview H5与应用通信 printf_824 uniapp分享 uni-app
H5端：1、找到index.html引入依赖2、在需要通讯处发送消息uni.postMessage({data:{code:200,msg:"处理完成"}})uniapp端：使用@message="handlerMessage"回调的event里有所需信息functionhandlerMessage(event){console.log("接收到信息");let{code,msg}=event.d
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

【课程笔记】华为 HCIA-Big Data 大数据 总结

HDFS分布式文件系统

ZooKeeper分布式应用程序协调服务

HBase非关系型分布式数据库

Hive分布式数据仓库

ClickHouse列式数据库管理系统

MapReduce分布式计算框架

Yarn资源管理调度器

Spark分布式计算框架

Flink分布式计算框架

Flume日志采集工具

Kafka分布式消息队列

你可能感兴趣的:(华为,HCIA-Big,Data,大数据,大数据)

【课程笔记】华为 HCIA-Big Data 大数据总结