大数据云原生hadoop 第26页

大数据新视界 -- Hive 事务管理的应用与限制（2 - 16 - 8）

亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数

青云交·2025-02-02 05:38

深度学习-图像数据标注工具使用（LabelImg和BBox）

文章与视频资源多平台更新微信公众号|知乎|B站|头条：AI研习图书馆深度学习、大数据、IT编程知识与资源分享，欢迎关注，共同进步~图像数据标注工具的使用教程1.LabelImgLabelImg下载地址：

AI研习图书馆·2025-02-02 03:35

Hive 整合 Spark 全教程（Hive on Spark）

hadoop.proxyuser.luanhao.groups*hadoop.proxyuser.luanhao.groups*2）HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00

字节全栈_rJF·2025-02-02 02:56

Spark 任务与 Spark Streaming 任务的差异详解

Spark任务与SparkStreaming任务的主要差异源自于两者的应用场景不同：Spark主要处理静态的大数据集，而SparkStreaming处理的是实时流数据。

goTsHgo·2025-02-02 00:14

spark和python的区别_Spark入门(Python)

Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型，可以涵盖广泛的工作流，这些工作流之前被实现为Hadoop之上的特殊系统。

weixin_39934257·2025-02-01 23:42

spark python入门_python pyspark入门篇

一.环境介绍：1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:spark-1.6.0-bin-hadoop2.6.tar.gz二.Setup1.解压spark

weixin_39686634·2025-02-01 23:12

Python大数据之PySpark(三)使用Python语言开发Spark程序代码_windows spark python

算子：rdd的api的操作，就是算子，flatMap扁平化算子，map转换算子Transformation算子Action算子步骤：1-首先创建SparkContext上下文环境2-从外部文件数据源读取数据3-执行flatmap执行扁平化操作4-执行map转化操作，得到(word,1)5-reduceByKey将相同Key的Value数据累加操作6-将结果输出到文件系统或打印代码：#-*-codi

2401_84181704·2025-02-01 23:09

《大数据时代“快刀”：Flink实时数据处理框架优势全解析》

在数字化浪潮中，数据呈爆发式增长，实时数据处理的重要性愈发凸显。从金融交易的实时风险监控，到电商平台的用户行为分析，各行业都急需能快速处理海量数据的工具。Flink作为一款开源的分布式流处理框架，在这一领域崭露头角，备受瞩目。一、真正实时，毫秒级响应与部分将流处理模拟为微批处理的框架不同，Flink是专为实时流处理打造的“原生”引擎。它直接处理持续不断的事件流，无需将数据攒成批次再处理，这种设计赋

程序猿阿伟·2025-02-01 20:15

园区智能化系统实现管理与服务的智能化转型与创新进阶

通过集成大数据分析、物联网和人工智能，园区智能化系统能够为各类园区如工业园、产业园、物流园、写字楼与公寓等提供切实可行的解决方案。“智能化管理不仅是未来的发展趋势，更是提升竞争力的必要手段。”

快鲸智慧楼宇管理系统·2025-02-01 19:35

vdist-1.3.1：Python项目自动化构建与分发工具

它集成了分布式系统支持，如Zookeeper，以及云原生技术标准，确保了高效的软件生命周期管理。该工具具备依赖管理、自动化构建流程、环境隔离和多平台支持等功能，并提供了解压后目录结构的详细说明。

46497976464·2025-02-01 18:57

挣脱“数据沼泽”，重获用云自由

混合多云新趋势云原生时代的到来，企业上云需求日益细致化，从而推进了企业IT架构进化，混合多云已经成为企业上云新趋势。

京东云开发者·2025-02-01 17:24

CDH_6.3.2的搭建

一站式搭建大数据的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032

我的K8409·2025-02-01 17:22

大数据笔记之 Flink1.17 算子

文章目录前言一、Partition分区（物理分区）1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma

凡许真·2025-02-01 17:20

安装HBase-2.4.12 (hadoop3.3.1)

1.下载https://www.apache.org/dyn/closer.lua/hbase/2.4.12/hbase-2.4.12-bin.tar.gz节点角色配置节点MasterZooKeeperRegionServernode001yesyesyesnode002backupyesyesnode003noyesyes2.解压下载的文件，并切换到新创建的目录。(base)[root@node

不饿同学·2025-02-01 17:18

01.双Android容器解决方案

ControlGroups）1.1.3联合文件系统（UnionFileSystem）1.2容器的应用1.2.1微服务架构1.2.2持续集成和持续部署（CI/CD）1.2.3多租户环境1.2.4混合云和多云环境1.2.5大数据和机器学习

高桐@BILL·2025-02-01 13:46

监控易：智慧高校一体化综合运维解决方案

自“十三五”规划中明确提出“支持各级各类学校建设智慧校园，综合利用互联网、大数据、人工智能和虚拟现实技术探索未来教育教学新模式”以来，政策春风也不断加码教育信息化进程，《教育信息化2.0行动计划》以及《

MXsoft618·2025-02-01 13:15

TDengine 做为 FLINK 数据源技术参考手册

ApacheFlink是一款由Apache软件基金会支持的开源分布式流批一体化处理框架，可用于流处理、批处理、复杂事件处理、实时数据仓库构建及为机器学习提供实时数据支持等诸多大数据处理场景。

TDengine （老段）·2025-02-01 11:02

【云原生】Docker可视化工具Portainer使用详解

目录一、前言二、docker可视化管理概述2.1什么是docker可视化管理2.1.1Docker可视化管理常用功能2.2为什么需要docker可视化管理工具2.3docker可视化工具带来的好处三、常用的docker容器可视化管理工具解决方案3.1Portainer3.2Rancher3.2.1Rancher功能特性3.3DockerDesktop3.3.1DockerDesktop功能特性3.

小码农叔叔·2025-02-01 10:22

Hadoop--HA架构详解

为了解决上述问题，Hadoop给出了高容错，高可用的HA方案：一个HDFS集群至少存在两个nameNode，一个nameNode处在active（主）状态，其他nameNode处在standby（备

娘子，出来看上帝·2025-02-01 10:20

Hadoop HA 架构

企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过

weixin_30569033·2025-02-01 09:49

守护每一比特的安全——探索基于差分隐私的MySQL数据脱敏之道

在当今数字化时代，随着互联网和大数据技术的发展，数据的价值愈发凸显。然而，随之而来的个人隐私泄露风险也日益增加，成为社会广泛关注的问题之一。

墨夶·2025-02-01 09:13

云原生架构体系

云原生（Cloud-Native）的概念在国内提及的越来越多，但大部分人对云原生的认识仅限于容器、微服务、DevOps等内容，把容器、微服务、DevOps就等同于云原生，这显然是不对的。

米朵儿技术屋·2025-02-01 06:17

云原生网络架构

着云原生技术的不断发展和演进，实现容器间互联的云原生网络架构也在不断地进行优化和完善，从Docker本身的动态端口映射网络模型到CNCF的CNI容器网络接口，再到“ServiceMesh+CNI”层次化的

key_3_feng·2025-02-01 05:45

云原生：构建现代化应用的基石

一、什么是云原生？云原生是一种构建和运行应用程序的方法，旨在充分利用云计算的分布式系统优势，例如弹性伸缩、微服务架构、容器化技术等。

moton2017·2025-02-01 05:42

12.udp

数据传输：适合传输大数据，但实际传输受网络MTU等因素限制。2.UDP编程框架（C/S模式）服务器端流程：创建套接字：调用socket()函数，参

就很对·2025-02-01 05:40

【hadoop学习之路】Hive HQL 语句实现查询

目录表数据表1students_data.txt表2course.txt实验步骤结论表数据表1students_data.txt21434,Sara,F,21,20,73,classC41443,Mary,M,19,30,90,classA43333,Dery,F,20,40,85,classB45454,Mary,F,22,10,91,classA14634,Henry,M,18,50,56,c

新世纪debug战士·2025-02-01 03:58

【大数据入门核心技术-Hive】（十一）HiveSQL数据分区

目录一、分区的概念二、创建分区1）静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1：通过union方法2：通过or一、分区的概念数据分区的概念以及存在很久了，通常使用分区来水平分散压力，将数据从物理上移到和使用最频繁的用户更近的地方，以及实现其目的。hive

forest_long·2025-02-01 03:25

毕设开源 python大数据旅游数据分析可视化系统(源码分享)

文章目录0前言1课题背景2数据处理3数据可视化工具3.1django框架介绍3.2ECharts4Django使用echarts进行可视化展示（mysql数据库）4.1修改setting.py连接mysql数据库4.2导入数据4.3使用echarts可视化展示5实现效果5.1前端展示5.2后端展示6最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到

bee_dc·2025-01-31 23:26

大数据“超能力”：数据安全和隐私该如何保障？

一人人都喜欢超级英雄。不论是超人还是钢铁侠，又或者是小蜘蛛和绿巨人，几乎每一个超级英雄漫画及电影的粉丝，都曾为其不公遭遇打抱不平：“他们明明是在用超能力做好事，拯救人类的，为什么电影里的政府和平民会这么蠢，总对他们缺乏信任，满是提防。”这就是所谓的“叶公好龙”了，因为当你身边真出现了个能把卡车当皮球一样抛来抛去的人时，你的反应恐怕也好不到哪儿去，可能也巴不得有政府出面，逼他接受《超级英雄注册法案》

大数据在线·2025-01-31 22:44

HDFS总结

基于前面的学习与配置，相信对于HDFS有了一定的了解HDFS概述1.什么是HDFSHadoopDistributedFileSystem：分步式文件系统HDFS是Hadoop体系中数据存储管理的基础HDFS

ChenJieYaYa·2025-01-31 20:03

Python爬虫基础知识：从零开始的抓取艺术

在大数据时代，网络数据成为宝贵的资源，而Python爬虫则是获取这些数据的重要工具。

egzosn·2025-01-31 19:20

探索Oracle数据库的多租户特性：架构、优势与实践

在云计算和大数据时代，多租户架构成为数据库设计中的一个重要趋势。

2401_85812026·2025-01-31 18:12

「大数据」Kappa架构

Kappa架构是一种处理大数据的架构，它作为Lambda架构的替代方案出现。

吴维炜·2025-01-31 18:07

新零售社交电商系统小程序功能开发详细解析

现在的购物方式是越来越有趣了，新零售社交电商系统是互联网、大数据、人工智能的技术和咱们熟悉的传统零售深度结合后产生的。它整合线上线下渠道及数据，带来全方位、多渠道、个性化购物体验。

v.15889726201·2025-01-31 17:34

Spark性能调优

1、前言在大数据计算领域，Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。

大数据侠客·2025-01-31 16:58

11 Spark面试真题

2.hadoop和spark使用场景？3.spark如何保证宕机迅速恢复?4.hadoop和spark的相同点和不同点？5.RDD持久化原理？6.checkpoint检查点机制？

TTXS123456789ABC·2025-01-31 16:26

Python学习-九大数据类型整合，详细讲解

目录1.int(整型)2.float(浮点型)3.Bool(布尔类型)4.Str(字符串类型)5.None(空值)6.List(列表)7.Tuple(元组)8.Dict(字典)9.Set(集合)（字典，列表，元组，字符串知识点可能不全，可以参考本人之前发的博客进行学习，加油。）1.int(整型)特点和用途：1.可以表示正整数、负整数和零，没有小数部分。2.取值范围取决于您所使用的Python版本和

小伙儿.·2025-01-31 16:26

[碎碎念] 重启学习与博客之旅-我的每日计划

比如说，我最近对人工智能和大数据分析特别感兴趣，所以打算每天看点相关的专业书，或

言午coding·2025-01-31 16:56

Java 性能优化与新特性

Java学习资料Java学习资料Java学习资料一、引言Java作为一门广泛应用于企业级开发、移动应用、大数据等多个领域的编程语言，其性能和特性一直是开发者关注的重点。

来恩1003·2025-01-31 16:52

pandas读取大数据量的Excel文件

使用pandas快速读取百万行Excel数据的一种方法是使用pandas中的read_excel函数。可以使用以下代码读取Excel文件：importpandasaspddf=pd.read_excel('file_name')这个适合少量数据，如果一旦数据几十万或者上百万，那么程序就很慢有几种优化方法只读取需要的列：使用read_excel函数的usecols参数来指定需要读取的列。这可以减少读

兮知·2025-01-31 15:13

林子雨《大数据技术原理与应用》第五讲——NoSQL数据库

林子雨《大数据技术原理与应用》第五讲——NoSQL数据库林子雨《大数据技术原理与应用》第五讲笔记NoSQL数据库特点灵活的可扩展性灵活的数据模型和云计算结合查询性能差未形成通用的行业标准维护更加复杂NoSQL

天才代号23·2025-01-31 10:06

OLAP引擎比较

doris是一个OLAP数据库，支持对大数据的复杂查询，延迟为秒级。doris比sparksql快，主要原因在于针对场景不同导致的架构不同。

小手追梦·2025-01-31 10:30

docker compose 部署 nacos

它由阿里巴巴开发，广泛应用于云原生应用和微服务环境中。核心特性服务发现:支持服务的注册与发现，允许服务实例动态注册到Nacos，其他服务可以通过Nacos查询相应的服务实例。

自在1990·2025-01-31 09:56

大数据组件ClickHouse介绍（场景、优劣势、性能）

大数据组件ClickHouse介绍简介使用场景优势与劣势优势劣势性能单个查询吞吐量处理短查询的延时时间处理大量短查询数据写入性能查询性能简介clickhouse是一个高性能的列式存储分析数据库管理系统，

坚持是一种态度·2025-01-31 09:46

DB2-Db2StreamingChangeEventSource

在大数据和实时数据处理场景中，CDC可以用来同步数据到其他系统，比如数据仓库、数据湖或者流处理平台如ApacheKafka。文章目录前言一、核心功能

DataLu·2025-01-31 09:15

MySQL实战教程：从小白到大神的进阶之路！

发展历程2.1MySQL的起源2.2MySQL的早期发展2.3MySQL的成熟与普及2.4MySQL的商业化与收购2.5MySQL的持续创新3、MySQL应用场景3.1Web应用程序3.2企业级应用3.3大数据分析

奔跑吧邓邓子·2025-01-31 08:08

【详细讲解】hive优化

1、开启本地模式大多数的HadoopJob是需要Hadoop提供的完整的可扩展性来处理大数据集的。不过，有时Hive的输入数据量是非常小的。

songqq27·2025-01-31 06:56

# Nacos学习

Nacos是一个用于构建云原生应用的动态服务发现、配置和服务管理平台。

Jeff-Jiang·2025-01-31 06:56

大规模分布式存储（1）-- 概念、挑战和分类

随着数据的激增，我们已经进入到了一个数据时代，无论是云计算，大数据还是互联网公司的各种应用，其后台存储平台的目标都是要构建低成本、高性能、可扩展、易用的分布式存储系统。

叹了口丶气·2025-01-31 06:23

【云原生】Docker 部署 Nacos使用详解

目录一、前言二、使用Docker部署Nacos2.1环境准备2.2搭建Nacos操作过程2.2.1拉取Nacos镜像2.2.2创建配置数据库2.2.3启动容器2.2.4删除nacos容器2.2.5再次启动容器2.2.6访问nacos三、基于Centos7搭建Nacos3.1搭建过程3.1.1服务器环境3.1.2mysql环境3.1.3提前下载安装包3.1.4初始化sql脚本3.1.5修改配置文件3

逆风飞翔的小叔·2025-01-31 05:18

推荐频道

大数据云原生hadoop