E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据云原生hadoop
大数据
新视界 -- Hive 事务管理的应用与限制(2 - 16 - 8)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:大数
青云交
·
2025-02-02 05:38
大数据新视界
#
Hive
之道
Hive
事务管理
应用场景
优化策略
数据一致性
并发处理
大数据爱好者们
大数据
深度学习-图像数据标注工具使用(LabelImg和BBox)
文章与视频资源多平台更新微信公众号|知乎|B站|头条:AI研习图书馆深度学习、
大数据
、IT编程知识与资源分享,欢迎关注,共同进步~图像数据标注工具的使用教程1.LabelImgLabelImg下载地址:
AI研习图书馆
·
2025-02-02 03:35
方法教程
LabelImg
BBox
图像标注工具
Hive 整合 Spark 全教程 (Hive on Spark)
hadoop
.proxyuser.luanhao.groups*
hadoop
.proxyuser.luanhao.groups*2)HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00
字节全栈_rJF
·
2025-02-02 02:56
hive
spark
hadoop
Spark 任务与 Spark Streaming 任务的差异详解
Spark任务与SparkStreaming任务的主要差异源自于两者的应用场景不同:Spark主要处理静态的
大数据
集,而SparkStreaming处理的是实时流数据。
goTsHgo
·
2025-02-02 00:14
spark-streaming
分布式
大数据
spark
streaming
大数据
分布式
spark和python的区别_Spark入门(Python)
Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被实现为
Hadoop
之上的特殊系统。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
spark python入门_python pyspark入门篇
一.环境介绍:1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:spark-1.6.0-bin-
hadoop
2.6.tar.gz二.Setup1.解压spark
weixin_39686634
·
2025-02-01 23:12
spark
python入门
Python
大数据
之PySpark(三)使用Python语言开发Spark程序代码_windows spark python
算子:rdd的api的操作,就是算子,flatMap扁平化算子,map转换算子Transformation算子Action算子步骤:1-首先创建SparkContext上下文环境2-从外部文件数据源读取数据3-执行flatmap执行扁平化操作4-执行map转化操作,得到(word,1)5-reduceByKey将相同Key的Value数据累加操作6-将结果输出到文件系统或打印代码:#-*-codi
2401_84181704
·
2025-02-01 23:09
程序员
大数据
python
spark
《
大数据
时代“快刀”:Flink实时数据处理框架优势全解析》
在数字化浪潮中,数据呈爆发式增长,实时数据处理的重要性愈发凸显。从金融交易的实时风险监控,到电商平台的用户行为分析,各行业都急需能快速处理海量数据的工具。Flink作为一款开源的分布式流处理框架,在这一领域崭露头角,备受瞩目。一、真正实时,毫秒级响应与部分将流处理模拟为微批处理的框架不同,Flink是专为实时流处理打造的“原生”引擎。它直接处理持续不断的事件流,无需将数据攒成批次再处理,这种设计赋
程序猿阿伟
·
2025-02-01 20:15
大数据
flink
园区智能化系统实现管理与服务的智能化转型与创新进阶
通过集成
大数据
分析、物联网和人工智能,园区智能化系统能够为各类园区如工业园、产业园、物流园、写字楼与公寓等提供切实可行的解决方案。“智能化管理不仅是未来的发展趋势,更是提升竞争力的必要手段。”
快鲸智慧楼宇管理系统
·
2025-02-01 19:35
其他
vdist-1.3.1:Python项目自动化构建与分发工具
它集成了分布式系统支持,如Zookeeper,以及
云原生
技术标准,确保了高效的软件生命周期管理。该工具具备依赖管理、自动化构建流程、环境隔离和多平台支持等功能,并提供了解压后目录结构的详细说明。
46497976464
·
2025-02-01 18:57
挣脱“数据沼泽”,重获用云自由
混合多云新趋势
云原生
时代的到来,企业上云需求日益细致化,从而推进了企业IT架构进化,混合多云已经成为企业上云新趋势。
京东云开发者
·
2025-02-01 17:24
数据库
数据迁移
混合云
CDH_6.3.2的搭建
一站式搭建
大数据
的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032
我的K8409
·
2025-02-01 17:22
Flink
linux
大数据
分布式
大数据
笔记之 Flink1.17 算子
文章目录前言一、Partition分区(物理分区)1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma
凡许真
·
2025-02-01 17:20
大数据
flink1.17
算子
安装HBase-2.4.12 (
hadoop
3.3.1)
1.下载https://www.apache.org/dyn/closer.lua/hbase/2.4.12/hbase-2.4.12-bin.tar.gz节点角色配置节点MasterZooKeeperRegionServernode001yesyesyesnode002backupyesyesnode003noyesyes2.解压下载的文件,并切换到新创建的目录。(base)[root@node
不饿同学
·
2025-02-01 17:18
大数据
hbase
big
data
hadoop
01.双Android容器解决方案
ControlGroups)1.1.3联合文件系统(UnionFileSystem)1.2容器的应用1.2.1微服务架构1.2.2持续集成和持续部署(CI/CD)1.2.3多租户环境1.2.4混合云和多云环境1.2.5
大数据
和机器学习
高桐@BILL
·
2025-02-01 13:46
容器
Android
监控易:智慧高校一体化综合运维解决方案
自“十三五”规划中明确提出“支持各级各类学校建设智慧校园,综合利用互联网、
大数据
、人工智能和虚拟现实技术探索未来教育教学新模式”以来,政策春风也不断加码教育信息化进程,《教育信息化2.0行动计划》以及《
MXsoft618
·
2025-02-01 13:15
运维
信息安全
物联网
监控类
TDengine 做为 FLINK 数据源技术参考手册
ApacheFlink是一款由Apache软件基金会支持的开源分布式流批一体化处理框架,可用于流处理、批处理、复杂事件处理、实时数据仓库构建及为机器学习提供实时数据支持等诸多
大数据
处理场景。
TDengine (老段)
·
2025-02-01 11:02
tdengine
flink
大数据
涛思数据
时序数据库
数据库
【
云原生
】Docker可视化工具Portainer使用详解
目录一、前言二、docker可视化管理概述2.1什么是docker可视化管理2.1.1Docker可视化管理常用功能2.2为什么需要docker可视化管理工具2.3docker可视化工具带来的好处三、常用的docker容器可视化管理工具解决方案3.1Portainer3.2Rancher3.2.1Rancher功能特性3.3DockerDesktop3.3.1DockerDesktop功能特性3.
小码农叔叔
·
2025-02-01 10:22
linux与容器实战
Portainer搭建
Portainer使用
Portainer使用详解
Portainer详解
Portainer
portainer
Hadoop
--HA架构详解
为了解决上述问题,
Hadoop
给出了高容错,高可用的HA方案:一个HDFS集群至少存在两个nameNode,一个nameNode处在active(主)状态,其他nameNode处在standby(备
娘子,出来看上帝
·
2025-02-01 10:20
Hadoop
Hadoop
大数据
HA
Hadoop
HA 架构
企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM
大数据
所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过
weixin_30569033
·
2025-02-01 09:49
shell
大数据
守护每一比特的安全——探索基于差分隐私的MySQL数据脱敏之道
在当今数字化时代,随着互联网和
大数据
技术的发展,数据的价值愈发凸显。然而,随之而来的个人隐私泄露风险也日益增加,成为社会广泛关注的问题之一。
墨夶
·
2025-02-01 09:13
数据库学习资料2
安全
mysql
数据库
云原生
架构体系
云原生
(Cloud-Native)的概念在国内提及的越来越多,但大部分人对
云原生
的认识仅限于容器、微服务、DevOps等内容,把容器、微服务、DevOps就等同于
云原生
,这显然是不对的。
米朵儿技术屋
·
2025-02-01 06:17
行业信息处理技术与政策研究专栏
云原生
架构
devops
云原生
网络架构
着
云原生
技术的不断发展和演进,实现容器间互联的
云原生
网络架构也在不断地进行优化和完善,从Docker本身的动态端口映射网络模型到CNCF的CNI容器网络接口,再到“ServiceMesh+CNI”层次化的
key_3_feng
·
2025-02-01 05:45
云原生
网络
云原生
架构
云原生
:构建现代化应用的基石
一、什么是
云原生
?
云原生
是一种构建和运行应用程序的方法,旨在充分利用云计算的分布式系统优势,例如弹性伸缩、微服务架构、容器化技术等。
moton2017
·
2025-02-01 05:42
后端
架构
云原生
微服务
容器
kubernetes
docker
12.udp
数据传输:适合传输
大数据
,但实际传输受网络MTU等因素限制。2.UDP编程框架(C/S模式)服务器端流程:创建套接字:调用socket()函数,参
就很对
·
2025-02-01 05:40
udp
网络协议
网络
【
hadoop
学习之路】Hive HQL 语句实现查询
目录表数据表1students_data.txt表2course.txt实验步骤结论表数据表1students_data.txt21434,Sara,F,21,20,73,classC41443,Mary,M,19,30,90,classA43333,Dery,F,20,40,85,classB45454,Mary,F,22,10,91,classA14634,Henry,M,18,50,56,c
新世纪debug战士
·
2025-02-01 03:58
hadoop学习之路
hive
【
大数据
入门核心技术-Hive】(十一)HiveSQL数据分区
目录一、分区的概念二、创建分区1)静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1:通过union方法2:通过or一、分区的概念数据分区的概念以及存在很久了,通常使用分区来水平分散压力,将数据从物理上移到和使用最频繁的用户更近的地方,以及实现其目的。hive
forest_long
·
2025-02-01 03:25
大数据技术入门到21天通关
大数据
hive
hadoop
数据仓库
hdfs
毕设开源 python
大数据
旅游数据分析可视化系统(源码分享)
文章目录0前言1课题背景2数据处理3数据可视化工具3.1django框架介绍3.2ECharts4Django使用echarts进行可视化展示(mysql数据库)4.1修改setting.py连接mysql数据库4.2导入数据4.3使用echarts可视化展示5实现效果5.1前端展示5.2后端展示6最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到
bee_dc
·
2025-01-31 23:26
毕业设计
毕设
大数据
大数据
“超能力”:数据安全和隐私该如何保障?
一人人都喜欢超级英雄。不论是超人还是钢铁侠,又或者是小蜘蛛和绿巨人,几乎每一个超级英雄漫画及电影的粉丝,都曾为其不公遭遇打抱不平:“他们明明是在用超能力做好事,拯救人类的,为什么电影里的政府和平民会这么蠢,总对他们缺乏信任,满是提防。”这就是所谓的“叶公好龙”了,因为当你身边真出现了个能把卡车当皮球一样抛来抛去的人时,你的反应恐怕也好不到哪儿去,可能也巴不得有政府出面,逼他接受《超级英雄注册法案》
大数据在线
·
2025-01-31 22:44
云静思园
大数据
数据安全
数据隐私
英特尔
HDFS总结
基于前面的学习与配置,相信对于HDFS有了一定的了解HDFS概述1.什么是HDFS
Hadoop
DistributedFileSystem:分步式文件系统HDFS是
Hadoop
体系中数据存储管理的基础HDFS
ChenJieYaYa
·
2025-01-31 20:03
Hadoop
hdfs
hadoop
big
data
Python爬虫基础知识:从零开始的抓取艺术
在
大数据
时代,网络数据成为宝贵的资源,而Python爬虫则是获取这些数据的重要工具。
egzosn
·
2025-01-31 19:20
python
爬虫
开发语言
探索Oracle数据库的多租户特性:架构、优势与实践
在云计算和
大数据
时代,多租户架构成为数据库设计中的一个重要趋势。
2401_85812026
·
2025-01-31 18:12
数据库
oracle
架构
「
大数据
」Kappa架构
Kappa架构是一种处理
大数据
的架构,它作为Lambda架构的替代方案出现。
吴维炜
·
2025-01-31 18:07
AIGC架构设计师
大数据
架构
kappa
AIGC
新零售社交电商系统小程序功能开发详细解析
现在的购物方式是越来越有趣了,新零售社交电商系统是互联网、
大数据
、人工智能的技术和咱们熟悉的传统零售深度结合后产生的。它整合线上线下渠道及数据,带来全方位、多渠道、个性化购物体验。
v.15889726201
·
2025-01-31 17:34
零售
小程序
Spark性能调优
1、前言在
大数据
计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。
大数据侠客
·
2025-01-31 16:58
spark相关问题汇总及解决
spark
性能调优
11 Spark面试真题
2.
hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.
hadoop
和spark的相同点和不同点?5.RDD持久化原理?6.checkpoint检查点机制?
TTXS123456789ABC
·
2025-01-31 16:26
#
Spark
spark
面试
大数据
Python学习-九
大数据
类型整合,详细讲解
目录1.int(整型)2.float(浮点型)3.Bool(布尔类型)4.Str(字符串类型)5.None(空值)6.List(列表)7.Tuple(元组)8.Dict(字典)9.Set(集合)(字典,列表,元组,字符串知识点可能不全,可以参考本人之前发的博客进行学习,加油。)1.int(整型)特点和用途:1.可以表示正整数、负整数和零,没有小数部分。2.取值范围取决于您所使用的Python版本和
小伙儿.
·
2025-01-31 16:26
Python
python
开发语言
学习
[碎碎念] 重启学习与博客之旅-我的每日计划
比如说,我最近对人工智能和
大数据
分析特别感兴趣,所以打算每天看点相关的专业书,或
言午coding
·
2025-01-31 16:56
碎碎念
碎碎念
Java 性能优化与新特性
Java学习资料Java学习资料Java学习资料一、引言Java作为一门广泛应用于企业级开发、移动应用、
大数据
等多个领域的编程语言,其性能和特性一直是开发者关注的重点。
来恩1003
·
2025-01-31 16:52
Java
从入门到精通
java
pandas读取
大数据
量的Excel文件
使用pandas快速读取百万行Excel数据的一种方法是使用pandas中的read_excel函数。可以使用以下代码读取Excel文件:importpandasaspddf=pd.read_excel('file_name')这个适合少量数据,如果一旦数据几十万或者上百万,那么程序就很慢有几种优化方法只读取需要的列:使用read_excel函数的usecols参数来指定需要读取的列。这可以减少读
兮知
·
2025-01-31 15:13
python基础
数据分析
pandas
excel
数据分析
林子雨《
大数据
技术原理与应用》第五讲——NoSQL数据库
林子雨《
大数据
技术原理与应用》第五讲——NoSQL数据库林子雨《
大数据
技术原理与应用》第五讲笔记NoSQL数据库特点灵活的可扩展性灵活的数据模型和云计算结合查询性能差未形成通用的行业标准维护更加复杂NoSQL
天才代号23
·
2025-01-31 10:06
大数据
数据库
hadoop
nosql
大数据
OLAP引擎比较
doris是一个OLAP数据库,支持对
大数据
的复杂查询,延迟为秒级。doris比sparksql快,主要原因在于针对场景不同导致的架构不同。
小手追梦
·
2025-01-31 10:30
hadoop
rpc
java
docker compose 部署 nacos
它由阿里巴巴开发,广泛应用于
云原生
应用和微服务环境中。核心特性服务发现:支持服务的注册与发现,允许服务实例动态注册到Nacos,其他服务可以通过Nacos查询相应的服务实例。
自在1990
·
2025-01-31 09:56
linux运维之拿来就用
docker
容器
运维
阿里云
大数据
组件ClickHouse介绍(场景、优劣势、性能)
大数据
组件ClickHouse介绍简介使用场景优势与劣势优势劣势性能单个查询吞吐量处理短查询的延时时间处理大量短查询数据写入性能查询性能简介clickhouse是一个高性能的列式存储分析数据库管理系统,
坚持是一种态度
·
2025-01-31 09:46
大数据开发
ClickHouse
大数据
clickhouse
数据库
列式数据库
DB2-Db2StreamingChangeEventSource
在
大数据
和实时数据处理场景中,CDC可以用来同步数据到其他系统,比如数据仓库、数据湖或者流处理平台如ApacheKafka。文章目录前言一、核心功能
DataLu
·
2025-01-31 09:15
DB2-debezium
数据库
数据库开发
大数据
开源
MySQL实战教程:从小白到大神的进阶之路!
发展历程2.1MySQL的起源2.2MySQL的早期发展2.3MySQL的成熟与普及2.4MySQL的商业化与收购2.5MySQL的持续创新3、MySQL应用场景3.1Web应用程序3.2企业级应用3.3
大数据
分析
奔跑吧邓邓子
·
2025-01-31 08:08
项目实战
mysql
数据库
【详细讲解】hive优化
1、开启本地模式大多数的
Hadoop
Job是需要
Hadoop
提供的完整的可扩展性来处理
大数据
集的。不过,有时Hive的输入数据量是非常小的。
songqq27
·
2025-01-31 06:56
大数据
hive
# Nacos学习
Nacos是一个用于构建
云原生
应用的动态服务发现、配置和服务管理平台。
Jeff-Jiang
·
2025-01-31 06:56
java
阿里云
后端
大规模分布式存储(1)-- 概念、挑战和分类
随着数据的激增,我们已经进入到了一个数据时代,无论是云计算,
大数据
还是互联网公司的各种应用,其后台存储平台的目标都是要构建低成本、高性能、可扩展、易用的分布式存储系统。
叹了口丶气
·
2025-01-31 06:23
HDFS全方位实战
分布式
分类
数据库
【
云原生
】Docker 部署 Nacos使用详解
目录一、前言二、使用Docker部署Nacos2.1环境准备2.2搭建Nacos操作过程2.2.1拉取Nacos镜像2.2.2创建配置数据库2.2.3启动容器2.2.4删除nacos容器2.2.5再次启动容器2.2.6访问nacos三、基于Centos7搭建Nacos3.1搭建过程3.1.1服务器环境3.1.2mysql环境3.1.3提前下载安装包3.1.4初始化sql脚本3.1.5修改配置文件3
逆风飞翔的小叔
·
2025-01-31 05:18
运维
docker搭建nacos详解
docker部署nacos
docker安装nacos
腾讯云搭建nacos
centos7搭建nacos
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他