E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop离线数仓
大数据技术汇总
Hadoop
Hadoop
入门概述
Hadoop
运行模式介绍
Hadoop
HDFS的运行流程
Hadoop
MapReduce的运行流程
Hadoop
yarn的运行流程
Hadoop
内HDFS、MapReduce和YARN
转身成为了码农
·
2024-01-21 07:41
大数据
hadoop
hive
spark
数据仓库
Spark:SparkSQL与Hive on Spark(Shark)的比较
简要介绍了SparkSQL与HiveonSpark的区别与联系一、关于Spark简介在
Hadoop
的整个生态系统中,Spark和MapReduce在同一个层级,即主要解决分布式计算框架的问题。
花和尚也有春天
·
2024-01-21 06:17
sparkSQL
SparkSQL
Hive
on
Spark
基于kubernetes构建spark-thriftserver集群(Deployment模式)
1、构建镜像这里采用spark-2.4.4-bin-
hadoop
2.7.tar.gz包部署,先解压文件到/opt/spark目录。(1)将需要第三方扩展包导入/opt/spark/
Moutai码哥
·
2024-01-21 06:46
大数据
云计算
企业架构
spark
thriftserver
spark
hive
Spark面试题
1.sparkcore1.简述
hadoop
和spark的不同点(为什么spark更快)♥♥♥ shuffle都是需要落盘的,因为在宽依赖中需要将上一个阶段的所有分区数据都准备好,才能进入下一个阶段,那么如果一直将数据放在内存中
韩顺平的小迷弟
·
2024-01-21 06:53
大数据面试题
spark
大数据
分布式
Ubuntu安装Hbase数据库
Hbase,并修改其名称sudotar-zxfhbase-1.1.2-bin.tar.gz-C/usr/localcd/usr/localsudomvhbase-2.2.2/hbasesudochown-R
hadoop
hbase
殊迟
·
2024-01-21 06:51
大数据
hbase
hadoop
big
data
大数据
分布式
Ubuntu安装MySQL数据库
MySQLsudoapt-getinstallmysql-server输入Y后回车继续安装设置root用户密码,此处会设置两次三、启动、关闭、测试数据库servicemysqlstart#此处输入2回车选择
hadoop
殊迟
·
2024-01-21 06:51
大数据
ubuntu
mysql
服务器
linux
数据库
安装Kafka
Kafkasudotar-zxfkafka_2.11-0.10.2.0.tgz-C/usr/localcd/usr/localsudomvkafka_2.11-0.10.2.0/kafkasudochown-R
hadoop
kafka
殊迟
·
2024-01-21 06:51
大数据
kafka
java
大数据
spark
scala
在 Python 中实现语音合成的四种方法
1
离线
合成pytts配置环境$apt-getupdate$apt-getinstallespeak$pipinstallpyttsx3$apt-getinstallffmpeg$apt-getinstallalsa-utils
xieyan0811
·
2024-01-21 06:06
大模型
python
开发语言
Hadoop
3完全分布式搭建
一、第一台的操作搭建修改主机名使用hostnamectlset-hostname修改当前主机名关闭防火墙和SELlinux1,使用systemctlstopfirewalldsystemctldisablefirewalld关闭防火墙2,使用vim/etc/selinux/config修改为SELINUX=disabled使用NAT模式配置静态IP1,修改网络配置vim/etc/sysconfig
三木一立
·
2024-01-21 05:54
大数据
分布式
php
开发语言
WIN 10 系统无法安装以下功能.NET Framework 3.5(包括 .NET 2.0 和 3.0)
离线
解决办法
WIN10无法安装以下功能.NETFramework3.5(包括.NET2.0和3.0)
离线
解决的两种办法ps:由于开发项目是
离线
断网开发,遇到这个问题,在此分享解决方法,资源无偿提供,转载请备注!!
グッ!(๑•̀ㅂ•́)و非常暴躁
·
2024-01-21 05:19
Windows系统
.net
window
.Net Framework 4.7.2
离线
包下载及安装时出现“无法建立到信任根颁发机构的证书链“ 问题
.NetFramework4.7.2
离线
包下载及安装时出现“无法建立到信任根颁发机构的证书链"问题.NetFramework4.7.2点击下载(无需积分)当安装.NetFramework4.7.2
离线
包时出现
グッ!(๑•̀ㅂ•́)و非常暴躁
·
2024-01-21 05:49
Windows系统
.net
windows
Linux 部署
Hadoop
伪分布式集群教程
首先:我们需要下载一些关于
Hadoop
伪分布式集群需要的工具与tar包链接:https://pan.baidu.com/s/1oUw1jDCxfghWsnaWauSHKg提取码:6s5a接下来打开虚拟机终端
qq_61247494
·
2024-01-21 05:15
hadoop
分布式
linux
linux 部署
Hadoop
完全分布式集群教程
一、准备工作1、本次任务需要三台虚拟机,主机名分别为Master、Slave01、Slave02先在Master上安装好jdk和
Hadoop
(安装教程可以参考这两篇文章)然后为了简便我们直接克隆两台Master
qq_61247494
·
2024-01-21 05:15
hadoop
分布式
linux
Linux修改
hadoop
配置文件及启动
hadoop
集群详细步骤
目录一、配置
Hadoop
环境1.查看
Hadoop
解压位置2.配置环境变量3.编辑环境变量4.重启环境变量5.查看
Hadoop
版本,查看成功就表示
Hadoop
安装成功了二、修改配置文件1.检查三台虚拟机:
CatalinaCatherine
·
2024-01-21 05:45
Linux
linux
hadoop
运维
linux下
hadoop
集群并且配置安装百分百成功
可以去jdk官网下载8或者11版本,别用18因为
hadoop
会不兼容,先卸载本机的自带的jdk,下面我给大家带一个我在用的
hadoop
链接
hadoop
下载链接假设在你的linux上面有三个虚拟机
hadoop
102
hadoop
103
hadoop
104
新城已无旧少年_
·
2024-01-21 05:45
大数据
大数据
Linux-
Hadoop
集群配置
文章目录一、配置
Hadoop
集群1、在master虚拟机上配置
hadoop
(1)编辑
Hadoop
环境配置文件-
hadoop
-env.sh(2)编辑
Hadoop
核心配置文件-core-site.xml(3
人生苦短@我用python
·
2024-01-21 05:44
探索大数据
hadoop
linux
大数据
mapreduce
hdfs
hadoop
分布式集群配置(linux)
linux配置
hadoop
分布式集群一、前期准备二、Jdk的安装三、配置
hadoop
集群安装
hadoop
分布式集群
hadoop
-3.3.0及jdk1.8下载链接一、前期准备1.安装
hadoop
分布式之前先准备好
小-枝-丫
·
2024-01-21 05:44
linux
hadoop
hadoop
分布式
linux
linux上面
hadoop
配置集群
要在Linux上配置
Hadoop
集群,需要按照以下步骤进行操作:安装JavaDevelopmentKit(JDK):首先,确保您的Linux系统上已经安装了JDK。
酷爱码
·
2024-01-21 05:14
大数据基础教程
linux
hadoop
运维
11. 线程
线程是如何创建起来的1.1.3线程的特点1.1.4线程与进程1.2并发和并行2.线程ID3.创建线程4.终止线程5.回收线程6.取消线程6.1取消一个线程6.2取消状态以及类型6.3取消点6.4线程可取消性的检测7.分
离线
程
等你看日出
·
2024-01-21 05:39
嵌入式Linux应用开发
嵌入式硬件
WARN util.NativeCodeLoader: Unable to load native-
hadoop
library for your platform... using builtin-
1.问题来源
hadoop
启动时控制台一直提示WARNutil.NativeCodeLoader:Unabletoloadnative-
hadoop
libraryforyourplatform…usingbuiltin-javaclasseswhereapplicableStartingnamenodeson
寂夜了无痕
·
2024-01-21 04:57
大数据搭建问题
hadoop
大数据
mac-
hadoop
3.3.6 源码构建以及踩坑记录
1.为什么需要构建源码因为
hadoop
的可执行文件是在专门的机器上编译的其中native库不一定能适用于每个机器导致在启动
hadoop
过程中出现烦人的警告WARNutil.NativeCodeLoader
寂夜了无痕
·
2024-01-21 04:55
大数据搭建问题
hadoop
大数据
hadoop
源码编译
HDFS中的Erasure Coding纠删码是个什么样的存在?
在
Hadoop
3.x之后就引入了纠删码技术(ErasureCoding)纠删码技术(Erasurecoding)简称EC,是一种编码容错技术。最早用于通信行业,数据传输中的数据恢复。它通过对数
小KKKKKKKK
·
2024-01-21 03:29
SeaTunnel 海量数据同步工具的使用(连载中……)
一、概述SeaTunnel是一个非常易用,高性能、支持实时流式和
离线
批处理的海量数据处理产品,前身是WaterDrop(中文名:水滴),自2021年10月12日更名为SeaTunnel。
programmer_山风
·
2024-01-21 03:49
JAVA进阶
java
ElasticSearch 亿级数据检索深度优化!
一、前言数据平台已迭代三个版本,从头开始遇到很多常见的难题,终于有片段时间整理一些已完善的文档,在此分享以供所需朋友的实现参考,少走些弯路,在此篇幅中偏重于ES的优化,关于HBase,
Hadoop
的设计优化估计有很多文章可以参考
夜空_2cd3
·
2024-01-21 03:53
Redis学习笔记--尚硅谷
、Tomcat、HTML、Linux、JDBC、SVNe解决扩展性的问题:Struts、Spring、SpringMVC、Hibernate、Mybatise解决性能的问题:NoSQL、Java线程、
Hadoop
Geho
·
2024-01-21 02:52
redis
数据库
nosql
java
springboot
大数据技术原理及应用课实验1 熟悉常用的Linux操作和
Hadoop
操作
实验1熟悉常用的Linux操作和
Hadoop
操作一、实验目的
Hadoop
运行在Linux系统上,因此,需要学习实践一些常用的Linux命令。
Blossom i
·
2024-01-21 02:21
大数据编程
大数据
linux
hadoop
大数据技术原理及应用课实验2 :熟悉常用的HDFS操作
实验2熟悉常用的HDFS操作目录实验2熟悉常用的HDFS操作一、实验目的二、实验平台三、实验步骤(每个步骤下均需有运行截图)(一)编程实现以下功能,并利用
Hadoop
提供的Shell命令完成相同任务:(
Blossom i
·
2024-01-21 02:21
大数据编程
大数据
hdfs
hadoop
通过WordCount解析Spark RDD内部源码机制
HelloSparkHelloScalaHello
Hadoop
HelloFlinkSparkisAwesome然后在Eclipse中编写wo
联旺
·
2024-01-21 01:54
客户案例|知名证券机构核心大数据平台升级之路
Hadoop
作为海量数据处理的关键技术框架,自诞生以来就改变了企业对数据的存储、处理和分析的过程,因具备开源低成本、高可靠等特性,在证券行业得到了广泛的应用。
云掣YUNCHE
·
2024-01-21 01:17
产品介绍
大数据
云原生
运维开发
【Python】查看anaconda内置base的python版本
目录condalistpythonpython-Vconda--version在jupyternotebook内查看当电脑联网的时候,想要装一些包直接pipinstall就可以,但是当电脑未联网,需要
离线
安装时
离川的风
·
2024-01-21 00:24
python
jupyter
conda
PDsehell16连接pgsql出现“Non SQL Error : Could not load class org.postgresql.Driver“时的解决步骤
我是直接选择的pd16自带的pgsql驱动,但是依旧提示,链接失败缺少驱动解决方案和步骤:我的方案是直接下载
离线
驱动不用pd的驱动;下再
离线
包之后直接放到任意路径,然后直接把驱动配置到本地驱动jar,再尝试链接就可以链接成功了
飞天小栗旬
·
2024-01-21 00:11
postgresql
数据库
Spark(一): 基本架构及原理
前言:目标:架构及生态:Spark与
hadoop
:运行流程及特点:常用术语:Spark运行模式:RDD运行流程:前言:ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009
贝賏赑钡
·
2024-01-20 22:46
spark
架构
大数据
Hologres V2.1版本发布,新增计算组实例构建高可用实时
数仓
Highlight产品介绍Hologres是阿里云自研一站式实时
数仓
,统一数据平台架构,将OLAP查询、即席分析、在线服务、向量计算多个数据应用构建在统一存储之上,实现一份数据,多种计算场景。
阿里云大数据AI技术
·
2024-01-20 21:07
网络
java
数据库
大数据导论(3)---大数据技术
文章目录1.大数据技术概述2.数据采集与预处理2.1数据采集2.2预处理3.数据存储和管理3.1分布式基础架构
Hadoop
3.2分布式文件系统HDFS3.3分布式数据库HBase3.4非关系型数据库NoSQL4
冒冒菜菜
·
2024-01-20 21:28
大数据导论
大数据导论
大数据技术
课程学习
Sqoop与HBase结合使用:实现强大的数据存储
Sqoop用于将数据从关系型数据库导入到
Hadoop
生态系统中,而HBase则用于实时、非关系型数据存储和查询。
晓之以理的喵~~
·
2024-01-20 19:57
sqoop
sqoop
hbase
hadoop
使用Sqoop从Oracle数据库导入数据
在大数据领域,将数据从关系型数据库(如Oracle)导入到
Hadoop
生态系统是一项常见的任务。Sqoop是一个强大的工具,可以帮助轻松完成这项任务。
晓之以理的喵~~
·
2024-01-20 19:27
sqoop
数据库
sqoop
oracle
Sqoop数据传输中的常见挑战及其解决方法
Sqoop是一个用于将数据传输到
Hadoop
生态系统的强大工具,但在实际使用中,可能会面临一些挑战。
晓之以理的喵~~
·
2024-01-20 19:26
sqoop
sqoop
eclipse
hadoop
创建虚拟机
弹出如下对话框,点击“下一步”3.继续点击“下一步”4.选择“稍后安装操作系统”,然后点击“下一步”5.在版本下拉框中选择“CentOS764位”,然后点击“下一步”6.给虚拟机起一个名字,本机叫做“
Hadoop
100
吃草料的羊
·
2024-01-20 19:56
hadoop
大数据
Linux之postgis
离线
安装
PostgreSQL是一个开源数据库,而PostGIS在此基础上增添了空间对象扩展模块。PostGIS最大的特点是符合并且实现了OpenGIS的一些规范,是最著名的开源GIS数据库。虚拟机环境:CentOS7.8,PostgreSQL12.4本地环境:Windows10,pgadmin4,qgis目录1安装条件准备1.1Postgis安装的必要条件1.2Postgis安装的可选条件1.3必要库和软
牛肉面加肉
·
2024-01-20 19:07
postgis
postgis
postgresql
qgis
保姆级ESP-IDF开发环境搭建
1.手动安装工具链,命令行方式(windows)1.1下载
离线
安装器进入乐鑫ESP-IDFWindowsInstallerDownload下载页面,选择
离线
版本工具(网络原因,安装过程中使用github
帐篷Li
·
2024-01-20 19:35
嵌入式千宝箱
stm32
单片机
嵌入式硬件
2022.07, Spacy==3.4.0,en_core_web_md/sm/lg/trf下载
离线
下载:en_core_web_sm:链接:https://pan.baidu.com/s/1MppnMopRkHTDiO-pnez0ZA提取码:ht50en_core_web_md:链接:https
believe__m
·
2024-01-20 19:24
python
pytorch
深度学习
神经网络
大数据
Hadoop
入门——HDFS分布式文件系统基础
HDFS命令基础语法:【
hadoop
fs具体命令、hdfsdfs具体命令】两个是完全相同的。显示文件列表#hdfsdfs-lsURL创建目录#hdfsdfs-mkdir[-p]URL使用-p参数可以
nucty
·
2024-01-20 16:00
大数据
大数据
hadoop
hdfs
Zookeeper简介
一、Zookeeper简介ZooKeeper是一个分布式的、开放源码的分布式应用程序协调服务,它是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
破茧......
·
2024-01-20 16:35
Zookeeper
zookeeper
分布式
云原生
大数据技术之
Hadoop
伪分布式安装步骤及结果(Ubuntu)
、下载安装虚拟机软件;下载Ubuntu镜像文件,安装Ubuntu虚拟机;2、在Ubuntu系统中创建用户、更新APT、安装SSH并配置SSH无密码登录、安装Java环境、配置PATH环境变量;3、下载
Hadoop
小嘤嘤怪学
·
2024-01-20 16:52
Hadoop
分布式
hadoop
大数据
【大数据】了解 YARN 架构的基础知识
3.1.2ApplicationManager应用程序管理器3.2NodeManager节点管理器3.3ApplicationMaster应用程序主控3.4Container容器4.在YARN中提交应用程序5.
Hadoop
YARN
G皮T
·
2024-01-20 14:23
大数据
大数据
架构
yarn
资源管理
作业调度
hadoop
hdfs
Hive性能优化
sum,count,max,min等UDAF,不怕数据倾斜问题,
hadoop
在map端的汇总合并优化,使数据倾斜不成问题。count(distinct),在数据量大的情况下,效率较
La victoria
·
2024-01-20 13:23
大数据
CentOS 7
离线
迁移 Elasticsearch 数据
CentOS7
离线
迁移Elasticsearch数据文章目录CentOS7
离线
迁移Elasticsearch数据环境说明环境验证源地址目标地址elasticsearch-dump环境依赖验证JDK环境验证
老实人张大傻
·
2024-01-20 13:22
服务器配置
ElasticSearch
elasticsearch
dump
【Centos7内网环境Nexus3私服搭建】
1、使用背景在项目开发的过程中,我们通常在内部网络进行开发,在内网环境开发中我们经常遇到Maven包、Npm包、Yum镜像、Docker镜像等无法联网下载问题,当然这些问题也可以通过
离线
安装的方式进行安装
码农山泉
·
2024-01-20 13:48
私有仓库
npm
maven
巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践
我们基于ApachePaimon(Incubating)构建StreamingLakehouse的落地实践主要分为三期:第一期是在调研验证的基础上进行
数仓
分层,并且上线一些简单的业务验证效果;第二期是实现流式
数仓
的基础设施建设
Apache Flink
·
2024-01-20 12:21
Flink
大数据
实时计算
apache
kafka
大数据
java
分布式
hive Error while compiling statement: FAILED: ClassCastException org.apache.
hadoop
.hive.serde2.objec
Errorwhilecompilingstatement:FAILED:ClassCastExceptionorg.apache.
hadoop
.hive.serde2.objectinspector.primitive.WritableConstantStringObjectInspectorcannotbecasttoorg.apache.
hadoop
.hive.serde2
圆周率的后六位
·
2024-01-20 12:35
hive
hadoop
apache
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他