E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop离线数仓
实验二 :HIve数据定义操作实验
二、实验环境要首先自行搭建由3台虚拟机构成的
Hadoop
环境及Hive环境。
又是被bug折磨的一天
·
2024-01-13 04:55
hive
sql
大数据
git和myeclipse的整合操作(很基础希望对java的你们有帮助)
github下载到电脑的某个位置上===》》大家想要的话我明天准备上传这些大家可以通过我的博客下载资源都是免费的2.sourceTree也是使用git的一个很好的工具3.eclipse安装egit在线安装或者
离线
狗子也能编码
·
2024-01-13 03:34
git
sourceTree
基础使用
idea使用Java工作流
idea使用JAVA工作流一.安装.1.在线安装:2.
离线
安装:(1).网盘链接:[点击]链接:https://pan.baidu.com/s/1rXoOdAIinTv6HRj3SToyUQ提取码:wi7q
狗子也能编码
·
2024-01-13 03:03
工作流
Java工作流
Hadoop
/Spark安装
单机安装
Hadoop
安装Javasudoapt-getinstalldefault-jdkjava-version2.设置
Hadoop
用户和组sudoaddgroup
hadoop
sudoadduser-
周倜吉
·
2024-01-13 03:40
2022字节跳动【数据仓库工程师】日常实习面经-----一面
都还没学扎实)一,自我介绍二,问答阶段shuffle阶段详细介绍回答环形缓冲区,分区排序,溢写磁盘,reduce再抽取归并等等计算单元和实际block存储单元不在一个机器节点上,这样会带来大量的IO操作,
Hadoop
dyson不只是吹风机
·
2024-01-13 03:34
面试
数据仓库
大数据
麒麟操作系统缓存rpm包,制作
离线
yum源
缓存rpm包,以make为例mkdir-p/data/yumyumdownloader--resolve--destdir=/data/yummake制作
离线
yum包yuminstallcreaterepo-ycd
运维@小兵
·
2024-01-13 03:03
Linux
缓存
制作离线yum源
实战案例:chatglm3 基础模型多轮对话微调
base模型https://huggingface.co/THUDM/chatglm3-6b-base由于模型较大,建议
离线
下载后放在代码目录,以".
机器学习社区
·
2024-01-13 02:46
机器学习
chatgpt
人工智能
大模型
langchain
AIGC
Flink
GoogleFileSystemBigTableMapReduceHDFSHBase
Hadoop
Hadoop
基于硬盘,可以处理海量数据;Spark基于内存,性能提高百倍,微批(500ms);Flink基于
三半俊秀
·
2024-01-13 01:53
设置5台SSH互免的虚拟机服务器配置
步骤如下——1、准备五台机器服务器名字服务器IP
hadoop
1192.168.31.130
hadoop
2192.168.31.131
hadoop
3192.168.31.132
hadoop
4192.168.31.133
hadoop
5192.168.31.134
朱季谦
·
2024-01-12 23:24
Linux
ssh
服务器
eclipse
hadoop
(4)--NameNode元数据管理
这是分享的第四篇文章了,可能有些小伙伴看到标题后,很纳闷,完全是跳跃式的,NameNode是什么呢?NameNode是管理元数据的,这个和大数据有什么关系呢?对了,就爱带着问题去探索,NameNode是HDFS的一个组件,可以说一个进程,HDFS中共有三个组件NameNode,DataNode,SecondNameNode。这三个都是做什么的呢?NameNode:管理元数据的DataNode:保存
ROCK_杰哥
·
2024-01-12 22:41
Office Tool Plus v10.6.2.0绿色版
它可以快速自定义部署,在线下载安装Office的各个版本,也可以通过已有的
离线
安装文件来部署Office镜像,同时在安装过程中你可以自由选择安装哪些需要使用的组件,在安装之后也可以单独来安装某个需要的组件
酷爱码
·
2024-01-12 22:19
电脑软件
office
visio
如何进行大数据系统测试
大数据系统常见的架构形式有如下几种:
Hadoop
架构:
Hadoop
DistributedFileSystem(HDFS):这是一种分布式文件系统,设计用于存储海量数据并允许跨多台机器进行高效访问。
Feng.Lee
·
2024-01-12 21:41
系统测试
项目管理
测试工具
大数据
Ubuntu16.04 NVIDIA显卡驱动卸载与安装
Ubuntu16.04NVIDIA显卡驱动卸载与安装1、NVIDIA显卡驱动下载2、NVIDIA显卡驱动卸载3、NVIDIA显卡驱动安装3.1、在线安装3.2、
离线
安装1、NVIDIA显卡驱动下载nvidia
勇闯天涯528
·
2024-01-12 21:29
NVIDIA
ubuntu
nvidia
大数据开发工程师需要具备哪些技能?
在回答这个问题之前,需要充分了解一下当前大数据的几个就业方向,可以参考下主流互联网行业的部门架构、职责和JD,大数据开发工程师,总体来说有这么几类,不同的公司叫法不一样:1、
数仓
开发工程师2、算法挖掘工程师
郑小柒是西索啊
·
2024-01-12 21:58
大数据
Databend 开源周报第 127 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2024-01-12 20:45
数据库
开源
安防视频监控系统EasyCVR设备分组中在线/
离线
数量统计的开发与实现
安防视频监控EasyCVR系统具备较强的兼容性,它可以支持国标GB28181、RTSP/Onvif、RTMP,以及厂家的私有协议与SDK,如:海康ehome、海康sdk、大华sdk、宇视sdk、华为sdk、萤石云sdk、乐橙sdk等。EasyCVR平台可覆盖多类型的设备接入,包括IPC、NVR、智能移动终端、应急布控球、移动执法仪、车载监控设备、无人机等,在移动监控场景上,具备很强的灵活性和可拓展
EasyCVR
·
2024-01-12 19:48
EasyCVR
网络
音视频
监控
视频监控
CANoe中的
离线
回放+Trace回放
前言:首先介绍两种不同回放方式的不同使用场景。首先需要明确的是这两种方式都是利用已经存在的数据文件(blf,asc,vsb等常见数据帧的格式)。从新播放一遍的手段。但是二者的使用场景却非常不同,同时他们实现的方法也是不同的。(1)首先来看Trace回放1.1Trace回放前提条件trace回放,需要在home界面,将整体状态设置为online(在线转态),对realbus或者simulation没
王夏奇
·
2024-01-12 18:37
网络
芯课堂 | SWM341系列屏驱应用之素材篇
01.图片预处理输出数据格式:BinaryRGB565(Swap)or888/CArray由于在线工具受限于网络链接,故使用
离线
转换工具较为快捷便利,请读者自行斟酌。
华芯微特SYNWIT
·
2024-01-12 18:53
单片机
嵌入式硬件
ZooKeeper 安装与部署
1.1认识Zookeeper介绍Zookeeper前,看下面这个图:在这张图片里,我们可以看到
Hadoop
是一只大象,HIVE是一只蜜蜂,Bigtop是马戏团,Pig是一只猪,HAMA是一只河马…只有Zookeeper
Destiny_-Sky
·
2024-01-12 18:48
ZooKeeper
zookeeper
分布式
java
Linux学习笔记——ZooKeeper集群安装部署
5.8、ZooKeeper集群安装部署5.8.1、简介Zookeeper是一个分布式的、开放源码的分布式应用程序协调服务,是
Hadoop
和HBase的重要组件。
kxttmx
·
2024-01-12 18:16
linux
学习
zookeeper
Zookeeper安装与部署
由于ZooKeeper便捷的使用方式、卓越的性能和良好的稳定性,被广泛地应用于诸如
Hadoop
、HBase、Kafka和Dubbo等大型分布式系统中。一个分布式系统最多只能同时满足一致性
HRX98
·
2024-01-12 18:12
经验贴
zookeeper
分布式
zookeeper下载安装部署
zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的
Hadoop
项目的一个子项目,并根据google发表的一篇论文来实现的。
倚-天-照-海
·
2024-01-12 18:38
kafka
zookeeper
linux
分布式
Centos安装Datax
实践案例1、环境信息2、编写同步的配置文件(user_info.json)3、执行同步4、验证同步结果一、DataX简介DataX是阿里云DataWorks数据集成的开源版本,在阿里巴巴集团内被广泛使用的
离线
数据同步工具
GreaterBuilder
·
2024-01-12 18:04
DataX
centos
dataX
mysql
hdfs
Hadoop
常用命令
启动
Hadoop
所有进程:start-all.sh关闭
Hadoop
所有进程:stop-all.sh单进程启动:start-dfs.sh和start-yarn.sh分别启动HDFS和YARNhdfsdfs-xxx
在努力的Jie
·
2024-01-12 16:16
Hadoop
的核心 —— HDFS(1)
首先来看看
Hadoop
是什么?
土冥王
·
2024-01-12 16:13
数据交付变革:研发到产运自助化的转型之路
作者|Chris导读本文讲述为了提升产运侧数据观察、分析、决策的效率,支持业务的快速迭代,移动生态数据研发部对
数仓
建模与BI工具完成升级,采用宽表建模与TDA平台相结合的方案,一站式自助解决数据应用需求
百度Geek说
·
2024-01-12 16:14
信息可视化
数据分析
数据挖掘
数仓建模
BI工具
kafka下载安装部署
它现在是Apache旗下的一个开源系统,作为
hadoop
生态系统的一部分,被各种商业公司广泛应用。
倚-天-照-海
·
2024-01-12 15:25
kafka
kafka
分布式
Hbase2.1 集群搭建
Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了
Hadoop
3.2集群搭建了,本次我们将继续紧接着搭建Hbase集群。
kikiki2
·
2024-01-12 15:31
Hadoop
框架下MapReduce中的map个数如何控制
一个job的map阶段并行度由客户端在提交job时决定客户端对map阶段并行度的规划基本逻辑为:一、将待处理的文件进行逻辑切片(根据处理数据文件的大小,划分多个split),然后每一个split分配一个maptask并行处理实例二、具体切片规划是由FileInputFormat实现类的getSplits()方法完成切分规则如下:1.简单地按照文件的内容长度进行切片2.切片大小默认是datanode
数据萌新
·
2024-01-12 14:31
解决java连接Hbase程序卡住执行也不报错的问题
程序运行不知多久,就报错了(截取一行有用的):java.net.UnknownHostException:cannotresolve
hadoop
01,1
向他一样rap
·
2024-01-12 14:37
hbase
java
big
data
查询速度提升15倍!银联商务基于 Apache Doris 的数据平台升级实践
为更好提供数据服务,银联商务实现了从
Hadoop
到ApacheDoris的架构升级,使数据导入性能提升2-5倍、ETL场景性能提升3-12倍、查询分析响应速度提升10-15倍,满足大规模数据导入和实时极速查询的业务需求
SelectDB技术团队
·
2024-01-12 13:28
apache
数据库
大数据
数据分析
数据仓库
GBASE南大通用 GBase 8a 产品构建
数仓
系统架构
lGBASE南大通用GBase8a产品构建
数仓
应用的系统架构:架构技术实现特点适用场景独立数据仓库(集市)系统架构一套GBase8a物理集群适用于数据规模较小的业务场景适用于各业务之间数据互访较频繁的业务场景适用于单一独立的业务场景企业级
数仓
系统架构多套
GBASE数据库
·
2024-01-12 12:04
数据库
GBASE南大通用
GBASE
Centos7
离线
安装 gcc g++
1.下载centos镜像:https://buildlogs.centos.org/rolling/7/isos/x86_64/我下载的是CentOS-7-x86_64-DVD-1611.iso,对应的gcc版本是4.8.5如果需要更高版本的gcc,按照时间排序,选择日期靠前的镜像下载,如下图:image2.用压缩工具打开镜像,进入Packages目录拷贝下面的文件:image网盘下载:链接:ht
芥末巴士
·
2024-01-12 11:09
使用Markdown编辑器
Markdown编辑器使用[StackEdit][6]修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图
离线
写博客导入导出
Heffie199
·
2024-01-12 11:01
编辑器
Hive安装与配置
注意:Hive的安装与配置建立在
Hadoop
已安装配置好的情况下。hadopp安装与配置Hive的基本安装从官网下载Hive二进制包,下载好放在/opt目录下。
qq_58647543
·
2024-01-12 11:50
hive
hive
关于hive在运行insert时失败原因刨析
yarn容器最大内存、容器最小内存等Theclasstouseastheresourcescheduler.yarn.resourcemanager.scheduler.classorg.apache.
hadoop
.yarn.server.resourcemanager.scheduler
Alonzo de blog
·
2024-01-12 08:57
hadoop
hadoop
大数据
hive
mapreduce
hadoop
分布式文件系统
Hadoop
分布式文件系统分布式文件系统:管理网络中跨多台计算机存储的文件系统称为分布式文件系统。
Alonzo de blog
·
2024-01-12 08:27
hadoop
hadoop
大数据
hdfs
【数据库学习】hive
1,HIVE
Hadoop
的数据仓库处理工具,数据存储在
Hadoop
兼容的文件系统(例如,AmazonS3、HDFS)中。
兔兔西
·
2024-01-12 08:50
数据库
学习
hive
【DolphinScheduler】datax读取hive分区表时,空分区、分区无数据任务报错问题解决
问题背景:最近在使用海豚调度DolphinScheduler的Datax组件时,遇到这么一个问题:之前给客户使用海豚做的
离线
数仓
的分层搭建,一直都运行好好的,过了个元旦,这几天突然在
数仓
做任务时报错,具体报错信息如下
Alex_81D
·
2024-01-12 08:49
部署项目相关
大数据基础
数据治理
hive
hadoop
数据仓库
基于JavaWeb+BS架构+SpringBoot+Vue基于hive旅游数据的分析与应用系统的设计和实现
文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》源码获取文末获取源码Lun文目录1概述51.1研究背景51.2研究意义51.3研究内容52关键技术介绍72.1Java介绍72.2MySql数据库72.3
Hadoop
FREE技术
·
2024-01-12 07:01
架构
spring
boot
vue.js
计算机专业毕业设计
Spark基础
pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplepandas更新最新版本pippython-mpipinstall--upgradepip1、启动服务
Hadoop
中长跑路上crush
·
2024-01-12 07:33
Spark阶段
spark
大数据
分布式
【大数据面试】常见
数仓
建模面试题附答案
数仓
架构为什么要分层?事实表的类型?维度建模步骤?维度建模的三种模式?
数仓
架构进化?数据仓库如何保证数据质量?开发流程/你们是怎么测试的?维度建模过程?维度建模的三种模式?事实表都有哪几种?
话数Science
·
2024-01-12 07:28
面试
大数据
大数据
三毛游APP使用过程中的常见问题解答
1、为什么要先下载
离线
数据?国外景区网络普遍较差,缺少wifi或无法连上。提前下载
离线
数据可以做到免流量使用三毛游,充分节省您的流量费用,也提供了更顺畅的App使用体验。
三毛游APP
·
2024-01-12 06:02
Zookeeper+
Hadoop
+Spark+Flink+Kafka+Hbase+Hive
说明Zookeeper+
Hadoop
+Spark+Flink+Kafka+Hbase+Hive完全分布式高可用集群搭建下载https://archive.apache.org/dist/我最终选择Zookeeper3.7.1
nsa65223
·
2024-01-12 06:08
hadoop
zookeeper
spark
Hive解析json数组
在使用Hive搭建数据仓库,处理数据时,同传统
数仓
的结构化数据不同,我们经常会遇到一些非结构化的数据,json格式的字符串就是常见的一种类型。
风筝flying
·
2024-01-12 03:47
黑猴子的家:Redis 客户端访问
1、一个端口[root@
hadoop
102redis-3.2.5]#redis-cli2、多个端口客户端访问有多个端口的情况下[root@
hadoop
102redis-3.2.5]#redis-cli-p63793
黑猴子的家
·
2024-01-12 03:21
python在线编译器源码,python语言在线编译器
离线
Python编辑器和编译器都具有许多功能,但是在线编译器通常在功能上受到限制,并试图满足特定需求而不是满足所有需求,其中在线编译大多数是免费的,所以也受到开发者的热爱。
gpt886
·
2024-01-12 03:20
网络
Linux操作系统下,彻底删除MySQL
背景:部署Hive时,遇到了无法访问数据库的问题;此时Linux中的环境是,已安装MySQL-8.0.35的版本,JDK8和
Hadoop
-3.3.4版本;然后开始上传Hive-3.1.3版本的的安装包和
zhiweizhang_zzw
·
2024-01-12 02:59
大数据
linux
mysql
hive
win10自带Groove音乐不能播放CUE和APE文件的一种曲线救国办法,自己创建aimppack插件包,AIMP安装DSP插件
如果你的系统区域设置的是国内,那么Groove就会变成阉割
离线
版,只能播放本地音乐。如果你把区域设为国外,能播放国外的在线音乐,当然前提你要会魔法上网。
森之千手
·
2024-01-12 02:18
音乐播放器
AIMP
DSP
AIMP
DSP
aimppack
aimp插件
C++并发编程实战第2版笔记
文章目录p19某个线程只可以join()一次p22只有当joinable()返回true时才能调用detach()P21在std::thread对象析构前,必须明确是等待还是分
离线
程P25移动语义P25
barbyQAQ
·
2024-01-12 02:27
c++
笔记
c++
笔记
jvm
上一页
35
36
37
38
39
40
41
42
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他