E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
[1145]Hive导入csv文件
zs,231002,lis,24首先创建表createtableifnotexistscsv2(uidint,unamestring,ageint)rowformatserde'org.apache.
hadoop
.hive.serde2
周小董
·
2023-11-24 11:54
大数据
hive
hadoop
hdfs
Hive系统配置及数据导入--【导入csv文件】
1、安装
Hadoop
环境、并安装Hive。
outside-R
·
2023-11-24 11:51
大数据课程学习
hive
docker
hadoop
hive中导入csv_
hadoop
hive中怎么导入带引号的csv文件?
这边有个项目开始用
hadoop
来做数据分析,我们拿到一个csv文件,每一列都是双引号.格式如下“cola1″,”colb1″,”colc1”“cola2″,”colb2″,”colc2”现在想问下,在load
weixin_39531780
·
2023-11-24 11:49
hive中导入csv
【log4j漏洞】log4j 1.x漏洞依赖包解决方案
于是继续检查本地程序,在pom中一个个的排查依赖包,发现是
hadoop
相关的包引用到了log4j1.x,
秦拿希
·
2023-11-24 11:18
log4j
java
springboot
安装Hive并导入csv文件
并导入csv文件下载安装包下载hive:https://mirrors.aliyun.com/apache/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz下载
hadoop
quick5g
·
2023-11-24 11:47
大数据
hive
hadoop
大数据
Hive导入csv文件
zs,231002,lis,24首先创建表createtableifnotexistscsv2(uidint,unamestring,ageint)rowformatserde'org.apache.
hadoop
.hive.serde2
鸭梨山大哎
·
2023-11-24 11:46
hive
hive
csv
parquet
【大数据】Docker部署HMS(Hive Metastore Service)并使用Trino访问Minio
Presto使用Docker独立运行HiveStandaloneMetastore管理MinIO(S3)_hiveminio_BigDataToAI的博客-CSDN博客一.背景团队要升级大数据架构,需要摒弃
hadoop
秦拿希
·
2023-11-24 11:35
docker
容器
hive
trino
minio
【大数据实训】基于赶集网租房信息的数据分析与可视化(七)
温馨提示:文末有CSDN平台官方提供的博主的联系方式,有偿帮忙部署基于赶集网租房信息的数据分析与可视化一、实验环境(1)Linux:Ubuntu16.04(2)Python:3.6(3)
Hadoop
:3.1.3
AI_Maynor
·
2023-11-24 10:54
#
课设&毕设
大数据
数据分析
数据挖掘
ubuntu操作系统中docker下
Hadoop
分布式前置环境配置实验
版本:centos7
hadoop
3.1.3javaJDK:1.8集群规划:masterslave1slave2HDFSNameNodeDataNodeDataNodeSecondryNameNodeDataNodeYARNNodeManagerResourceManageNodeManagerNodeManager1
芝士小熊饼干
·
2023-11-24 09:05
分布式
docker
hadoop
HBase本地安装Snappy
它直接关系到需要使用的Snappy以及
Hadoop
的版本。如果版本对不上,很可能出现链接本地动态链接库时的错误。操作操作其
AlstonWilliams
·
2023-11-24 09:08
Spark 数据倾斜及其解决方案
一、什么是数据倾斜对Spark/
Hadoop
这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。对于分布式系统而言,理想情况下,随着系统规模(节点数量)的增加,应用整体耗时线性下降。
沐白的微笑
·
2023-11-24 09:17
spark
spark
数据倾斜
Hadoop
原生态版安装
最近在学厦门大学的《大数据技术原理与应用》公开课,参考学习内容自己部署了一个
Hadoop
平台,整个分布式集群分一个Master服务器和两个Slave服务器,方便后面学习。
SMILE_NO_09
·
2023-11-24 09:27
Centos 7下分布式
Hadoop
2.7.7+Hive2.3.7安装教程
一、基本配置集群包括角色名称简称masterinspur5212m4.it.163.org以下简称m4slaveinspur5212m5.it.163.org以下简称m4slavelenovosr630.it.163.org以下简称sr二、JDK和SSH的配置修改三台机器的/etc/hostssudovim/etc/hosts添加内容:10.220.16.161inspur5212m5.it.16
XH_zhao
·
2023-11-24 08:45
Note31:Apache Atlas-0.8.4 安装配置
apache-atlas-0.8.4-sources.tar.gz把源码包上传到/opt/software目录编译环境:Maven-3.6.3编译(编译时间主要看下载相关jar包的速度)[kevin@
hadoop
112software
K__3f8b
·
2023-11-24 07:05
Spark算子综合应用案例
一.WordCount数据
hadoop
mapreduceyarnhdfs
hadoop
mapreducemapreduceyarnlagoulagoulagou案例:Scala版defmain(args:
谷应泰
·
2023-11-24 07:24
大数据
spark
重新使用hbase前
启动关闭
Hadoop
和HBase的顺序一定是:启动
Hadoop
—>启动HBase—>关闭HBase—>关闭
Hadoop
1.挂载共享文件夹到挂载点sudomount-tvboxsfvirtualmachineShare
北辰Charih
·
2023-11-24 06:19
大数据挖掘
linux
运维
服务器
hadoop
hbase
大数据面试经验分享:探索大规模数据处理的技巧与实践
常见的大数据处理框架包括Apache
Hadoop
和Apache
星光璀璨下的梦幻舞台
·
2023-11-24 06:38
大数据
大数据技术,Spark任务调度原理 四种集群部署模式介绍
一、spark-submit任务提交机制spark-submit\--classorg.apache.spark.examples.SparkPi\--masterspark://ns1.
hadoop
:
喵感数据
·
2023-11-24 06:01
Hadoop
之mapreduce数据去重和求平均分(案例)
阅读目录一、数据去重使用idea创建Maven项目在pom.xml文件添加
Hadoop
的依赖库,内容如下:编写Dedup.class运行程序二、求平均分关于部分详细说明一、数据去重使相同的数据在最终的输出结果中只保留一份
忌颓废
·
2023-11-24 05:13
hadoop+spark
mapreduce
hadoop
大数据
hadoop
启动java.lang.nullpointerexception_
hadoop
下载文件出现的问题java.lang.NullPointerException...
hadoop
下载文件代码如下:packageweek01;importjava.io.FileInputStream;importjava.io.IOException;importjava.net.URI
weixin_39790528
·
2023-11-24 05:41
hadoop
mapreduce mysql_
hadoop
mapreduce数据去重
hadoop
mapreduce数据去重假设我们有下面两个文件,需要把重复的数据去除。
反正我不慌哈
·
2023-11-24 05:11
hadoop
mapreduce
mysql
【
Hadoop
学习项目】2. 数据去重
0.项目结构数据处理过程图1.DupDriverpackage
hadoop
_test.data_duplicate_demo_02;importorg.apache.
hadoop
.conf.Configuration
辰阳星宇
·
2023-11-24 05:05
#
Hadoop
hadoop
mapreduce
big
data
大数据MapReduce学习案例:数据去重
文章目录一,案例分析(一)数据去重介绍(二)案例需求二,案例实施(一)准备数据文件(1)启动
hadoop
服务(2)在虚拟机上创建文本文件(3)上传文件到HDFS指定目录(二)Map阶段实现(1)创建Maven
梁辰兴
·
2023-11-24 05:32
大数据
大数据
mapreduce
hadoop
数据去重
Hadoop
MapReduce数据去重程序
packagecom.
hadoop
.sample;importjava.io.IOException;importjava.util.StringTokenizer;importorg.apache.
hadoop
.conf.Configuration
GarfieldEr007
·
2023-11-24 05:28
Hadoop
Hadoop
MapReduce
数据去重
程序
Hadoop
学习总结(MapReduce的数据去重)
现在假设有两个数据文件file1.txtfile2.txt2018-3-1a2018-3-2b2018-3-3c2018-3-4d2018-3-5a2018-3-6b2018-3-7c2018-3-3c2018-3-1b2018-3-2a2018-3-3b2018-3-4d2018-3-5a2018-3-6c2018-3-7d2018-3-3c上述文件file1.txt本身包含重复数据,并且与fi
Qinqin.J
·
2023-11-24 05:23
学习
mapreduce
大数据
出现:WARNING :POSSIBLE DNS SPOOFING DETECTED!问题解决方法
image.png出现这个问题解决方式:ssh-keygen-R
hadoop
03ssh-copy-id
hadoop
03
printf200
·
2023-11-24 03:22
HiveSQL解析原理:包括SQL转化为MapReduce过程及MapReduce如何实现基本SQL操作
Hive是基于
Hadoop
的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的HiveETL计算流程,负责每天数百GB的数据存储和分析。
数仓大山哥
·
2023-11-24 02:00
hive
hive
mapreduce
sql执行原理
Impala-大数据时代快速SQL引擎
Impala介绍ApacheImpala是由Cloudera开发并开源的一款基于HDFS/Hbase的MPPSQL引擎,它拥有和
Hadoop
一样的可扩展性、它提供了类SQL(类Hsql)语法,在多用户场景下也能拥有较高的响应速度和吞吐量
盛装吾步
·
2023-11-24 02:30
hadoop
impala
hive
hadoop
sql
Spark设计理念与基本架构
Hadoop
MapReduce的缺陷:对HDFS的频繁操作导致磁盘IO称为系统性能的瓶颈,因此只适用于离线数据处理。
whynotybb
·
2023-11-24 02:29
[
大数据学习
之ClickHouse]05-ClickHouse之SQL操作
传统关系型数据库支持的SQL语句,CLK基本都支持1.insert语法一致,不过多做讲解2.UpDate/DeleteCLK支持修改和删除操作,但是不支持事务,并且语法和传统数据库有区别,删除和修改用的比较少一点删除:altertablet_order_smtdeletewheresku_id='sku_001';修改:altertablet_order_smtupdatetotal_amount
阿月.
·
2023-11-24 01:08
BigData
sql
big
data
学习
大数据学习
教程SD版第十三篇【Clickhouse】
Clickhouse列式数据库快,简单,yandex开源,C++编写,分析型数据库,SQL查询,列操作快,多样化引擎,高吞吐写入(LSMTree),多版本数据(Hbase),顺序Append写,数据分区,线程级并行(单条查询能利用整机所有CPU),不适合初始存储,尽量避免join操作(不快,右表加载到内存)1.Clickhouse安装准备工作关闭防火墙#statussystemctlstatusf
道-闇影
·
2023-11-24 01:37
big
data
hadoop
Clickhouse
HDFS小结01
首先我们来认识一下HDFS,HDFS(
Hadoop
DistributedFileSystem)
Hadoop
分布式文件系统。它其实是将一个大文件分成若干块保存在不同服务器的多个节点中。
liuzx32
·
2023-11-24 01:30
代码思路分享 计算机毕业设计Python+
Hadoop
+Spark+Hive旅游可视化 旅游数据分析 数据仓库 旅游推荐系统 旅游大数据 大数据毕业设计 大数据毕设
涉及技术
hadoop
hiveazkabanpython爬虫huesqoopmysql运行截图
haochengxu2022
·
2023-11-24 00:09
推荐系统
机器学习
数据分析
大数据
hive
hadoop
大数据毕设-基于
hadoop
+spark+大数据+机器学习+大屏的电商商品数据分析可视化系统设计实现 电商平台数据可视化实时监控系统 评论数据情感分析
作者:雨晨源码简介:java、微信小程序、安卓;定制开发,远程调试代码讲解,文档指导,ppt制作精彩专栏推荐订阅:在下方专栏Java精彩实战毕设项目案例小程序精彩项目案例Python实战项目案例文末获取源码文章目录电商商品数据分析可视化系统-系统前言简介spark电商商品数据分析可视化系统-开发技术与环境spark电商商品数据分析可视化系统-研究内容spark电商商品数据分析可视化系统-演示图片s
雨晨源码
·
2023-11-24 00:37
Python实战项目集
大数据
hadoop
机器学习
spark
毕业设计
python
预测模型
大数据毕设-基于
hadoop
+spark+echarts+机器学习的豆瓣图书数据可视化分析系统设计实现(附开发文档+部署)
定制开发,远程调试代码讲解,文档指导,ppt制作精彩专栏推荐订阅:在下方专栏Java精彩实战毕设项目案例小程序精彩项目案例Python实战项目案例文末获取源码文章目录豆瓣图书数据可视化分析系统-系统前言简介
Hadoop
雨晨源码
·
2023-11-24 00:37
Python实战项目集
信息可视化
大数据
python
django
hadoop
spark
毕业设计
Hadoop
常用组件zookeeper,kafka
Hadoop
常用组件zookeeper,kafkaZooKeeper是一个开源的分布式应用程序协调系统。
wayne342175926
·
2023-11-23 23:22
大数据
hadoop
kafka
zookeeper
【Spark技术与实战】Spark+Scala对化妆品指标的计算处理
读取数据3.计算价格范围4.分析品牌分布5.分析适用皮肤类型分布6.分析成分7.分析排名变化最大的品牌8.判断排名变化方向总结前言我们知道,Spark是一个优秀的基于内存的计算框架,可以独立使用,也可以和
Hadoop
db_lmr_2071
·
2023-11-23 22:35
spark
scala
大数据
【
Hadoop
】安装部署-完全分布式搭建
文章目录前言一、部署需要的软件二、
Hadoop
配置环境1.配置网络环境关闭防火墙2.安装jdk和
hadoop
2.1配置jdk环境变量2.2配置
Hadoop
环境变量三、准备三台虚拟机1.修改主机名与IP映射
db_lmr_2071
·
2023-11-23 22:05
分布式
hadoop
大数据
计算机毕业设计吊打导师
hadoop
+spark+hive微博预警系统 微博数据分析可视化大屏 微博情感分析 微博爬虫 微博大数据 微博推荐系统 微博预测系统
流程:1.selenium爬取微博热搜、文章、评论数据存入mysql数据库(并对评论lstm情感分析模型建模分析);2.使用mapreduce对mysql中采集的微博数据进行数据清洗,转为.csv文件上传hdfs文件系统;3.使用hive建库建表,导入.csv数据集;4.一半指标使用hive_sql进行离线分析,一半指标使用Spark之Scala实时分析;5.分析的结果使用sqoop导入mysql
计算机毕业设计大神
·
2023-11-23 20:09
XJAU
Hadoop
课程设计MapReduce及Hive学生成绩查询统计实现
XJAU
Hadoop
课程设计课程设计要求分析每位学生的平均成绩(MapReduce实现和hive实现)分析每位学生的总分(MapReduce实现和hive实现)分析每门课程的平均成绩(hive实现)显示每位学生详细信息
7ANGHUAN
·
2023-11-23 20:12
课设
hive
hadoop
Java连接hbase
在hbase中添加测试数据见《实验3-HBase安装及配置》的5、Hbase的基本使用添加一张student表修改配置文件登录centos,用
hadoop
用户登录①修改
hadoop
核心配置sudovi/
ccyhYY
·
2023-11-23 20:39
笔记
hbase
java
Java连接HBASE数据库
HBASE是建立在
Hadoop
分布式系统基础之上的列模式数据库,Java连接HBASE需要如下几个jar包:
hadoop
-common、
hadoop
-mapreduce-client-core、hbase-common
玉儿小跟班
·
2023-11-23 20:08
JAVA
java
hbase
hadoop
Java程序连接Hbase集群
2.1pom.xml依赖2.2application.conf文件三、JavaAPI一、环境介绍Java8SpringBoot2.3.7.RELEASEHbase:1.2.0zookeeper:3.4.5
Hadoop
Liu_Shihao
·
2023-11-23 20:38
大数据
Bug
java
hbase
Kafka 生产者、消费者命令行操作
2.发送消息bin/kafka-console-producer.sh--bootstrap-server
hadoop
102:9092--topicfirs
不想起床32
·
2023-11-23 18:40
kafka
java
mybatis
在阿里云服务器上配置
Hadoop
单机环境无法启动namenode
报错信息如下:Failedtostartnamenode.java.net.BindException:Problembindingto[test01:9000]java.net.BindException:Cannotassignrequestedaddress报错时给了该问题的参考网站:维基百科关于BindException的说明。根据其提示一般是由于IP地址配置错误或者端口占用。根据nets
analanxingde
·
2023-11-23 16:39
cesi部署文档
安装cesi之前我们需要先安装Yarn(Apache
Hadoop
YARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的
Hadoop
资源管理器,它是一个通用资源管理系统
飞翔的秋裤
·
2023-11-23 15:11
cesi
python
伪分布式系列 - 第三篇 - spark-2.4.3环境搭建on
hadoop
3.2.0
目录基础环境搭建spark配置spark下载spark配置文件环境配置拷贝包yarn配置spark启动测试基础环境搭建基于前面的文章,
hadoop
已经搭建好,下面我们将进行sparkonyarn搭建下载并配置
rolin-刘瑞
·
2023-11-23 15:22
spark
大数据生态搭建系列
hadoop
spark
伪分布式系列 - 第一篇 -
hadoop
-3.2.0环境搭建
目录
Hadoop
的三种运行模式单机模式伪分布式模式全分布式集群模式环境准备系统环境ssh免密码连接防火墙关闭jdk安装配置相关环境变量配置安装包下载
Hadoop
配置解压
hadoop
文件配置linux环境配置启动服务格式化
rolin-刘瑞
·
2023-11-23 15:21
hadoop
大数据生态搭建系列
hadoop
hadoop
搭建全分布式集群-虚拟机
hadoop
搭建全分布式集群-虚拟机一、本次搭建环境说明VMwareFusionmaster:ubuntu16.0464位ip:172.16.29.11slave1:ubuntu16.0464位ip:172.16.29.12slave1
皓阳当空
·
2023-11-23 14:46
环境搭建
大数据
hadoop
Hadoop
【基础知识 04】【HDFS常用shell命令】(
hadoop
fs +
hadoop
dfs + hdfs dfs 使用举例)
Hadoop
fs:使用面最广,可以操作任何文件系统。
hadoop
dfs与hdfsdfs:只能操作HDFS文件系统相关(包括与LocalFS间的操作),前者已经Deprecated,一般使用后者。
シ風
·
2023-11-23 13:13
#
:::
::
:
Hadoop
:
::
:::
hadoop
大数据
上一页
46
47
48
49
50
51
52
53
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他