E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop面试问题
HDFS的编程
一、HDFS原理HDFS(
Hadoop
DistributedFileSystem)是
hadoop
生态系统的一个重要组成部分,是
hadoop
中的的存储组件,在整个
Hadoop
中的地位非同一般,是最基础的一部分
卍king卐然
·
2024-08-25 07:02
hdfs
hadoop
大数据安全
web安全
经验分享
Hadoop
入门基础(二):
Hadoop
集群安装与部署详解(超详细教程)
NameNodemaster192.168.1.101DataNode1slave1192.168.1.102DataNode2slave2192.168.1.1032.软件要求操作系统:CentOS7或Ubuntu20.04JavaJDK:
Hadoop
william.zhang(张)
·
2024-08-25 06:57
hadoop
大数据
分布式
Ubuntu下部署
Hadoop
集群+Hive(一)
配置主机Host在三台服务器上添加主机名与IP的映射,以方便在局域网内进行主机间的快速访问和后续的文件配置;配置方法:vi/etc/hosts为方便配置:我的三台主机取名为
Hadoop
Master、
Hadoop
Slave01
岩屿
·
2024-08-24 17:41
hadoop
ubuntu
hive
大数据
C#开发工程师最终面试复盘
面试问题
1.首先介绍一下自我介绍。原版我叫jack,毕业于xx大学,计算机科学与技术专业。我第一份工作在XX公司,是一家零售行业的系统供应商。我的职位是系统工程师,主要工作职责是,需求确
一心赚狗粮的宇叔
·
2024-08-24 16:33
C#常见面试题目
c#
面试
microsoft
java
wpf
Hadoop
的基本 shell 命令
Hadoop
的基本shell命令主要用于与
Hadoop
分布式文件系统(HDFS)和MapReduce进行交互。
难以触及的高度
·
2024-08-24 14:22
hadoop
大数据
分布式
基于
Hadoop
的海量图像检索
基于
Hadoop
的海量图像检索“MassiveImageRetrievalBasedon
Hadoop
:AStudyinSoftwareEngineering”完整下载链接:基于
Hadoop
的海量图像检索文章目录基于
usp1994
·
2024-08-24 13:12
hadoop
eclipse
大数据
从零到一建设数据中台 - 关键技术汇总
一、数据中台关键技术汇总语言框架:Java、Maven、SpringBoot数据分布式采集:Flume、Sqoop、kettle数据分布式存储:
Hadoop
HDFS离线批处理计算:MapReduce、Spark
我码玄黄
·
2024-08-24 12:09
数据中台
数据挖掘
数据分析
大数据
Kylin的工作原理及使用分享
Kylin提供了一个
Hadoop
之上的SQL查询接口及多维分析(OLAP)能力,能够支持大规模数据,处理TB乃至PB级别的分析任务,并且能够在亚秒级查询巨大的Hive表。
丁爸
·
2024-08-24 07:01
大数据
kylin
阿里云服务器内存型r7、r8a、r8y实例区别及最新活动价格参考
在阿里云目前的活动中,属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格,相比于活动内的经济型e和通用算力型u1等实例规格来说,这些实例规格等性能更强,适用于数据分析与挖掘,
Hadoop
阿里云最新优惠和活动汇总
·
2024-08-23 22:23
Ubuntu下部署
Hadoop
集群+Hive(二)
Hadoop
集群搭建准备环境
hadoop
-3.3.6.tar.gz,jdk-8u421-linux-x64.tar.gz根据自己的使用下载对的
hadoop
和jdk版本
hadoop
下载地址:Apache
Hadoop
JDK
岩屿
·
2024-08-23 14:46
hadoop
hive
计算机毕业设计
hadoop
+spark知识图谱美食推荐系统 美食价格预测 美团推荐系统 美团爬虫 大众点评爬虫 美食数据分析 美食可视化大屏 大数据毕设
创新点:1.支付宝沙箱支付2.支付邮箱通知(JavaMail)3.短信验证码修改密码4.知识图谱5.四种推荐算法(协同过滤基于用户、物品、SVD混合神经网络、MLP深度学习模型)6.线性回归算法预测房价7.Python爬虫采集大众点评美食数据8.AI短信识别9.百度地图API10.lstm情感分析11.spark大屏可视化开发技术:springbootvue.jspythonechartsspar
计算机毕业设计大全
·
2024-08-23 13:22
计算机毕业设计
hadoop
+spark知识图谱高考分数预测系统 高考志愿推荐系统 高考可视化大屏 高考大数据 高考数据分析 高考爬虫 大数据毕业设计
开发技术
hadoop
sparkspringbootvue.jsPython爬虫、机器学习、深度学习mybatis-plusneo4j知识图谱图数据库mysql协同过滤算法(基于物品、基于用户模式)MLP
计算机毕业设计大全
·
2024-08-23 11:05
基于
Hadoop
平台的电信客服数据的处理与分析④项目实现:任务16:数据采集/消费/存储
任务描述“数据生产”的程序启动后,会持续向callLog.csv文件中写入模拟的通话记录。接下来,我们需要将这些实时的数据通过Flume采集到Kafka集群中,然后提供给HBase消费。Flume:是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据
我非夏日
·
2024-08-23 06:28
大数据开发---电信项目
大数据
大数据技术开发
hadoop
《Linux运维总结:基于银河麒麟V10+ARM64架构CPU部署zookeeper 3.8.4二进制分布式集群》
它是Google的Chubby项目的开源实现之一,并且是
Hadoop
和HBase等项目的重要组成部分。ZooKeeper提供的功能包括配置维护
东城绝神
·
2024-08-22 16:35
《Linux运维实战总结》
运维
分布式
linux
zookeeper
Amazon EFS:云端弹性文件系统的多元化应用场景
应用:
Hadoop
、Spark等大数据框架优势:高
ivwdcwso
·
2024-08-22 04:51
运维
EFS
AWS
Hadoop
的概念
1.什么是大数据数据体量巨大:数据量规模庞大,通常以PB(拍字节)或EB(艾字节)来衡量,远远超出了传统数据库和数据处理工具的处理能力。数据类型多样:大数据包括结构化数据、半结构化数据和非结构化数据。其中,非结构化数据占据了相当大的比例,如文本、音频、视频、图片、地理位置信息等。价值密度低:在大量的数据中,真正有价值的信息可能只是很小的一部分。因此,如何从海量数据中快速提取有价值的信息是大数据处理
子非鱼
·
2024-08-22 02:03
hadoop
大数据
分布式
模拟面试总结
常见
面试问题
有:形式可以一次三人(抢答),或者一次一人(一对一)基本数据类型switch分支结构比较相等++--包装类oop常见概念方法重载、方法重写try-catch-finallyfinalizethrowthrows
孤独斗士
·
2024-08-22 01:00
模拟面试
笔试题
1024程序员节
MAP REDUCE
框架示例Apache
Hadoop
:以MapReduce作为默认处理引擎的框架。ApacheSpark:可以整合进
Hadoop
,取代MapReduce的框架
Xiao_die888
·
2024-08-22 01:58
大数据分析与应用
mapreduce
HiveSQL常见函数及使用方法(含代码示例)
HiveSQL(HiveSQL)是ApacheHive所使用的SQL方言,专门用于在
Hadoop
上进行大规模数据处理。以下是一些常见的HiveSQL函数及其使用方法:1.聚合函数COUNT统计记录数。
会飞的岛格酱
·
2024-08-21 21:31
SQL代码练习
hive
sql
数据分析
Azkaban各种类型的Job编写
一、概述原生的Azkaban支持的plugin类型有以下这些:command:Linuxshell命令行任务gobblin:通用数据采集工具
hadoop
Java:运行
hadoop
MR任务java:原生java
__元昊__
·
2024-03-28 21:00
Linux(centos7)部署hive
前提环境:已部署完
hadoop
(HDFS、MapReduce、YARN)1、安装元数据服务MySQL切换root用户#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysqL
灯下夜无眠
·
2024-03-28 12:44
Linux
linux
hive
运维
dbeaver
hive客户端
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括
Hadoop
框架、HDFS、MapReduce、YARN以及
Hadoop
生态系统中的其他关键工具,如Spark、Flink、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
【
Hadoop
】使用Scala与Spark连接ClickHouse进行数据处理
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域,ApacheSpark是一个广泛使用的高性能、通用的计算框架,而ClickHouse作为一个高性能的列式数据库,特别适合在线分析处理(OLAP)。结合Scala语
音乐学家方大刚
·
2024-03-26 09:56
Scala
Hadoop
hadoop
scala
spark
数据结构面试常见问题
数据结构是面试中经常被问及的重要主题之一,以下是一些常见的数据结构
面试问题
:什么是数据结构?为什么需要数据结构?数组和链表有什么区别?各自的优缺点是什么?树的常见类型有哪些?请解释它们的特点。
工作学习小贴士
·
2024-03-25 07:53
java
数据结构
hadoop
配置免密登录
1.生成密钥ssh-keygen-trsa所有节点都要执行2.所有节点执行ssh-copy-id-i~/.ssh/id_rsa.pub用户名1@主机名1ssh-copy-id-i~/.ssh/id_rsa.pub用户名2@主机名2ssh-copy-id-i~/.ssh/id_rsa.pub用户名3@主机名33.目录授权chmod700~/.sshchmod600~/.ssh/authorized_
我干开发那十年
·
2024-03-24 07:25
ssh
服务器
linux
春招面试高频题目总结
面试问题
redis可以用于进程间通信吗?Why?How?--->延展一下有哪些进程间通信技术,优劣如何?有大量的插入sql语句,一条条的插入性能很差,如何通过事务进行优化?保证线程安全的策略有哪些?
小杰312
·
2024-03-22 03:19
面试笔试
面试
c++
职场和发展
学习
【笔记】HDFS基础笔记
启动
hadoop
命令(未配环境变量):进入
hadoop
安装目录输入.
哇咔咔哇咔
·
2024-03-20 04:12
Hadoop
hdfs
笔记
hadoop
大数据
ubuntu
【笔记】Linux常用命令
命令含义cd/home/
hadoop
#把/home/
hadoop
设置为当前目录cd..#返回上一级目录cd~#进入到当前Linux系统登录用户的主目录(或主文件夹)。
哇咔咔哇咔
·
2024-03-20 03:11
Linux
笔记
linux
运维
ubuntu
linux安装单机版spark3.5.0
一、spark介绍是一种通用的大数据计算框架,正如传统大数据技术
Hadoop
的MapReduce、Hive引擎,以及Storm流式实时计算引擎等.Spark主要用于大数据的计算二、spark下载spark3.5.0
爱上雪茄
·
2024-03-17 18:57
大数据
JAVA知识
spark
大数据
分布式
Hadoop
简介
简介大数据简介概述大数据的说法从出现到现在,也经历了十多年时间的发展。而在这十几年的发展过程中,非常多的机构、组织都试图对大数据做出过定义,例如:研究机构Gartner给出了这样的定义:"大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。再例如根据维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
程序员小郭同学
·
2024-03-16 07:10
hadoop
Hive中的NVL函数与COALESCE函数
ReturnsdefaultvalueifvalueisnullelsereturnsvalueExample:>SELECTnvl(null,'bla')FROMsrcLIMIT1;blaFunctionclass:org.apache.
hadoop
.hive.ql.udf.generic.GenericUDFNv
独影月下酌酒
·
2024-03-15 13:13
Hadoop
大数据
hive
hadoop
数据仓库
hive库表占用空间大小的命令
hdfsdfs-du-h/user/hive/warehouse2、按占用空间大小降序排列hdfsdfs-du/user/hive/warehouse/ipms.db|sort-nr3、查某一个分区占用空间大小(单位G)
hadoop
fs-ls
刀鋒偏冷
·
2024-03-15 13:13
hive
hadoop
数据仓库
03hive数仓安装与基础使用
hiveHive概述Hive是基于
Hadoop
的一个数据仓库工具。
daydayup9527
·
2024-03-14 13:39
hadoop_hive
运维
hadoop
算法部署优化工程师面试题整理
原文来自【知乎-高性能计算方向
面试问题
总结】个人简介:一个全栈工程师的升级之路!个人专栏:C/C++面试整理CSDN主页发狂的小花人生秘诀:学习的本质就是极致重复!
发狂的小花
·
2024-03-12 15:03
C/C++面试宝典
算法
面试
性能优化
计算机视觉
HDFS
(一)HDFS简介及其基本概念 HDFS(
Hadoop
DistributedFileSystem)是
hadoop
生态系统的一个重要组成部分,是
hadoop
中的的存储组件,在整个
Hadoop
中的地位非同一般
weixin_51987187
·
2024-03-12 14:32
笔记
大数据
大数据开发(
Hadoop
面试真题-卷二)
大数据开发(
Hadoop
面试真题)1、在大规模数据处理过程中使用编写MapReduce程序存在什么缺点?如何解决这些问题?
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
C#面试经历分享(好好看,好好学)
二、C#
面试问题
部分总结(我还记得的):1、int类型占多少字节?(面试的时候没说出来)4个字节。2、ActionResult有哪些类型?
黄瓜炒鸡蛋emm
·
2024-03-11 14:14
面试
C#
c#
面试
zookeeper 使用
zookeeper介绍zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的
Hadoop
项目中的一个子项目,并且根据google发表的论文来实现的,接下来我们首先来安装使用下这个软件,然后再来探索下其中比较重要一致性算法
SkTj
·
2024-03-10 02:15
Hive SQL 开发指南(三)优化及常见异常
在大数据领域,HiveSQL是一种常用的查询语言,用于在
Hadoop
上进行数据分析和处理。为了确保代码的可读性、维护性和性能,制定一套规范化的HiveSQL开发规范至关重要。
大数据_苡~
·
2024-03-09 14:13
003-数据开发
hive
Hive优化
数据倾斜
Hive常见异常
hive
join
大数据开发(
Hadoop
面试真题-卷九)
大数据开发(
Hadoop
面试真题)1、Hivecount(distinct)有几个reduce,海量数据会有什么问题?
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
大数据开源框架技术汇总
目录系统平台(
Hadoop
、CDH、HDP)监控管理(CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle)文件系统(HDFS、GPFS、Ceph、Gluster
浪尖聊大数据-浪尖
·
2024-03-08 20:48
数据仓库
hive
flume
分布式
scipy
makefile
crm
lighttpd
redis常见
面试问题
合集
什么是Redis?Redis是一个开源的、基于内存的数据结构存储系统,它可以用作数据库、缓存和消息队列。Redis支持多种数据类型,包括字符串、列表、集合、有序集合和哈希表。Redis支持的数据类型有哪些?Redis支持五种主要的数据类型:字符串(String)、列表(List)、集合(Set)、有序集合(SortedSet)和哈希表(Hash)。Redis的使用场景有哪些?Redis的使用场景非
V火居道士V
·
2024-03-04 01:20
Redis
redis
面试
数据库
【
Hadoop
】在spark读取clickhouse中数据
读取clickhouse数据库数据importscala.collection.mutable.ArrayBufferimportjava.util.Propertiesimportorg.apache.spark.sql.SaveModeimportorg.apache.spark.sql.SparkSessiondefgetCKJdbcProperties(batchSize:String="
方大刚233
·
2024-03-03 06:54
Hadoop
Scala
hadoop
spark
clickhouse
【
Hadoop
】使用Metorikku框架读取hive数据统计分析写入mysql
一、定义作业文件作业文件该文件将包括输入源、输出目标和要执行的配置文件的位置,具体内容如下metrics:-/user/xrx/qdb.yaml#此位置为hdfs文件系统目录inputs:output:jdbc:connectionUrl:"jdbc:mysql://233.233.233.233:3306/sjjc"user:"root"password:"123456"driver:"com.
方大刚233
·
2024-03-03 06:23
Hadoop
Scala
hadoop
hive
mysql
Spark-sql Adaptive Execution动态调整分区数量,调整输出文件数
看看这个参数如何运用:我们的spark-sql版本:[
hadoop
@666~]$spark-sql--versionWelcometo______/__
不想起的昵称
·
2024-03-02 15:03
hive
spark
hive
数据仓库
hadoop
里需要的lib
hadoop
.so版本不一致导致问题及解决办法
$
HADOOP
_HOME/lib/native/Linux-amd64-64(64位操作系统)$
HADOOP
_HOME/lib/native/Linux-i386-32(32位操作系统)文件夹中的lib
hadoop
.so
weixin_34304013
·
2024-03-02 09:23
大数据
操作系统
嵌入式
hadoop
启动报错处理
1.
hadoop
启动报错1.1.问题1util.NativeCodeLoader:Unabletoloadnative-
hadoop
libraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
akuibpt23191
·
2024-03-02 08:51
大数据
操作系统
Spring Boot基础
面试问题
(一)
上篇文章中10个SpringBoot
面试问题
的标准答案:什么是SpringBoot?它与Spring框架有什么区别?
Zm6Cc
·
2024-03-02 02:13
Java面试背诵
spring
boot
面试
后端
Spark整合hive(保姆级教程)
准备工作:1、需要安装配置好hive,如果不会安装可以跳转到Linux下编写脚本自动安装hive2、需要安装配置好spark,如果不会安装可以跳转到Spark安装与配置(单机版)3、需要安装配置好
Hadoop
万家林
·
2024-02-29 09:47
spark
hive
spark
hadoop
Hadoop
-Yarn-NodeManager是如何监控容器的
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在我的博客中的ContainerLaunchprepareForLaunch
隔着天花板看星星
·
2024-02-28 06:15
hadoop
大数据
yarn
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他