E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop学习总结
大数据开发之机器
学习总结
(一)
大数据开发之机器
学习总结
1.背景在大数据开发中,数据分析目的一般分为2大类,一个是基于已有数据,提炼出想要的数据汇总信息。一个是基于已有数据使用算法训练出模型,基于模型预测和分析未来的新数据。
闻香识代码
·
2024-02-05 21:41
大数据
机器学习
用户画像
机器学习
大数据
算法
大数据之 ZooKeeper原理及其在
Hadoop
和HBase中的应用
链接:https://blog.csdn.net/zhang123456456/article/details/78008626ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。简介ZooKeep
yangfhit
·
2024-02-05 20:29
宇宙公民高效阅读蜕变营第13期
学习总结
第三天-芒果M分享
我们在学生时期没学过的知识或者技能,在社会这所终身制大学都会补上。学习一个新的知识,首先我们要学会溯源➕定义➕分类。今日课题:掌握思维导图思维导图是什么?思维导图的应用。如何绘制思维导图?一、思维导图是什么溯源:第一揭开思维导图的神秘面纱。思维导图是由世界著名的英国学者东尼•博赞发明。思维导图,又叫心智图。是把我们大脑中的想法用彩色的笔画在纸上。他把传统的语言智能,数字智能和创造智能结合起来。是表
芒果SHC
·
2024-02-05 19:36
Hadoop
Start(1) ——Google与
Hadoop
的前世今生
参考文档:《
Hadoop
权威指南(第4版)》网址:http://
hadoop
.apache.org/[1]HDFS:
Hadoop
DistributionFileSystem
Hadoop
分布式文件系统[2
bclz
·
2024-02-05 18:41
如何对HDFS进行节点内(磁盘间)数据平衡
由于
Hadoop
2.x版本并不支持HDFS的磁盘间数据均衡,因此,会造成老数据磁盘占用率很高,新挂载的数据盘几乎很空。在这种情况下
格格巫 MMQ!!
·
2024-02-05 16:39
hadoop
hdfs
hdfs
hadoop
大数据
hadoop
调优-HDFS集群数据不均衡处理hdfs balancer
会造成datanode数据存储不均衡,一个datanode使用了70%,而有一个只使用了30%.解决:通过执行
hadoop
提供的balancer,来进行datanode之间数据balance。
不会吐丝的蜘蛛侠。
·
2024-02-05 16:08
Hadoop
hadoop
hdfs
big
data
HDFS BALANCER
介绍
Hadoop
的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。
风筝Lee
·
2024-02-05 16:07
hadoop
hdfs
balancer
Hadoop
-HDFS的DataNode介绍及原理
DataNodeDataNode工作机制1、一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2、DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。3、心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机
魔笛Love
·
2024-02-05 16:07
hadoop
大数据
绝对完美解决hdfs datanode数据和磁盘数据分布不均调整(hdfs balancer )——经验总结
Hadoop
集群Datanode数据倾斜,个别节点hdfs空间使用率达到95%以上,于是新增加了三个Datenode节点,由于任务还在跑,数据在不断增加中,这几个节点现有的200GB空间估计最多能撑20
ZhaoYingChao88
·
2024-02-05 16:05
Hadoop
hdfs
spark学习4:spark安装
1.下载spark安装包2.配置环境1.cd/bigdata/spark-3.0.1-bin-
hadoop
3.2/conf/2.4.添加动态库在
hadoop
-3.2.2/bin目录下添加
hadoop
.dll
hzp666
·
2024-02-05 14:58
spark
spark
大数据
计算机毕业设计
hadoop
+spark+hive小说数据分析可视化大屏 小说推荐系统 小说爬虫 小说大数据 机器学习 知识图谱 小说网站 大数据毕业设计
流程1.爬取17k的小说数据约5-10万,存入mysql数据库;2.使用mapreduce对mysql中的小说数据集进行数据清洗,转为.csv文件上传至hdfs文件系统;3.根据.csv文件结构,使用hive建库建表;4.一半分析指标使用hive_sql完成,一半分析指标使用Spark-Scala完成;5.将分析结果使用sqoop导入mysql数据库;6.使用Flask+echarts构建可视化大
计算机毕业设计大神
·
2024-02-05 14:48
6.Linux虚拟机下的
Hadoop
集群搭建之完全分布式配置
Hadoop
及相关组件搭建指导WeChat:h19396218469
hadoop
-3.1.3jdk-8u162-linux-x64本案例软件包:链接:https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w
学习BigData
·
2024-02-05 13:01
关于Hadoop的学习笔记
hadoop
分布式
linux
Exception in thread “main“ java.lang.NoSuchMethodError: com.google.comon.base.Preconditions.checkArg
hadoop
-3.1.3hbase-2.2.2-bin一、问题描述:在学习林子雨老师编写的《Spark编程基础》时使用如下命令运行jar包读取HBase时出现如下错误:Exceptioninthread
学习BigData
·
2024-02-05 13:01
关于Hadoop的学习笔记
java
hadoop
hive
Hadoop
一键启动脚本编写
一、问题描述针对
Hadoop
集群使用start-dfs.shstart-yarn.sh进程无法全部启动,但是使用单独启动命令可以启动的问题进行解决。
学习BigData
·
2024-02-05 13:01
关于Hadoop的学习笔记
linux
hadoop
4.Linux虚拟机下的
Hadoop
集群搭建之Xshell及Xftp的使用和SSH服务配置
Hadoop
及相关组件搭建指导WeChat:h19396218469本案例软件包:链接:https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w提取码:lkjh(若链接失效在下面评论
学习BigData
·
2024-02-05 13:31
关于Hadoop的学习笔记
linux
hadoop
ssh
6.0 MapReduce 服务使用教程
Hadoop
中包含了许多经典的MapReduce示例程序,其中就包
二当家的素材网
·
2024-02-05 13:29
Hadoop
教程
mapreduce
大数据
Hive中分区表与分桶表的操作
目录分区表一级分区表知识点示例多级分区知识点示例分区表的操作示例
hadoop
_hive文档分桶表重要参数基础分桶表知识点示例分桶表排序知识点示例分桶原理分区表和分桶表区别分区表分区表特点/好处:需要产生分区目录
Sisi525693
·
2024-02-05 10:26
hive
hadoop
数据仓库
[
Hadoop
]万字长文
Hadoop
相关优化和问题排查总结
namenode优化namenode内存生产配置NameNode心跳并发配置开启回收站配置datanode的优化hdfs调优
hadoop
的优化YARN的优化HDFS调优的基本原则HDFS调优的常用参数排查哪个任务的
王一1995
·
2024-02-05 10:55
hadoop
jvm
java
Hive drop 事务表 报错 flushing changes to datastore
-2802:13:01][08S01][1]Errorwhileprocessingstatement:FAILED:ExecutionError,returncode1fromorg.apache.
hadoop
.hive.ql.exec.DDLTask.MetaException
AdamShyly
·
2024-02-05 10:54
Hive
踩过的坑
hive
Hadoop
3.x单机安装教程
为什么要搭建单机环境的
Hadoop
?
文景大大
·
2024-02-05 10:06
转载:Html
学习总结
Html
学习总结
1.什么是html:HyperTextMarketlanguage,超文本标记语言,是用来描述网页语言,html使用标记标签来描述网页,html不是编程语言,是一种标记语言。
kmoon_b426
·
2024-02-05 10:38
袁瑞红漯河网络初级六期坚持分享第601天《生活》
就像新婚过后,恢复平淡的生活一样,在学习充电两天后的兴奋,随着上班下班的两点生活渐渐充淡了,但是生活依旧,我的学习之路没有停止一般,开始了我的
学习总结
之路。
袁瑞红
·
2024-02-05 09:14
大数据 - Spark系列《三》- 加载各种数据源创建RDD
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客目录3.1
王哪跑nn
·
2024-02-05 09:28
spark
大数据
spark
分布式
大数据原理-Spark
概述:基于内存计算三大分布式计算系统:
Hadoop
、Spark、Storm特点:采用有向无环图DAG作业调度运行速度快循环数据流容易使用:可以通过SparkShell交互式编程用途:SQL查询、流式计算
monster++
·
2024-02-05 09:28
大数据原理
分布式
编程语言
分布式计算
hadoop
spark
大数据 - Spark系列《四》- Spark分布式运行原理
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-05 08:54
spark
大数据
分布式
spark
Hadoop
执行WorldCount出现的问题和解决
failedonconnectionexception:java.net.ConnectException:Connectionrefused;Formoredetailssee:http://wiki.apache.org/
hadoop
SZHjy
·
2024-02-05 08:38
大数据
hadoop
大数据
2.0
Hadoop
运行环境
由于
Hadoop
是为集群设计的软件,所以我们在学习它的使用时难免会遇到在多台计算机上配置
Hadoop
的情况,这对于学习者来说会制造诸多障碍,主要有两个:昂贵的计算机集群。
二当家的素材网
·
2024-02-05 07:01
Hadoop
教程
hadoop
大数据
分布式
impala与kudu进行集成
文章目录概要Kudu与Impala整合配置Impala内部表Impala外部表Impalasql操作kuduImpalajdbc操作表如果使用了
Hadoop
使用了Kerberos认证,可使用如下方式进行连接
shandongwill
·
2024-02-05 07:44
大数据
impala
kudu
impala与kudu集成
1.0
Hadoop
教程
Hadoop
是一个开源的分布式计算和存储框架,由Apache基金会开发和维护。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
3.0
Hadoop
概念
本章着重介绍
Hadoop
中的概念和组成部分,属于理论章节。如果你比较着急可以跳过。但作者不建议跳过,因为它与后面的章节息息相关。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
基于
hadoop
+spark的大规模日志的一种处理方案
而且CDN上的访问日志一般都非常大,需要用大数据处理架构来进行处理,本文描述了一种利用
hadoop
+spark来处理大量CDN日志的方法,当然本方
码农心语
·
2024-02-05 06:36
日志处理
大规模
大数据
hadoop
spark
cdn
2019-01-27
《时间管理》线上课程
学习总结
随着年龄增长,思想上也逐步成熟,意识到时间的重要性,小时候总感觉有用不完的时间,但现在总感觉时间太少,根本不够用,一眨眼的功夫这一年就这样没了,年末回首,真心想不出这一年到底都干了什么
lijinmaria
·
2024-02-05 04:34
2.4
学习总结
2.41.不相交的线2.最⼤⼦序和3.判断⼦序列4.不同的子序列5.编辑距离6.零的数列ZeroSum7.迷宫与陷阱https://leetcode.cn/problems/uncrossed-lines/description/还是找最长公共子序列的问题classSolution{public:intmaxUncrossedLines(vector&nums1,vector&nums2){int
啊这泪目了
·
2024-02-05 04:49
学习
2.3
学习总结
2.31..买卖股票的最佳时机2..买卖股票的最佳时机II3.最长递增子序列4.最长连续递增的子序列5.最长重复子数组6.最长公共子序列https://leetcode.cn/problems/best-time-to-buy-and-sell-stock/description/定义:dp[i][0]表示第i天持有股票所得现⾦。dp[i][1]表示第i天不持有股票所得现⾦。所以dp[i][0]的
啊这泪目了
·
2024-02-05 04:18
学习
2.2
学习总结
2.21.⼀和零2.零钱兑换II3.组合总和Ⅳ4.零钱兑换5.完全平⽅数6.封印7.杨辉三角形8.卡牌9.最大子段和题1:https://leetcode.cn/problems/ones-and-zeroes/description/01背包问题,其中m,n分别是背包的容量,s字符串中的子串是物品的数量,字符串的个数相当于物品的价值,找最大的字符串个数定义:dp[i][j]最多有i个0和j个1的
啊这泪目了
·
2024-02-05 04:18
学习
实用的,富含人生哲理的,五年级上册语文课文
这篇作文,是他五年级上学期的语文
学习总结
。《外星人》在相声晚会上,我玩荧光棒的时候,手指不小心受伤、流血了,但奇怪的是那一刻我竟然
GOSP作者-明心
·
2024-02-05 03:57
经验分享
学习方法
学习
学习总结
影响二期业绩的关键因素1:情绪员工+店长鼓励打气,老员工分享,二期工作安排2:数据分析开盘复盘,邀约率,到场率,成单率3:二期业绩来源分析升级+定金+潜在+到访+拉访根据每个员工数据辅助分析后制定每日到访目标4:制定业绩目标团队目标+个人目标(结合时间情况跳一跳能完成)5:监督反馈游戏奖励和惩罚机制设定6:每日复盘笔记(会员档案)+(每人工作安排和次日计划+个人设计奖励惩罚机制)7:会员活动公开课
閞俪詳
·
2024-02-05 01:24
linux中如何输入控制字符
看以下实例:以下文本中的字段用^A分隔,[leo@
hadoop
orgplan]$sed"s/^A//g"orgplan一定要注意^并不是数字键6上的
发狂的蜗牛
·
2024-02-05 01:47
linux
运维
服务器
《做大自然的孩子》教学反思
这节课是对这一单元的一个总结,我是带着孩子们通过回顾活动手册来
学习总结
的,这节课首先是回顾了地球家园当中有什么,引出我们地球家园还有另外一个名字—大自然,再回顾土壤,太阳,月相等都与我们大自然息息相关。
程linyu
·
2024-02-05 00:11
六段有效演讲线上直播课
学习总结
1陈佳华
听了滕雪刚老师有关六段有效演讲在《产品介绍》中的应用1、先是对目前销售提出两个共性的问题:一是缺乏目的性,二是没有逻辑感,来引出主题2、通过主题,把六段有效演讲中PATSC模型,即明确演讲目的,确定演讲主题,分析演讲对象,构建演讲结构,设计演讲内容这五个要点和产品介绍进行了结合。3、对于产品介绍我通常分为两个方面来思考,一是产品介绍前的准备,二是产品介绍中的表达。4、产品介绍的前期准备阶段的注意点
迪信通陈佳华
·
2024-02-04 22:11
Flink1.18.0集成Yarn-session模式部署
上次部署了
Hadoop
集群
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager
china-zhz
·
2024-02-04 21:34
flink
yarn
hadoop
大数据
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、
Hadoop
部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件
china-zhz
·
2024-02-04 21:33
hdfs
mapreduce
hadoop
yarn
企业级大数据安全架构(九)FreeIPA管理员密码忘记后如何修改
作者:楼高1重置DirectoryServer管理员密码1.1停止directoryserver服务[root@ipaschema]#start-dirsrvHDP-
HADOOP
如果你不知道你的实例名,
云掣YUNCHE
·
2024-02-04 20:36
企业级大数据安全架构
大数据
安全架构
安全
Hadoop
集群搭建
搭建
Hadoop
集群涉及多个步骤,包括准备硬件环境、安装和配置
Hadoop
以及验证集群的安装。
终将老去的穷苦程序员
·
2024-02-04 19:53
hadoop
放大的概念和放大电路的主要性能指标
目录一、放大的概念二、放大电路的主要性能指标三、
学习总结
一、放大的概念放大是将输入信号的幅度或功率进行增强的过程。在电子学中,放大电路是一种用于增加信号幅度或功率的电路。
㉨㉨
·
2024-02-04 19:48
零基础学模拟电路
模电
双极型晶体管
目录一、双极型晶体管的基本结构二、双极型晶体管的工作原理三、双极型晶体管的特性曲线四、双极型晶体管的应用五、
学习总结
一、双极型晶体管的基本结构双极型晶体管(BipolarJunctionTransistor
㉨㉨
·
2024-02-04 19:18
零基础学模拟电路
模电
场效应管学习笔记
目录一、场效应管的基本原理二、场效应管的特性三、场效应管的应用四、
学习总结
一、场效应管的基本原理场效应管(Field-EffectTransistor,简称FET)是一种利用电场效应控制电流的半导体器件
㉨㉨
·
2024-02-04 19:45
零基础学模拟电路
模电
LinuxShell编程二之使用结构化命令
《Linux命令行与shell脚本编程大全》(第三版)第十二章
学习总结
第十二章:使用结构化命令本章内容使用if-then语句嵌套if语句test命令复合条件测试使用双方括号和双括号case命令12.1使用
数据萌新
·
2024-02-04 18:57
HDFS常用命令
hdfsdfs-putwc.input/user/anna/input查看上传的文件是否正确bin/hdfsdfs-cat/user/anna/input/wc.input运行mapreduce程序bin/
hadoop
jarshar
须臾之北
·
2024-02-04 18:41
Fink CDC数据同步(六)数据入湖Hudi
数据入湖HudiApacheHudi(简称:Hudi)使得您能在
hadoop
兼容的存储之上存储大量数据,同时它还提供两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。
大数据_苡~
·
2024-02-04 16:21
flink
hadoop
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他