E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop;Spark
nosql数据库技术与应用知识点
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(
Spark
、Flink
皆过客,揽星河
·
2024-09-16 08:42
NoSQL
nosql
数据库
大数据
数据分析
数据结构
非关系型数据库
浅谈MapReduce
从今天开始,本人将会开始对另一项技术的学习,就是当下炙手可热的
Hadoop
分布式就算技术。目前国内外的诸多公司因为业务发展的需要,都纷纷用了此平台。
Android路上的人
·
2024-09-16 04:40
Hadoop
分布式计算
mapreduce
分布式
框架
hadoop
Hadoop
Apache
Hadoop
是一个开源的分布式计算框架,主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。
傲雪凌霜,松柏长青
·
2024-09-16 00:16
后端
大数据
hadoop
大数据
分布式
Hadoop
架构
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代,数以万计用户的互联网服务时时刻刻都在产生大量的交互,要处理的数据量实在是太大了,以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现,在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合,
henan程序媛
·
2024-09-16 00:14
hadoop
大数据
分布式
分享一个基于python的电子书数据采集与可视化分析
hadoop
电子书数据分析与推荐系统
spark
大数据毕设项目(源码、调试、LW、开题、PPT)
作者:计算机源码社个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!学习资料、程序开发、技术解答、文档报告如需要源码,可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
计算机源码社
·
2024-09-15 20:02
Python项目
大数据
大数据
python
hadoop
计算机毕业设计选题
计算机毕业设计源码
数据分析
spark毕设
Spark
组件 GraphX、Streaming
Spark
组件GraphX、Streaming一、
Spark
GraphX1.1GraphX的主要概念1.2GraphX的核心操作1.3示例代码1.4GraphX的应用场景二、
Spark
Streaming2.1
Spark
Streaming
叶域
·
2024-09-15 14:54
大数据
spark
spark
大数据
分布式
hbase介绍
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用
hadoop
hdfs作为其文件存储系统,提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用
CrazyL-
·
2024-09-15 13:06
云计算+大数据
hbase
大数据毕业设计
hadoop
+
spark
+hive知识图谱租房数据分析可视化大屏 租房推荐系统 58同城租房爬虫 房源推荐系统 房价预测系统 计算机毕业设计 机器学习 深度学习 人工智能
做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。我先来介绍一下这些东西怎么用,文末抱走。(1)Python所有方向的学习路线(
2401_84572577
·
2024-09-15 10:20
程序员
大数据
hadoop
人工智能
Spark
集群的三种模式
文章目录1、
Spark
的由来1.1
Hadoop
的发展1.2MapReduce与
Spark
对比2、
Spark
内置模块3、
Spark
运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式
MelodyYN
·
2024-09-15 01:16
#
Spark
spark
hadoop
big
data
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线
申请到了校图书馆的考研专座,决定暂时放弃就业,先准备考研,买了数学和408的资料书3月9日-3月13日,因疫情原因,宿舍区暂封,这段时间在准备考研,发现内容特别多3月13日-3月19日,大部分时间在刷
Hadoop
「已注销」
·
2024-09-14 23:30
个人总结
hadoop
HBase介绍
HBase是GoogleBigtable的开源实现,它利用
Hadoop
HDFS作为其文件存储系统,利用
Hadoop
MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。
mingyu1016
·
2024-09-14 21:47
数据库
Java中的大数据处理框架对比分析
本文将重点介绍Apache
Hadoop
、Apache
Spark
、ApacheFlink和ApacheStorm这四种流行的
省赚客app开发者
·
2024-09-14 20:41
java
开发语言
写出渗透测试信息收集详细流程
一、扫描域名漏洞:域名漏洞扫描工具有AWVS、APPSCAN、Net
spark
、WebInspect、Nmap、Nessus、天镜、明鉴、WVSS、RSAS等。
卿酌南烛_b805
·
2024-09-14 16:08
Hadoop
windows intelij 跑 MR WordCount
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9
Hadoop
分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven
piziyang12138
·
2024-09-14 12:33
Spark
MLlib模型训练—推荐算法 ALS(Alternative Least Squares)
Spark
MLlib模型训练—推荐算法ALS(AlternativeLeastSquares)如果你平时爱刷抖音,或者热衷看电影,不知道有没有过这样的体验:这类影视App你用得越久,它就好像会读心术一样
不二人生
·
2024-09-14 08:25
Spark
ML
实战
spark-ml
推荐算法
算法
Hadoop
学习第三课(HDFS架构--读、写流程)
1010ml,瓶子的规格200ml=>需要6个瓶子装完块的大小规格,只要是需要存储,哪怕一点点,也是要占用一个块的块大小的参数:dfs.blocksize官方默认的大小为128M官网:https://
hadoop
.apache.org
小小程序员呀~
·
2024-09-14 03:53
数据库
hadoop
架构
big
data
hadoop
启动HDFS命令
启动命令:/
hadoop
/sbin/start-dfs.sh停止命令:/
hadoop
/sbin/stop-dfs.sh
m0_67401228
·
2024-09-14 03:49
java
搜索引擎
linux
后端
Python基础知识进阶之正则表达式_头歌python正则表达式进阶
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
前端陈萨龙
·
2024-09-13 13:50
程序员
python
学习
面试
【计算机毕设-大数据方向】基于
Hadoop
的电商交易数据分析可视化系统的设计与实现
博主介绍:✌全平台粉丝5W+,高级大厂开发程序员,博客之星、掘金/知乎/华为云/阿里云等平台优质作者。【源码获取】关注并且私信我【联系方式】最下边感兴趣的可以先收藏起来,同学门有不懂的毕设选题,项目以及论文编写等相关问题都可以和学长沟通,希望帮助更多同学解决问题前言随着电子商务行业的迅猛发展,电商平台积累了海量的数据资源,这些数据不仅包括用户的基本信息、购物记录,还包括用户的浏览行为、评价反馈等多
程序员-石头山
·
2024-09-13 13:19
大数据实战案例
大数据
hadoop
毕业设计
毕设
分布式离线计算—
Spark
—基础介绍
原文作者:饥渴的小苹果原文地址:【
Spark
】
Spark
基础教程目录
Spark
特点
Spark
相对于
Hadoop
的优势
Spark
生态系统
Spark
基本概念
Spark
结构设计
Spark
各种概念之间的关系Executor
测试开发abbey
·
2024-09-13 11:11
人工智能—大数据
spark
常用命令
查看报错日志:yarnlogsapplicationID
spark
2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$
SPARK
_HOME
我是浣熊的微笑
·
2024-09-13 10:38
spark
spark
启动命令
hadoop
启动:cd/root/toolssstart-dfs.sh,只需在
hadoop
01上启动stop-dfs.sh日志查看:cat/root/toolss/
hadoop
/logs/
hadoop
-root-datanode-
hadoop
03
学不会又听不懂
·
2024-09-13 10:36
spark
大数据
分布式
大数据领域的深度分析——AI是在帮助开发者还是取代他们?
1.大数据领域的AI工具现状在大数据领域,AI工具已经取得了显著进展,以下是几款主要的AI工具及其功能和实际应用:Apache
Spark
+MLlib:Apache
Spark
是一个开源的分布式计算系统,广泛用于
阳爱铭
·
2024-09-13 09:32
大数据与数据中台技术沉淀
大数据
人工智能
后端
数据库架构
数据库开发
etl工程师
chatgpt
大数据新视界 --大数据大厂之
Spark
性能优化秘籍:从配置到代码实践
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:Ja
青云交
·
2024-09-13 08:25
大数据新视界
Spark
性能优化
内存分配
并行度
存储级别
shuffle
减少
算法优化
代码实践
数据读取
广播变量
数据倾斜
Spark
数据库
编程常用命令总结
编程命令大全1.软件环境变量的配置JavaScala
Spark
Hadoop
Hive2.大数据软件常用命令
Spark
基本命令
Spark
-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令
Yellow0523
·
2024-09-13 02:42
Linux
BigData
大数据
Hadoop
常见面试题整理及解答
Hadoop
常见面试题整理及解答一、基础知识篇:1.把数据仓库从传统关系型数据库转到
hadoop
有什么优势?答:(1)关系型数据库成本高,且存储空间有限。
叶青舟
·
2024-09-12 19:24
Linux
hdfs
大数据
hadoop
linux
【面试系列】
Spark
高频面试题解答
欢迎来到我的博客,很高兴能够在这里和您见面!欢迎订阅相关专栏:⭐️全网最全IT互联网公司面试宝典:收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来:详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️大数据平台建设指南:全面讲解从数据采集到数据可视化的整个过程,掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python:初识、了解与热恋》:涵盖了Pytho
野老杂谈
·
2024-09-12 18:52
全网最全IT公司面试宝典
面试
spark
职场和发展
大数据
spark
常见面试题
文章目录1.
Spark
的运行流程?2.
Spark
中的RDD机制理解吗?3.RDD的宽窄依赖4.DAG中为什么要划分Stage?
爱敲代码的小黑
·
2024-09-12 18:51
spark
大数据
分布式
Spark
面试题
Spark
面试题1.
Spark
基础概念1.1解释
Spark
是什么以及它的主要特点
Spark
是什么?
golove666
·
2024-09-12 18:19
面试题大全
spark
大数据
分布式
面试
图计算:基于
Spark
GrpahX计算聚类系数
图计算:基于
Spark
GrpahX计算聚类系数文章目录图计算:基于
Spark
GrpahX计算聚类系数一、什么是聚类系数二、基于
Spark
GraphX的聚类系数代码实现总结一、什么是聚类系数聚类系数(ClusteringCoefficient
妙龄少女郭德纲
·
2024-09-12 18:16
Spark
图算法
Scala
聚类
数据挖掘
机器学习
2024年最全使用Python求解方程_python解方程(1),字节面试官迟到
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
2401_84569545
·
2024-09-12 02:33
程序员
python
学习
面试
Spark
运行时架构
目录一,
Spark
运行时架构二,YARN集群架构(一)YARN集群主要组件1、ResourceManager-资源管理器2、NodeManager-节点管理器3、Task-任务4、Container-容器
tooolik
·
2024-09-12 01:59
spark
架构
大数据
使用
Spark
Sql进行表的分析与统计
背景我们的数据挖掘平台对数据统计有比较迫切的需求,而
Spark
本身对数据统计已经做了一些工作,希望梳理一下
Spark
已经支持的数据统计功能,后期再进行扩展。
xingyuan8
·
2024-09-12 00:24
大数据
java
2025毕业设计指南:如何用
Hadoop
构建超市进货推荐系统?大数据分析助力精准采购
⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于
hadoop
的超市进货推荐系
计算机编程指导师
·
2024-09-11 18:08
Java实战集
Python实战集
大数据实战集
课程设计
hadoop
数据分析
spring
boot
java
进货
python
13.
Spark
Core-
Spark
中广播变量和累加器
一、前述
Spark
中因为算子中的真正逻辑是发送到Executor中去运行的,所以当Executor中需要引用外部变量时,需要使用广播变量。累机器相当于统筹大变量,常用于计数,统计。
__元昊__
·
2024-09-11 12:33
Hadoop
Common 之序列化机制小解
这不过此种序列化虽然跨病态兼容性强,但是因为存储过多的信息,但是传输效率比较低,所以
hadoop
弃用它。
猫君之上
·
2024-09-11 08:59
#
Apache
Hadoop
深入理解
hadoop
(一)----Common的实现----Configuration
一,
hadoop
的配置管理a,
hadoop
通过独有的Configuration处理配置信息Configurationconf=newConfiguration();conf.addResource("core-default.xml
maoxiao_jsd
·
2024-09-11 08:59
深入理解----hadoop
比较
Spark
与Flink
Apache
Spark
和ApacheFlink都是目前非常流行的大数据处理引擎,但它们在架构、处理模式、应用场景等方面有一些显著的区别。
傲雪凌霜,松柏长青
·
2024-09-11 04:29
大数据
后端
spark
flink
大数据
Spark
底层逻辑
Apache
Spark
的底层逻辑可以从其核心概念、组件和执行流程等方面来理解。
Spark
提供了一个分布式数据处理框架,其底层逻辑基于批处理架构,能够在大规模集群中高效地处理数据。
傲雪凌霜,松柏长青
·
2024-09-11 04:29
大数据
后端
spark
大数据
hadoop
0.22.0 部署笔记
hbase是部署在
hadoop
平台上的NOSql数据库,因此在部署hbase之前需要先部署
hadoop
。
weixin_33701564
·
2024-09-10 17:41
大数据
java
运维
Spark
- 升级版数据源JDBC2
在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,在
大猪大猪
·
2024-09-10 17:28
解决Windows环境下
hadoop
集群的运行_window运行
hadoop
,unknown
hadoop
01(4)
org.apache.
hadoop
hadoop
-com
2401_84160087
·
2024-09-10 16:34
大数据
面试
学习
解决Windows环境下
hadoop
集群的运行_window运行
hadoop
,unknown
hadoop
01(3)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!xmlns:xsi="http://www.w3.or
2401_84160087
·
2024-09-10 16:04
大数据
面试
学习
Py
Spark
Py
Spark
的本质确实是Python的一个接口层,它允许你使用Python语言来编写Apache
Spark
应用程序。
静听山水
·
2024-09-10 13:44
Spark
spark
深入解析HDFS:定义、架构、原理、应用场景及常用命令
引言
Hadoop
分布式文件系统(HDFS,
Hadoop
DistributedFileSystem)是
Hadoop
框架的核心组件之一,它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。
CloudJourney
·
2024-09-10 12:39
hdfs
架构
hadoop
Hadoop
的搭建流程
文章目录一、配置IP二、配置主机名三、配置主机映射四、关闭防火墙五、配置免密六、安装jdk1、第一步:2、第二步:3、第三步:4、第四步:5、第五步:七、安装
hadoop
1、上传2、解压3、重命名4、开始配置环境变量
lzhlizihang
·
2024-09-10 07:06
hadoop
大数据
分布式
hive搭建 -----内嵌模式和本地模式
文章目录一、内嵌模式(使用较少)1、上传、解压、重命名2、配置环境变量3、配置conf下的hive-env.sh4、修改conf下的hive-site.xml5、启动
hadoop
集群6、给hdfs创建文件夹
lzhlizihang
·
2024-09-10 07:06
hive
hadoop
Hadoop
之mapreduce -- WrodCount案例以及各种概念
文章目录一、MapReduce的优缺点二、MapReduce案例--WordCount1、导包2、Mapper方法3、Partitioner方法(自定义分区器)4、reducer方法5、driver(main方法)6、Writable(手机流量统计案例的实体类)三、关于片和块1、什么是片,什么是块?2、mapreduce启动多少个MapTask任务?四、MapReduce的原理五、Shuffle过
lzhlizihang
·
2024-09-10 07:06
hadoop
mapreduce
大数据
IAAS: IT公司去IOE-Alibaba系统构架解读
从
Hadoop
到自主研发,技术解读阿里去IOE后的系统架构原地址:......................云计算阿里飞天摘要:从IOE时代,到
Hadoop
与飞天并行,再到飞天单集群5000节点的实现
wishchin
·
2024-09-10 04:18
心理学/职业
BigDataMini
Spark
PaaS
Ubuntu的ssh
sshsudoapt-getupdatesudoapt-getinstallopenssh-server检测ssh是否启动sudops-e|grepssh创建root用户sudopasswdroot配置本机无密码ssh登录cd/home/
spark
0ssh-keygen-trsa-P
请不要问我是谁
·
2024-09-10 03:29
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他