E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop入门笔记
大数据原理-Spark
概述:基于内存计算三大分布式计算系统:
Hadoop
、Spark、Storm特点:采用有向无环图DAG作业调度运行速度快循环数据流容易使用:可以通过SparkShell交互式编程用途:SQL查询、流式计算
monster++
·
2024-02-05 09:28
大数据原理
分布式
编程语言
分布式计算
hadoop
spark
大数据 - Spark系列《四》- Spark分布式运行原理
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-05 08:54
spark
大数据
分布式
spark
Hadoop
执行WorldCount出现的问题和解决
failedonconnectionexception:java.net.ConnectException:Connectionrefused;Formoredetailssee:http://wiki.apache.org/
hadoop
SZHjy
·
2024-02-05 08:38
大数据
hadoop
大数据
2.0
Hadoop
运行环境
由于
Hadoop
是为集群设计的软件,所以我们在学习它的使用时难免会遇到在多台计算机上配置
Hadoop
的情况,这对于学习者来说会制造诸多障碍,主要有两个:昂贵的计算机集群。
二当家的素材网
·
2024-02-05 07:01
Hadoop
教程
hadoop
大数据
分布式
impala与kudu进行集成
文章目录概要Kudu与Impala整合配置Impala内部表Impala外部表Impalasql操作kuduImpalajdbc操作表如果使用了
Hadoop
使用了Kerberos认证,可使用如下方式进行连接
shandongwill
·
2024-02-05 07:44
大数据
impala
kudu
impala与kudu集成
1.0
Hadoop
教程
Hadoop
是一个开源的分布式计算和存储框架,由Apache基金会开发和维护。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
3.0
Hadoop
概念
本章着重介绍
Hadoop
中的概念和组成部分,属于理论章节。如果你比较着急可以跳过。但作者不建议跳过,因为它与后面的章节息息相关。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
基于
hadoop
+spark的大规模日志的一种处理方案
而且CDN上的访问日志一般都非常大,需要用大数据处理架构来进行处理,本文描述了一种利用
hadoop
+spark来处理大量CDN日志的方法,当然本方
码农心语
·
2024-02-05 06:36
日志处理
大规模
大数据
hadoop
spark
cdn
深度学习
入门笔记
(1)——什么是深度学习?
深度学习
入门笔记
(1)——什么是深度学习?
ZRX_GIS
·
2024-02-05 05:56
深度学习
深度学习
数据挖掘
机器学习
神经网络
pytorch
深度学习
入门笔记
(6)—— Logistic Regression
对比第三节中的Adaline和LogisticRegression,可以发现它们只有两点不同:1、激活函数,Adaline中的激活函数是恒等函数(线性),而LogisticRegression中的激活函数是Sigmoid函数(非线性);2、损失函数,Adaline中的损失函数是均方误差,而LogisticRegression中的损失函数则是交叉熵。Sigmoid函数如图所示,其值域为0到1,输入为
cnhwl
·
2024-02-05 05:55
深度学习入门笔记
深度学习
机器学习
逻辑回归
人工智能
python
深度学习
入门笔记
(三)常用AI术语
本节我们介绍一些深度学习领域常用的术语。训练确定模型中的参数的过程,我们就称为“训练”。Epoch遍历一遍训练数据就叫作“一个Epoch”。训练模型的时候,我们要告诉模型预计训练多少个Epoch,但这个值并不是固定的,因为并没有一个准确的Epoch数能一定能得到一个比较好的模型。我们有一个标准:模型训练的Epoch数必须要让模型达到一个收敛的状态。并且为了模型有更多的选择,我们可以让模型收敛后,再
zhanghui_cuc
·
2024-02-05 05:54
深度学习笔记
人工智能
深度学习
笔记
Redis
入门笔记
一:简介:基于内存的key-value的结构数据库1.基于内存存储,读写性能高2.适合存储热点数据(热点商品,资讯,新闻)3.企业应用广泛二:Redis与MySQL的对比:Redis和MySQL是两种不同类型的数据库,各有其适用的场景和优势。数据存储方式:Redis:Redis是一种基于内存的键值存储系统,数据存储在内存中,读写速度非常快。它支持多种数据结构,如字符串、哈希表、列表、集合、有序集合
我真卷不动啦。。。
·
2024-02-05 01:32
redis
数据库
linux中如何输入控制字符
看以下实例:以下文本中的字段用^A分隔,[leo@
hadoop
orgplan]$sed"s/^A//g"orgplan一定要注意^并不是数字键6上的
发狂的蜗牛
·
2024-02-05 01:47
linux
运维
服务器
Flink1.18.0集成Yarn-session模式部署
上次部署了
Hadoop
集群
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager
china-zhz
·
2024-02-04 21:34
flink
yarn
hadoop
大数据
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、
Hadoop
部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件
china-zhz
·
2024-02-04 21:33
hdfs
mapreduce
hadoop
yarn
企业级大数据安全架构(九)FreeIPA管理员密码忘记后如何修改
作者:楼高1重置DirectoryServer管理员密码1.1停止directoryserver服务[root@ipaschema]#start-dirsrvHDP-
HADOOP
如果你不知道你的实例名,
云掣YUNCHE
·
2024-02-04 20:36
企业级大数据安全架构
大数据
安全架构
安全
Hadoop
集群搭建
搭建
Hadoop
集群涉及多个步骤,包括准备硬件环境、安装和配置
Hadoop
以及验证集群的安装。
终将老去的穷苦程序员
·
2024-02-04 19:53
hadoop
HDFS常用命令
hdfsdfs-putwc.input/user/anna/input查看上传的文件是否正确bin/hdfsdfs-cat/user/anna/input/wc.input运行mapreduce程序bin/
hadoop
jarshar
须臾之北
·
2024-02-04 18:41
深度学习
入门笔记
4 深度神经网络
多层感知器在之前的课程中,我们了解到,感知器(指单层感知器)具有一定的局限——无法解决异或问题,即线性不可分的问题。将多个单层感知器进行组合,就可以得到一个多层感知器(MLP——Multi-LayerPerceptron)结构。多层感知器包含输入层,一个或多个隐藏层以及一个输出层。每层的神经元与下一层进行完全连接。如果网络中包含一个以上的隐层,则称其为深度人工神经网络。说明:通常我们说的神经网络的
深度学习从入门到放弃
·
2024-02-04 16:03
深度学习笔记
神经网络
深度学习
人工智能
机器学习
算法
深度学习
入门笔记
:第二章感知机
深度学习
入门笔记
:第二章感知机笔记来源书籍:《深度学习入门:基于+Python+的理论与实现》文章目录深度学习
入门笔记
:第二章感知机前言为什么学习感知机2.1感知机是什么2.2简单逻辑电路2.2.1与门
维持好习惯
·
2024-02-04 16:03
深度学习
深度学习
笔记
人工智能
深度学习
入门笔记
(二)神经元 激励函数 神经网络
声明:本文内容源自《白话深度学习与tensorflow》高扬卫峥编著一书读书笔记!!!神经网络:神经网络又称为人工神经网络(artificialneutralnetwork,ANN)。神经网络是一种人类由于受到生物神经细胞结构启发而研究出的一种算法体系神经元:如上图所示是一个最简单的神经元,有一个输入,一个输出。我们现在所使用的神经元通常有两个部分组成,一个是“线性模型”,另一个是“激励函数”。假
花落雨微扬
·
2024-02-04 16:32
神经网络
网络
深度学习
人工智能
机器学习
深度学习
入门笔记
(二)神经元的结构
神经网络的基本单元是神经元,本节我们介绍神经元的结构。2.1神经元一个神经元是由下面5部分组成的:输入:x1,x2,…,xk。权重:w1,w2,…,wk。权重的个数与神经元输入的个数相同。偏移项:可省略。激活函数:一般都会有,根据实际问题也是可以省略的。输出。2.2激活函数激活函数有很多种,不同的激活函数适用于不同的问题。二分类问题我们一般采用Sigmoid函数,多分类问题我们采用Softmax函
zhanghui_cuc
·
2024-02-04 16:30
深度学习笔记
深度学习
笔记
人工智能
Fink CDC数据同步(六)数据入湖Hudi
数据入湖HudiApacheHudi(简称:Hudi)使得您能在
hadoop
兼容的存储之上存储大量数据,同时它还提供两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。
大数据_苡~
·
2024-02-04 16:21
flink
hadoop
如何解决“
hadoop
:未找到命令”?
原因是未将
hadoop
命令添加至执行路径。
听风347
·
2024-02-04 15:17
eclipse
hadoop
大数据
做大数据需要学习哪些东西啊
Linux:因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解
hadoop
、hi
kuntoria
·
2024-02-04 14:02
大数据技术未来发展前景及趋势分析
Storm加速了流数据处理的过程,为
Hadoop
批处理提供实时数据处理。Spark:Spark是一个兼容
Hadoop
数据源的内存数据处理平台,运行速度相比于
Hadoop
MapReduce更快。
丨程序之道丨
·
2024-02-04 12:54
django基于
Hadoop
的小额信贷平台系统(程序+开题)
本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取系统程序文件列表开题报告内容研究背景:随着互联网技术的快速发展,小额信贷平台系统在金融领域得到了广泛应用。传统的小额信贷模式存在信息不对称、审批流程繁琐等问题,而小额信贷平台系统通过整合用户、银行和信贷公示等多方资源,实现了借款申请、撤销借款以及用户信用分等功能,为用户提供了更加便捷和高效的金融服务。意义:小额信贷平台系
liu10662
·
2024-02-04 12:36
django
python
后端
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki4
·
2024-02-04 11:08
Ranger-Yarn插件安装
登陆hdfs安装的用户,garrison/zdh1234(用户组
hadoop
),获取安装包解压安装scp/home/backup/ranger/ranger-0.6.0-yarn-plugin.tar.gz.tar–zxvfr
木木与呆呆
·
2024-02-04 10:22
Hadoop
详解
架构设计NameNodeNameNode:文件系统的命名空间(面试题)1.文件名称2.文件目录结构3.文件的属性(权限创建时间副本数)4.文件对应哪些数据块-->数据块对应哪些分布在哪些DN节点上列表不会持久化存储这个映射关系,是通过集群的启动和运行时,DataNode定期发送blockReport给NameNode,以此NameNode在【内存】中动态维护这种映射关系。作用:管理文件系统的命名空
ly稻草
·
2024-02-04 09:34
Hadoop
3.x基础(3)- Yarn
来源:B站尚硅谷目录Yarn资源调度器Yarn基础架构Yarn工作机制作业提交全过程Yarn调度器和调度算法先进先出调度器(FIFO)容量调度器(CapacityScheduler)公平调度器(FairScheduler)Yarn常用命令yarnapplication查看任务yarnlogs查看日志yarnapplicationattempt查看尝试运行的任务yarncontainer查看容器ya
魅美
·
2024-02-04 09:36
大数据基础
大数据
hadoop
转载-58同城离线计算平台设计与实践
58同城离线计算平台设计与实践编者荐语:58离线计算平台基于
Hadoop
生态体系打造,单集群4000+台服务器,数百PB存储,日40万计算任务,面临挑战极大。
无色的叶
·
2024-02-04 09:14
完结,从零开始学python(十八)想成为一名APP逆向工程师,需要掌握那些技术点?
我们来简单的回顾一下内容1.编程语法语法编程并发编程网络编程多线程/多进程/协程数据库编程MySQLRedisMongoDB2.机器学习3.全栈开发4.数据分析Numpy+pandas+Matplotlib
Hadoop
Spark5
爬完虫变成龙
·
2024-02-04 07:52
python
python开发
APP逆向
python
开发语言
python爬虫
python开发
java
APP逆向
NDK
服务容错Sentinel
入门笔记
服务容错Sentinel
入门笔记
相关连接简单概述准备工作依赖导入application.yml配置修改启动Sentinel登录Senetinel流量控制Demo:其他流控选项流控模式1.直接2.关联3.
qq_39040378
·
2024-02-04 07:19
java
分布式
Hive 主要内容一览
Hadoop
使用HDFS进行存储,使
大数据左右手
·
2024-02-04 07:13
Hive
大数据
面试
大数据
大数据本地环境搭建03-Spark搭建
需要提前部署好Zookeeper/
Hadoop
/Hive环境1Local模式1.1上传压缩包下载链接链接:https://pan.baidu.com/s/1rLq39ddxh7np7JKiuRAhDA?
OnePandas
·
2024-02-04 06:31
Spark
大数据集群环境搭建
大数据
spark
分布式
Hadoop
大数据实战系列文章之Hive
hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据可以将
测试帮日记
·
2024-02-04 05:45
spark运维问题记录
环境:spark-2.1.0-bin-
hadoop
2.71.Spark启动警告:neitherspark.yarn.jarsnotspark.yarn.archiveisset,fallingbacktouploadinglibrariesunderSPARK_HOME
lishengping_max
·
2024-02-04 05:11
Spark
spark
解决“Spark context stopped while waiting for backend“ issue
在配置为4C16G的虚拟机上安装
hadoop
生态全家桶,在安装Spark2,使用了社区版2.3的版本。
江畔独步
·
2024-02-04 05:10
Spark
bigdata
大数据组件部署下载链接
Hadoop
2.7下载连接:https://archive.apache.org/dist/
hadoop
/core/
hadoop
-2.7.6/Hive2.3.2下载连接:http://archive.apache.org
运维道上奔跑者
·
2024-02-04 05:13
大数据
zookeeper
hbase
kafka
hadoop
hive
【大数据开发运维解决方案】
Hadoop
+Hive+HBase+Kylin 伪分布式安装指南
Hadoop
2.7.6+Mysql5.7+Hive2.3.2+Hbase1.4.9+Kylin2.4单机伪分布式安装文档注意:######################################
运维道上奔跑者
·
2024-02-04 05:43
大数据
hadoop
分布式
Hadoop
2.7.6+Mysql5.7+Hive2.3.2+zookeeper3.4.6+kafka2.11+Hbase1.4.9+Sqoop1.4.7+Kylin2.4单机伪分布式安装及官方案例测
#################################################################最新消息:关于spark和Hudi的安装部署文档,本人已经写完,连接:
Hadoop
2.7.6
运维道上奔跑者
·
2024-02-04 05:43
分布式
hbase
zookeeper
hadoop
2021-07-02
Hadoop
集群构建配主机名vi/etc/sysconfig/networkNETWORKING=yesHOSTNAME=
hadoop
012.配置IP映射vi/etc/hosts127.0.0.1localhostlocalhost.localdomainlocalhost4localhost4
谢尔比比
·
2024-02-04 02:40
笔记
hadoop
、spark、flink集群修改默认ssh端口号
大数据集群在实际搭建过程中,其默认ssh端口不一定都是22,这时需要根据各自的配置文件进行适配。ssh端口号默认为22,以centos7.x为例,可以在/etc/ssh/sshd_config中进行修改,如下示例将22改为22222:#IfyouwanttochangetheportonaSELinuxsystem,youhavetotell#SELinuxaboutthischange.#sem
0X码上链
·
2024-02-03 21:12
大数据
分布式技术
ssh
hadoop
spark
flink
Zookeeper集群安装
简介ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
万总有点菜
·
2024-02-03 21:14
2019-10-08 大数据开发进阶之路
市场需要的水平熟练掌握Linux、SQL与HiveSQL掌握
Hadoop
生态主流技术,如HDFS/MapRedunce/Yarn/HBase/Flume等掌握Spark生态核心技术,如Spark架构/RDD
红瓦李
·
2024-02-03 20:39
Hadoop
框架下MapReduce中的map个数如何控制
一个job的map阶段并行度由客户端在提交job时决定客户端对map阶段并行度的规划基本逻辑为:一、将待处理的文件进行逻辑切片(根据处理数据文件的大小,划分多个split),然后每一个split分配一个maptask并行处理实例二、具体切片规划是由FileInputFormat实现类的getSplits()方法完成切分规则如下:1.简单地按照文件的内容长度进行切片2.切片大小默认是datanode
piziyang12138
·
2024-02-03 20:13
小白的spring
入门笔记
目录前情回顾基础(IOC(控制反转),DI(依赖注入))Spring框架概述什么是Springspring核心spring优点spring体系结构IOC入门,控制反转构建maven依赖目标类配置文件测试结果DI入门,依赖注入daoservice配置文件测试结果核心API装配Bean基于XML实例化方式Bean种类作用域生命周期属性依赖注入构造方法setter方法p命名空间【了解】SpEL【了解】集
程序员小赵OvO
·
2024-02-03 17:25
spring
java
mysql
aop
Hadoop
MapReduce 各阶段理解
Hadoop
的MapReduce是一个很经典的分布式并行计算框架,一直对各个阶段的具体含义有些模糊。花时间看了下stackoverflow上的理解,记录一下。
phusFuNs
·
2024-02-03 16:10
阿里云服务器2核16G、4核32G、8核64G配置最新收费标准及活动价格
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,
Hadoop
、Spark集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择,
阿里云最新优惠和活动汇总
·
2024-02-03 15:07
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他