E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark安装部署
Hive3.1.3基础
参考B站尚硅谷目录什么是HiveHive架构原理Hive安装Hive安装地址Hive
安装部署
安装Hive启动并使用HiveMySQL安装安装MySQL配置MySQL配置Hive元数据存储到MySQL配置元数据到
魅美
·
2024-01-27 08:55
hive
大数据
2019年12月10日
今天在公司继续看
spark
教程,这么说来我已经快一个月没啥正事了(望向每日记录Excel文档),究竟说明公司药丸还是我药丸……反正先做好多手准备【今天明明温度不低办公室的三恒系统却还是开着高温,仿佛电费不要钱
真昼之月
·
2024-01-27 08:49
Spark
-RDD持久化
(1)persist算子使用方法:varrdd=sc.textFile("test")rdd=rdd.persist(StorageLevel.MEMORY_ONLY)valcount=rdd.count()//或者其他操作StorageLevel说明:StorageLevel的构造函数:classStorageLevelprivate(privatevar_useDisk:Boolean,#是否
printf200
·
2024-01-27 08:02
Spark
SQL中掌控sql语句的执行 - 了解你的查询计划
本文翻译自BeinchargeofQueryExcutionin
Spark
SQL背景自
spark
2.x的sql以及申明行DataFrameAPi以来,在
spark
查询数据越来越方便。
鸿乃江边鸟
·
2024-01-27 08:18
Hadoop与
Spark
横向比较【大数据扫盲】
大数据场景下的数据库有很多种,每种数据库根据其数据模型、查询语言、一致性模型和分布式架构等特性,都有其特定的使用场景。以下是一些常见的大数据数据库:1.**NoSQL数据库**:这类数据库通常用于处理大规模、非结构化的数据。它们通常提供简单的查询语言,并强调水平扩展和高可用性。例如:-**键值存储**:如Redis,AmazonDynamoDB-**列式存储**:如ApacheCassandra,
super_journey
·
2024-01-27 07:51
大数据
hadoop
spark
2020-09-26 数据库知识点
MySQLMaridb数据库:存储数据分类用户信息--用户信息库商品信息---商品交易信息---支付业务数据表:数据表信息数据字段:存储具体内容信息,存储信息规范数据行:真实每一条合法的数据信息2.数据库服务环境
安装部署
Double_G9
·
2024-01-27 07:15
使用
spark
mllib训练中文文本分类器的
importorg.apache.
spark
.mllib.classification.NaiveBayesimportorg.apache.
spark
.mllib.feature.HashingTFimportorg.apache.
spark
.mllib.linalg.Vectorsimportorg.apache.
spark
.sql.functions
DreamNotOver
·
2024-01-27 07:45
spark-ml
中文分类
使用
Spark
MLlib 使用 jieba 分词训练中文分类器
importorg.apache.
spark
.ml.classification.NaiveBayesimportorg.apache.
spark
.ml.feature.HashingTFimportorg.apache.
spark
.sql.functions
DreamNotOver
·
2024-01-27 07:45
spark-ml
中文分类
集群
Spark
Thrift Server 架构和原理介绍
也可以看我CSDN的博客:https://blog.csdn.net/u013332124/article/details/90339850一、
Spark
ThriftServer介绍
Spark
ThriftServer
疯狂的哈丘
·
2024-01-27 04:17
ARM全国产云平台部署容器实战
目录第一节基于国产CPU的服务器2第二节国产云平台61、安装云平台91.1启动ARM服务器,从U盘启动91.2ARM服务器BIOS基本设置10第三节基于ZStack云主机构建K8S集群181、准备工作202、
安装部署
bjczhl
·
2024-01-27 04:08
科技
实时分析海量新数据的难点 和解决方案
解决方案:使用分布式计算和存储技术,如Hadoop、
Spark
、Kafka等,将数据分散存储在多个节点上,同时进行分布式计算和处理,以实现数据的实时处理和分析。2.数据质量的保障:海量新
云台095
·
2024-01-27 03:40
大数据的应用
大数据
idea上搭建py
spark
开发环境
1环境版本说明python版本:Anaconda3.6.5
spark
版本:
spark
-2.4.8-bin-hadoop2.7idea版本:2019.32环境变量配置2.1python环境变量配置将python.exe
jackyan163
·
2024-01-27 00:06
Zookeeper3.5.7基础学习
文章目录一、Zookeeper入门1、概述2、特点3、数据结构4、应用场景二、Zookeeper
安装部署
1、本地模式安装1.1基础操作1.2配置参数解读2、集群部署2.1集群安装2.2选举机制(面试重点
魅Lemon
·
2024-01-27 00:32
大数据
zookeeper
Flume1.9基础学习
文章目录一、Flume入门概述1、概述2、Flume基础架构2.1Agent2.2Source2.3Sink2.4Channel2.5Event3、Flume
安装部署
3.1安装地址3.2
安装部署
二、Flume
魅Lemon
·
2024-01-27 00:01
大数据
flume
opengauss-高斯数据库的
安装部署
及MySQL数据迁移实战.
目录介绍下载安装包安装1.设置SEMMNI2.新建用户和用户组3.下载安装包解压4.安装数据库5.修改配置6.重启服务数据库使用gsql命令和常用sql1.使用omm用户连接数据库-本地登陆无需输入密码:2.查看用户信息3.删除数据库4.创建用户5.创建数据库B模式即MySQL模式(一定要设置成B)6.切换到数据库7.创建SCHEMA,需切换到指定的数据库执行8.退出gsql参考介绍opengau
一只打酱油De篴
·
2024-01-26 23:57
数据库
gaussdb
mysql
kubernetes版本升级
kubernetes版本升级我当前的kubernetes环境是基于二进制
安装部署
的主机IPservices192.168.21.120apiservice,etcd,kubectl,kube-controller-manager
捞一碗月光-zq
·
2024-01-26 23:44
kubernetes
容器
云原生
QT5.14.2开发的Mysql8.0系统
安装部署
过程
最近在Windows1164位系统下使用QT5.14.2开发了套系统、使用了MYSQL8.0数据库,项目使用mingw-64编译器进行编译,编译完成后使用windeployqt进行发布,并制作安装包,拷贝到工控机Windows1064位系统上进行安装运行。本文记录下安装包制作和工控机部署中的过程如下。1、MySQL8.0的下载安装:下载地址:MySQL::DownloadMySQLInstalle
疾风铸境
·
2024-01-26 20:40
qt
开发语言
mysql
安装包
工控机
Spark
2.3.4 StandAlone 集群模式部署
Spark
2.3.4StandAlone集群模式部署相关文档依赖服务系统优化创建路径配置/etc/profile配置$
SPARK
_HOME/conf/
spark
-env.sh配置$
SPARK
_HOME/
JP.Hu
·
2024-01-26 19:07
Spark
spark
大数据
分布式
Flink 基础入门
前言
Spark
Streaming准确来说算是一个微批处理伪实时的做法,可是Flink是真的来一条就会处理一条,而且在
Spark
Streaming和Kafka进行整合时我们需要手动去管理偏移量的问题,而在
IT领域君
·
2024-01-26 19:28
第二课 Flink
安装部署
、环境配置及运行应用程序(2)
上接第二课Flink
安装部署
、环境配置及运行应用程序(1)视频地址【ApacheFlink入门教程】3.Flink
安装部署
、环境配置及运行应用程序_哔哩哔哩_bilibiliApacheFlinkChina
起名-困难户
·
2024-01-26 18:26
Flink
flink
大数据
SkyWalking8.5 logback日志收集
说明本文主要介绍在SkyWalking8.5下收集logback日志,关于SkyWalking8.5的
安装部署
本文不做介绍。
Liekkasz
·
2024-01-26 16:16
Spark
常见问题解决-日志和排查办法
Spark
日志与排查报错问题查看:https://blog.csdn.net/qq_33588730/article/details/109353336
Spark
常见问题1.org.apache.
spark
.
Spark
Exception
for your wish
·
2024-01-26 15:39
spark
大数据
分布式
Spark
3内核源码与优化
文章目录一、
Spark
内核原理1、
Spark
内核概述1.1简介1.2
Spark
核心组件1.3
Spark
通用运行流程概述2、
Spark
部署模式2.1YARNCluster模式(重点)2.2YARNClient
魅Lemon
·
2024-01-26 15:38
大数据
spark
Spark
3学习笔记
文章目录一、
Spark
基础1、
Spark
概述1.1
Spark
简介1.2
Spark
VSHadoop1.3
Spark
特点1.4
Spark
入门Demo2、
Spark
运行模式2.1概述2.2Local模式2.3Standalone
魅Lemon
·
2024-01-26 15:38
大数据
spark
py
spark
学习_dataframe常用操作_02
#回顾01常用操作frompy
spark
import
Spark
Session,DataFrame
spark
=
Spark
Session.builder.getOrCreate()peopleDF=
spark
.read.json
heiqizero
·
2024-01-26 15:07
spark
spark
NoSQL-lesson14-MongoDB核心技术-运维篇
------->oldguo第二章:
安装部署
1、系统准备(1)redhat或centos6.2以上系统(2)系统开发包完整(3)ip地址和hosts文件解析正常(4)i
学无止境_9b65
·
2024-01-26 14:47
梳理离线批次
spark
作业提交脚本
/bin/bash-x#
[email protected]
_NAME="
Spark
ALS"CDHUSER=adminCDHPASSWORD=adminCDHURL=http:/
赛尔木
·
2024-01-26 11:47
Apache
Spark
Apache
Spark
是一种快速、通用的大数据处理引擎,用于分布式数据处理和分析。它支持在大规模数据集上进行高性能计算,并且具有内置的分布式数据处理功能。
先------------------
·
2024-01-26 10:30
apache
spark
大数据
本地部署轻量级web开发框架Flask并实现无公网ip远程访问开发界面
文章目录1.
安装部署
Flask2.安装Cpolar内网穿透3.配置Flask的web界面公网访问地址4.公网远程访问Flask的web界面本篇文章主要讲解如何在本地安装Flask,以及如何将其web界面发布到公网进行远程访问
大海里的番茄
·
2024-01-26 10:22
前端
flask
tcp/ip
CentOS 7 部署 Redis
文章目录1、前言2、
安装部署
2.1、单机模式2.1.1、通过yum安装(不推荐,版本老旧)2.1.1、通过源码编译安装(推荐)2.2、主从模式2.3、哨兵模式2.4、集群模式2.5、其他命令2.6、其他操作系统
achi010
·
2024-01-26 09:13
database
java
Redis
安装部署
Redis
哨兵模式
Redis
集群模式
Redis
主从模式
Redis
部署
部署
Redis
CentOS
7部署Redis
“研学测”好帮手,三步带你安装体验TDH社区开发版
“三步”安装TDH社区开发版本文将为大家介绍如何在“三步”内快速完成TDH社区开发版在单台服务器中的
安装部署
,让大家更全面地了解到社区开发版更轻
星环科技
·
2024-01-26 07:10
人工智能
大数据
Kafka3学习笔记
文章目录一、Kafka概述和入门1、Kafka概述1.1定义1.2消息队列1.3Kafka基础架构2、Kafka快速入门2.1
安装部署
2.2集群启停脚本3、Kafka命令行操作3.1Topic命令行操作
魅Lemon
·
2024-01-26 06:03
大数据
kafka
深度干货|谈谈阿里云AnalyticDB
Spark
如何构建低成本数据湖分析
本文将分享AnalyticDBMySQL
Spark
助力构建低成本数据湖分析的最佳实践。
阿里云瑶池数据库
·
2024-01-26 06:57
阿里云
spark
云计算
Spark
OLAP高阶分析函数总结
我们经常困惑在数据挖掘和报表分析场景中sql不会写,或者因为sql太长以至于可读性降低;今天我为大家总结了一些
Spark
SQL中的高阶函数,它们将会对你的业务形成助力,百倍提升你的工作效率GROUPING
易企秀工程师
·
2024-01-26 06:47
Spark
学习笔记五:
Spark
资源调度和任务调度
一、Stage
Spark
任务会根据RDD之间的依赖关系,形成一个DAG有向无环图,DAG会提交给DAGScheduler,DAGScheduler会把DAG划分相互依赖的多个stage,划分stage的依据就是
开发者连小超
·
2024-01-26 04:42
py
spark
数据类型转换_apache
spark
-将py
spark
字符串转换为日期形式
apache
spark
-将py
spark
字符串转换为日期形式我有一个日期py
spark
数据框,其中的字符串列格式为df.select(to_date(df.STRING_COLUMN).alias('new_date
weixin_39860201
·
2024-01-26 04:39
pyspark
数据类型转换
Docker容器基础命令
Docker容器基础命令一、
安装部署
环境1.依赖环境2.镜像加速3.网络优化二、docker镜像操作镜像重命名和标签删除镜像导入导出镜像三、docker容器操作容器的创建查看所有运行的容器状态启动容器如果想创建并启动容器
?普天?
·
2024-01-26 03:12
容器
docker
Py
Spark
-DataFrame各种常用操作举例--转载
最近开始接触py
spark
,其中DataFrame的应用很重要也很简便。因此,这里记录一下自己的学习笔记。详细的应用可以参看py
spark
.sqlmodule。
zuoseve01
·
2024-01-26 02:10
pyspark
Py
Spark
SQL 入门(概述、DataFrame操作)
#博学谷IT学习技术支持#第一章快速入门1.1什么是
Spark
SQL
Spark
SQL是
Spark
的一个模块,用于处理海量结构化数据第一、针对结构化数据处理,属于
Spark
框架一个部分第二、抽象数据结构:
y鱼鱼
·
2024-01-26 02:10
大数据
大数据
spark
Py
spark
读 DataFrame 的使用与基本操作
一、安装基于mac操作系统安装jdkjdk下载地址安装py
spark
pipinstallpy
spark
二、读取HDFS文件读json注意,如果是多行的json,需要用“multiLine”模式,否则会报错
苏学算法
·
2024-01-26 02:10
spark
sql
hadoop
spark
sql
pyspark
spark
学习_rdd常用操作
【
spark
API函数讲解详细】https://www.iteblog.com/archives/1399#reduceByKey[重要API接口,全面】http://
spark
.apache.org/
weixin_30852367
·
2024-01-26 02:40
5g
python
scala
py
spark
学习_wordcount
#统计文件中每个字母出现次数#第一版rdd文件行类型:Aaron,OperatingSystem,100frompy
spark
import
Spark
Conf,
Spark
Contextconf=
Spark
Conf
heiqizero
·
2024-01-26 02:09
spark
spark
python
py
spark
学习_RDD转为DataFrame
#方法1:反射机制推断RDD模式people.txtTom12Jack13Janny14frompy
spark
.sqlimport
Spark
Session,Row
spark
=
Spark
Session.builder.getOrCreate
heiqizero
·
2024-01-26 02:09
spark
spark
python
py
spark
学习-RDD转换和动作
#RDD创建#1.parallelize方法:创建RDD,参数为list,返回RDDsc.parallelize(param:list)#demosc.parallelize(['tom','jack','black'])#2.textFile方法:读取文件,创建RDD,参数为hdfs文件地址或者本地文件地址,返回RDDsc.textFile(param:filepath)#demosc.text
heiqizero
·
2024-01-26 02:39
spark
spark
python
Py
Spark
—DataFrame笔记
本人博客园同篇文章:Py
Spark
—DataFrame笔记 DataFrame基础+示例,为了自查方便汇总了关于Py
Spark
-dataframe相关知识点,集合了很多篇博客和知乎内容,结合了自身实践
了无痕1314
·
2024-01-26 02:38
PySpark
spark
大数据
【
Spark
】py
spark
基于DataFrame使用MLlib包
另外,根据
Spark
文档,现在主要的
Spark
机器学习API是
spark
.ml包中基于DataFrame的一套模型。1ML包的介绍从顶层上看,ML包主要包含三大抽象类:转换器、预测器和工作流。
beautiful_huang
·
2024-01-26 02:37
Spark
spark
Py
Spark
常见操作
DataFrame创建1、RDD转换DataFrame首先创建一个rdd对象frompy
spark
.sqlimport
Spark
Sessioncolumns=["language","users_count
kang0709
·
2024-01-26 02:37
Spark
大数据
机器学习
py
spark
学习_dataframe常用操作_01
1.创建DataFrame本文使用DataFrame通过读取json文件获取数据,代码如下:frompy
spark
.sqlimport
Spark
Session
spark
=
Spark
Seesion.builder.getOrCreate
heiqizero
·
2024-01-26 02:37
spark
spark
python
使用CDH的api接口对cdh服务进行滚动重启
importtimeimportrequestsimportjsonimportsys#可操作的服务列表server_list=['hdfs','yarn','zookeeper','hbase','
spark
_on_yarn
Mumunu-
·
2024-01-26 01:32
大数据
python
Day 1322:架构师训练营学习总结(w13)
本周主要讲了
Spark
流计算、数据分析和机器学习。
Spark
的主要特点是DAG切分多阶段计算、内存存储中间结果、RDD的编程模型。RDD是
Spark
的核心概念。
kafkaliu
·
2024-01-25 22:18
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他