E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark安装部署
Hbase BulkLoad用法
要导入大量数据,Hbase的BulkLoad是必不可少的,在导入历史数据的时候,我们一般会选择使用BulkLoad方式,我们还可以借助
Spark
的计算能力将数据快速地导入。
kikiki2
·
2023-12-28 23:55
Ubuntu 20.04
安装部署
Yolo5 开发环境
目录1.安装显卡驱动2.安装Miniconda33.安装Pytorch(GPU版)4.配置Yolo5环境基于Ubuntu20.04安装Yolo5的开发环境。1.安装显卡驱动先安装显卡驱动。从NVDIA官网上下载最新的驱动,安装后进行下一步。驱动下载地址:NVIDIAGeForce驱动程序-N卡驱动|NVIDIA2.安装Miniconda32.1下载后进行安装。2.2安装之后,使用conda-V和p
背 锅 侠
·
2023-12-28 23:41
Cv2
YOLO
pytorch
tensorflow2
linux
2021年Wordpress手把手教你做个独立站——部署篇
2021年Woocommerce电商主题的
安装部署
教程Woocommerce是一个Wordpress的一个流行的电商插件。完成Wordpress的安装即已完成80%。
今何用
·
2023-12-28 22:48
ClickHouse 单机安装及基础知识与
Spark
应用
什么是ClickHouse?ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。在传统的行式数据库系统中,数据按如下顺序存储:处于同一行中的数据总是被物理的存储在一起。常见的行式数据库系统有:MySQL、Postgres等。在列式数据库系统中,数据按如下的顺序存储:这些示例只显示了数据的排列顺序。来自不同列的值被单独存储,来自同一列的数据被存储在一起。不同的数据存储
月亮给我抄代码
·
2023-12-28 18:36
clickhouse
spark
数据库
【大数据】Hudi HMS Catalog 完全使用指南
HudiHMSCatalog完全使用指南1.HudiHMSCatalog基本介绍2.在Flink中写入数据3.在FlinkSQL中查看数据4.在
Spark
中查看数据5.在Hive中查看数据1.HudiHMSCatalog
G皮T
·
2023-12-28 18:24
#
Hudi
大数据
hudi
数据湖
hive
flink
spark
metastore
mysql-archery
安装部署
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、部署Docker1.通过uname-r命令查看你当前的内核版本2确保yum包更新到最新3卸载旧版本4安装需要的软件包,yum-util提供yum-config-manager功能,另外两个是devicemapper驱动依赖的5设置yum源6、可以查看所有仓库中所有docker版本,并选择特定版本安装7安装docker8
与数据交流的路上
·
2023-12-28 18:13
Django
mysql
docker
mysql
spark
应用编写时5个最需要避免的错误
https://www.slideshare.net/cloudera/top-5-mistakes-to-avoid-when-writing-apache-
spark
-applications
Bitson
·
2023-12-28 18:24
【K8S 部署】基于kubeadm搭建Kurbernetes集群
目录一、基本架构二、环境准备:三、
安装部署
1、所有节点安装docker2、、所有节点安装kubeadm,kubelet和kubectl3、配置网络--flannel4、测试pod资源创建四、
安装部署
与k8s
koeda1(粉丝冲刺一个亿)
·
2023-12-28 18:49
Kurbernetes
kubernetes
容器
云原生
Actor模型与Akka Actor体系基础总结
前言最近用业余时间把Flink的RPC基础设施翻了个底朝天,又与之前分析过的
Spark
RPC机制做了一些对比,越发觉得Actor模型甚为精妙,值得简单记录一下,顺便也可作为日后解析FlinkRPC机制的基础入门
LittleMagic
·
2023-12-28 17:51
Dbeaver,Hudi,Hive,
Spark
,Presto应用问题及解决措施梳理
问题1:基于Dbeaver工具,新建的Hudi表无法进行更新(即表结构,新增字段等);解决措施:在Dbeaver中集成
spark
的包,通过
spark
SQL的方式进行Hudi表的新建,解决表无法更新问题。
p1i2n3g4
·
2023-12-28 17:31
大数据
hive
spark
hadoop
PingCAP 被评为 Translytical Data Platforms 2023 全球技术领导者
近日,PingCAP在全球化商业咨询公司QuadrantKnowledgeSolutions公布的
SPARK
MatrixforTranslyticalDataPlatforms中,被评为2023年全球TranslyticalDataPlatforms
TiDB_PingCAP
·
2023-12-28 16:40
tidb
TiDB
数据库
macOS hadoop+
spark
+scala安装教程
macOShadoop+
spark
+scala安装教程环境搭建操作系统:macOS10.13.6JDK:1.8.0_201hadoop:2.8.5
Spark
:2.4.3Scala:2.13.0一、文件准备
飞翔客栈
·
2023-12-28 15:43
Flink 在有赞实时计算的实践
在这个部分,主要是Flink与
Spark
的structuredstreaming的一些对比和选择Flink的原因。第三个就是比较重点的内容,Flink在有赞的实践。
有赞技术团队
·
2023-12-28 15:11
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2023-12-28 14:18
【linux系统
安装部署
私有化的GitLab】
环境准备劝退坑:服务器建议空余内存在3G以上,2G给gitlab安装,1G空余给服务器正常使用,亲测不够会导致服务器其他服务根本无法正常运行安装gitlab依赖yuminstall-ycurlpolicycoreutilsopenssh-serveropenssh-clients1将ssh设置为开机启动和启动ssh服务systemctlenablesshdsystemctlstartsshd12添
JAVA终结者
·
2023-12-28 14:41
gitlab
【HBase】——
安装部署
1规划&前提Zookeeper、HDFS正常部署规划如下2解压并重命名cd/opt/software/tar-zxvfhbase-2.4.11-bin.tar.gz-C/opt/module/cd/opt/modulemvhbase-2.4.11/hbase3修改配置文件3.1hbase-env.sh#!/usr/bin/envbash##/**#*LicensedtotheApacheSoftw
那时的样子_
·
2023-12-28 14:59
hbase
数据库
大数据
zabbix基本介绍
安装部署
页面访问
一、zabbix监控1、zabbix监控架构2、zabbix监控报警渠道zabbix-server-->企业QQ-->运维工程师zabbix-server-->企业微信-->运维工程师zabbix-server-->钉钉-->运维工程师zabbix-server-->邮箱-->运维工程师zabbix-server-->短信-->运维工程师zabbix-server-->电话-->运维工程师3、Za
我的麦子熟了。
·
2023-12-28 13:20
zabbix
运维
探究Presto SQL引擎(1)-巧用Antlr
从Hadoop生态的Hive,
Spark
,Presto,Kylin,Druid到非Hadoop生态的Clic
vivo互联网技术
·
2023-12-28 12:14
Hadoop安装笔记_单机/伪分布式配置_Hadoop3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
将下发的ds_db01.sql数据库文件放置mysql中12、编写Scala代码,使用
Spark
将MySQL的ds_db01库中表user_info的全量数据抽取到Hive的ods库中表user_info
Stitch .
·
2023-12-28 12:32
我的大学笔记
Hadoop
分布式
大数据
hadoop
笔记
hadoop hive
spark
flink 安装
下载地址Indexof/distubuntu安装hadoop集群准备IP地址主机名称192.168.1.21node1192.168.1.22node2192.168.1.23node3上传hadoop-3.3.5.tar.gz、jdk-8u391-linux-x64.tar.gzJDK环境node1、node2、node3三个节点解压tar-zxvfjdk-8u391-linux-x64.tar
nsa65223
·
2023-12-28 11:59
hadoop
hive
spark
【头歌实训】Py
Spark
Streaming 数据源
文章目录第1关:MySQL数据源任务描述相关知识Py
Spark
JDBC概述Py
Spark
JDBCPy
Spark
StreamingJDBC编程要求测试说明答案代码第2关:Kafka数据源任务描述相关知识Kafka
撕得失败的标签
·
2023-12-28 11:24
【头歌实训】
pyspark
streaming
Kafka
mysql
kafka
头歌实训
[
spark
] RDD, DataFrame和DataSet是什么?如何相互转化
文章目录是什么如何转化是什么在Apache
Spark
中,RDD(ResilientDistributedDataset)、DataFrame和Dataset是三个不同的数据抽象层,各自有不同的特点和用途
言之。
·
2023-12-28 11:53
spark
大数据
分布式
[
spark
] SaveMode
https://
spark
.apache.org/docs/latest/api/java/index.html?
言之。
·
2023-12-28 11:53
spark
大数据
分布式
Spark
从入门到精通23:
Spark
SQL简介
Spark
SQL是
Spark
专门用来处理结构化数据的一个模块,它提供了一个名为DataFrame的编程抽象,并且可以作为分布式SQL查询引擎来使用。本节就来介绍一下
Spark
SQL的相关知识。
金字塔下的小蜗牛
·
2023-12-28 09:20
RabbitMQ安装与介绍(LInux)(超详细)
前言RabbitMQ是一个开源的遵循AMQP协议实现的基于Erlang语言编写,即需要先
安装部署
Erlang环境再安装RabbitMQ环境。
JAVA贩卖机
·
2023-12-28 06:41
java-rabbitmq
rabbitmq
数据库
linux
最新AI系统ChatGPT网站H5系统源码,支持Midjourney绘画,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-28 05:05
人工智能
ChatGPT
AIGC
人工智能
chatgpt
AI作画
语音识别
midjourney
安装部署
ElasticSearch插件踩过的坑和解决方式,常见的ElasticSearch启动显示内存不足、服务器或虚拟机内核低、进程虚拟内存不足、文件权限不足等问题。
1、启动显示内存不足1.1、
安装部署
完成ElasticSearch后,执行启动命令内存不足报错如下图所示:报错异常,es默认配置的内存较大,而服务器内存较小导致。
qq_clw
·
2023-12-28 04:57
运维存储
linux运维
elasticsearch
jenkins
大数据
Nosql之Redis配置与优化
单线程memcached与Redis对比Redis
安装部署
部署步骤Redis命令工具redis-cli命令行工具(远程
BWL1998
·
2023-12-28 04:54
nosql
redis
数据库
day 30 综合架构备份章节
备份服务概念介绍2.rsync备份服务软件使用方法3.rsync备份服务配置文件/etc/rsyncd.conf04.rsync备份服务应用方式05.rsnyc备份服务排错过程01.学习方法---服务01.
安装部署
流云若雨
·
2023-12-28 03:23
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。##使用方法csv```
spark
.sql("select*fromcsv.
kikiki4
·
2023-12-28 03:49
Hadoop集成对象存储和HDFS磁盘文件存储
1.环境配置1.1版本说明组件版本是否必须其他事项Hadoop3.3.0+是hadoop3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用
spark
sql,使用hive
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
hdfs
大数据
阿里云
spark
开发笔记(三、
Spark
SQL笔记)
基本概念Shark、
Spark
SQL和Hive之间的关系:Shark借用了Hive大部分的组件,包括词法分析、语法分析和逻辑分析阶段,只是在最后将逻辑执行计划转化为物理执行计划这一步,将底层的实现从MapReduce
眼君
·
2023-12-27 22:27
【头歌实训】
Spark
MLlib ( Python 版 )
文章目录第1关:基本统计编程要求测试说明答案代码第2关:回归编程要求测试说明参考资料答案代码第3关:分类编程要求测试说明参考资料答案代码第4关:协同过滤编程要求测试说明参考资料答案代码第5关:聚类编程要求测试说明参考资料答案代码第6关:降维编程要求测试说明参考资料答案代码第7关:特征提取与转化编程要求测试说明答案代码第8关:频繁模式挖掘编程要求测试说明参考资料答案代码第9关:评估指标编程要求测试说
撕得失败的标签
·
2023-12-27 20:26
【头歌实训】
spark-ml
python
开发语言
头歌实训
【头歌实训】
Spark
完全分布式的安装和部署
文章目录第1关:Standalone分布式集群搭建任务描述相关知识课程视频
Spark
分布式安装模式示例集群信息配置免密登录准备
Spark
安装包配置环境变量修改
spark
-env.sh配置文件修改slaves
撕得失败的标签
·
2023-12-27 20:56
【头歌实训】
分布式
spark
大数据
头歌实训
【头歌实训】
Spark
完全分布式的安装和部署(新)
文章目录第1关:Standalone分布式集群搭建任务描述相关知识课程视频
Spark
分布式安装模式主机映射免密登录准备
Spark
安装包配置环境变量修改
spark
-env.sh配置文件修改slaves文件分发安装包启动
撕得失败的标签
·
2023-12-27 20:56
【头歌实训】
分布式
spark
wpf
头歌实训
【头歌实训】Py
Spark
Streaming 入门
文章目录第1关:
Spark
Streaming基础与套接字流任务描述相关知识
Spark
Streaming简介Python与
Spark
StreamingPython
Spark
StreamingAPI
Spark
Streaming
撕得失败的标签
·
2023-12-27 20:54
【头歌实训】
pyspark
streaming
头歌实训
【知乎大数据技术】用Flink取代
Spark
Streaming!知乎实时数仓架构演进
“数据智能”(DataIntelligence)有一个必须且基础的环节,就是数据仓库的建设,同时,数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲,数据的结果代表了用户的反馈,获取结果的及时性就显得尤为重要,快速的获取数据反馈能够帮助公司更快的做出决策,更好的进行产品迭代,实时数仓在这一过程中起到了不可替代的作用。本文主要讲述知乎的实时数仓实践以及架构的演进,这包
yoku酱
·
2023-12-27 19:34
Impala 基于hive的交互式实时分析工具(一) 概念及原理介绍
技术背景impala是参照谷歌的新三篇论文(caffeine-网络搜索引擎,pregel-图形数据库,dremel-瞬时类sql查询)当中的dremel而来,号称是当前大数据领域最快的sql查询工具,比
spark
sql
章云邰
·
2023-12-27 19:59
Spark
与Py
Spark
(1.概述、框架、模块)
目录1.
Spark
概念2.Hadoop和
Spark
的对比3.
Spark
特点3.1运行速度快3.2简单易用3.3通用性强3.4可以允许运行在很多地方4.
Spark
框架模块4.1
Spark
Core4.2
Spark
SQL4.3
Spark
Streaming4.4MLlib4.5GraphX5
还是那个同伟伟
·
2023-12-27 18:06
Spark
spark
大数据
分布式
python
什么是
Spark
开发?
1、核心开发:离线批处理/延迟性的交互式数据处理2、SQL查询:底层都是RDD和计算操作3、实时计算:底层都是RDD和计算操作
一个人一匹马
·
2023-12-27 17:54
Flink实时电商数仓之Doris框架(七)
主要实现的功能有:实时看板面向企业内部分析师和管理者的报表面向用户或者客户的高并发报表分析即席查询统一数仓构建:替换了原来由
Spark
,Hive,Kudu,Hbase等旧框架数据湖联邦查询:通过外表的方式联邦分析位于
十七✧ᐦ̤
·
2023-12-27 16:47
flink
大数据
doris
Spark
使用mariadb驱动读取AWS Aurora所有结果数据行都是列名
目录一、使用mariadb驱动读取AWSAurora二、df.show()的内容三、解决办法一、使用mariadb驱动读取AWSAuroraval
spark
=
Spark
Session.builder()
瞎胡侃
·
2023-12-27 15:28
大数据
spark
mariadb
aws
java.lang.IllegalArgumentException: requirement failed: No output operations registered, so nothi...
Spark
Streaming报错java.lang.IllegalArgumentException:requirementfailed:Nooutputoperationsregistered,sonothingtoexecute
扣篮的左手
·
2023-12-27 14:58
Spark
与Hadoop的关系和区别
在大数据领域,
Spark
和Hadoop是两个备受欢迎的分布式数据处理框架,它们在处理大规模数据时都具有重要作用。本文将深入探讨
Spark
与Hadoop之间的关系和区别,以帮助大家的功能和用途。
晓之以理的喵~~
·
2023-12-27 12:13
Spark
spark
hadoop
大数据
Spark
生产集群各种使用
1.环境配置1.1版本说明要求版本是否必须其他事项Hadoop3.3.4是hadoop3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用
spark
sql,使用hive更好的管理
tuoluzhe8521
·
2023-12-27 10:15
hive相关
spark
大数据
分布式
七牛云存储
Flink on K8S集群搭建及StreamPark平台安装
1.环境准备1.1介绍在使用Flink&
Spark
时发现从编程模型,启动配置到运维管理都有很多可以抽象共用的地方,目前streampark提供了一个flink一站式的流处理作业开发管理平台,从流处理作业开发到上线全生命周期都做了支持
tuoluzhe8521
·
2023-12-27 10:45
flink
flink
kubernetes
大数据
StreamPark
Harbor
docker部署elasticsearch:8.6.2, kibana,logstash 版本以及kibana的使用
elasticsearch服务2.3访问验证2.4建一个索引试试,此索引名为my-book,有六个字段2.5用GET命令获取索引信息试试,如下,符合预期2.6再试试批量导入一笔数据,从这个地址下载数据文件2.7docker
安装部署
HappyLearnerL
·
2023-12-27 08:08
elasticsearch
docker
java
删除azkaban的执行历史
azkaban通常用在大数据任务调度场景,把任务提交之后,如果任务是
spark
,hive,hadoop,flink等任务的话,
飞有飞言
·
2023-12-27 07:09
Spark
的生态系统概览:
Spark
SQL、
Spark
Streaming
Apache
Spark
是一个强大的分布式计算框架,用于大规模数据处理。
Spark
的生态系统包括多个组件,其中两个重要的组件是
Spark
SQL和
Spark
Streaming。
晓之以理的喵~~
·
2023-12-27 06:35
Spark
spark
sql
大数据
[
spark
] 存储到hdfs时指定分区
在
Spark
SQL中指定多个分区字段进行数据存储:类似hive分区存储文章目录代码示例代码importorg.apache.
spark
.sql.
Spark
Sessionval
spark
=
Spark
Session.builder
言之。
·
2023-12-27 06:33
spark
hdfs
大数据
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他