E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark安装部署
基于JavaWeb+BS架构+SpringBoot+Vue+
Spark
的共享单车数据存储系统的设计和实现
基于JavaWeb+BS架构+SpringBoot+Vue+
Spark
的共享单车数据存储系统的设计和实现文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500
FREE技术
·
2024-01-10 16:56
计算机专业毕业设计
springboot
Spark
Spark
Core阶段练习
阶段练习查看数据集格式明确需求明确步骤读取文件抽取需要的列以年月为基础,进行reduceByKey统计Dongsi地区的PM排序获取结果编码拷贝数据集data.rar(已上传资源——
Spark
Core阶段练习数据集
我像影子一样
·
2024-01-10 16:44
Spark
大数据
spark
大数据
RDD算子——概念及部分操作
RDD的算子分类特点
Spark
中所有的Transformations是Lazy(惰性)的,它们不会立即执行获得结果,相反,它们只会记录在数据集上要应用的操作.只有当需要返回结果给Driver时,才会执行这些操作
我像影子一样
·
2024-01-10 15:06
Spark
大数据
spark
大数据
《Py
Spark
大数据分析实战》-26.数据可视化图表Seaborn介绍
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2024-01-10 14:58
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Spark
Core--加强
主要作用:提升
Spark
程序的计算效率注意事项:RDD的缓存可以存储在内存或者是磁盘上,甚至可以存储在Executor进程的堆外内存中。主要是放在内存中,因此缓存的数据是不太稳定可靠。
小希 fighting
·
2024-01-10 14:06
spark
大数据
分布式
Apache Doris (六十三):
Spark
Doris Connector - (3)-配置型及列映射关系
个人主页:IT贫道-CSDN博客私聊博主:私聊博主加WX好友,获取更多资料哦~博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频目录1.
Spark
操作Doris配置项
IT贫道
·
2024-01-10 14:35
大数据OLAP体系技术栈
Apache
Doris
apache
spark
大数据
doris
Spark
避坑系列一(基础知识)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模剖析及实践数据资产运营平台
Spark
作为大数据领域离线计算的王者,在分布式数据处理计算领域有着极高的处理效率
garagong
·
2024-01-10 14:04
大数据
spark
大数据
分布式
FineBI02:FineBI
安装部署
一、官网注册获取激活码https://www.fanruan.com/finebi百度网盘下载地址:链接:https://pan.baidu.com/s/1IC1htg-dAF-6Zm7zK-7Hyg?pwd=wuyc提取码:wuyc二、解压安装点击安装,一直下一步即可,最后在桌面上有快捷方式。三、运行1、输入激活码稍等一会。2、设置管理员账号密码3、数据库配置选择第一个就行,本地使用4、进行登录
做一个有趣的人Zz
·
2024-01-10 13:43
FineBI
数据分析
Flink集群
安装部署
(Standalone,Yarn模式)
目录一.环境准备二.Flink集群安装步骤三.FlinkOnYarn一.环境准备需要提前安装配置JDK,Hadoop二.Flink集群安装步骤1.下载安装包下载地址:Indexof/dist/flink(apache.org)根据自己所需选择版本,一个是scala版本为2.11,一个是scala版本为2.12,我下载的是flink-1.14.0-bin-scala_2.12.tgz2.解压安装包将
MJK祺
·
2024-01-10 12:03
大数据
hadoop
flink
开源C语言库Melon:数据恢复算法
关于Melon库,这是一个开源的C语言库,它具有:开箱即用、无第三方依赖、
安装部署
简单、中英文文档齐全等优势。
码哥比特
·
2024-01-10 12:56
c语言
算法
经验分享
程序人生
linux
单片机
学习
5.MapReduce之Combiner-预聚合
目录概述本地预计算Combiner意义实践前提代码日志观察结束概述在MR、
Spark
、Flink中,常用的减少网络传输的手段。
流月up
·
2024-01-10 12:49
大数据
mapreduce
大数据
Combiner
预聚合
4.MapReduce 序列化
序列化序列化对象-->字节序例:存储到磁盘或者网络传输MR、
Spark
、Flink:分布式的执行框架必然会涉及到网络传输ja
流月up
·
2024-01-10 12:46
大数据
mapreduce
大数据
序列化
实践
spark
sql写入mysql报错:Caused by: java.lang.IllegalArgumentException: Can‘t get JDBC type for void
一、问题描述
spark
sql写入mysql报错:Causedby:java.lang.IllegalArgumentException:Can’tgetJDBCtypeforvoidCausedby:java.lang.IllegalArgumentException
RayBreslin
·
2024-01-10 09:31
spark
sql
mysql
Failed to execute goal org.scala-tools:maven-scala-plugin:2.15.2:compile (scala-compile-first
一、问题描述
spark
项目编译,报错Failedtoexecutegoalorg.scala-tools:maven-scala-plugin:2.15.2:compile(scala-compile-first
RayBreslin
·
2024-01-10 09:00
scala
maven
开发语言
Spark
初级编程实践
什么是
Spark
?
Spark
是一个快速、通用、可扩展的大数据处理引擎,最初由加州大学伯克利分校的AMPLab开发。它提供了高级API,用于在大规模数据集上执行并行处理。
cwn_
·
2024-01-10 08:28
大数据
spark
大数据
分布式
深入理解 Flink(一)Flink 架构设计原理
大数据分布式计算引擎设计实现剖析MapReduceMapReduce执行引擎解析MapReduce的组件设计实现图
Spark
执行引擎解析
Spark
相比于RM的真正优势的地方在哪里:(Simple、Fast
我很ruo
·
2024-01-10 08:57
大数据
flink
大数据
分布式
Windows中处理Py
Spark
报错:
Spark
Exception: Python worker failed to connect back
Windows中处理Py
Spark
报错:
Spark
Exception:Pythonworkerfailedtoconnectback这个问题可能是发送在windows10以上的版本,使用datafram
就是喜欢看不惯你又干不掉你的样子
·
2024-01-10 08:55
spark
python
Apache Doris (六十二):
Spark
Doris Connector - (2)-使用
个人主页:IT贫道-CSDN博客私聊博主:私聊博主加WX好友,获取更多资料哦~博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频目录1.将编译jar包加入本地Maven仓库
IT贫道
·
2024-01-10 08:54
大数据OLAP体系技术栈
apache
spark
大数据
doris
2024 1.9
Spark
_SQL , 数据清洗API , 写出操作
目录一.DataFrame详解1.数据清洗API1.去重:2.去除空:3.填充替换:2.
Spark
SQL的shuffle分区设置3.
Spark
SQL数据写出操作3.1写出到文件系统3.2写出到数据库一.
白白的wj
·
2024-01-10 08:53
spark
大数据
分布式
hadoop
sql
etl工程师
2024.1.9
Spark
SQL day06 homework
目录一.
Spark
SQL中数据清洗的API有哪些,各自作用是什么?二.设置
Spark
SQL的shuffle分区数的方式有哪几种三.数据写出到数据库需要注意什么?
白白的wj
·
2024-01-10 08:53
spark
大数据
分布式
Spark
SQL基础知识
一.DataFrame详解1.清洗相关的API去重API:dropDuplicates总结:用来删除重复数据,如果没有指定参数subset,那么要比对行中的所有字段内容,如果全部相同,就认为是重复数据,会被删除;如果有指定参数subset,那么只比对subset中指定的字段范围,如果指定不存在的字段会报错.删除缺失值的API:dropna总结:1-如果不传递任何参数,只要有任意一个字段值为null
MSJ3917
·
2024-01-10 08:51
spark
大数据
分布式
记一次
spark
-sql数据倾斜解决方案
spark
-sql数据倾斜解决方案背景今天在做一张埋点事实表,需要关联几张维表,补充一些维度属性。
王糍粑的小夕
·
2024-01-10 08:20
spark
spark
sql
大数据
Spark
避坑系列二(
Spark
Core-RDD编程)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模Py
Spark
避坑系列第二篇,该篇章主要介绍
spark
的编程核心RDD
garagong
·
2024-01-10 08:19
大数据
spark
大数据
分布式
【
spark
】基于
Spark
的电影推荐系统+[详细代码及配置]
基于
Spark
的电影推荐系统项目架构组件版本及配置名称版本Hadoop2.8.5Hive2.1.0
Spark
1.6.3Kafka2.10_0.8.21MariaDB(Mysql)5.5.64Scala2.10.6Java1.8.0
BIG*BOSS
·
2024-01-10 06:25
Spark
spark
2024最新AI系统ChatGPT商业运营网站源码,支持Midjourney绘画AI绘画,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-10 06:12
人工智能
ChatGPT
AIGC
人工智能
chatgpt
语音识别
midjourney
AI作画
最新ChatGPT源码,AI绘画Midjourney绘画系统,GPT-4V识图理解+GPT语音对话+ChatFile文档对话总结+DALL-E3文生图+自定义知识库一站式解决方案
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-10 06:41
人工智能
AIGC
ChatGPT
人工智能
chatgpt
语音识别
midjourney
AI作画
gpt
Java大数据学习~Hadoop初识三Yarn模式
Hbase做自己的,
Spark
也是做自己的,等等。这样的话就会造成资源的浪费,不能充分的把资源给利用
胖琪的升级之路
·
2024-01-10 05:55
史上最详细的webrtc-streamer访问摄像机视频流教程
目录前言一、webrtc-streamer的API二、webrtc-streamer的启动命令介绍1.原文2.译文三、webrtc-streamer的
安装部署
1.下载地址https://github.com
吭哧瘪肚的万能工
·
2024-01-10 03:36
webrtc
linux
windows
github
java
Flink任务实战优化
一、Flink任务优化分析1.1参考
Spark
的优化方式对于任何的技术发展,后来的的技术架构都可以参考之前优秀竞品的设计思想或缺陷,然后
i7杨
·
2024-01-10 01:06
Flink
flink
大数据
大数据OLAP引擎发展原因及特性分析
在大数据高速发展时期,多个技术团队基于OLAP的应用需求,开发出多种OLAP技术,如Hive、
Spark
Sql、FlinkSql、Impala、Kylin、ClickHouse、Doris等,或者在实现其他应用需求的时候
i7杨
·
2024-01-10 01:31
大数据技术分析
大数据
笔记:分布式大数据技术原理(三)
Spark
Apache
Spark
是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm
WeeeicheN
·
2024-01-09 22:17
Big
Data
big
data
spark
大数据技术学习笔记之Hadoop框架基础1-Hadoop介绍及伪分布式部署
一、学习建议-》学习思想-》设计思想:分布式-》数据采集-》数据存储-》数据计算-》数据可视化-》学习阶段-》了解功能简单使用-》java、java变量-》
安装部署
配置环境-》开发-》熟练的使用,了解基本原理
黄剑锋1996
·
2024-01-09 22:16
如何在CentOS安装SQL Server数据库并通过内网穿透工具实现公网访问
sqlserver2.局域网测试连接3.安装cpolar内网穿透4.将sqlserver映射到公网5.公网远程连接6.固定连接公网地址7.使用固定公网地址连接前言简单几步实现在Linuxcentos环境下
安装部署
大海里的番茄
·
2024-01-09 21:08
centos
数据库
linux
Spark
源码分析(二): Driver 注册及启动
一,org.apache.
spark
.deploy.master.Master这个Master就是前面Client发送的对象,是一个ThreadSafeRpcEndpoint。内部的recei
stone_zhu
·
2024-01-09 21:30
黑猴子的家:
Spark
SQL RDD vs DataFrames vs DataSet
在
Spark
SQL中
Spark
为我们提供了两个新的抽象,分别是DataFrame和DataSet。他们和RDD有什么区别呢?
黑猴子的家
·
2024-01-09 18:28
酒店订房小程序源码系统:帮您打造类似美团的酒店模式的小程序 带完整的
安装部署
教程
小编给大家分享一款酒店订房小程序源码系统,旨在帮助您快速打造类似美团的酒店预订模式的小程序,并附带完整的
安装部署
教程。
源码集结地
·
2024-01-09 17:41
源码分享
小程序
酒店订房小程序源码
酒店订房小程序
酒店订房小程序源码系统
微信小程序
机器学习分布式架构
2.流计算(Storm,
Spark
,Flink)使用滑动窗口,在滑动窗口内的数据全部完成后再滑动到下一个时间窗口进行新一轮的数据处理,以分钟级别居多
小幸运Q
·
2024-01-09 17:27
redis 的安装
目录关系数据库与非关系型数据库关系型数据库非关系型数据库关系型数据库和非关系型数据库区别非关系型数据库产生背景总结Redis概述Redis具有以下几个优点使用场景哪些数据适合放入缓存中Redis为什么这么快Redis
安装部署
袁慕求玲
·
2024-01-09 17:20
redis
数据库
缓存
Oracle database oracle 12c 单节点
安装部署
oracle12c单节点部署环境情况linux环境:#cat/etc/redhat-releaseCentOSLinuxrelease7.9.2009(Core)oracle版本:12.2.0.1下载地址:Oracle12clinux-server下载器oracle安装目录:/oracledata/app/oracle/product/12.2.0/dbhome_1主机名与实例名:orcl服务器地
为什么不问问神奇的海螺呢丶
·
2024-01-09 17:47
Oracle
database
数据库
linux
oracle
Linux GitLab
安装部署
笔记
一、说明以下为官方文档的安装说明,详细的信息请访问gitlab官网二、开始安装1、先查看自己的CentosOS版本#这下面的两种方式都可以查看当前Linux的版本信息uname-alsb_release-a2、安装和配置必要的依赖在CentOS7,下面的命令将在系统防火墙打开HTTP和SSH访问。#安装所需命令sudoyuminstall-ycurlpolicycoreutils-pythonop
Wjhsmart
·
2024-01-09 16:55
Linux
Linux
Git
GitLab
Spark
---RDD(Key-Value类型转换算子)
文章目录1.RDDKey-Value类型1.1partitionBy1.2reduceByKey1.3groupByKeyreduceByKey和groupByKey的区别分区间和分区内1.4aggregateByKey获取相同key的value的平均值1.5foldByKey1.6combineByKey1.7sortByKey1.8join1.9leftOuterJoin1.10cogroup
肥大毛
·
2024-01-09 15:23
大数据
scala
spark
spark
python
大数据
xgb模型json转pmml
一背景:在实际项目中往往会有不同种类的模型,如xgb的训练完保存为json格式、pkl格式以及原始booster的.model格式,预测需要用到pmml可以在
spark
中借助大数据的能力的跑因此需要对模型的格式进行转换
zcc_0015
·
2024-01-09 15:31
json
机器学习
基于
spark
的Hive2Pg数据同步组件
一、背景Hive中的数据需要同步到pg供在线使用,通常sqoop具有数据同步的功能,但是sqoop具有一定的问题,比如对数据的切分碰到数据字段存在异常的情况下,数据字段的空值率高、数据字段重复太多,影响sqoop的分区策略,特别是hash分区,调用hash函数容易使得cpu高产生报警。同时sqoop的mapreduce任务对数据表的分割以及数据文件也会有一定的不均衡性。为了弥补这些问题,开发了基于
zcc_0015
·
2024-01-09 15:53
spark
大数据
分布式
常见技术选型
MQRocketMQ,RabbitMQ,Kafka,ActiveMQNoSQLRedis,Memcache分布式计算Blink,Storm,
Spark
DB关系型TiDB,MySQL,MongoDB,CassandraKVLevelDB
独处人
·
2024-01-09 14:46
Java接入Apache
Spark
(入门环境搭建、常见问题)
Java接入Apache
Spark
(环境搭建、常见问题)背景介绍Apache
Spark
是一个快速的,通用的集群计算系统。
许忆
·
2024-01-09 13:12
java
apache
spark
Hive基础知识(二):Hive
安装部署
教程
1.安装Hive1)把apache-hive-3.1.2-bin.tar.gz上传到linux的/opt/software目录下2)解压apache-hive-3.1.2-bin.tar.gz到/opt/module/目录下面[root@hadoop100~]$tar-zxvfapache-hive-3.1.2-bin.tar.gz-C/opt/module/#更改名字[root@hadoop10
依晴无旧
·
2024-01-09 13:25
大数据
hive
hadoop
数据仓库
Hive基础知识
2)其本质是将SQL语句转换为MapReduce/
Spark
程序进行运算,底层数据由HDFS分布式文件系统进行存储。3)可以理解Hive就是MapReduce/
Spark
Sql的客户端。
巷子里的猫X
·
2024-01-09 13:52
数据分析
hive
大数据
hadoop
Hadoop的数据仓库Hive的基础知识和
安装部署
1、数据仓库和Hive 数据仓库是为了协助分析报告,支持决策,为需要业务智能的企业提供业务流程的改进和指导,从而节省时间和成本,提高质量。它与数据库系统的区别是,数据库系统可以很好地解决事务处理,实现对数据的“增、删、改、查”操作,而数据仓库则是用来做查询分析的数据库,通常不会用来做单条数据的插入、修改和删除。 Hive主要应用于传统的数据仓库任务ETL(Extract‐Transformat
姠惢荇者
·
2024-01-09 13:21
大数据
大数据
数据仓库
Hive
数据导入
Spark
与Hive的集成与互操作
Apache
Spark
和ApacheHive是大数据领域中两个非常流行的工具,用于数据处理和分析。
Spark
提供了强大的分布式计算能力,而Hive是一个用于查询和管理大规模数据的数据仓库工具。
晓之以理的喵~~
·
2024-01-09 11:30
Spark
spark
hive
大数据
Spark
回归分析与特征工程
在大数据领域,Apache
Spark
为回归分析提供了强大的工具和库,以处理大规模数据集。本文将深入探讨如何使用
Spark
进行回归分析以及如何进行特征工程,以提高模型性能。
晓之以理的喵~~
·
2024-01-09 11:00
Spark
spark
回归
大数据
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他