E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
SparkSQL学习
Spark
入门02-
Spark
开发环境配置(idea环境)
安装与配置
Spark
开发环境1.下载解压安装包https://archive.apache.org/dist/
spark
/
spark
-2.1.2/https://mirrors.tuna.tsinghua.edu.cn
chde2Wang
·
2024-01-30 07:41
spark
大数据
分布式
Hadoop与
Spark
横向比较【大数据扫盲】
大数据场景下的数据库有很多种,每种数据库根据其数据模型、查询语言、一致性模型和分布式架构等特性,都有其特定的使用场景。以下是一些常见的大数据数据库:NoSQL数据库:这类数据库通常用于处理大规模、非结构化的数据。它们通常提供简单的查询语言,并强调水平扩展和高可用性。例如:-键值存储:如Redis,AmazonDynamoDB-列式存储:如ApacheCassandra,HBase-文档数据库:如M
super_journey
·
2024-01-30 06:51
大数据
hadoop
spark
Apache
Spark
的基本概念和在大数据分析中的应用
Apache
Spark
是一个快速、通用、可扩展的大数据处理引擎。它提供了一个高级的编程接口,可以在分布式环境中对大规模数据进行处理和分析。
数据科学与艺术的贺公子
·
2024-01-30 06:17
spark
数据分析
大数据
my
sql学习
笔记(四):备份和主从复制
目录1备份1.1备份方式1.2备份数据库的内容1.3问题模拟一下环境,来更加了解备份过程2.主从复制1.1为什么需要主从复制?1.2MySQL主从复制概念1.3MySQL主从复制主要用途1.4MySQL主从形式1.5mysql延时备份1.6MySQL主从复制原理1.7MySQL主从复制的过程1.8MySQL主从复制模式1.9主从切换离线主从复制实验:在线主从复制组复制1.10MySQL的复制机制1
meikokoo
·
2024-01-30 06:16
mysql
mysql
数据库
学习
TCP Scoket数据流WordCount
安装nc:yuminstallncWordCountpackagecn.
spark
.streaming;importjava.util.Arrays;importjava.util.Iterator;importorg.apache.
spark
.
Spark
Conf
hipeer
·
2024-01-30 05:19
my
sql学习
打卡day17
今日成果:insertintoproducts(name,quantity_in_stock,unit_price)values('t1',10,1.1),('tom',20,1.23),('t2',11,12.2);--一次插入多条数据--字符串和日期需要加引号--PK代表主键记录的唯一标识--NN表示非空--AI表示自动增长感谢各位读者查阅,欢迎各位点赞✍评论⭐收藏+关注!
一次旅行
·
2024-01-30 04:01
mysql
学习
数据库
my
sql学习
打卡day18
今日成果:insertintoorders(customer_id,order_date,status)values(1,'2019-01-02',1);--插入一条新数据selectlast_insert_id();--获取新订单的idinsertintoorder_itemsvalues(last_insert_id(),1,1,2.96);--插入新订单的数据createtableinvoi
一次旅行
·
2024-01-30 04:01
mysql
学习
数据库
my
sql学习
打卡day10
今日成果:selectorder_id,o.product_id,o.quantity,o.unit_price,p.namefromorder_itemsojoinproductspono.product_id=p.product_id;--查询订单表里用户信息--两张表不相同的字段可以直接查找,相同的字段需要使用别名进行查找select*fromorder_itemsoijoinsql_inv
一次旅行
·
2024-01-30 04:31
数据库
my
sql学习
打卡day16
今日成果:selectc.customer_id,c.first_name,c.points,'Bronze'astypefromcustomerscwherec.points3000orderbyfirst_name;--union:用来合并多个表的查询结果,每个表的列数量需要保持一致否则会报错。感谢各位读者查阅,欢迎各位点赞✍评论⭐收藏+关注!
一次旅行
·
2024-01-30 04:31
数据库
sql
前端
my
sql学习
打卡day8
今日成果:select*fromcustomerslimit10;--查询10条顾客信息select*fromcustomerslimit6,3;--查询第7-9名顾客信息select*fromcustomersorderbypointsdesclimit3;--查询分数最多的前三名顾客--limit一定放到最后出现感谢各位读者查阅,欢迎各位点赞✍评论⭐收藏!
一次旅行
·
2024-01-30 04:30
mysql
学习
数据库
my
sql学习
打卡day4
今日成果:select*fromproductswherequantity_in_stockin(49,38,72);--in表示多个符合条件的结果集select*fromcustomerswherebirth_datebetween'1990-01-01'and'2000-01-01';--betwee-and表示在两者之间感谢各位读者查阅,欢迎各位点赞✍评论⭐收藏!
一次旅行
·
2024-01-30 04:00
mysql
学习
数据库
my
sql学习
打卡day5
今日成果:select*fromcustomerswhereaddresslike'%trail%'oraddresslike'%avenue%';--like包含特定条件的字符串--%表示任意字符--_表示单个字符select*fromcustomerswherefirst_nameregexp'elka|ambur';--查找elka或ambur的firstnameselect*fromcus
一次旅行
·
2024-01-30 04:00
学习
my
sql学习
打卡day19
今日成果:updateinvoicessetpayment_total=invoice_total*0.5,payment_date=due_datewhereinvoice_id=1;--更新单行记录updateorderssetcomments='金牌顾客'wherecustomer_idin(selectcustomer_idfromcustomerswherepoints>3000);--
一次旅行
·
2024-01-30 04:30
mysql
学习
数据库
My
SQL学习
笔记-多表查询
多表查询内连接1).隐式内连接SELECT字段列表FROM表1,表2WHERE条件...;案例:查询每一个员工的姓名,及关联的部门的名称(隐式内连接实现)表结构:emp,dept连接条件:emp.dept_id=dept.id--为每一张表起别名,简化SQL编写SELECTe.name,d.nameFROMempe,deptdWHEREe.dept_id=d.id;2).显式内连接SELECT字段
DevCodeMemo
·
2024-01-30 03:14
mysql
学习
笔记
大数据 -
Spark
系列《一》- 分区 partition数目设置详解
目录3.2.1分区过程3.2.2SplitSize计算和分区个数计算3.2.3Partition的数目设置1.对于数据读入阶段,输入文件被划分为多少个InputSplit就会需要多少初始task.2.对于转换算子产生的RDD的分区数3.repartition和coalesce操作会聚合成指定分区数。3.2.4groupBy不一定会Shuffle3.2.1分区过程每一个过程的任务数,对应一个Inpu
王哪跑nn
·
2024-01-29 23:59
spark
大数据
大数据
spark
分布式
Macbook M1 安装PDI(Kettle) 9.3
参考:https://indie
spark
.top/software/run-command-line-apple-silico
Pierre_
·
2024-01-29 23:32
#
Pipeline
Java
kettle
macos
java
My
sql学习
笔记第六章—存储引擎
存储引擎1.存储引擎一个完整的建表语句:#创建了一张新表,默认的mysql>createtablet_x(idint);QueryOK,0rowsaffected(0.02sec)#查看新表mysql>showcreatetablet_x;t_x|CREATETABLE`t_x`(`id`intDEFAULTNULL)ENGINE=InnoDBDEFAULTCHARSET=utf8mb4COLLA
咖啡加Ice
·
2024-01-29 22:30
咖啡ice的MySQL学习记录
mysql
学习
笔记
My
sql学习
笔记第八章—索引与范式
补充1.索引索引:相当于一本书的目录,通过目录可以快速找到对应的资源。查询一张表有两种检索方式:第一种:全局扫描第二种:根据索引检索(效率高)需要考虑给字段加索引情况:数据量庞大、字段很少DML操作、经常出现在where子句中。注:主键与具有unique约束的字段会自动添加索引。根据主键查询效率较高。索引语法格式创建索引:createindex索引名on表名(字段名);删除所以:dropindex
咖啡加Ice
·
2024-01-29 22:30
咖啡ice的MySQL学习记录
mysql
学习
笔记
My
sql学习
笔记第一章—Mysql数据库概述
Mysql数据库1.数据库概述DB:DataBase数据库,数据库实际上在硬盘上以文件形式存在。DBMS:DataBaseManagementSystem数据库管理系统,常见有:MySQL、Oracle、DB2、Sybase、SqlServer……SQL:结构化查询语言,是一门标准通用的语言。标准的sql适合于所有的数据库产品。SQL属于高级语言,SQL语句由DBMS完成。DBMS负责执行SQL语
咖啡加Ice
·
2024-01-29 22:00
咖啡ice的MySQL学习记录
数据库
mysql
学习
My
sql学习
笔记第五章—约束
约束1.约束概述在创建表时,给表的字段添加相应约束,保证数据的合法性、有效性、完整性。常见的约束:非空约束:notnull,约束的字段不能为NULL唯一约束:unique,约束的字段不能重复但可以为NULL。主键约束:primarykey(简称PK),约束的字段既不能为NULL,也不能重复外键约束:foreignkey(简称FK),2.非空约束notnull非空约束:notnull,约束的字段不能
咖啡加Ice
·
2024-01-29 22:00
咖啡ice的MySQL学习记录
mysql
学习
笔记
My
sql学习
笔记第七章—事务
事务1.事务概述事务是一个完整的业务逻辑单元,不可再分。例如:银行账户转账,从用户actno-001向actno-002转账10000,需要执行两条update语句updatet_actsetbalance=balance-10000whereactno='actno-001';updatet_actsetbalance=balance+10000whereactno='actno-002';以上
咖啡加Ice
·
2024-01-29 22:53
咖啡ice的MySQL学习记录
mysql
学习
笔记
golang读取json文件
golang读取json数据json文件:{"hostUrl":"wss://
spark
-api.xf-yun.com/v2.1/chat","appid":"yourappid","apiSecret
xin麒
·
2024-01-29 22:56
golang
读取文件
Spark
的核心组件
运行架构
Spark
框架的核心是一个计算引擎,整体来说,它采用了标准master-slave的结构。如下图所示,他展示了一个
Spark
执行时的基本结构。
cluse_ld
·
2024-01-29 21:25
spark
spark
大数据
分布式
Spark
的架构与组件
1.背景介绍
Spark
是一个快速、通用的大规模数据处理框架,它可以处理批量数据和流式数据,支持多种数据源,并提供了丰富的数据处理功能。
OpenChat
·
2024-01-29 21:24
spark
架构
大数据
分布式
spark
调优之资源调优
资源调优为
spark
程序提供合理的内存资源,cpu资源等
spark
-sumbmit脚本常见参数1、–confPROP=VALUE==》手动给
spark
Conf指定相关配置,比如–conf
spark
.serializer
XLMN
·
2024-01-29 20:54
My
SQL学习
笔记【实时更新...】
文章目录MySQL数据库基本概念与分类数据库的定义数据库的分类关系型数据库非关系型数据库结构化查询语言数据定义语言DDL数据库查看show创建create删除drop使用use数据库的复制表查看show创建create修改alter添加列add修改列modify/change删除列drop删除drop清空truncate修改表名rename表的复制数据操作语言DML插入insert修改update
程序员劝退师_
·
2024-01-29 19:32
mysql
学习
笔记
浅析大数据的技术生态圈(Hadoop,hive,
spark
)
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择。大数据,首先你要能存的下大数据。传统的文件系统是单机的,不能横跨不同的机器。H
Rysinal
·
2024-01-29 19:11
hadoop
大数据
hadoop
spark
生态圈
阿里云服务器2024年2核16G、4核32G、8核64G配置最新收费标准及活动价格
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,Hadoop、
Spark
集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择,
qq_3304559116
·
2024-01-29 18:17
阿里云
阿里云
服务器
云计算
SpringSecurity 免密登录方法
添加自定义校验#MyAuthenticationProviderpackagecom.
spark
.security.config;importorg.springframework.security.authentication.BadCreden
yueF_L
·
2024-01-29 16:27
java
开发语言
最新AI系统ChatGPT网站系统源码V5.0版本,Midjourney绘画,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图+思维导图一站式解决方案
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-29 13:27
人工智能
ChatGPT
软件源码
人工智能
chatgpt
语音识别
midjourney
AI作画
gpt
Hbase BulkLoad用法
要导入大量数据,Hbase的BulkLoad是必不可少的,在导入历史数据的时候,我们一般会选择使用BulkLoad方式,我们还可以借助
Spark
的计算能力将数据快速地导入。
kikiki2
·
2024-01-29 12:32
Spark
- 升级版数据源JDBC2
>在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,
kikiki5
·
2024-01-29 11:42
198、
Spark
2.0之Dataset开发详解-聚合函数:collect_list、collect_set
collect_list和collect_set,都用于将同一个分组内的指定字段的值串起来,变成一个数组常用于行转列比如说depId=1,employee=leodepId=1,employee=jackdepId=1,employees=[leo,jack]代码objectAggregateFunction{caseclassEmployee(name:String,age:Long,depId
ZFH__ZJ
·
2024-01-29 11:41
spark
快速入门java_
Spark
快速入门
本教程快速介绍了
Spark
的使用。首先我们介绍了通过
Spark
交互式shell调用API(Python或者scala代码),然后演示如何使用Java,Scala或者Python编写独立程序。
陈兰香
·
2024-01-29 11:54
spark快速入门java
Spark
入门01
1
Spark
是什么
Spark
是用于大规模数据处理的统一分析引擎。对任意类型的数据进行自定义计算。
chde2Wang
·
2024-01-29 11:53
spark
大数据
分布式
MR和
Spark
的比较
目录一、
Spark
为什么比MR快?二、hadoop和
spark
的shuffle相同和差异?三、
Spark
与Hadoop差异一、
Spark
为什么比MR快?
猿来孺词
·
2024-01-29 10:55
mr
spark
大数据
分布式
hadoop
ID Mapping技术解析:从Redis到
Spark
GraphX的演进与应用
目录一、IDMapping的背景二、IDMapping的重要性三、IDMapping的方案3.1基于Redis的IDMapping(效率不行)
数据与后端架构提升之路
·
2024-01-29 10:48
#
风控
大数据
#
数据中台
idmapping
Spark
常用Transformations算子(一)
介绍以下Transformations算子:mapflatMapmapPartitionsmapPartitionsWithIndexfiltersampleunionintersectionsortBysortByKeygroupByKeyreduceByKeydistinctcoalescerepartition(1)map、mapPartitions、mapPartitionsWithInd
数据萌新
·
2024-01-29 07:12
Hadoop, HIve,
Spark
关系简述
大数据∈数据管理系统的范畴数据管理系统:数据怎么存?数据怎么算?单机数据管理时代下,数据处理的任务:IO密集型;数据存不下?HDFS用于存放多机器的数据并提供相关Api接口。HDFS中引入了一个模块:MapReduce(基于磁盘计算)。MapReduce:提供了一个任务并行的框架,通过它的Api抽象让用户把这个并行程序分成两个阶段,即Map阶段(分工),Reduce阶段(汇总)。Hive:在Had
小白兔奶糖ovo
·
2024-01-29 07:22
hadoop
hive
spark
最新AI创作系统ChatGPT网站系统源码,Midjourney绘画V6 ALPHA绘画模型,ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-29 06:01
人工智能
ChatGPT
软件源码
人工智能
chatgpt
语音识别
AI作画
midjourney
基于
Spark
个性化图书推荐系统
介绍该系统基于
Spark
,结合了协同过滤算法和个性化推荐技术,实现了一款个性化的书籍推荐系统。
沐知全栈开发
·
2024-01-29 04:48
spark
大数据
分布式
spark
shuffle
spark
的shuffle过程分为:1:map2:shufflewrite3:shuffleread4:reduce一般来说机器的性能好的话,shuffle过程之中,数据不写入磁盘。
流砂月歌
·
2024-01-29 01:13
java
spark
运行原理_
SPARK
:作业基本运行原理
Spark
作业基本运行原理:我们使用
spark
-submit提交一个
spark
作业之后,这个作业就会启动一个对应的Driver进程。
长野君
·
2024-01-28 23:44
java
spark
运行原理
spark
作业调度原理
概述
spark
有多种方式调度各个计算所需的资源.首先,每个application(即
spark
Context实例)有一组独立的Executor进程。
Deegue
·
2024-01-28 23:14
spark
spark
原理&机制
参数调优
Spark
作业执行流程
一、
Spark
组件
Spark
的基本组件,包括负责集群运行的Master和Worker,负责作业运行的Client和Driver,以及负责集群资源管理器(如YARN)和执行单元Executor等。
晓之以理的喵~~
·
2024-01-28 23:13
Hadoop
Spark
大数据
spark
大数据
分布式
【
Spark
】
Spark
作业执行原理--获取执行结果
一、执行结果并序列化任务执行完成后,是在TaskRunner的run方法的后半部分返回结果给Driver的:overridedefrun():Unit={...//执行任务valvalue=try{valres=task.run(taskAttemptId=taskId,attemptNumber=attemptNumber,metricsSystem=env.metricsSystem)thre
勤言不勤语
·
2024-01-28 23:43
Spark
spark
Spark
作业基本运行原理
Spark
作业基本运行原理:我们使用
spark
-submit提交一个
spark
作业之后,这个作业就会启动一个对应的Driver进程。
wybdt
·
2024-01-28 23:42
Spark
spark
大数据
【
Spark
系列2】
Spark
编程模型RDD
RDD概述RDD最初的概述来源于一片论文-伯克利实验室的ResilientDistributedDatasets:AFault-TolerantAbstractionforIn-MemoryClusterComputing。这篇论文奠定了RDD基本功能的思想RDD实际为ResilientDistributionDatasets的简称,意为弹性分布式数据集RDD的基本属性1、分区RDD的中文含义是弹
周润发的弟弟
·
2024-01-28 23:12
spark
大数据
分布式
【
Spark
系列3】RDD源码解析实战
本文主要讲1、什么是RDD2、RDD是如何从数据中构建一、什么是RDD?RDD:弹性分布式数据集,ResillientDistributedDataset的缩写。个人理解:RDD是一个容错的、并行的数据结构,可以让用户显式的将数据存储到磁盘和内存中,并能控制数据的分区。同时RDD还提供一组丰富的API来操作它。本质上,RDD是一个只读的分区集合,一个RDD可以包含多个分区,每个分区就是一个data
周润发的弟弟
·
2024-01-28 23:12
spark
大数据
分布式
Spark
作业执行原理
Spark
的作业和任务调度系统是
Spark
的核心,它能够有效地进行调度根本原因是对任务划分DAG和容错,使得它对低层到顶层的各个模块之间的调用和处理显得游刃有余。下面介绍一些相关术语。
垫路的石头
·
2024-01-28 23:12
spark
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他