E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark编程模型
AI创作系统ChatGPT网站源码,AI绘画,支持GPT联网提问/即将支持TSS语音对话功能
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-14 15:11
人工智能
ChatGPT
软件源码
chatgpt
人工智能
midjourney
AI作画
玩转大数据10:深度学习与神经网络在大数据中的应用
目录1.引言:深度学习和神经网络在大数据中的重要性和应用场景2.深度学习的基本概念和架构3.Java中的深度学习框架3.1.Deeplearning4j框架介绍及Java
编程模型
3.2.DL4J、Keras
沛沛老爹
·
2023-12-14 14:37
人工智能
数字化转型
BigData
深度学习
神经网络
大数据
TensorFlow
DL4j
大规模数据训练
【
Spark
精讲】
Spark
内存管理
目录前言Java内存管理Java运行时数据区Java堆垃圾回收机制Executor内存管理内存类型堆内内存堆外内存内存管理模式静态内存管理统一内存管理编辑执行内存管理多任务间内存分配Shuffle的内存占用MemoryOverHead详解任务内存调节错误类型及调整方案1.ExecutorOOM类错误(错误代码137、143等)方式一:增加单个task的内存使用量方式二:降低单个Task的内存消耗量
话数Science
·
2023-12-14 13:52
Spark精讲
Spark
大数据
spark
大数据
分布式
Spark
读写MySQL数据库
Spark
读写MySQL数据库文章目录
Spark
读写MySQL数据库一、读取数据库(一)通过RDD的方式读取MySQL数据库(二)通过DataFrame的方式读取MySQL数据库二、添加数据到MySQL
叶子上的考拉
·
2023-12-14 13:45
大数据
数据库
spark
mysql
Spark
Dataset的实用操作笔记
最近的项目用
spark
做离线计算,所以有用到一些操作,简单笔记一下1.Dataset纵向复制数据当一个dataset中数据量太少,不能有效的随机联查别的dataset时,需要将数据纵向复制,把数据量撑起来
容若只如初见
·
2023-12-14 13:12
spark
笔记
ajax
spark
rdd和dataframe的区别,结合底层逻辑
在Apache
Spark
中,RDD(ResilientDistributedDataset)和DataFrame是处理数据的两种不同的抽象。
三水青一人尤
·
2023-12-14 12:29
spark
spark
大数据
分布式
数据仓库
sql
理解
Spark
写入 API 的数据处理能力
这张图解释了Apache
Spark
DataFrame写入API的流程。它始于对写入数据的API调用,支持的格式包括CSV、JSON或Parquet。
小技术君
·
2023-12-14 12:23
spark
大数据
分布式
反应式编程(Reactive Programming)
异步数据流和事件异步数据流和事件是反应式编程的核心概念,用于描述非阻塞的数据流和事件驱动的
编程模型
。
qq_40260394
·
2023-12-14 12:33
javascript
开发语言
ecmascript
前端
visual
studio
算法
java
Spark
分布式内存计算框架
目录一、
Spark
简介(一)定义(二)
Spark
和MapReduce区别(三)
Spark
历史(四)
Spark
特点二、
Spark
生态系统三、
Spark
运行架构(一)基本概念(二)架构设计(三)
Spark
运行基本流程四
Francek Chen
·
2023-12-14 12:43
大数据技术基础
Spark编程基础
spark
大数据
分布式
spark
lyr: R interface for Apache
Spark
关于
spark
lyr的一个简单的教程下载
Spark
lyrinstall.packages("
spark
lyr")下载
spark
library(
spark
lyr)
spark
_install(version
Liam_ml
·
2023-12-06 23:16
Spark
SQL运行流程浅析
写了有相当长一段时间的
Spark
SQL了,所以结合网上其他大神的分析,写一篇文章,谈谈我对
Spark
SQL整个运行流程的一个简单的理解。哈哈,毕竟程序员要做到知其然,还要知其所以然不是。
淡定一生2333
·
2023-12-06 21:08
Spark学习
Spark
常见算子汇总
创建RDD在
Spark
中创建RDD的方式分为三种:从外部存储创建RDD从集合中创建RDD从其他RDD创建textfile调用
Spark
Context.textFile()方法,从外部存储中读取数据来创建
话数Science
·
2023-12-06 21:05
大数据
面试
Spark
spark
大数据
Spark
面试题汇总
问题汇总
Spark
SQL调优:场景是怎样的?怎么发现的?怎么定位的?怎么解决的?达到了一个怎样的效果?引申下还有哪些更好的优化方案?UDF怎么管理的,如何避免重复的UDF的提交?
话数Science
·
2023-12-06 21:04
Spark
大数据
面试
spark
大数据
Spark
宽依赖窄依赖的区别
定义:一般观点:窄依赖是子RDD的一个分区只依赖于父RDD的一个分区,即每个父RDD的分区最多被子RDD的一个分区使用;宽依赖是子RDD的一个分区依赖了父RDD的多个分区,即多个子RDD的分区数据依赖父RDD的同一个分区的数据。而实际上:窄依赖是父RDD的一个或多个分区的数据全部流入到子RDD的一个或多个分区;宽依赖是父RDD的每个分区的不同部分,分别流入到子RDD的不同分区。算子:窄依赖算子:m
话数Science
·
2023-12-06 21:04
Spark
大数据
面试
spark
大数据
分布式
如何设置和读取
Spark
配置
设置在SaprkConf中设置,如valconf=new
Spark
Conf().setMaster("local").setAppName("Myapplication").set("
spark
.executor.memory
话数Science
·
2023-12-06 21:04
大数据
Spark
spark
大数据
Spark
自定义分区器
spark
目前支持两个分区器,分别是HashPartitioner和RangePartitioner.均继承自Partitioner,有共同方法-defnumPartitions--分区器的分区数量-defgetPartition
鸭梨山大哎
·
2023-12-06 21:02
spark
spark
分区
快手数仓面试题附答案
2你在工作中都负责哪一部分3
spark
提交一个程序的整体执行流程4
spark
常用算子列几个,6到8个吧5transformation跟action算子的区别6map和flatmap算子的区别7自定义udf
话数Science
·
2023-12-06 21:59
大数据
面试
Spark
spark
大数据
大数据实战项目_电商推荐系统
一、项目介绍Hadoop+
Spark
+(Python)Scala+
Spark
SQL+
Spark
Streaming+MongoDB+Redis+Kafka+Flume+(SpringMVC+vue)1项目介绍
Guff_hys
·
2023-12-06 20:28
大数据开发学习
大数据
服务器
hadoop
spark
zookeeper
flume
kafka
解决安装py
spark
所遇到的所有问题
一开始安装Hadoop,hive,hbase,
spark
很顺利。但是到了py
spark
时候已
天亮说晚安ii
·
2023-12-06 17:33
大数据
spark
机器学习---py
Spark
代码开发
1、eclipse开发py
Spark
程序在eclipse中开发py
Spark
程序,需要安装pydev插件。1).eclipse安装python插件,安装完成后重启。
30岁老阿姨
·
2023-12-06 17:23
机器学习
spark
大数据
分布式
机器学习---环境准备
一、py
Spark
环境准备1、window配置python环境变量window安装python,配置python环境变量。
30岁老阿姨
·
2023-12-06 17:53
机器学习
python
开发语言
机器学习---py
Spark
案例
1、统计PV,UV1.if__name__=='__main__':2.conf=
Spark
Conf()3.conf.setMaster("local")4.conf.setAppName("test"
30岁老阿姨
·
2023-12-06 17:53
机器学习
前端
服务器
javascript
异构编程和cuda程序概念
文章目录异构编程和cuda程序概念一、异构系统和异构
编程模型
1、什么是异构系统2、异构系统优点3、什么是异构
编程模型
二、cuda基本知识三、cuda工作流程1、基本流程2、并行线程组织结构3、CUDA程序异构编程和
这是一个图像
·
2023-12-06 15:13
cuda
异构编程
前后端分离vue+springboot家庭理财账单财务管理系统
技术栈:后端:SpringBoot,Sa-Token,MyBatis-Plus,MyBatisGenerator,MySQL,Nginx,
Spark
,Fastjson前端:Vue,Vue-router,
说书客啊
·
2023-12-06 15:12
SpringBoot框架源码
vue.js
spring
boot
javascript
java
后端
ERROR
Spark
Context: Error initializing
Spark
Context.org.apache.
spark
.
Spark
Exception:无效的
Spark
URL:
在idea中用scala编写
spark
的WordCount的案例时,老是报错,scala能运行其他程序scala没有问题,依赖按照视频教程也成功下载,Maven仓库也下载的巴巴适适,报的错误太多了,我节选有价值的错误信息
Guff_hys
·
2023-12-06 11:40
大数据开发学习
spark
大数据
分布式
scala
intellij
idea
服务器
后端
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。使用方法csv
spark
.sql("select*fromcsv.
kikiki2
·
2023-12-06 11:16
Spark
由浅到深(1)--安装,测试,问题排错
安装部署//选择需要的版本.官网下载:http://
spark
.apache.org/downloads.html//部署tar-zxf
spark
-1.4.0-bin-hadoop2.6.tgzcd
spark
GeezKe
·
2023-12-06 10:04
Spark
Spark
BigData
【RabbitMQ基础
编程模型
】
文章目录RabbitMQ基础
编程模型
基础
编程模型
step1、首先创建连接,获取Channelstep2、声明Exchange-可选step3、声明queuestep4、声明Exchange与Queue的绑定关系
向前再向前
·
2023-12-06 09:58
rabbitmq
【C++高并发编程】reactor并发
编程模型
文章目录提纲引言Reactor模式概述Reactor模式定义和设计原则Reactor模式与其他并发模式的比较Reactor模式适用的场景和优势Reactor模式组件Reactor事件源事件处理器具体业务逻辑事件和事件类型模式工作原理IO多路复用Reactor工作流程实现策略参考文献提纲引言高并发编程的重要性和挑战并发模型概述:同步/异步、阻塞/非阻塞、多进程/多线程/事件驱动Reactor模式概述
ichdream
·
2023-12-06 08:11
C++高性能编程
高性能计算
服务器
linux
c++
架构
车载系统
Spark
读写Doris数据
1准备
Spark
环境创建maven工程,编写pom.xml文件 4.0.0
shangjg3
·
2023-12-06 08:48
Doris
大数据
数据仓库
doris
sql
spark
Spark
环境安装
Spark
环境安装一、准备工作1、hadoop成功安装2、防火墙关闭二、解压安装1、上传
spark
安装包到/opt/soft目录,进入该目录下,执行如下命令:tar-zxvf
spark
-2.1.1-bin-hadoop2.7
会java的怪蜀黍
·
2023-12-06 07:35
大数据
spark
大数据
分布式
生产环境_从数据到层级结构JSON:使用
Spark
构建多层次树形数据_父子关系生成
代码补充了!兄弟萌造的样例数据valdata=Seq(("USA","Male","Asian","Chinese"),("USA","Female","Asian","Chinese"),("USA","Male","Black","African"),("USA","Female","Black","African"),("USA","Male","White","European"),("U
Matrix70
·
2023-12-06 07:04
Spark
数据分析与处理
spark
大数据
算法
json
分布式
开发语言
spark
不同结构Dataset合并
1.先将hdfs(或本地)存储的csv文件加载为Dataset先在本地C盘准备两个csv文件test.csvclient_id,behives,del,normal_status,cust_type,no_trd_days7056,zl,1,hy,个人,27057,cf,1,hy,个人,127058,hs,2,hy,个人,1200212121,0,sj,hy,个人,1100212122,1,yx,
容若只如初见
·
2023-12-06 07:03
spark
大数据
分布式
spark
sql基于CBO的优化
前言
spark
sql基于CBO的优化是建立在物理计划层面的,原理是计算出所有可能的物理执行计划,并挑选成代价最小的物理执行计划。
!@123
·
2023-12-06 07:02
大数据
spark
sql
大数据
spark
写入 hudi时数据类型报错
报错信息如下:Causedby:org.apache.
spark
.sql.execution.QueryExecutionException:Parquetcolumncannotbeconvertedinfilehdfs
南城守护
·
2023-12-06 07:31
spark
大数据
分布式
spark
sql-Broadcast Hash Join、SMB-JOIN
那么再次进行join的时候,就相当于大表的各自分区的数据与小表进行本地join,从而避免了shuffle配置set
spark
.sql.autoBroadcastJoinThreshold=10m,默认为
!@123
·
2023-12-06 07:27
大数据
spark
大数据
Py
Spark
开发环境搭建常见问题及解决
Py
Spark
环境搭建常见问题及解决1、winutils.exe问题2、
Spark
URL问题3、set_ugi()问题本文主要收录Py
Spark
开发环境搭建时常见的一些问题及解决方案,并收集一些相关资源
对许
·
2023-12-06 07:54
Python大数据
#
Spark
spark
使用 pyarrow 将parquet转成
spark
能用的parquet
最近发现
spark
的一个坑(发现时
spark
最新为2.4.4版本),
spark
对parquet格式有特殊要求,不支持带“uint8”类型的parquethttps://github.com/apache
爱知菜
·
2023-12-06 06:55
Python
比较 Apache Hive 和
Spark
Hive和
Spark
是两种非常流行且成功的用于处理大规模数据集的产品。换句话说,他们进行大数据分析。本文重点描述这两种产品的历史和各种功能。
vvoennvv
·
2023-12-06 06:50
apache
hive
spark
Ambari hdp
Spark
多版本并存
本示例基于ambarihdp-2.6.0.3(
spark
2.1.0),集成
spark
2.2.2,其他的版本思路类似(
spark
2.3经测试也是没问题的)下载
spark
-2.2.2-bin-hadoop2.7
Respect123
·
2023-12-06 05:20
Spark
Streaming(三)集成Kafka
Kafka从0.8版本到0.10版本提供了一种新的消费者api,所以根据你的kafka版本不同相应的有2种包可用,分别是
spark
-streaming-kafka-0-8和
spark
-streaming-kafka
Sx_Ren
·
2023-12-06 03:33
分享2024年第一期!全国高校大数据与人工智能师资研修班
全国高校大数据与人工智能师资研修班2024年第一期上海线下班:数据采集与机器学习实战广州线下班:大数据技术应用实战(Hadoop+
Spark
)线上班(十一大专题)PyTorch深度学习与大模型应用实战数据采集与处理实战大数据分析与机器学习实战大数据技术应用实战
泰迪智能科技
·
2023-12-06 03:22
师资培训
大数据
人工智能
Scrapy爬虫数据存储为JSON文件的解决方案
它基于JavaScript
Spark
语言的一个子集,但独立于Smashing语言,因此在许多中语言中都可以使用。JSON文件由键值对组成,可以表示对象和缓存等复杂结构。
小白学大数据
·
2023-12-06 02:16
python
爬虫
scrapy
爬虫
json
开发语言
数据分析
python
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。使用方法csv
spark
.sql("select*fromcsv.
kikiki2
·
2023-12-06 01:07
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。使用方法csv
spark
.sql("select*fromcsv.
kikiki2
·
2023-12-06 01:40
(一)NET Core 项目中通过EF Core的Code First方式进行数据库的迁移
还支持"代码优先"或"数据库优先"方法作为
编程模型
。代码优先(Codefirst)是一种技术,可以帮助我们通过代码来创建数据库,迁移和维护数据库及其表。
知更鸟的码
·
2023-12-06 00:38
.Net
Core
c#
EF
Core
当发送“Hello,World”时,channel发生了什么?
Cassandra-nosql数据库
Spark
-大数据分布式计算框架Hadoop-大数据
仙草不加料
·
2023-12-05 22:53
netty
java
网络编程
Flink快速入门
大数据处理框架发展史大数据-3v-tpezy-分而治之批处理流处理-微信运动、信用卡月度账单、国家季度GDP增速MPI-节点间数据通信-c和pythonMR-2004谷歌提出的编程范式-hadoop/storm/
spark
WaiSaa
·
2023-12-05 21:30
Java
大数据
flink
大数据
基于Docker搭建
Spark
集群
介绍在MacOS下使用Docker搭建
Spark
集群,进行学习。
_吹灭读书灯_
·
2023-12-05 19:39
Spark
中cache和persist区别
cache和persist的区别基于
Spark
1.4.1的源码,可以看到/**PersistthisRDDwiththedefaultstoragelevel(`MEMORY_ONLY`).
西二旗老司机
·
2023-12-05 18:51
上一页
38
39
40
41
42
43
44
45
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他