E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark调优
从术语到
Spark
,10篇必读大数据学习资源
大数据文摘作品编译:王一丁、王梦泽、夏雅薇本文给想进入大数据领域的朋友提供了一系列的资源,由浅入深,比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个必须要参加的大数据会议”等有趣的话题。相信各种背景的朋友都会在这篇文章中有所收获。之前,我们已就数据可视化进行了深入探讨。这次,我们将从更基本的概念讲起,以便在涉足更复杂的数据科学和商业智能之前能够真正理解大数据。文中会引领
金光闪闪耶
·
2024-01-18 13:45
sql中的explain关键字用法
在SQL中,使用EXPLAIN关键字可以获取查询的执行计划,以便进行性能优化和查询
调优
。执行计划提供了关于查询操作的详细信息,涵盖了多个表头字段,每个字段都提供了特定的信息。
不可能掉发
·
2024-01-18 13:16
sql
数据库
02-项目性能优化-课程笔记
项目性能优化授课目标:目标01-了解分布式压力测试目标02-掌握Web服务容器优化:Tomcat
调优
,网络IO
调优
,及服务容器更换目标03-理解为什么进行数据库
调优
,以及数据库
调优
的调什么目标04-掌握
程序媛9688
·
2024-01-18 11:30
性能优化
笔记
JVM实战(15)——Full GC
调优
作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬学习必须往深处挖,挖的越深,基础越扎实!阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析阶段5、深入jvm源码解析一、简介本章将会讲解一个频繁FullGC的案例,示例来自于JVM基础篇中
smart哥
·
2024-01-18 11:17
jvm专题
jvm
django大数据_草稿本01
文档Learning_
Spark
/5.
Spark
Streaming/ReadMe.mdatmaster·LeslieZhoa/Learning_
Spark
#在py
spark
下运行frompy
spark
.ml.featureimportHashingTF
哈都婆
·
2024-01-18 09:15
django
作为刚入职的小白,怎么才能学好大数据 ?
大数据学习方向一、大数据运维之Linux基础打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,
Spark
,Storm,docker,openstack等。
铁拳虎
·
2024-01-18 09:40
大数据学习
大数据开发
大数据入门
数据分析
Hadoop
Kafka
大数据
大数据技术
人工智能
spark
Linux
大数据
大数据学习
大数据开发
Spark
Session对象操作--学习笔记
1,
Spark
Session对象操作frompy
spark
.sqlimport
Spark
Sessionfrompy
spark
import
Spark
Conffrompy
spark
.sqlimportfunctionsasF
祈愿lucky
·
2024-01-18 07:35
大数据
学习
笔记
javascript
大数据知识点
Spark
:
Spark
RDD的概念:RDD是
Spark
中最基本的数据抽象,是一个不可变、可分区、里面的元素可并行计算的集合。
꧁༺朝花夕逝༻꧂
·
2024-01-18 07:29
hbase
数据库
大数据
py
spark
笔记:over
1方法介绍在Py
Spark
中,over函数是一个非常重要的概念,尤其是在使用窗口函数(例如row_number,rank,dense_rank,lead,lag等)时。
UQI-LIUWJ
·
2024-01-18 07:27
python库整理
笔记
Python进阶知识:整理1 -> py
Spark
入门
1编写执行入口#1.导包frompy
spark
import
Spark
Conf,
Spark
Context#2.创建
Spark
Conf类对象conf=
Spark
Conf().setMaster("local
是小蟹呀^
·
2024-01-18 07:57
Python
python
spark
Spark
SQL函数定义
目录窗口函数SQL函数分类
Spark
原生自定义UDF函数Pandas的UDF函数ApacheArrow框架基本介绍基于Arrow完成PandasDataFrame和
Spark
DataFrame互转基于Pandas
Sisi525693
·
2024-01-18 07:23
spark
sql
大数据
Spark
—shell,Hbase—shell
Spark
:
SPARK
SQLresults=
spark
.sql("SELECT*FROMpeople")//读取JSON文件valuserScoreDF=
spark
.read.json("hdfs://
꧁༺朝花夕逝༻꧂
·
2024-01-18 07:21
spark
大数据
分布式
003-90-15【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王大爷家女儿用GPT学习DataSet的基本操作
003-90-14【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王大爷家女儿用GPT学习DataSet的基本操作【
Spark
SQL&DF&DS】Dataset的创建和使用【
Spark
SQL
一杯派蒙
·
2024-01-18 06:53
spark
gpt
学习
spark
大数据
笔记
JVM参数
调优
1、为什么会有JVM参数
调优
优化在项目运行过程中,往往会出现各种各样的性能瓶颈而影响程序的运行,或者用户的体验,每当遇到这些的问题的时候,都需要进行相应性能优化。
weixin_34168880
·
2024-01-18 04:00
运维
java
开发工具
cmd命令设置java虚拟机内存_JVM
调优
基础——运行参数、内存分析命令、内存分析工具...
不多BB,开门见山-D=传入参数作为系统的参数属性,项目中可以根据这个命令传入文件路径去选择不同的配置文件,选择是开发环境配置还是测试环境配置、还是线上环境配置java-versionimage.png我们看到上面的-server,java有两种运行模式:client和server,启动时client比server快,但是启动完成后server的比client性能更好,不同的模式默认的jvm参数和
weixin_39585675
·
2024-01-18 01:02
关于
调优
操作系统
调优
句柄、swapiness、文件系统、网络IOJVM
调优
合理设置堆大小、合理选择GC收集器Broker
调优
尽力保持客户端版本和Broker端版本一致、合理配置参数应用层不要频繁地创建Producer
kar_joe
·
2024-01-18 01:20
spark
-udf函数
udf函数自定义frompy
spark
.sqlimport
Spark
Sessionfrompy
spark
.sql.typesimport*创建连接ss=
Spark
Session.builder.getOrCreate
中长跑路上crush
·
2024-01-17 23:34
Spark阶段
spark
大数据
分布式
【论文阅读 CIDR17】Self-Driving Database Management Systems
Self-DrivingDatabaseManagementSystemsMySummaryABSTRACT之前的advisorytools来帮助DBA处理系统
调优
和物理设计的各个方面,都仍然需要人类对数据库的任何更改做出最终决定
Tototototorres
·
2024-01-17 19:41
self-driving
DB
论文阅读
论文阅读
数据库
常用图算法实现--
Spark
使用
Spark
实现PageRank,强连通分量等图算法PageRank数据准备边:1211523242526273134251151261676871788189810914911011013111211112113141412151
zealscott
·
2024-01-17 19:45
Linux高并发
调优
springboot的tomcat的几个配置参数环境:jdk1.8+springboot2.1.1.RELEASEserver:port:8085servlet:context-path:/testtomcat:max-threads:1#最大线程数,默认200accept-count:1#挂起的最大连接数,默认100,最终会体现在这里publicabstractServerSocketChann
胖小白_d797
·
2024-01-17 17:10
2024.1.16 用户画像day01 - 项目介绍
名词解释一.项目介绍整体流程:项目介绍-elasticSearch-业务数据源导入-离线指标开发-Flume实时采集-Nginx日志埋点数据-结构化流实时指标-制作报表数仓开发用户画像实时开发hive-
spark
白白的wj
·
2024-01-17 15:40
spark
大数据
分布式
python
kafka
zookeeper
hive
2024.1.15
Spark
阶段原理,八股,面试题
目录1.简述什么是
Spark
?
白白的wj
·
2024-01-17 15:38
spark
大数据
分布式
python
kafka
hadoop
hive
Apache Zeppelin学习记录1
它支持多种编程语言(如Scala、Python、R、SQL等)和数据处理工具(如Apache
Spark
、Hadoo
旻璿gg
·
2024-01-17 15:01
大数据
python
zeppelin
Python 与批处理:数据处理、系统管理和任务调度
批处理学习大数据篇|大数据实操三剑客之一的批处理目录批处理的概念使用场景框架选择选型如何选docker安装hivePython操作hivedocker安装
spark
py
spark
操作dataframe如果使用
Wade_Crab
·
2024-01-17 15:23
python
开发语言
大数据
关于CarbonData+
Spark
SQL的一些应用实践和
调优
经验分享
大数据时代,中大型企业数据的爆发式增长,几乎每天都能产生约100GB到10TB的数据。而企业数据分系统构建与扩张,导致不同应用场景下大数据冗余严重。行业亟需一个高效、统一的融合数仓,从海量数据中快速获取有效信息,从而洞察机遇、规避风险。\\在这样的现状下,CarbonData诞生了,作为首个由中国贡献给Apache社区的顶级开源项目,CarbonData提供了一种新的融合数据存储方案,以一份数据同
weixin_34075551
·
2024-01-17 15:31
大数据
人工智能
后端
后端开发工程师需要掌握的内容
1.语言相关1.1Java核心知识点Java的类加载机制JVM相关:JVM内存模型和结构,GC原理,性能
调优
泛型集合体系异常体系IO体系多线程编程反射Servlet推荐数据《Java编程思想》《EffectiveJava
Programmer boy
·
2024-01-17 15:01
后端知识
后端
需要学习的知识
学习方向
R 安装 devtools 报错信息
在编译
spark
源码时遇到
spark
r有依赖R环境,当然一般用不到
spark
r时可以不加入编译在安装R环境和一些依赖包时遇到一些问题Rscript-e"install.packages(c('knitr
第一次看海
·
2024-01-17 15:00
r语言
java
开发语言
Yahoo的
Spark
实践
Yahoo的
Spark
实践Yahoo是大数据巨头中对
Spark
最情有独钟的一家。这次峰会,Yahoo贡献了三个演讲,让我们一一道来。
chuanjiaoye5017
·
2024-01-17 15:30
人工智能
数据库
操作系统
spark
sql实践开发后端引擎
写在前面:一转眼的时间,2024年了,翻看了一下博客首页,已有8年的码领,自从去年开启博客关注才能预览,至今已有1500个粉丝,比其他短视频平台的粉丝还要多,经年累月,8年一瞬,在码代码的道路上越来越不快乐,为何不快乐,因为寻觅不到快乐的源泉。-------------“何以解忧,唯有暴富”需求开发一个系统,主要是将数仓中治理完用于检索的数据灌入Elasticsearch中,一般情况,开源的一些系
第一次看海
·
2024-01-17 14:28
spark
sql
大数据
Java17优化指南
JVM
调优
的基本概念JVM
调优
主要涉及内存管理、垃圾收集器的选择和配置、JIT编译器优化等方面。优化目的在于减少延迟,提高吞吐量和资源利用率。1.内存管理优化内存管理是JVM
调优
的核心。
程序员升仔
·
2024-01-17 14:45
java
FlinkSQL【分组聚合-多维分析-性能
调优
】应用实例分析
FlinkSQL处理如下实时数据需求:实时聚合不同类型/账号/发布时间的各个指标数据,比如:初始化/初始化后删除/初始化后取消/推送/成功/失败的指标数据。要求实时产出指标数据,数据源是mysqlcdcbinlog数据。代码实例--SETtable.exec.state.ttl=86400s;--24hour,默认:0msSETtable.exec.state.ttl=2592000s;--30d
PONY LEE
·
2024-01-17 14:44
flink
大数据
flink
MySQL单表记录数过大的优化策略详解
1.2多列索引2.分区表2.1分区表概述2.2按时间范围分区3.垂直拆分3.1垂直拆分概述3.2垂直拆分示例4.水平拆分4.1水平拆分概述4.2水平拆分示例4.3水平拆分优缺点4.4补充5.性能监控和
调优
喔的 喔的嘛呀
·
2024-01-17 14:49
mysql
数据库
py
spark
_2_入门篇(编写我们的第一个程序WordCount)
跟着Leo学习Py
Spark
chapter2——编写我们的第一个程序WordCount上一章我们大致讲了一下py
spark
的基本理论和重要概念,如果想系统化且更深入地理解
spark
中的概念,还请移步官方文档
NikolasNull
·
2024-01-17 12:32
2018-06
spark
北美会议ppt下载
https://github.com/397090770/
spark
-summit-north-america-2018-06/tree/master/ppt
生活的探路者
·
2024-01-17 12:11
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2024-01-17 11:48
介绍 Apache
Spark
的基本概念和在大数据分析中的应用
Apache
Spark
是一个开源的分布式计算系统,它旨在处理大规模数据集并提供高性能和易用性。
Spark
提供了一个统一的编程模型,可以在多种编程语言中使用,包括Scala、Java、Python和R。
酷爱码
·
2024-01-17 11:45
经验分享
spark
大数据
分布式
运维监控篇Zabbix简单的性能
调优
http://www.cnblogs.com/zhengchunyuan/p/9282574.html
Lucky__Strike
·
2024-01-17 10:24
zabbix
Hive架构设计
我们知道MapReduce和
Spark
它们提供了高度抽象的编程接口便于用户编写分布式程序,它们具有极好的扩展性和容错性,能够处理超大规模的数据集。
跟着大数据和AI去旅行
·
2024-01-17 08:12
大数据企业级实战
hive
【小笔记】算法基础超参数
调优
思路
【学而不思则罔,思维不学则怠】9.29本文总结一下常见的一些超参数
调优
思路Batch_size2023.9.29简单来说,较大的bz可以加快训练速度,特别是基于GPU进行模型训练时,应该在显存允许范围内
落叶阳光
·
2024-01-17 08:39
笔记
算法
机器学习
深度学习
2023 IoTDB Summit:天谋科技高级开发工程师谭新宇《优其效:如何用 IoTDB 监控工具进行深度系统
调优
》...
12月3日,2023IoTDB用户大会在北京成功举行,收获强烈反响。本次峰会汇集了超20位大咖嘉宾带来工业互联网行业、技术、应用方向的精彩议题,多位学术泰斗、企业代表、开发者,深度分享了工业物联网时序数据库IoTDB的技术创新、应用效果,与各行业标杆用户的落地实践、解决方案,并共同探讨时序数据管理领域的行业趋势。我们邀请到天谋科技高级开发工程师,ApacheIoTDBPMCMember谭新宇参加此
Apache IoTDB
·
2024-01-17 08:41
iotdb
科技
Spark
master HA
1.原理只针对
Spark
自带的Standalone资源调度框架,因为Yarn本身就是高可用的Standalone集群只有一个Master,如果Master挂了就无法提交应用程序,需要给Master进行高可用配置
乔一波一
·
2024-01-17 08:34
计算机毕业设计之全网独家
Spark
租房爬虫数据分析与推荐系统 租房大数据 租房app 租房数据分析 租房爬虫 房源推荐系统 房源数据分析 房源可视化
一、网站·登录与注册、注销·短信验证码修改密码·我的信息:身份证实名认证·租房业务流程(预约+看房+支付+完成+评价)、进度步骤条展示·支付宝沙箱支付·房屋浏览、中介信息查看·房屋推荐(基于mahout协同过滤算法)·房屋评价、点赞与收藏二、后端·统计主页、个人信息(带头像上传)、权限管理、用户管理、资讯管理、通知管理、日志管理、评论管理、轮播图管理、房屋管理、中介管理、订单管理。·中介权限可以登
haochengxu2022
·
2024-01-17 08:34
数据分析
爬虫
推荐系统
spark
爬虫
数据分析
推荐系统
运行时管理和监控 Java 应用程序-JMX技术初探
文章目录1.JMX简介2.使用场景2.1性能监控和
调优
2.2运行时配置管理2.3故障诊断和问题排查3.使用样例3.1简单的MBean接口3.2简单的MBean实现3.3使用jconsole工具监测jmx
David爱编程
·
2024-01-17 07:52
java
java
开发语言
jattach-一个集成jmap、jstack、jinfo、jcmd功能的轻量级JVM工具,无需JDK也能运行
jattach简介3.容器内安装jattach工具3.1容器内可访问外网安装jattach工具的方法3.2容器内无法访问外网安装jattach工具的方法4.在容器内使用jattach工具定位JVM问题/
调优
David爱编程
·
2024-01-17 07:21
java
jvm
java
开发语言
最新使用宝塔反代openai官方API接口搭建详细教程及502 Bad Gateway错误问题解决
二、实现前提一台海外VPS服务器OpenAI官方的API_KEY第三方网站系统或插件关于第三方网站系统或插件,可以看另一篇文章介绍《
Spark
Ai系统详情及搭建部署文档》:https://www.yuque
白云如幻
·
2024-01-17 06:16
教程
运维
ChatGPT
gateway
chatgpt
nginx
spark
之checkpoint原理机制
当RDD使用cache机制从内存中读取数据,如果数据没有读到,会使用checkpoint机制读取数据。此时如果没有checkpoint机制,那么就需要找到父RDD重新计算数据了,因此checkpoint是个很重要的容错机制。checkpoint就是对于一个RDDchain(链)如果后面需要反复使用某些中间结果RDD,可能因为一些故障导致该中间数据丢失,那么就可以针对该RDD启动checkpoint
临界爵迹
·
2024-01-17 06:44
大数据
spark
checkpoint
spark
之shuffle参数优化
spark
.shuffle.file.buffer默认32kshufflewritetask端的缓冲区,到达阈值后,溢写到磁盘。
临界爵迹
·
2024-01-17 06:43
大数据
spark
Spark
面试
1、
Spark
如何保证宕机迅速恢复?
lune_Lucky
·
2024-01-17 05:30
大数据
big
data
spark
Apriori
Apriori算法原理总结-刘建平FPTree算法原理总结-刘建平PrefixSpan算法原理总结-刘建平用
Spark
学习FPTree算法和PrefixSpan算法-刘建平
BluthLeee
·
2024-01-17 05:41
基于
spark
的淘宝用户行为数据分析及其可视化研究
数据准备1、数据来源:淘宝用户购物行为数据集数据的相关介绍:数据的一条记录包括:用户id,商品id,商品类目id,行为类型(行为类型:pv——点击,buy——购买,cart——加入购物车,fav——收藏),时间戳数据包含了2017年11月25日至2017年12月3日之间淘宝用户的数据行为用户数量:987994商品数量:4162024用户数量:987994商品类目数量:9439所有行为数量:1001
简单的小呆瓜
·
2024-01-17 02:14
spark
spark
数据分析
大数据
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他