E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
Scala核心编程 第一章—Scala语言概述
一、Scala语言解释1.什么是Scala语言
Spark
—新一代内存级大数据计算框架,是大数据的重要内容。
Spark
就是使用Scala编写的。因此为了更好的学习
Spark
,需要掌握Scala这门语言。
我是星星我会发光i
·
2024-01-31 15:47
Scala核心编程
第一章
Scala语言概述
Python - 整理 MySQL 慢查询日志
当系统中的SQL查询花费的时间超过阈值时,MySQL会将这些查询记录在慢查询日志中,方便进行性能分析和
调优
。
冷风扇666
·
2024-01-31 12:37
#
Python小工具
python
flink sql运用入门
Job)#步骤4:停止集群#三、SQL客户端#1、准备sql涉及的lib包2、编写sql脚本3、webui查看总结前言目前我司项目中有实时大屏的需求,涉及实时计算部分的选型(以开源为基础),目前主流选择有
spark
yc_zlj
·
2024-01-31 11:21
大数据
flink
大数据
SQL索引与join语句
SQL性能下降,执行时间长,等待时间长原因:1.查询语句写的烂2.关联查询(Join)太多:设计缺陷或者不得已的需求3.索引失效(单值索引和复合索引)4.服务器
调优
及各个参数设置(缓冲、线程数等)比如有一张
被秃头支配的恐惧
·
2024-01-31 10:52
sql
数据库
database
Apache Flink -任意文件写入漏洞复现(CVE-2020-17518)
1、产品简介ApacheFlink是高效和分布式的通用数据处理平台,由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎(简单来说,就是跟
spark
类似)
OidBoy_G
·
2024-01-31 10:52
漏洞复现
apache
flink
安全
web安全
网络安全
基于backtrader的三均线策略(多参数自动
调优
和回测)
##导入相关包优化jupyter画图设置fromdatetimeimportdatetime,timedeltaimportbacktraderasbtimporttushareastsimportpandasaspdimporttalibastaimportnumpyasnpimportmatplotlib.pyplotaspltimportmplfinanceasmpfimportpyfoli
飘逸高铁侠
·
2024-01-31 10:40
backtrader学习日志
backtrader
三均线策略
多参数自动调优和回测
[
Spark
] 如何设置
Spark
资源
转自1.公众号[
Spark
学习技巧]如何设置
Spark
资源2.
Spark
性能优化篇一:资源
调优
Spark
和YARN管理的两个主要资源:CPU和内存应用程序中每个
Spark
Executor都具有相同的固定数量的核心和相同的固定堆大小
LZhan
·
2024-01-31 10:07
滴滴面试:数据库性能太差,有哪些
调优
方案?
尼恩说在前面在40岁老架构师尼恩的读者交流群(50+)中,最近有小伙伴拿到了一线互联网企业如阿里、滴滴、极兔、有赞、shein希音、百度、网易的面试资格,遇到很多很重要的面试题:MySQL性能太差,如何
调优
40岁资深老架构师尼恩
·
2024-01-31 09:44
面试
面试
数据库
微服务
架构
mysql
java
sql
SpringBoot假死,十万火急,怎么救火?
在指导简历的过程中,线上问题排查、Java
调优
是一项很重要的指导。问题是,很多小伙伴,连一点
调优
基础、线上问题排查经验都没有,当然,连高并发的场景也搞不清楚。
40岁资深老架构师尼恩
·
2024-01-31 09:07
技术圣经
面试
spring
boot
后端
java
spring
面试
架构
FullGC
调优
100倍,掌握这3招,吊打JVM
调优
在指导简历的过程中,线上问题排查、Java
调优
是一项很重要的指导。对于架构师、高级开发来说,
调优
和线上问题排查是核心内容,更是内功中的内功。
40岁资深老架构师尼恩
·
2024-01-31 09:07
技术圣经
面试
jvm
java
面试
性能优化
数据库
测试工具
Linux
调优
+Tomcat
调优
,超级干货,一定珍藏
在指导简历的过程中,线上问题排查、Java
调优
是一项很重要的指导。对于架构师、高级开发来说,
调优
和线上问题排查是核心内容,更是内功中的内功。
40岁资深老架构师尼恩
·
2024-01-31 09:36
技术圣经
面试
linux
tomcat
运维
java
面试
架构
P8大佬的 62条SQL优化策略,太牛X了!! 收藏起来有大用!!!
背景说明:Mysql
调优
,是大家日常常见的
调优
工作。所以Mysql
调优
是一个非常、非常核心的面试知识点。在40岁老架构师尼恩的读者交流群(50+)中,其相关面试题是一个非常、非常高频的交流话题。
40岁资深老架构师尼恩
·
2024-01-31 09:04
面试
sql
数据库
java
面试
前端性能
调优
前言移动互联网时代,用户对于网页的打开速度要求越来越高。首屏作为直面用户的第一屏,其重要性不言而喻。优化用户体验更是我们前端开发非常需要focus的东西之一。从用户的角度而言,当打开一个网页,往往关心的是从输入完网页地址后到最后展现完整页面这个过程需要的时间,这个时间越短,用户体验越好。所以作为网页的开发者,就从输入url到页面渲染呈现这个过程中去提升网页的性能。所以输入URL后发生了什么呢?在浏
R_X
·
2024-01-31 09:32
java进阶
大数据史上最全Flink面试题,高薪必备,大数据面试宝典史上最全Hadoop面试题:尼恩大数据面试宝典专题1史上最全HBase面试题,高薪必备,架构必备史上最全Hive面试题,高薪必备,架构必备绝密100个
Spark
don't_know
·
2024-01-31 09:44
java
中移(苏州)软件技术有限公司面试问题与解答(5)—— Linux进程调度参数
调优
是如何通过代码实际完成的1
接前一篇文章:中移(苏州)软件技术有限公司面试问题与解答(0)——面试感悟与问题记录本文对于中移(苏州)软件技术有限公司面试问题中的“(11)Linux进程调度参数
调优
是如何通过代码实际完成的?”
蓝天居士
·
2024-01-31 09:37
面试
面试
py
spark
学习-
spark
.sql.functions 聚合函数
https://
spark
.apache.org/docs/3.4.1/api/python/reference/py
spark
.sql/functions.html1.approx_count_distinct
heiqizero
·
2024-01-31 08:02
spark
spark
【
Spark
系列6】如何做SQL查询优化和执行计划分析
Apache
Spark
SQL使用Catalyst优化器来生成逻辑执行计划和物理执行计划。逻辑执行计划描述了逻辑上如何执行查询,而物理执行计划则是
Spark
实际执行的步骤。
周润发的弟弟
·
2024-01-31 08:01
spark
sql
大数据
【
Spark
系列5】Dataframe下常用算子API
Apache
Spark
DataFrameAPI提供了丰富的方法来处理分布式数据集。以下是一些常见的DataFrameAPI类别和方法,但这不是一个完整的列表,因为API非常广泛。
周润发的弟弟
·
2024-01-31 08:31
从零开始搞大数据
spark
大数据
分布式
中间件系列 - Kafka3.x从入门到精通
前言学习视频:【尚硅谷】Kafka3.x教程(从入门到
调优
,深入全面)本内容仅用于个人学习笔记,如有侵扰,联系删除1Kafka概述1.1定义Kafka传统定义:Kafka是一个分布式的基于发布/订阅模式的消息队列
代码的知行者
·
2024-01-31 08:58
中间件
中间件
(一)Py
Spark
3:安装教程及RDD编程(非常详细)
目录一、py
spark
介绍二、Py
Spark
安装三、RDD编程1、创建RDD2、常用Action操作①collect②take③takeSample④first⑤count⑥reduce⑦foreach⑧countByKey⑨saveAsTextFile3
唯余木叶下弦声
·
2024-01-31 08:57
大数据
python
python
spark
spark-ml
pyspark
Spark
性能
调优
Spark
性能
调优
executor内存不足用`UNIONALL`代替`UNION`persist与耗时监控executor内存不足问题表现1:Containerxxisrunningbeyondphysicalmemorylimits.Currentusage
HanhahnaH
·
2024-01-31 08:26
Spark
spark
大数据
分布式
Spark
如何用累加器Accumulator收集日志
Spark
如何用累加器Accumulator收集日志Accumulator如何使用Accumulator收集日志
Spark
任务的实际运算是交由众多executor来执行的,如果再执行算子内部打印日志,是需要到对应的
HanhahnaH
·
2024-01-31 08:03
Spark
spark
大数据
分布式
32个Java面试必考点-09(下)MySQL
调优
与最佳实践
详解MySQL下面来学习互联网行业使用最为广泛的关系型数据库MySQL,它的知识点结构图如下所示。常用SQL语句对于手写常用SQL语句,没有什么特殊的技巧,根据所列的语句类型多做一些练习就好。数据类型要知道MySQL都提供哪些基本的数据类型,不同数据类型占用的空间大小。可以按给出的分类进行记忆,不一一罗列。引擎介绍MySQL中主要的存储引擎。&MyISAM是MySQL官方提供的存储引擎,其特点是支
机智阳
·
2024-01-31 07:20
java
java
面试
mysql
后端
职场和发展
分布式虚拟文件系统,如何实现多种存储系统的融合
随着大数据技术和人工智能技术的发展,各种框架应运而生,比如大数据领域中的MapReduce和
Spark
,人工智能领域中的TensorFlow和PyTorch等。
数据存储张
·
2024-01-31 07:20
分布式
深入解析MySQL数据库锁机制
IntentionSharedLock)4.意向排它锁(IntentionExclusiveLock)5.记录锁三、MySQL锁的实现方式1.两阶段锁协议2.锁的存储结构4.死锁检测和超时处理5.实际应用四、锁的优化和性能
调优
喔的 喔的嘛呀
·
2024-01-31 07:33
数据库
mysql
大数据-
Spark
-关于Json数据格式的数据的处理与练习
上一篇:大数据-MapReduce-关于Json数据格式的数据的处理与练习-CSDN博客16.7Json在
Spark
中的引用依旧利用上篇的数据去获取每部电影的平均分{"mid":1,"rate":6,"
王哪跑nn
·
2024-01-31 06:50
大数据
spark
大数据
spark
json
大数据开发:hadoop系统搭建以及
spark
编程
csdn这个坑先留着…传送门:https://github.com/louxinyao/Hadoop-
spark
墨染枫
·
2024-01-31 06:47
大数据开发
大数据
分布式
hadoop
spark
2024.1.25 Object_basic 用户画像标签开发过程 面向对象定义基类
/usr/bin/envpython#@desc:__coding__="utf-8"__author__="bytedance"frompy
spark
.sqlimport
Spark
Session,DataFramefrompy
spark
.sql.typesimportStringTypefr
白白的wj
·
2024-01-31 06:03
python
大数据
spark
database
elasticsearch
2024.1.20 用户画像标签开发,面向过程方法
/usr/bin/envpython#@desc:__coding__="utf-8"__author__="bytedance"frompy
spark
.sqlimport
Spark
Session,DataFramefrompy
spark
.sql.typesimportStringTypefromcom.bytedance.tag.base.parse_ruleimportEsMetaimpo
白白的wj
·
2024-01-31 06:32
python
大数据
hadoop
elasticsearch
spark
大数据存储与处理技术之
Spark
1、
Spark
简介•
Spark
最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序•2013年
Spark
小嘤嘤怪学
·
2024-01-31 05:28
spark
hadoop
2024.1.30
Spark
SQL的高级用法
目录1、如何快速生成多行的序列2、如何快速生成表数据3.开窗函数排序函数平分函数聚合函数向上向下窗口函数1、如何快速生成多行的序列--需求:请生成一列数据,内容为1,2,3,4,5仅使用select语句selectexplode(split('1,2,3,4,5',','))asnum;--需求:请生成一列数据,内容1~100python中有一个函数range(1,100)--SQL函数:http
白白的wj
·
2024-01-31 05:56
spark
sql
大数据
database
hive
数据仓库
数据库
Structured Streaming 基于 event-time 的窗口(Java语言)
在这种机制下,即不必考虑
Spark
陆续接收事件的顺序是否与事件发生的顺序一致,也不必考虑事件到达
Spark
的时间与事件发生时间的关系。因此,它在提高数据处理精度的同时,大大减少了开发者的工作量。
2301_79479951
·
2024-01-31 00:19
java
开发语言
spark
启动bin/
spark
-shell警告:WARN NativeCodeLoader: Unable to load native-hadoop library for your platform.
启动bin/
spark
-shell警告:WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
2301_79479951
·
2024-01-31 00:18
spark
hadoop
大数据
CMS如何
调优
业务JVM频繁FullGC如何排查原则是先止损,再排查。FGC的原因是对象晋升失败或者并发模式失败,原因都是老年代放不下晋升的对象了。1.可能是大对象导致的内存泄漏。快速排查方法:观察数据库网络IO是否和FGC时间点吻合,找到对应的SQL和代码。分析内存dump。可以使用jvisualvm查看,TODO需要了解分析工具中指标的含义,这种方式定位的时间比较长。https://cloud.tencen
ZyyIsPig
·
2024-01-30 23:53
jvm
java
机器学习 | 掌握 K-近邻算法 的理论实现和
调优
技巧
目录初识K-近邻算法距离度量K值选择kd树数据集划分特征预处理莺尾花种类预测(实操)交叉验证与网格搜索初识K-近邻算法K-近邻算法(K-NearestNeighbor,KNN)是一种基本的分类和回归算法。它的基本思想是通过找出与新对象最近邻的K个训练数据,在分类时将新对象归类为出现频率最高的类别。这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法。定义:如果一个样
亦世凡华、
·
2024-01-30 22:47
#
机器学习
机器学习
近邻算法
人工智能
k-近邻算法
MySql
调优
(一)综述
3、修改大数据批量修改4、查询可优化空间较多,见MySql
调优
(三)SQL优化_mysql优化器可优化的sql类型-CSDN博客
w_t_y_y
·
2024-01-30 22:45
关系型数据库MySQL
mysql
数据库
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset 以及DataFrame 的转换
003-90-16【
Spark
SQL&DF&DS】慈航寺庙山脚下八卦田旁油菜花海深处人家王二爷家女儿大红用GPT学习Rdd和Dataaset以及DataFrame的转换【
Spark
SQL&DF&DS】Dataset
一杯派蒙
·
2024-01-30 21:31
spark
gpt
学习
spark
大数据
分布式
Spark
SQL之函数解析
!!expr-Logicalnot.不的意思Examples:>SELECT!true;false>SELECT!false;true>SELECT!NULL;NULLSince:1.0.0!=expr1!=expr2-Returnstrueifexpr1isnotequaltoexpr2,orfalseotherwise.如果expr1不等于expr2则返回true,否则返回false。Argu
OnePandas
·
2024-01-30 21:00
Spark
spark
kafka学习笔记二
课程地址:【尚硅谷】Kafka3.x教程(从入门到
调优
,深入全面)_哔哩哔哩_bilibili讲解版本:kafka3.x;时长13小时官网:ApacheKafkaKafka2.8.0以后也可以配置不采用
薛薛哦
·
2024-01-30 21:25
分布式
kafka
JVM垃圾回收与性能
调优
那我就就对最近一直用的jvm性能
调优
方法介绍一下,这可是java程序都要涉及的:1.JVM的gc概述,刚开始测试的时候,根本就不知道这个到底是什么意思,所以就没对这个指标进行统计,但是后来发现这是一个很重要的指标
满龙林
·
2024-01-30 21:16
从术语到
Spark
,10篇必读大数据学习资源
本文给想进入大数据领域的朋友提供了一系列的资源,由浅入深,比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个必须要参加的大数据会议”等有趣的话题。相信各种背景的朋友都会在这篇文章中有所收获。之前,我们已就数据可视化进行了深入探讨。这次,我们将从更基本的概念讲起,以便在涉足更复杂的数据科学和商业智能之前能够真正理解大数据。文中会引领大家阅读介绍大数据的相关文章,研究网络上流
大数据的时代
·
2024-01-30 20:34
Spark
Submit提交时,Json字符串作为参数
今天遇到一个把json作为参数传入
spark
程序中的问题原因如下,
Spark
源码中会对把}}和{{替换掉@VisibleForTestingpublicstaticStringexpandEnvironment
南修子
·
2024-01-30 19:21
Spark
读取、写入时序数据库TDengine以及TDengine概述
一、TDengine是什么TDengine是一款高性能、分布式、支持SQL的时序数据库,其核心代码,包括集群功能全部开源(开源协议,AGPLv3.0)。TDengine能被广泛运用于物联网、工业互联网、车联网、IT运维、金融等领域。除核心的时序数据库功能外,TDengine还提供缓存、数据订阅、流式计算等大数据平台所需要的系列功能,最大程度减少研发和运维的复杂度。1.TDengine总结出了物联网
Alex_81D
·
2024-01-30 18:10
数据库
大数据基础
时序数据库
PDF如何提取页面
操作软件:旋风PDF编辑器下载地址:http://www.679
spark
le.com/pdfeditor1.下载旋风PDF编辑器安装完之后,点击右下角的打开文件按钮
六号_db7a
·
2024-01-30 18:24
如何接手一个大数据项目
以下是个人的一些思考总结:了解一个大数据系统,我认为需要从以下几个方面入手:宏观方面:1.了解系统的整体架构和技术栈:需要了解系统中使用的技术栈,包括各种大数据组件和工具,例如Hadoop、
Spark
、
Mmj666
·
2024-01-30 15:19
大数据
Spark
的核心RDD(Resilient Distributed Datasets弹性分布式数据集)
Spark
的核心RDD(ResilientDistributedDatasets弹性分布式数据集)铺垫在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念
fcyh
·
2024-01-30 15:46
Spark
Spark
RDD(弹性分布式数据集)
1.RDD1.1RDD是什么RDD(ResilientDistributedDataset):弹性分布式数据集,是
Spark
对数据集的抽象,代表一个只读、不可变、可分区、其中元素可进行并行计算的集合,并且是可跨越集群节点进行并行操作的有容错机制的集合
JOEL-T99
·
2024-01-30 15:15
BigData
spark
RDD
理解
Spark
中RDD(Resilient Distributed Dataset)
文章目录1RDD基础1.1分区1.2不可变1.3并行执行2RDD结构2.1
Spark
Context、
Spark
Conf2.2Partitioner2.3Dependencies2.4Checkpoint
小何才露尖尖角
·
2024-01-30 15:45
Spark
spark
RDD
弹性分布式数据集
依赖关系
RDD结构
Spark
RDD基础实战(弹性分布式数据集)
http://
spark
.apache.org/docs/latest/sql-data-sources-json.htmlhttp://jsonlines.org/examples/官网的准备的数据集合启动
蜗牛杨哥
·
2024-01-30 15:14
Spark
RDD编程实战指南
大数据
Spark
弹性分布式数据集(Resilient Distributed Dataset)
1.弹性分布式数据集RDD1.1.RDD概述1.1.1.什么是RDDRDD(ResilientDistributedDataset)叫做分布式数据集,是
Spark
中最基本的数据抽象,它代表一个不可变、可分区
你狗
·
2024-01-30 15:14
大数据
scala
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他