E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
面试官:我就问了一个JVM性能
调优
,没想到他能吹半个小时
一、JVM内存模型及垃圾收集算法1.根据Java虚拟机规范,JVM将内存划分为:New(年轻代)Tenured(年老代)永久代(Perm)其中New和Tenured属于堆内存,堆内存会从JVM启动参数(-Xmx:3G)指定的内存中分配,Perm不属于堆内存,由虚拟机直接分配,但可以通过-XX:PermSize-XX:MaxPermSize等参数调整其大小。年轻代(New):年轻代用来存放JVM刚分
程序员麦冬
·
2023-11-20 17:38
2019-09-06bigo面试
4、说一下协同过滤,推荐系统5、层级softmax和softmax精度差别6、
spark
的知识要准备一下小米:1、FM,怎么做的矩阵分解,介绍一下链接:https://www.nowcoder.com/
小小肖肖冲鸭
·
2023-11-20 17:06
2023.11.17 -hivesql
调优
,数据压缩,数据存储
目录1.hive命令和参数配置2.hive数据压缩3.hive数据存储0.原文件大小18.1MB1.textfile行存储格式,压缩后size:18MB2.行存储格式:squencefile,压缩后大小8.89MB3.列存储格式orc-ZILIB,压缩后大小2.78MB4.列存储格式orc-snappy,压缩后大小3.75MB5.列存储格式之parquets,压缩后大小13.09MB4.在linu
白白的wj
·
2023-11-20 16:33
hive
hadoop
数据仓库
sql
大数据
数据库
database
Spring Boot项目优化和JVM
调优
项目
调优
作为一名工程师,项目
调优
这事,是必须得熟练掌握的事情。在SpringBoot项目中,
调优
主要通过配置文件和配置JVM的参数的方式进行。
Java天天
·
2023-11-20 14:51
一文学会使用Scala
IntroduceScala上一门纯面向对象的函数式编程语言,其主要贡献以及备受欢迎大概是因为其是
Spark
的开发语言(个人观点)。
算法小白_gyl
·
2023-11-20 13:47
计算机
云计算
编程语言
三十分钟学会SCALA
可以让程序短小精悍,看起来更简洁,更优雅;Scala是静态类型的:Scala拥有非常先进的静态类型系统,支持类型推断和模式匹配等;Scala可以开发大数据应用程序:例如
Spark
、Flin
地球魔
·
2023-11-20 12:04
数据库
大数据
scala
AIGC创作系统ChatGPT源码,支持最新GPT-4-Turbo模型,支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-20 12:37
人工智能
AIGC
ChatGPT
人工智能
AIGC
chatgpt
07-Hive优化---高级部分3
一、Hive优化大数据的学习:1、学习工具及其原理(50%~70%)2、学习重要的(java、scala、python、sql[mysql\hivesql\
spark
sql\flinksql])(30%
YuPangZa
·
2023-11-20 12:24
大数据
hive
hadoop
数据仓库
大数据流处理框架:
Spark
Streaming与Storm
Hadoop之后,
Spark
和Storm在流处理上成为对手。今天的大数据入门分享,我们就主要来讲讲,流处理框架
Spark
Streaming与Storm。
成都加米谷大数据
·
2023-11-20 12:20
LLM模型-讯飞星火与百度文心api调用
spark
-wenxin1-讯飞星火1_1-
Spark
Api.py1_2-Chat_
spark
.py1_3-调用api2-百度文心2_1.code3-两者之间比较与openai1-讯飞星火进入讯飞官网进行创建应用
Elvis_hui
·
2023-11-20 10:39
AI
百度
python
开发语言
Linux常见系统
调优
方法
目录一.关闭不必要的开机自启程序二.修改国外yum源为国内yum源1.备份本地默认yum源2.下载阿里云的yum源配置文件并改名3.清理并生成缓存,效验结果三.修改主机名1.临时修改主机名2.永久修改主机名①.命令修改②.配置文件修改四.修改网卡名1.查看网卡信息2.修改/etc/default/grub配置文件3.重命名/etc/sysconfig/network-scripts网卡配置文件4.
ChiZB
·
2023-11-20 08:03
linux
服务器
运维
系统安全
安全
网络
Java性能优化最佳实践,附答案
一,阿里巴巴面试题二,百度面试题三,蚂蚁金服面试题四,美团面试题五,携程面试题六,所有面试题所得结论通过面试题来看,可以看出目前互联网公司面试考点为:性能
调优
、算法数据机构高并发下数据安全、接口冪等性、
最新Java面经
·
2023-11-20 08:01
程序员
面试
后端
java
机器学习模型开发必读:开源数据库最全盘点
类似于TensorFlow、Torch和
Spark
这样的开源工具,在AI开发者群体中已是无处不在。
isuccess88
·
2023-11-20 07:57
机器学习
机器学习
开源数据
大数据学习(22)-
spark
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦
Spark
是一个基于内存计算的大数据并行计算框架,具有快速、易用
viperrrrrrr
·
2023-11-20 07:23
大数据
学习
spark
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2023-11-20 06:12
Hive
调优
1.参数配置优化设定Hive参数有三种方式:(1)配置Hive文件当修改配置Hive文件的设定后,对本机启动的所有Hive进程都有效,因此配置是全局性的。一般地,Hive的配置文件包括两部分:a)用户自定义配置文件:$HIVE_CONF_DIR/hive-site.xmlb)默认配置文件:$HIVE_CONF_DIR/hive-default.xml.template#当用户自定义配置后,会覆盖默
祈愿lucky
·
2023-11-20 06:33
大数据
hive
hadoop
数据仓库
【转】YARN的Memory和CPU
调优
配置详解
转载地址:http://blog.itpub.net/30089851/viewspace-2127851/
白面葫芦娃92
·
2023-11-20 04:55
Spark
系列之
Spark
Submit提交任务到YARN
title:
Spark
系列第十三章
Spark
Submit提交任务到YARN13.1
Spark
Submit提交的一些参数解释local本地单线程local[K]本地多线程(指定K个内核)local[*]本地多线程
落叶飘雪2014
·
2023-11-20 04:28
Spark
数据计算
Spark
大数据
Scala_scopt 解析命令行参数
一、说明1、在做
spark
项目时,在命令行提交任务时,可以利用--参数名:参数进行动态传参;2、操作步骤(1)首先写个表示配置的caseclass类,里面为每一个参数指定默认值;(2)Config配置对象作为参数传递给
郝少
·
2023-11-20 04:53
Spark技术经验
大数据
scopt
spark
scala
Failed to execute goal net.alchim31.maven:scala-maven-plugin:3.2.2:testCompile问题解决
解决方法1转载:http://www.cnblogs.com/war3blog/p/7864804.html在编译
spark
源码的时候老师报类似的错误然后在
spark
文件夹下的pom.xml里加入如下依赖
xiaoliuyiting
·
2023-11-20 03:51
spark
IDEA+Maven构建scala项目【一篇就够】
一、新建项目输入项目名称:
Spark
Demo_WordCount,点击“完成”项目创建成功,如下所示:"C:\ProgramFiles\Java\jdk1.8.0_45\bin\java"-Dmaven.multiModuleProjectDirectory
sjmz30071360
·
2023-11-20 03:48
Spark
Process exited with an error: -10000 (Exit value: -10000) 以error: java.lang.StackOverflowError为起源
Processexitedwithanerror:-10000(Exitvalue:-10000)1.问题描述编译一段
spark
-scala程序时,打包文件失败,由于之前也偶发性存在这种问题,关闭其他应用
我真的有在变好
·
2023-11-20 03:18
java
scala
开发语言
net.alchim31.maven:scala-maven-plugin:maven依赖无法下载或无法编译
背景:测试
spark
代码时,部分类无法正常导入,具体原因是部分maven依赖没有下载下来,导致类无法正常导入;原因:package默认只处理java源代码的编译、打包,而不管scala;解决方法:mvncleanscala
东耳飘雪
·
2023-11-20 03:45
每日随笔
spark
双十一空
调优
惠力度大吗?双十一买空调合适吗?
双十一空
调优
惠力度大吗?双十一买空调合适吗?每年的双十一都是购物狂欢的时刻,众多电商平台都推出了各种促销活动。我们常见的家电空调在双十一期间真的有大幅度的优惠吗?双十一这个时间节点购买空调是否明智呢?
专注优惠省钱
·
2023-11-20 03:54
【图数据库实战】HugeGraph架构
OLAP计算是基于
Spark
GraphX实现。二、组件HugeGraph的主要功能分为HugeC
码农丁丁
·
2023-11-20 02:15
后端技术
#
大数据
#
数据库
数据库
架构
图数据库
HugeGraph
大数据流式处理框架Flink介绍
1、Flink的介绍随着数据的飞速发展,出现了很多热门的开源社区,比如:hadoop、
spark
、storm社区,他们都有各自专注的适用场景,比如hadoop主要是做数据的存储及批处理计算,
spark
既可以做批处理也可以做准实时计算
大数据动物园
·
2023-11-20 01:57
大数据flink学习及问题解决
大数据
大数据常见面试题及答案
大特性:2、Hive分桶和分区的区别:3、Hive表动态分区和静态分区4、一个Hive表,数据量很大,分布在集群的100个节点,现在需要定期取top100,如何设计/实现:5、窗口函数6、hivesql和
spark
sql
遐想者csdn
·
2023-11-20 01:18
大数据
hadoop
spark
hdfs
mapreduce
大数据
luajit开发文档中文版(一)下载和安装
LuaJIT扩展luajit开发文档中文版(三)FAQ常见问题luajit开发文档wiki中文版(一)总目录luajit开发文档wiki中文版(二)LuaJIT扩展luajit开发文档wiki中文版(三)性能
调优
和测试
zh7314
·
2023-11-20 01:05
lua
开发语言
hive lateral view explode列拆分与行转列用法
先创建一张临时表供测试,sql如下:--执行引擎:
spark
引擎--1.创建表createtabletmp.tmp1(book_namestri
平凡的大数据之路
·
2023-11-20 00:03
hive
hadoop
数据仓库
Hive参数与性能企业级
调优
(建议收藏)
但是如果我们只局限于会使用Hive,而不考虑性能问题,就难搭建出一个完美的数仓,所以Hive性能
调优
是我们大数据从业者必须掌握的技能。本文将给大家讲解Hive性能
调优
的一些方法及技巧。
坨坨的大数据
·
2023-11-19 23:58
最全JVM与性能
调优
知识点总结,看看哪些是你还没掌握的?
前言JVM
调优
是每个高级程序员的必修课,在本章中,我会从发展过程以及核心价值来剖析JVM的体系结构。
前程有光
·
2023-11-19 23:16
大数据组件
spark
hadoop hive简单介绍
spark
单机启动
spark
-shell集群启动/usr/local/
spark
-2.4.5-bin-hadoop2.7/sbin/start-all.sh提交任务1.打包python环境:whereispython
转身之后才不会
·
2023-11-19 23:29
大数据
hadoop
大数据
spark
AIGC创作系统ChatGPT源码,AI绘画源码,支持最新GPT-4-Turbo模型,支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-19 22:09
AIGC
人工智能
软件源码
chatgpt
AIGC
AI作画
人工智能
huggingface transfromers基于预训练模型进行
调优
以Resnet为例,找到了一个微软的resnet-50的预训练模型fromtransformersimportAutoImageProcessor,ResNetForImageClassification#加载前处理处理器,自动构建;功能:输入图片,输出Tenser(1,3,224,224)processor=AutoImageProcessor.from_pretrained("microsof
onmeiei
·
2023-11-19 22:22
2011-2022年高职大数据竞赛-赛题内容
-离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化第一部分竞赛内容赛项以大数据技术与应用为核心内容和工作基础,重点考查参赛选手基于
Spark
xlw2003
·
2023-11-19 21:54
大数据
Spark
hadoop
flink
高职大数据竞赛
2011-2022年高职大数据竞赛-赛题任务剖析
离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化(一)任务一:大数据平台环境搭建具体内容按照大数据分析平台需求,需要完成Hadoop完全分布式、
Spark
xlw2003
·
2023-11-19 21:54
Spark
Flink
hadoop
spark
flume
kafka
flink
电商大数据分析案例(Hadoop+Hive+
Spark
+Azkaban+Spring MVC+ECharts)
项目描述某著名电商平台双十一美妆销售数据分析。由于是真实的商业数据,所以做了脱敏处理,数据集中对店名的引用被处理为产品的品牌名以保护店家隐私。。通过对该平台双十一美妆销售数据的品牌、销量、热度等特征的分析(平台视角和用户视角),尝试探索以下问题:双十一期间,最受消费者青睐的产品或品牌是哪些?双十一期间,美妆行业各品类的销售情况?双十一期间,消费高峰何时出现?双十一期间,客户的评论数对销量的影响?.
xlw2003
·
2023-11-19 21:53
Spark
hive
Hadoop
hive
spark
hadoop
Spark
SQL
spring
Doris Routine Load接入Kafka0.8.0实战
DorisRoutineLoad接入Kafka0.8.0实战想要更全面了解
Spark
内核和应用实战,可以购买我的新书。
wangleigiser
·
2023-11-19 21:48
Doris
kafka
大数据
java
MySQL进阶_8.数据库其他
调优
策略
文章目录第一节、数据库
调优
的步骤1.1、选择合适的DBMS1.2、优化表设计1.3、优化逻辑查询1.4、优化物理查询1.5、使用Redis或Memcached作为缓存1.6、库级优化第二节、优化MySQL
珍珠是蚌的眼泪
·
2023-11-19 21:44
MySQL
mysql
数据库调优
读写分离
大表优化
分库分表
【
Spark
深入学习 02】- 我是一个凶残的
spark
学一门新鲜的技术,其实过程都是相似的,先学基本的原理和概念,再学怎么使用,最后深究这技术是怎么实现的,所以本章节就带你认识认识
spark
长什么样的,帅不帅,时髦不时髦(这货的基本概念和原理),接着了解
spark
weixin_34055910
·
2023-11-19 21:47
大数据
Python大数据之linux学习总结——day10_hive
调优
hive
调优
hive
调优
hive命令和参数配置1.hive数据压缩压缩对比开启压缩2.hive数据存储[练习]行列存储原理存储压缩比拓展dfs-du-h3.fetch抓取4.本地模式5.join的优化操作
笨小孩124
·
2023-11-19 20:50
hive
学习总结
大数据
python
linux
那个陪我打王者的兄弟进了阿里
百世物流专场一面线上SQL
调优
经验。
调优
的惯用思路。索引为什么采用
艾小仙人
·
2023-11-19 19:14
【jvm】MinorGC、MajorGC和FullGC
目录一、说明二、年轻代GC(MinorGC)触发机制三、老年代GC(MajorGC/FullGC)触发机制四、FullGC触发机制一、说明1.jvm
调优
的主要目的是GC的时间少一些,用户线程执行的时间多一些
王佑辉
·
2023-11-19 18:01
jvm
jvm
flink原理实战与性能优化 pdf_三万字长文 |
Spark
性能优化实战手册
本文分为四个部分,基本涵盖了所有
Spark
优化的点,面试和实际工作中必备。
weixin_39685697
·
2023-11-19 18:07
flink原理实战与性能优化
pdf
spark算子
spark
性能
调优
之合理的并行度设置
Spark
性能
调优
之合理设置并行度1.
Spark
的并行度指的是什么?
spark
作业中,各个stage的task的数量,也就代表了
spark
作业在各个阶段stage的并行度!
浪子城
·
2023-11-19 18:07
大数据
spark优化
大数据
Spark
性能
调优
之合理设置并行度
1.
Spark
的并行度指的是什么?
spark
作业中,各个stage的task的数量,也就代表了
spark
作业在各个阶段stage的并行度!
跳跃的list
·
2023-11-19 18:06
spark
spark
调优
【
Spark
】|【
Spark
性能
调优
】|【设置并行度】|【
Spark
多配置优先级】|【总结】
一、【关于
Spark
并行度】1.什么是
Spark
的并行度?
Haven.Liu
·
2023-11-19 18:35
Spark
Spark
性能调优
task并行度
配置读取优先级
spark
性能
调优
| 默认并行度
Spark
Sql默认并行度看官网,默认并行度200https://
spark
.apache.org/docs/2.4.5/sql-performance-tuning.html#other-configuration-options
Knight_AL
·
2023-11-19 18:04
Spark优化
spark
大数据
分布式
Spark
性能
调优
之并行度设置
Spark
性能
调优
之并行度设置
Spark
作业中的并行度什么是并行度
Spark
在每一个stage中task数量,就称为这个stage上的并行度;为什么要设置并行度如果你按照集群能给的最大资源给当前
Spark
fffalconer
·
2023-11-19 18:04
Spark
spark
大数据
大数据之
Spark
:
Spark
数据倾斜
目录1.预聚合原始数据1.避免shuffle过程2.增大key粒度(减小数据倾斜可能性,增大每个task的数据量)2.预处理导致倾斜的key1.过滤2.使用随机key3.sample采样对倾斜key单独进行join3.提高reduce并行度1.reduce端并行度的设置2.reduce端并行度设置存在的缺陷4.使用mapjoin1.核心思路:2.不适用场景分析:数据倾斜:就是数据分到各个区的数量不
浊酒南街
·
2023-11-19 17:23
大数据系列三
big
data
spark
hive
上一页
69
70
71
72
73
74
75
76
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他