E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark系统性学习专栏
Linux——系统优化
https://blog.csdn.net/li_wen01/article/details/82699167系统调优概述系统的运行状况:CPU->MEM->DISK*->NETWORK->应用程序调优
系统性
能优化的
@小官人^
·
2024-03-19 14:25
Spark
Q&A
A:从
Spark
2.1开始,你可以通过启用
spark
.sql.files.ignoreCorruptFiles选项来忽略损毁的文件。
耐心的农夫2020
·
2024-03-19 00:12
读《重塑心灵》,悟个人与企业系统关系
系统动力派NLP的创始人李中莹先生在他的《重塑心灵》中写到:一个人生于宇宙之间,不可能脱离其它人事物的影响,也不可能完全不影响其他人,因此只有充分尊重这种
系统性
才能摆正自己的位置,达到天人合一,内外和谐的境界
猫咪06
·
2024-03-18 16:24
大语言模型(LLM)入门学习路线图
这份资料重点介绍了我们应该掌握哪些核心知识,并推荐了一系列优质的学习视频和博客,旨在帮助大家
系统性
地掌握大型语言模型的相关技术。大语言模型(LargeLanguageM
Kk-Quiana
·
2024-03-17 19:28
语言模型
学习
人工智能
linux安装单机版
spark
3.5.0
一、
spark
介绍是一种通用的大数据计算框架,正如传统大数据技术Hadoop的MapReduce、Hive引擎,以及Storm流式实时计算引擎等.
Spark
主要用于大数据的计算二、
spark
下载
spark
3.5.0
爱上雪茄
·
2024-03-17 18:57
大数据
JAVA知识
spark
大数据
分布式
嵌入式驱动学习第三周——Linux网络基础调试命
嵌入式驱动
学习专栏
将详细记录博主学习驱动的详细过程,未来预计四个月将高强度更新本专栏,喜欢的可以关注本博主并订阅本专栏,一起讨论一起学习。现在关注就是老粉啦!
亭墨
·
2024-03-17 01:04
嵌入式驱动学习
学习
linux
网络
驱动开发
笔记
运维
服务器
《道德经》:天道无亲,常与善人。
以简明清晰的逻辑分析,
系统性
地概括书中的知识关联,不过度推理及过度化书中内容的态度去阐述书中知识。如有不当之处,还请读者们多多指正。上文品读了“弱之胜强,柔之胜刚”,老子再次提出“柔弱”的重要性。
海挽天文化传播
·
2024-03-16 19:28
Spark
的数据结构——RDD
RDD的5个特征下面来说一下RDD这东西,它是ResilientDistributedDatasets的简写。咱们来看看RDD在源码的解释。Alistofpartitions:在大数据领域,大数据都是分割成若干个部分,放到多个服务器上,这样就能做到多线程的处理数据,这对处理大数据量是非常重要的。分区意味着,可以使用多个线程了处理。Afunctionforcomputingeachsplit:作用在
bluedraam_pp
·
2024-03-14 08:32
Spark
spark
数据结构
大数据
大数据开发(
Spark
面试真题-卷一)
大数据开发(
Spark
面试真题)1、什么是
Spark
Streaming?简要描述其工作原理。2、什么是
Spark
内存管理机制?请解释其中的主要概念,并说明其作用。
Key-Key
·
2024-03-13 07:58
大数据
spark
面试
基于HBase和
Spark
构建企业级数据处理平台
摘要:在中国HBase技术社区第十届Meetup杭州站上,阿里云数据库技术专家李伟为大家分享了如何基于当下流行的HBase和
Spark
体系构建企业级数据处理平台,并且针对于一些具体落地场景进行了介绍。
weixin_34071713
·
2024-03-12 22:44
大数据
数据库
爬虫
lightGBM专题4:py
spark
平台下lightgbm模型保存
之前的文章(py
spark
lightGBM1和py
spark
lightGBM2)介绍了py
spark
下lightGBM算法的实现,本文将重点介绍下如何保存训练好的模型,直接上代码:frompy
spark
.sqlimport
Spark
Sessionfrompy
spark
.ml.featureimportStringIndexer
I_belong_to_jesus
·
2024-03-12 12:30
大数据
为什么要使用ElasticSearch?
5.实时监控:帮助企业实时监测
系统性
能,监控数据变化,以保证系统正常运行。6
z.jiaminf
·
2024-03-12 06:52
ElasticSearch
elasticsearch
大数据
搜索引擎
大数据开发(
Spark
面试真题-卷六)
大数据开发(
Spark
面试真题)1、
Spark
HashPartitioner和RangePartitioner的实现?
Key-Key
·
2024-03-12 02:16
大数据
spark
面试
大数据开发(Hadoop面试真题-卷二)
6、
Spark
为什么比MapReduce更快?7、详细描述一
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
坚持不懈以学增智,着力提升能力本领
要健全学习制度,加强对学习活动的动态管理,保证学习活动的经常性和学习内容的
系统性
。构建集体学和自主学相结合的灵活机制,每
gul819
·
2024-03-11 02:35
Spark
从入门到精通29:
Spark
SQL:工作原理剖析以及性能优化
Spark
SQL工作原理剖析1.编写SQL语句只要是在数据库类型的技术里面,例如MySQL、Oracle等,包括现在大数据领域的数据仓库,例如Hive。
勇于自信
·
2024-03-11 00:20
大数据开发(Hadoop面试真题-卷九)
3、
Spark
mapjoin的实现原理?4、
Spark
的stage如何划分?在源码中是怎么判断属于ShuffleMapStage或ResultStage的?5、
Spark
reduceByKe
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
Spark
Streaming(二):DStream数据源
1、输入DStream和Receiver输入(Receiver)DStream代表了来自数据源的输入数据流,在之前的wordcount例子中,lines就是一个输入DStream(JavaReceiverInputDStream),代表了从netcat(nc)服务接收到的数据流。除了文件数据流之外,所有的输入DStream都会绑定一个Receiver对象,该对象是一个关键的组件,用来从数据源接收数
雪飘千里
·
2024-03-09 01:28
Spark
常见问题汇总
注意:如果Driver写好了代码,eclipse或者程序上传后,没有开始处理数据,或者快速结束任务,也没有在控制台中打印错误,那么请进入
spark
的web页面,查看一下你的任务,找到每个分区日志的stderr
midNightParis
·
2024-03-08 03:25
spark
spark
Spark
Shop开源可商用,匹配小程序H5和PC端带分销功能!
Spark
Shop(星火商城)B2C商城是基于thinkphp6+elementui的开源免费可商用的高性能商城系统;包含小程序商城、H5商城、公众号商城、PC商城、App,支持页面diy、秒杀、优惠券
行动之上
·
2024-03-05 15:09
源码免费下载
小程序
架构面试题汇总:缓存(二)
7.问题:你如何评估缓存的效率和对
系统性
能的影响?8.问题:请描述一下你曾经
码到三十五
·
2024-03-04 20:15
面试
架构
java
面试
【Hadoop】在
spark
读取clickhouse中数据
clickhouse数据库数据importscala.collection.mutable.ArrayBufferimportjava.util.Propertiesimportorg.apache.
spark
.sql.SaveModeimportorg.apache.
spark
.sql.
Spark
SessiondefgetCKJdbcProperties
方大刚233
·
2024-03-03 06:54
Hadoop
Scala
hadoop
spark
clickhouse
Spark
-sql Adaptive Execution动态调整分区数量,调整输出文件数
有时间为了解决小文件问题,我们把
spark
.sql.shuffle.partitions这个参数调整的很小,但是随着时间的推移,数据量越来越大,当初设置的参数就不合适了,那有没有一个可以自我伸缩的参数呢
不想起的昵称
·
2024-03-02 15:03
hive
spark
hive
数据仓库
hive join中出现的数据暴增(数据重复)
我们来看一下案例:
spark
-sql>withtest1as>(select'10001'asuid,'xiaomi'asqid>unionall>select'10002'asuid,'huawei'asqid
不想起的昵称
·
2024-03-02 15:03
hive
大数据
hadoop
hive
hive四种常见的join
1.左连接leftjoin
spark
-sql>withtest1as(>select1asuser_id,'xiaoming'asname>unionall>select2asuser_id,'xiaolan'asname
不想起的昵称
·
2024-03-02 15:33
hive
大数据
hadoop
hdfs
hive
VMware负载均衡特性以及相关配置
如果管理员不能恰当地使用这些工具,那么就有可能导致严重的
系统性
能问题,比如在vSphere环
ducode
·
2024-02-29 11:49
运维
Spark
整合hive(保姆级教程)
准备工作:1、需要安装配置好hive,如果不会安装可以跳转到Linux下编写脚本自动安装hive2、需要安装配置好
spark
,如果不会安装可以跳转到
Spark
安装与配置(单机版)3、需要安装配置好Hadoop
万家林
·
2024-02-29 09:47
spark
hive
spark
hadoop
在
Spark
数据导入中的一些实践细节
best-practices-import-data-
spark
-nebula-graph本文由合合信息大数据团队柳佳浩撰写1.前言图谱业务随着时间的推移愈发的复杂化,逐渐体现出了性能上的瓶颈:单机不足以支持更大的图谱
NebulaGraph
·
2024-02-27 07:53
Spark
开发_简单DataFrame判空赋值逻辑
valtable1="实时转存数据"valtable2="历史存hdf数据"valdfin1=inputRDD(table1).asInstanceOf[org.apache.
spark
.sql.DataFrame
Matrix70
·
2024-02-26 22:06
Spark开发_工作
spark
大数据
分布式
Spark
SQL编程指南
Spark
SQL编程指南
Spark
SQL是用于结构化数据处理的一个模块。同
Spark
RDD不同地方在于
Spark
SQL的API可以给
Spark
计算引擎提供更多地信息,例如:数据结构、计算算子等。
<>=
·
2024-02-26 05:46
spark
android 内存泄漏(多文章摘录)
垃圾回收(GC)垃圾回收或GC(GarbageCollection),是一种自动的存储管理机制,它是Java语言的一大特性,把内存释放工作的压力都转让到了系统,故而是以消耗
系统性
能为代价的。
小浩_w
·
2024-02-25 10:32
第244篇 如何预测家庭教育的成功与失败?字数763
字数7632022年6月23日星期四培养孩子,是一个非常缓慢,非常复杂的
系统性
工程。所谓十年树木,百年树人。有没有一个简单、有效的,可以预测家庭教育成功或失败的方法呢?其实还真有。
家庭教育CEO
·
2024-02-23 14:59
2022-06-20
女排连输泰国、美国和日本不是偶然的,只能说女排是有难言之隐的而且是
系统性
的女排沦落至此,不是因为蔡斌的健康原因,而是女排“病”了如果说女排输美国,我们还能接受的话,是在意料之中的话。
英雄用武
·
2024-02-20 23:16
HarmonyOS4.0
系统性
深入开发35 弹性布局(Flex)
弹性布局(Flex)概述弹性布局(Flex)提供更加有效的方式对容器中的子元素进行排列、对齐和分配剩余空间。容器默认存在主轴与交叉轴,子元素默认沿主轴排列,子元素在主轴方向的尺寸称为主轴尺寸,在交叉轴方向的尺寸称为交叉轴尺寸。弹性布局在开发场景中用例特别多,比如页面头部导航栏的均匀分布、页面框架的搭建、多行数据的排列等等。图1主轴为水平方向的Flex容器示意图基本概念主轴:Flex组件布局方向的轴
程序员沙蛙
·
2024-02-20 22:05
鸿蒙系统
harmonyos
windows
intellij
idea
microsoft
HarmonyOS4.0
系统性
深入开发34栅格布局(GridRow/GridCol)
栅格布局(GridRow/GridCol)概述栅格布局是一种通用的辅助定位工具,对移动设备的界面设计有较好的借鉴作用。主要优势包括:提供可循的规律:栅格布局可以为布局提供规律性的结构,解决多尺寸多设备的动态布局问题。通过将页面划分为等宽的列数和行数,可以方便地对页面元素进行定位和排版。统一的定位标注:栅格布局可以为系统提供一种统一的定位标注,保证不同设备上各个模块的布局一致性。这可以减少设计和开发
程序员沙蛙
·
2024-02-20 22:33
harmonyos
windows
华为
运维
鸿蒙系统
Spring Boot 实现AOP功能
在我们的程序中,经常存在一些
系统性
的需求,比如权限校验、日志记录、统计等,这些代码会散落穿插在各个业务逻辑中,非常冗余且不利于维护。简单地去理解,其实AOP要做三类事
2017200502021
·
2024-02-20 19:34
spring
boot
java
spring
Pandas将单列XML格式数据转化为字典再拆分成多列 列表拆分成多列
单列XML扩展成多列遇到了个需求是需要把XML格式的数据拆分成多列的一个需求,本来需要使用
spark
进行处理的,但是没想到什么优雅的解决方案,所以打算先使用pandas找找感觉。样例数据如下所示。
aoyi1337
·
2024-02-20 18:22
python
人工智能学习与实训笔记(六):神经网络之智能推荐系统
人工智能专栏文章汇总:人工智能
学习专栏
文章汇总-CSDN博客本篇目录七、智能推荐系统处理7.1常用的推荐系统算法7.2如何实现推荐7.3基于飞桨实现的电影推荐模型7.3.1电影数据类型7.3.2数据处理
穿越光年
·
2024-02-20 17:30
人工智能技术学习
人工智能
学习
笔记
航班数据预测与分析
数据清洗:数据存储到HDFS:使用py
spark
对数据进行分析://数据导入frompy
spark
import
Spark
Contextfrompy
spark
.sqlimportSQLContextsc=
林坰
·
2024-02-20 16:15
大数据
spark
航班数据分析
杜艳辉
再聊阴影裁剪与高性能视锥剔除
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
·
2024-02-20 16:50
unity
spark
为什么比mapreduce快?
spark
为什么比mapreduce快?
·
2024-02-20 16:30
后端
分级阅读简单介绍
所谓分级阅读,就是按照孩子在不同年龄段的智力和心理发育程度为他们提供的阅读计划,这些阅读计划一般出自教育专家、专业出版社,比较具有科学性、针对性、
系统性
。
喜乐童书
·
2024-02-20 15:54
[CDH]
Spark
属性、内存、CPU相关知识梳理
version:2.4.0-cdh6.3.0文章目录
spark
properties常用配置
spark
task
spark
task使用的cpu核数
spark
architecture
spark
memory
spark
onyarn
枪枪枪
·
2024-02-20 15:24
Spark
spark
scala
big
data
民安智库如何做汽车满意度调查
汽车调研是一个
系统性
的过程,需要采用多种方法和工具,以便全面了解汽车市场的现状和趋势、不同品牌汽车的销售情况、消费者的购车需求和偏好等。
民安汇智
·
2024-02-20 14:06
人工智能
spark
CTAS nuion all (union all的个数很多)导致超过
spark
.driver.maxResultSize配置(2G)
背景该sql运行在
spark
版本3.1.2下的thriftserver下现象在运行包含多个union的
spark
sql的时候报错(该sql包含了50多个uinon,且每个union字查询中会包含join
鸿乃江边鸟
·
2024-02-20 13:29
Linux性能排查工具: dstat
但与传统的vmstat、iostat、mpstat等命令相比,dstat提供了一个更加灵活和统一的接口来监测和展示
系统性
能指标。
有谁看见我的剑了?
·
2024-02-20 13:18
linux
服务器
运维
Flink理论—Flink架构设计
它集成了所有常见的集群资源管理器,例如HadoopYARN,但也可以设置作为独立集群甚至库运行,例如
Spark
的StandaloneMode本节概述了Flink架构,并且描述了其主要组件如何交互以执行应用程序和从故障中恢复
不二人生
·
2024-02-20 12:59
#
Flink
理论
flink
大数据
普通人如何开启真正的赚钱之路
❤️3.Python爬虫专栏,
系统性
的学习爬虫的知识点。9.9元买不了吃亏,买不了上当。python爬虫入门进阶❤️4.Ceph实战,从原理到实战应有尽有。Ceph实战
码农飞哥
·
2024-02-20 10:23
副业探索
副业
个人IP
赚钱
《道德经》:以其不自生,故能长生。
以简明清晰的逻辑分析,
系统性
地构建书中的知识关联,不过度推理及过度神化书中内容的态度去阐述书中知识。如有不当之处,还请读者们多多指正。在上文品读了““道”,绵绵若存,用之不勤。”
海挽天文化传播
·
2024-02-20 10:46
大数据 -
Spark
系列《六》- RDD详解
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-20 10:55
spark
大数据
spark
分布式
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他