E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark系统性学习专栏
spark
sql 数据类型转换_
spark
sql时间类型转换以及其他
1.
spark
sql的日期转换一般使用两种形式第一种使用to_timestamp(REACHTIME1,"yyyy-MM-ddHH24:mi:ss")//它将字符串时间转换为日期类型例如2018-10-
weixin_39535527
·
2024-02-08 10:02
spark
sql
数据类型转换
Spark
streaming写入delta数据湖问题
但项目上线到生产环境,检查
spark
streaming的job,发现数据在merge写入到数据湖时,往往超过1小时。
kk_io
·
2024-02-08 10:01
疑难杂症
spark
大数据
分布式
Spark
streaming batch运行时间过长问题02
排查
Spark
streaming数据写入时间过长问题,一方面是因为程序写数据湖小文件问题。在解决了小文件问题后,还是不能达到预期的1分钟一个batch。
kk_io
·
2024-02-08 10:01
疑难杂症
spark
batch
大数据
企业
Spark
案例--酒店数据分析实战提交
第1关:数据清洗--过滤字段长度不足的且将出生日期转:packagecom.yyimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
cz学java
·
2024-02-08 10:30
spark
数据分析
大数据
Spark
的timestamp 数据时间问题
使用
Spark
来处理国际业务数据,涉及到数据时区转换,在实际项目中出现时区转换问题。
kk_io
·
2024-02-08 10:29
疑难杂症
spark
大数据
分布式
大数据毕业设计Py
Spark
+PyFlink航班预测系统 飞机票航班数据分析可视化大屏 机票预测 机票爬虫 飞机票推荐系统 大数据毕业设计 计算机毕业设计
博主介绍:✌全网粉丝100W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌由于篇幅限制,想要获取完整文章或者源码,或者代做,可以给我留言或者找我聊天。感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人。1.DrissionPage自动化Python爬虫工具采
B站计算机毕业设计超人
·
2024-02-08 09:17
大数据毕业设计
大数据
数据分析
hadoop
数据挖掘
爬虫
spark
flink
CEO的后备人才短缺必将成为企业快速发展的最大挑战
跨国公司的常态化做法是“领导人继任计划”,强调
系统性
和计划性,试图实现早期发现、早期培养。
大湾区CEO后备人才培养
·
2024-02-08 09:13
2019-01-10开营仪式
储君老师告诉我们越是碎片化时代越需要
系统性
学习,参加训练营就是
系统性
学习,而且不仅仅是学习excel,而是学习excel思维,主要是学习excel的底层逻辑,也就是基础和成为高手的思维,想要深入研究excel
4连夏天
·
2024-02-08 08:40
【项目实战】Flink+InfluxDB+Grafana实现对YARN集群队列资源进行画像
一、Flink实时计算第一章:Flink快速入门1.Flink架构2.Flink应用场景3.FlinkVS
Spark
4.实时计算技术选型第二章:Flink项目构建与测试1.快速构建Flink项目2.第一个
大数据研习社
·
2024-02-08 08:56
Flink
flink
Flink实时计算
可视化监控
InfluxDB
如何保持mac苹果电脑系统在最佳状态?不卡顿
在本文中,我们将分享一些如何清理苹果电脑更高效的方法,提高
系统性
能。如何清理苹果电脑,让mac始终保持最佳状态,我们可以采取以下措施。1.清理桌面如何清理苹果电脑?
CoCo玛奇朵
·
2024-02-08 08:40
macos
系统安全
数据库
经验分享
安全
spark
运行失败The directory item limit of /
spark
_dir/
spark
_eventLogs is exceeded: limit=1048576 items=104
org.apache.hadoop.hdfs.protocol.FSLimitException$MaxDirectoryItemsExceededException):Thedirectoryitemlimitof/
spark
_dir
不会吐丝的蜘蛛侠。
·
2024-02-08 08:58
Hadoop
spark
hadoop
hdfs
层次分析法(附实例)
-AHP问题:选择一部适合自己的手机一、确定评价对象与评价指标评价对象评价指标二、确定打分比较矩阵两两比较得到比较矩阵判断比较矩阵是否能通过一致性检验得分向量归一化处理求解得分向量打分矩阵模型评价优点
系统性
的分析方法简洁实用的决策方法所需定量数据信息较少缺点不能为决策提供新方案定量数据较少
陌雨’
·
2024-02-08 07:07
数学建模
Flink on Yarn的两种模式
首先,在集群运行时,可能会有很多的集群实例包括MapReduce、
Spark
、Flink等等,那么如果它们全基于onYarn就可以完成资源分配,减少单个实例集群的维护,提高集群的利用率。
GOD_WAR
·
2024-02-08 07:22
Flink
flink
yarn
flink
on
yarn
【MySQL】-11 MySQL 架构及优化原理
2MySQL逻辑架构整体分为三层:3MySQL查询过程MySQL整个查询执行过程,总的来说分为5个步骤:3.1客户端/服务端通信协议3.2查询缓存3.3查询优化3.4查询执行引擎3.5返回结果给客户端4查询
系统性
能
yinying293
·
2024-02-08 07:45
SQL
mysql
架构
adb
Flink流式数据倾斜
1.流式数据倾斜流式处理的数据倾斜和
Spark
的离线或者微批处理都是某一个SubTask数据过多这种数据不均匀导致的,但是因为流式处理的特性其中又有些许不同2.如何解决2.1窗口有界流倾斜窗口操作类似
Spark
orange大数据技术探索者
·
2024-02-08 07:58
#
flink迁移
flink
大数据
数据倾斜
大数据系列—数据迁移(Sqoop,Flume,DataX)对比学习(stage3)
个人大数据技术栈:DataX,Sqoop,Hadoop,Hive,
Spark
,Flink,Hbase,Kafka,Kettle,Azkaban,Airflow,Tableau…个人在学习领域:Python
道-闇影
·
2024-02-08 06:07
big
data
大数据
sqoop
flume
AI 提示词设计指南-图片
本指南深入研究了AI提示词的设计原则,以及如何通过巧妙选择和构建提示词,提升用户体验和
系统性
能。作为一名互联网从业者,您将在其中发现如何将人工智能引导至更精准、更贴近用户需求的方向。无论是推荐算法、
Young_svg
·
2024-02-08 06:28
程序人生
性能测试监控平台:InfluxDB+Grafana+Jmeter
因此如果有一个性能测试结果实时展示的页面,可以提高我们对
系统性
能表现的掌握程度,另一方面也提高了我们的测试效率。
测试界的路飞
·
2024-02-08 05:42
技术分享
软件测试
grafana
jmeter
GitHub获120k+star的阿里内网“疯传”葵花宝典JVM虚拟机调优指南
JVM性能调优有很多设置,这个参考JVM参数即可.主要调优的目的:控制GC的行为.GC是一个后台处理,但是它也是会消耗
系统性
能的,因此经常会根据系统运行的程序的特性来更改GC行为控制JVM堆栈大小.一般来说
写代码的珏秒秒
·
2024-02-08 05:32
Java
编程
程序员
jvm
java
算法
openGauss学习笔记-214 openGauss 性能调优-确定性能调优范围
正如“性能因素”小节所述,数据库性能受影响因素多,从而性能调优是一项复杂的工程,有些时候无法
系统性
地说明和解释
superman超哥
·
2024-02-08 05:53
openGauss学习笔记
openGauss
国产数据库
开源数据库
数据库
开源软件
Spark
安装(Yarn模式)
一、解压链接:https://pan.baidu.com/s/1O8u1SEuLOQv2Yietea_Uxg提取码:mb4htar-zxvf/opt/software/
spark
-3.0.3-bin-hadoop3.2
莫噶
·
2024-02-08 04:44
搭建
spark
大数据
分布式
图解大数据 | 大数据分析挖掘-
Spark
初步
图解大数据|大数据分析挖掘-
Spark
初步作者:韩信子@ShowMeAI教程地址:www.showmeai.tech/tutorials/8…本文地址:www.showmeai.tech/article-det
Dashesand
·
2024-02-08 03:22
大数据
数据分析
spark
遇见你真好
虽然没有能力全部掌握,但是,这一系列课程学习下来,让我知道了excel的知识和
系统性
。
裁裁缝缝
·
2024-02-08 03:09
docker数据科学与
spark
镜像源与使用常见问题疑难解答
以下是一些与数据挖掘和数据科学相关的Docker镜像源:jupyter/all-
spark
-notebook:此镜像包含JupyterNotebook和
Spark
的完整环境,用于
Spark
开发和学习。
DreamNotOver
·
2024-02-08 01:16
eureka
java
spring
cloud
Linux死机排查方法——内存日志
如果直接使用printk等打印排查问题,有可能会因为printk输出缓慢改变了系统运行的时序,导致问题无法复现,而且在中断里使用printk将大大降低
系统性
能。
Dokin丶
·
2024-02-08 01:15
Linux驱动
Linux
软件工具
linux
linux死机
linux死机排查
用docker 配置scala
spark
环境
要使用Docker配置Scala和
Spark
环境,您可以按照以下步骤进行操作。以下是一个基本的示例,您可能需要根据您的具体需求进行调整。安装Docker:在您的系统上安装Docker。
DreamNotOver
·
2024-02-08 01:14
python
数据挖掘
docker
docker
scala
spark
容器
网易和腾讯面试题精选---性能和优化面试问题
本文深入探讨了跨不同领域、技术和应用场景优化
系统性
能的关键策略、技术和最佳实践。
前网易架构师-高司机
·
2024-02-08 00:15
服务器面试题
面试
性能优化
Spark
Standalone 集群配置
集群管理类型
Spark
支持三种集群管理类型:Standalone-
Spark
附带的一个简单的集群管理器,可以轻松地设置集群。
董可伦
·
2024-02-07 23:01
Spark
spark
大数据
分布式
RDD vs DataFrame vs Dataset
RDD是
Spark
最基础的数据结构。RDD允许开发者使用容错的形式在集群中使用内存计算,这样可以提高计算速度。1.2DataFrameDataFrame是使用数据组成命名
一生逍遥一生
·
2024-02-07 22:20
Java串口通信技术探究3:RXTX库线程 优化
系统性
能的SerialPortEventListener类
目录一、失败方案串口监听工具Controller层MySerialPortEventListenerimpl二、成功方案串口监听工具Controller层MySerialPortEventListenerimpl前端Api在之前的文章中,我们讨论了使用单例模式的SerialPortEventListener类。然而,这种模式在某些情况下并不理想,因为它会导致重复创建监听器,从而无法正确获取串口返回
Yeats_Liao
·
2024-02-07 21:16
java
开发语言
设计模式—单例模式(学习笔记)
作用单例模式保证了系统内存中该类只存在一个对象,节省了系统资源,对于一些需要频繁创建销毁的对象,单例模式可以提高
系统性
能。
布道翁
·
2024-02-07 20:26
黑猴子的家:
Spark
SQL 的性能
1、内存列存储(In-MemoryColumnarStorage)内存列存储来说,将所有原生数据类型的列采用原生数组来存储,将Hive支持的复杂数据类型(如array、map等)先序列化后拼接成一个字节数组来存储。这样,每个列创建一个JVM对象,从而导致可以快速的GC和紧凑的数据存储。额外的,还可以用低廉CPU开销的高效压缩方法来降低内存开销。更有趣的是,对于分析查询中频繁使用的聚合特定列,性能会
黑猴子的家
·
2024-02-07 18:48
简单使用
Spark
、Scala完成对天气数据的指标统计
目录一、前言&什么是
Spark
?
db_lcz_2014
·
2024-02-07 18:33
spark
scala
大数据
HDFS 之 数据管理(namespace 和 slaves)
使HDFS集群存储能力可以轻松进行水平拓展;
系统性
能。单点性能受限,影响系统吞吐;隔离性。不同业务类型访问集群有时容易互相干扰,使用多Namespace可以有效管理访问分类。
Studying!!!
·
2024-02-07 17:57
中间件
hdfs
hadoop
大数据
第 2 章 ROS通信机制_话题通信(自学二刷笔记)
/www.bilibili.com/video/BV1Ci4y1L7ZZ讲义链接:Introduction·Autolabor-ROS机器人入门课程《ROS理论与实践》零基础教程机器人是一种高度复杂的
系统性
实现
Galaxy_1229
·
2024-02-07 15:41
机器人
c++
python
笔记
软件定义汽车5-中央计算单元架构
引言前几篇更多是从全局的视角阐述软件定义汽车,但写这个系列并不只是为了介绍软件架构,也不是为了给大家推销理念或普及概念,而是为了构建一张完整的全系统知识图谱,
系统性
的探讨在实现过程中的各种技术问题。
leo_huang_
·
2024-02-07 15:49
arduino学习笔记(一)
arduino学习笔记(一)原来其实也做过一段时间的arduino,但是一直没有
系统性
的学习,这里专门从头
系统性
学习一下arduino,希望以后能够有所帮助。
听竹先生
·
2024-02-07 13:34
【作业day2】
2.消息队列:优点:异步通信,提高
系统性
能,支持多对多通信。3.信号:优点:轻量级通信,适用于简单的通知机制。4.共享内存:优点:高效,直接访问共享数据,适用于大量数据的高速交换。
唠个锤子
·
2024-02-07 12:40
算法
JS内存泄漏与垃圾回收机制
对于持续运行的服务进程,必须及时释放内存,否则,内存占用越来越高,轻则影响
系统性
能,重则导致进程崩溃。不再用到的内存,没有及时释放,就叫做内存泄漏。
生命里那束光
·
2024-02-07 11:33
【Iceberg学习一】什么是Iceberg?
Iceberg为包括
Spark
、Trino、PrestoDB、Flink、Hive和Impala在内的计算引擎增加了表格功能,使用一种高性能的表格格式,其工作方式就像一个SQL表一样。
周润发的弟弟
·
2024-02-07 10:56
Iceberg
学习
LangGPT —— 让人人都能编写高质量 Prompt
虽然也有许多个人自发分享的prompt方法、框架,以及吴恩达老师的prompt教程,但是现有Prompt创建方法还是有各种各样的缺点:缺乏
系统性
:大多是细碎的规则,技巧,严重依赖个人经验缺乏灵活性:对他人分享的优质
云中江树
·
2024-02-07 09:10
prompt
人工智能
python
深度学习
文心一言
chatgpt
RDD任务切分之Stage任务划分(图解和源码)
RDD任务切分中间分为:Application、Job、Stage和Task(1)Application:初始化一个
Spark
Context即生成一个Application;(2)Job:一个Action
大数据左右手
·
2024-02-07 09:34
大数据
大数据
spark
stage切分
任务划分
kyuubi 接入starrocks | doris
kyuubi接入starrocks一、环境Hadoop集群组件版本Hadoop3.1.1
spark
3.Xzookeeper3.XHive3.Xkyuubi版本1.7.1starrocks2.X 已将kyuubi
甜甜的巧克力阿
·
2024-02-07 09:48
大数据相关
大数据
kyuubi
starrocks
doris
【健康知识】苏打水有助于缓解类风湿?
类风湿关节炎(RA)是一种病因未明的慢性、以炎性滑膜炎为主的
系统性
疾病。其特征是手、足小关节的多关节、对称性、侵袭性关节炎症,经常伴有关节外器官受累及血清类风湿因子阳性,可以导致关节畸形及功能丧失。
mingrensudashui
·
2024-02-07 07:40
《代码整洁之道》阅读笔记——第12章:迭进
12.3规则2:重构提升内聚性,降低耦合度,切分关注面,模块化
系统性
关注面,缩小函数和类的尺寸,选用更好的名称等。如何理解重构?
ChenEthan_
·
2024-02-07 07:53
研发基础
经验分享
Hive Sql优化记录
日常检查ETLjob时发现一段sql采用hiveonmr执行比hiveon
spark
要快70%,与正常的认知正好相反,所以对该sql进行了详细分析。
风筝flying
·
2024-02-07 07:40
Spark
JDBC读写数据库实战
默认的操作代码valdf=
spark
.read.format("jdbc").option("url","jdbc:postgresql://localhost:5432/testdb").option
SunnyRivers
·
2024-02-07 07:41
Spark最佳实战与性能优化
spark
jdbc
数据库
IDEA 本地运行
Spark
IDEA本地运行
Spark
1、背景2、环境准备3、具体流程3.1IDEA创建maven项目3.2pom.xml配置3.3Demo程序示例3.4结果输出4、总结改进1、背景主要用于本地阅读
Spark
源码,
fir_dameng
·
2024-02-07 06:41
大数据开发
spark
Spark
Scala大数据编程实例
一、Scala1.1、Scala简介Scala是一门现代的多范式编程语言,平滑地集成了面向对象和函数式语言的特性,旨在以简练、优雅的方式来表达常用编程模式。Scala的设计吸收借鉴了许多种编程语言的思想,只有很少量特点是Scala自己独有的。Scala语言的名称来自于“可伸展的语言”,从写个小脚本到建立个大系统的编程任务均可胜任。Scala运行于Java平台(JVM,Java虚拟机)上,并兼容现有
一直de不完的bug
·
2024-02-07 06:38
Hadoop
spark
大数据
hadoop
win10
spark
scala 本地运行wordcount
hadoopcommon,可以从github下载zip,解包以后设置HADOOP_HOME环境变量指向它,然后在PATH里加上HADOOP_HOME\bin,特别注意,hadoopcommon的版本要和
spark
疯琴
·
2024-02-07 06:06
大数据
java/scala
flink/spark
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他