E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark练习题
java学习日志
环境参考教程java开发环境配置—JDKjava开发环境配置—Mavenjava开发环境配置—IntelliJIDEA第一个Java应用程序2019-12-26ε=(´ο`*)))唉,这是什么神仙语言
练习题
大春儿的试验田
·
2024-02-05 14:33
java
java
Hudi学习6:安装和基本操作
目录1编译Hudi1.1第一步、Maven安装1.2第二步、下载源码包1.3第三步、添加Maven镜像1.4第四步、执行编译命令1.5第五步、HudiCLI测试2环境准备2.1安装HDFS2.2安装
Spark
3
hzp666
·
2024-02-05 14:59
Hudi
学习
hudi
Hudi学习 6:Hudi使用
准备工作:1.安装hdfshttps://mp.csdn.net/mp_blog/creation/editor/1096891432.安装
spark
spark
学习4:
spark
安装_hzp666的博客
hzp666
·
2024-02-05 14:58
Hudi
hudi
数据湖
湖仓一体
湖仓融合
实时数仓
spark
学习4:
spark
安装
1.下载
spark
安装包2.配置环境1.cd/bigdata/
spark
-3.0.1-bin-hadoop3.2/conf/2.4.添加动态库在hadoop-3.2.2/bin目录下添加hadoop.dll
hzp666
·
2024-02-05 14:58
spark
spark
大数据
计算机毕业设计hadoop+
spark
+hive小说数据分析可视化大屏 小说推荐系统 小说爬虫 小说大数据 机器学习 知识图谱 小说网站 大数据毕业设计
mapreduce对mysql中的小说数据集进行数据清洗,转为.csv文件上传至hdfs文件系统;3.根据.csv文件结构,使用hive建库建表;4.一半分析指标使用hive_sql完成,一半分析指标使用
Spark
-Scala
计算机毕业设计大神
·
2024-02-05 14:48
【Python】出现 TypeError: str object does not support item assignment 的原因
在做一道
练习题
的时候,题目是:利用map()函数,把用户输入的不规范的英文名字,变为首字母大写,其他小写的规范名字。
eruituoa
·
2024-02-05 13:20
python
python
亲子日记第71篇
今天上午有事,给孩子安排好要做的
练习题
,就匆匆出门了。回到家都两点钟了,儿子在和弟弟玩玩具,我问
练习题
做完了吗,儿子告诉我任务已完成。我给他检查了一下,就数学做错了一道题,但是书写不规范,提出批评。
孙学睿妈妈
·
2024-02-05 13:07
Exception in thread “main“ java.lang.NoSuchMethodError: com.google.comon.base.Preconditions.checkArg
hadoop-3.1.3hbase-2.2.2-bin一、问题描述:在学习林子雨老师编写的《
Spark
编程基础》时使用如下命令运行jar包读取HBase时出现如下错误:Exceptioninthread
学习BigData
·
2024-02-05 13:01
关于Hadoop的学习笔记
java
hadoop
hive
C语言之数据在内存中的存储
练习1练习2练习3练习4练习5练习63.浮点数在内存中的存储浮点数存的过程浮点数取得过程
练习题
解析1.整数在内存中的存储在讲解操作符的时候,我们已经了解了一下内容:整数的2进制表示方法有三种,即原码、反码和补码三种表示方法均有符号位和数值位两部分
凡人多烦事~
·
2024-02-05 12:48
C语言知识
c语言
开发语言
【
Spark
ML实践7】特征选择器FeatureSelector
本节介绍了用于处理特征的算法,大致可以分为以下几组:提取(Extraction):从“原始”数据中提取特征。转换(Transformation):缩放、转换或修改特征。选择(Selection):从更大的特征集中选择一个子集。局部敏感哈希(LocalitySensitiveHashing,LSH):这类算法结合了特征转换的方面与其他算法。FeatureSelectorsVectorSlicerVe
周润发的弟弟
·
2024-02-05 12:41
Spark机器学习
spark-ml
Spark
依赖包加载方式
1
Spark
依赖包来源我们知道
Spark
application运行加载依赖有三个地方:systemClasspath:
Spark
安装时候提供的依赖包,${
SPARK
_HOME}/jars下的包。
大数据AI
·
2024-02-05 12:11
大数据从入门到精通
spark
大数据
使用Py
Spark
处理DataFrame以拆分数组列
问题:用py
spark
处理df1,df1有三列,第一列是商品pid,第二列是商品name,第三列是候选标品cid_list(有多个cid),将df1中的cid_list拆开,转换成一个商品id和name
samoyan
·
2024-02-05 12:41
python
linux
服务器
运维
Spark
的JVM调优
目录导致gc因素内存不充足的时候,出现的问题降低cache操作的内存占比调节executor堆外内存与连接等待时长调节executor堆外内存调节连接等待时长
Spark
JVM参数优化设置
Spark
streaming
王一1995
·
2024-02-05 10:55
jvm
spark
Hadoop3.x单机安装教程
以最小化的成本学习和测试Hadoop;搭建基于Hadoop的上层应用,比如单机
Spark
环境需要先拥有单机的Hadoop;如果需要搭建分布式集群环境的Hadoop环境,请参考另外一篇:Hadoop3.x
文景大大
·
2024-02-05 10:06
成功日记(Day664)
整理中诊,做
练习题
。~8h。2、和小王哥一起打了2遍太极拳并聊天。~0.5h。3、和蛋,晋丽聊天,讨论学习及考试相关。~0.25h。4、和包、李微信简单聊天。~0.25h。
狮子座的兔子姑娘
·
2024-02-05 10:20
[qtp581715564-18] ERROR
spark
.http.matching.GeneralError - org.neo4j.driver.exceptions.ResultConsum
今天使用java连接neo4j执行查询的时候遇到了这个问题,报错如下:[qtp581715564-18]ERROR
spark
.http.matching.GeneralError-org.neo4j.driver.exceptions.ResultConsumedException
路过Coder
·
2024-02-05 09:36
spark
neo4j
大数据
java
趣头条
Spark
Remote Shuffle Service最佳实践
1.业务场景与现状趣头条是一家依赖大数据的科技公司,在2018-2019年经历了业务的高速发展,主App和其他创新App的日活增加了10倍以上,相应的大数据系统也从最初的100台机器增加到了1000台以上规模。多个业务线依赖于大数据平台展开业务,大数据系统的高效和稳定成了公司业务发展的基石,在大数据的架构上我们使用了业界成熟的方案,存储构建在HDFS上、计算资源调度依赖Yarn、表元数据使用Hiv
阿里云技术
·
2024-02-05 09:29
大数据
spark
Spark
Sql读取外部Hql文件的公共类开发
Spark
Sql读取外部Hql文件的公共类开发
Spark
SQL与Hive的区别简介一、什么是
Spark
SQL?
岁月的眸
·
2024-02-05 09:27
#
Hive总结
#
Spark总结
大数据
hive
大数据
spark
在 CDH 中调优 Apache Hive on
Spark
Spark
上的Hive在提供相同功能的同时提供比MapReduce上的Hive更好的性能。在
Spark
上运行Hive不需要更改用户查询。
海阔天空&沫语
·
2024-02-05 09:27
大数据/架构
hive
hadoop
spark
Spark
Shuffle Service简介与测试
Spark
管理资源有两种方式:静态资源分配和动态资源分配。静态资源分配:
spark
提交任务前,指定固定的资源,在
spark
运行任务过程中,一直占用这些资源不释放,job运行结束后才会释放。
大数据AI
·
2024-02-05 09:26
spark
大数据
CDH6.3.2 多
Spark
版本共存
一部署
Spark
客户端1.1部署
spark
3客户端tar-zxvf
spark
-3.3.1-bin-3.0.0-cdh6.3.2.tgz-C/opt/cloudera/parcels/CDH/libcd/
大数据AI
·
2024-02-05 09:56
大数据从入门到精通
spark
cdh
大数据-
Spark
调优(一)
大数据-
Spark
调优(一)分配更多的资源分配更多的资源是性能优化调优的王道,就是增加和分配更多的资源,这对于性能和速度上的提升是显而易见的,基本上,在一定范围之内,增加资源与性能的提升,是成正比的;写完了一个复杂的
海恋北斗星
·
2024-02-05 09:29
大数据
spark
大数据笔记--
Spark
(第五篇)
目录一、
Spark
的调优1、更改序列化为kryo2、配置多临时文件目录3、启动推测执行机制4、某些特定场景,用mapPartitions代替map5、避免使用collect二、
Spark
的共享变量1、广播变量
是小先生
·
2024-02-05 09:59
大数据08-Spark
spark
大数据 -
Spark
系列《三》- 加载各种数据源创建RDD
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客目录3.1
王哪跑nn
·
2024-02-05 09:28
spark
大数据
spark
分布式
大数据原理-
Spark
概述:基于内存计算三大分布式计算系统:Hadoop、
Spark
、Storm特点:采用有向无环图DAG作业调度运行速度快循环数据流容易使用:可以通过
Spark
Shell交互式编程用途:SQL查询、流式计算
monster++
·
2024-02-05 09:28
大数据原理
分布式
编程语言
分布式计算
hadoop
spark
大数据 -
Spark
系列《四》-
Spark
分布式运行原理
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-05 08:54
spark
大数据
分布式
spark
三剑客
练习题
1.问题:在当前系统中打印出所有普通用户的用户和家目录(/etc/passwd)普通用户UID>=10002.显示当前系统中容量使用率大于5%的文件系统名称和挂载点df-h:查看block(biock是存放实际数据)df-i:查看inode(索引节点存放文件或目录属性‘例如ls-l的结果’的数据信息,但不包含文件名本身。[%]:空格或%(因为第5行有特殊符号,所以这里要加%)df-h|awk-F"
达不到点
·
2024-02-05 08:00
亲子日记
我本来要给他带上书和
练习题
的,宝妈没让!玩就玩个彻底吧!一到了就和爷爷抱在一起!之后拖着爷爷去打篮球,隔辈亲是真的!你投一个我投一个,很和谐!岁月静好!往常在家连吃饭都不积极!在那爷爷奶奶怕他吃撑了!
Givemeone
·
2024-02-05 08:58
Windows系统运行py
spark
报错:Py4JJavaError
运行py
spark
时出现以下错误---------------------------------------------------------------------------Py4JJavaErrorTraceback
赫桃
·
2024-02-05 07:25
windows
spark
scala
py
spark
报错TypeError: an integer is required (got type bytes)
安装配置py
spark
,计算时报错如下:Using
Spark
'sdefaultlog4jprofile:org/apache/
spark
/log4j-defaults.propertiesSettingdefaultloglevelto"WARN
helluy
·
2024-02-05 07:23
bug解决
bug
spark
python
py
spark
报错:ValueError: object of IntegerType out of range
背景:py
spark
任务中,调用了udf处理数据,并使用了链接:py
spark
并行调用udf函数的方式,报错如上。但是在python中很少遇到整型越界问题。
leap_ruo
·
2024-02-05 07:53
pyspark
spark
Python调用py
spark
报错整理
Pycharm配置了SSH服务器和Anaconda的python解释器,如果没有配置可参考大数据单机学习环境搭建(8)Linux单节点Anaconda安装和Pycharm连接Pycharm执行的脚本执行如下py
spark
_model.py
赫加青空
·
2024-02-05 07:52
Python
spark
大数据
python
开发语言
基于hadoop+
spark
的大规模日志的一种处理方案
而且CDN上的访问日志一般都非常大,需要用大数据处理架构来进行处理,本文描述了一种利用hadoop+
spark
来处理大量CDN日志的方法,当然本方
码农心语
·
2024-02-05 06:36
日志处理
大规模
大数据
hadoop
spark
cdn
【力扣白嫖日记】SQL
前言练习sql语句,所有题目来自于力扣(https://leetcode.cn/problemset/database/)的免费数据库
练习题
。
Gary.Li
·
2024-02-05 06:21
leetcode
sql
数据库
Flink实时流计算入门系列——广播变量使用
Flink和
Spark
一样,都有支持广播变量这定义。广播变量,可以理解成为日常的广播,是一个公共的变量。广播变量创建后,它可以运行在集群中的任何function上,而不需要多次传递给集群节
晨冉1688
·
2024-02-05 06:19
数组
练习题
知识点数组题目1请创建一个长度为6的整数数组,并为数组中的元素赋值。遍历数组,打印所有元素,元素之间用空格隔开。比如:数组为:{1,2,3,4,5}打印结果:12345训练提示1、数组中的元素有索引,开始索引和结束索引分别是什么?使用循环语句,依次通过索引获取元素即可遍历数组。2、在打印数组元素时,是以空格分隔,并且不换行,该怎样输出?解题方案for循环遍历数组操作步骤1、定义int数组,使用静态
Angus1648
·
2024-02-05 05:57
java
学习
笔记
研读数学教材的☞妙招☜
同时,我也会把《教师教学用书》用上,针对教材的例题和
练习题
,这本书会有针对性的阐述,用上它,在我带领学生们一起做教材里的
练习题
时,我会由浅入深、循序渐进地尽最大可能性从学生
我是你的小年糕
·
2024-02-05 04:03
第七周
数学啊我的痛啊,为啥就不理解呢这个礼拜也在认真的写
练习题
就
机械181的黄胖子
·
2024-02-05 00:00
HIVE
--------hive数据仓库hive底层执行引擎有MapReduceTez
Spark
压缩GZIPLZOSnappyBZIP2等存储TextFileSequenceFileRCFileORCParquetUDF
Yagami_
·
2024-02-05 00:23
spark
-submit 任务提交过程分析
https://blog.csdn.net/u013332124/article/details/91456422一、
spark
-submit脚本分析
spark
-submit的脚本内容很简单:#如果没设置
疯狂的哈丘
·
2024-02-04 22:08
第二模块 函数&模块
第二模块函数&模块day09文件操作相关1.文件操作1.1读文件1.2写文件1.3文件打开模式1.4常见功能1.5上下文管理
练习题
2.csv格式文件3.ini格式文件4.XML格式文件4.1读取文件和内容
李小狗儿
·
2024-02-04 21:16
python全栈
网络
开发语言
快速入门
python全栈
个人开发
特色作业之我见
主要有以下几种:一、每天一练——数学性设立《每天一练》本,针对每天课堂中出现的知识重点,设计几道专项
练习题
,完成作业时间控制在3-5分钟。这样,不仅
叶小连
·
2024-02-04 21:17
计算机网络_1.6.3 计算机网络体系结构分层思想举例
1.6.3计算机网络体系结构分层思想举例1、实例引入(用户在主机中使用浏览器访问web服务器)2、从五层原理体系结构的角度研究该实例3、
练习题
笔记来源:B站《深入浅出计算机网络》课程本节通过一个常见的网络应用实例
冰岛看极光_92655
·
2024-02-04 20:56
计算机网络
计算机网络
Unix/Linux 编程实践教程第六章习题
tips:这一章习题倒是少,
练习题
多到头皮发麻。。。
王鲜申
·
2024-02-04 19:04
团队程序天梯赛
练习题
题解
目录L1—001HelloWorldL1—002打印沙漏L1—003个位数统计L1—004计算摄氏温度L1—005考试座位号L1—006连续因子L1—007念数字L1—008求整数段和L1—009N个数求和L1—010比较大小L1—011A-BL1—012计算指数L1—013计算阶乘和L1—014简单题L1—015跟奥巴马一起画方块L1—016查验身份证L1—017到底有多二L1—018大笨钟后续
迷茫的大专生
·
2024-02-04 18:06
算法
数据结构
运行环境jre版本和jar包编译版本不一致导致:Unsupported major.minor version 52.0
问题我在本地使用IntellijIdea打包了一个
spark
的程序jar包,放到linux集群上运行,报错信息是:Unsupportedmajor.minorversion52.0环境本机系统->windows10
stone_zhu
·
2024-02-04 18:51
5分钟搞定几百张表格转换,Python办公自动化就是这么6!
最近在参加学习开源社区Datawhale组织的"21天精通Pandas学习",其中有个
练习题
做起来很有意思,
练习题
本身很简单,我在这里稍微引申一下让大家体会一下Pandas处理数据功能的灵活和强大。
木头里有虫911
·
2024-02-04 17:33
python循环
练习题
(1)
1010-找出二五仔的ID我们的双面特工发来一条简短的消息:“二五仔就是二五仔,除了在生的!”主管一听就说:不好,我们那1000名特工(ID从1到1000)里有叛徒,他们的ID既能被2整除,又能被5整除,但不被3整除!快把他们揪出来!输入无输出从小到大,每行一个,输出叛徒的IDforiinrange(1,1001):ifi%2==0andi%5==0andi%3!=0:print(i)1013-等
蒸德士泥鸭
·
2024-02-04 16:25
python
python
数据结构
练习题
1答案版
1.含有3个结点的二叉树的树形共有()种。A.2B.5C.6D.72.一棵二叉树共有25个结点,其中5个是叶子结点,则度为1的结点数为()A.16B.10C.6D.43.某二叉树有5个度为2的结点,则该二叉树中的叶子结点数是().A.10B.8C.6D.44.一个完全二叉树的第8层有8个结点,则其叶子结点数有A.68B.67C.64D.655.一个具有1025个结点的二叉树的高度h为()A.11B
飞莲
·
2024-02-04 14:00
数据结构
排序算法
算法
win10环境下通过anaconda安装py
spark
解决方法本来应该可以在anaconda上直接搜索安装,但是非常慢,而且还有错误,说python3.8无法和和py
spark
3.1.2兼容,需要安装python3.8之前的版本才行。
零下2度
·
2024-02-04 14:36
笔记
python
大数据
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他