E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark自定义函数
nosql数据库技术与应用知识点
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(
Spark
、Flink
皆过客,揽星河
·
2024-09-16 08:42
NoSQL
nosql
数据库
大数据
数据分析
数据结构
非关系型数据库
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统
spark
大数据毕设项目(源码、调试、LW、开题、PPT)
作者:计算机源码社个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!学习资料、程序开发、技术解答、文档报告如需要源码,可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
计算机源码社
·
2024-09-15 20:02
Python项目
大数据
大数据
python
hadoop
计算机毕业设计选题
计算机毕业设计源码
数据分析
spark毕设
MATLAB中的函数编写有哪些最佳实践
在MATLAB中,函数是执行特定任务的代码块,可以通过
自定义函数
来提高代码的可重用性和模块化。
2401_85812053
·
2024-09-15 19:59
matlab
算法
人工智能
Spark
组件 GraphX、Streaming
Spark
组件GraphX、Streaming一、
Spark
GraphX1.1GraphX的主要概念1.2GraphX的核心操作1.3示例代码1.4GraphX的应用场景二、
Spark
Streaming2.1
Spark
Streaming
叶域
·
2024-09-15 14:54
大数据
spark
spark
大数据
分布式
大数据毕业设计hadoop+
spark
+hive知识图谱租房数据分析可视化大屏 租房推荐系统 58同城租房爬虫 房源推荐系统 房价预测系统 计算机毕业设计 机器学习 深度学习 人工智能
做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。我先来介绍一下这些东西怎么用,文末抱走。(1)Python所有方向的学习路线(
2401_84572577
·
2024-09-15 10:20
程序员
大数据
hadoop
人工智能
02 Java-Lambda-Java 8 自带的函数接口
Java8自带的函数接口我们使用lambda在处理自己定义的业务时,需要
自定义函数
式接口,其实java8已经内置了常用的接口,这样我们在用的时候不要需要自己定义接口,根据需要选择符合自己业务逻辑的接口接口
王小杰at2019
·
2024-09-15 03:04
Spark
集群的三种模式
文章目录1、
Spark
的由来1.1Hadoop的发展1.2MapReduce与
Spark
对比2、
Spark
内置模块3、
Spark
运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式
MelodyYN
·
2024-09-15 01:16
#
Spark
spark
hadoop
big
data
Java中的大数据处理框架对比分析
本文将重点介绍ApacheHadoop、Apache
Spark
、ApacheFlink和ApacheStorm这四种流行的
省赚客app开发者
·
2024-09-14 20:41
java
开发语言
写出渗透测试信息收集详细流程
一、扫描域名漏洞:域名漏洞扫描工具有AWVS、APPSCAN、Net
spark
、WebInspect、Nmap、Nessus、天镜、明鉴、WVSS、RSAS等。
卿酌南烛_b805
·
2024-09-14 16:08
Spark
MLlib模型训练—推荐算法 ALS(Alternative Least Squares)
Spark
MLlib模型训练—推荐算法ALS(AlternativeLeastSquares)如果你平时爱刷抖音,或者热衷看电影,不知道有没有过这样的体验:这类影视App你用得越久,它就好像会读心术一样
不二人生
·
2024-09-14 08:25
Spark
ML
实战
spark-ml
推荐算法
算法
Python基础知识进阶之正则表达式_头歌python正则表达式进阶
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
前端陈萨龙
·
2024-09-13 13:50
程序员
python
学习
面试
分布式离线计算—
Spark
—基础介绍
原文作者:饥渴的小苹果原文地址:【
Spark
】
Spark
基础教程目录
Spark
特点
Spark
相对于Hadoop的优势
Spark
生态系统
Spark
基本概念
Spark
结构设计
Spark
各种概念之间的关系Executor
测试开发abbey
·
2024-09-13 11:11
人工智能—大数据
spark
常用命令
查看报错日志:yarnlogsapplicationID
spark
2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$
SPARK
_HOME
我是浣熊的微笑
·
2024-09-13 10:38
spark
spark
启动命令
hadoop启动:cd/root/toolssstart-dfs.sh,只需在hadoop01上启动stop-dfs.sh日志查看:cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动:cd/root/toolss/zookeeperbin/zkServer.shstart,三台都要启动bin/zkServ
学不会又听不懂
·
2024-09-13 10:36
spark
大数据
分布式
大数据领域的深度分析——AI是在帮助开发者还是取代他们?
1.大数据领域的AI工具现状在大数据领域,AI工具已经取得了显著进展,以下是几款主要的AI工具及其功能和实际应用:Apache
Spark
+MLlib:Apache
Spark
是一个开源的分布式计算系统,广泛用于
阳爱铭
·
2024-09-13 09:32
大数据与数据中台技术沉淀
大数据
人工智能
后端
数据库架构
数据库开发
etl工程师
chatgpt
大数据新视界 --大数据大厂之
Spark
性能优化秘籍:从配置到代码实践
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:Ja
青云交
·
2024-09-13 08:25
大数据新视界
Spark
性能优化
内存分配
并行度
存储级别
shuffle
减少
算法优化
代码实践
数据读取
广播变量
数据倾斜
Spark
数据库
编程常用命令总结
编程命令大全1.软件环境变量的配置JavaScala
Spark
HadoopHive2.大数据软件常用命令
Spark
基本命令
Spark
-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令
Yellow0523
·
2024-09-13 02:42
Linux
BigData
大数据
【面试系列】
Spark
高频面试题解答
欢迎来到我的博客,很高兴能够在这里和您见面!欢迎订阅相关专栏:⭐️全网最全IT互联网公司面试宝典:收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来:详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️大数据平台建设指南:全面讲解从数据采集到数据可视化的整个过程,掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python:初识、了解与热恋》:涵盖了Pytho
野老杂谈
·
2024-09-12 18:52
全网最全IT公司面试宝典
面试
spark
职场和发展
大数据
spark
常见面试题
文章目录1.
Spark
的运行流程?2.
Spark
中的RDD机制理解吗?3.RDD的宽窄依赖4.DAG中为什么要划分Stage?
爱敲代码的小黑
·
2024-09-12 18:51
spark
大数据
分布式
Spark
面试题
Spark
面试题1.
Spark
基础概念1.1解释
Spark
是什么以及它的主要特点
Spark
是什么?
golove666
·
2024-09-12 18:19
面试题大全
spark
大数据
分布式
面试
图计算:基于
Spark
GrpahX计算聚类系数
图计算:基于
Spark
GrpahX计算聚类系数文章目录图计算:基于
Spark
GrpahX计算聚类系数一、什么是聚类系数二、基于
Spark
GraphX的聚类系数代码实现总结一、什么是聚类系数聚类系数(ClusteringCoefficient
妙龄少女郭德纲
·
2024-09-12 18:16
Spark
图算法
Scala
聚类
数据挖掘
机器学习
JS函数定义、调用、this指向、严格模式、高阶函数、闭包、递归、深浅拷贝
函数函数的定义1.
自定义函数
(命名函数)functionfn(){};2.函数表达式(匿名函数)varfun=function(){};3.利用newFunction(‘参数1’,‘参数2’,‘函数体’
sharp_wu
·
2024-09-12 11:37
javascript
js
bind
2024年最全使用Python求解方程_python解方程(1),字节面试官迟到
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
2401_84569545
·
2024-09-12 02:33
程序员
python
学习
面试
Spark
运行时架构
目录一,
Spark
运行时架构二,YARN集群架构(一)YARN集群主要组件1、ResourceManager-资源管理器2、NodeManager-节点管理器3、Task-任务4、Container-容器
tooolik
·
2024-09-12 01:59
spark
架构
大数据
使用
Spark
Sql进行表的分析与统计
背景我们的数据挖掘平台对数据统计有比较迫切的需求,而
Spark
本身对数据统计已经做了一些工作,希望梳理一下
Spark
已经支持的数据统计功能,后期再进行扩展。
xingyuan8
·
2024-09-12 00:24
大数据
java
13.
Spark
Core-
Spark
中广播变量和累加器
一、前述
Spark
中因为算子中的真正逻辑是发送到Executor中去运行的,所以当Executor中需要引用外部变量时,需要使用广播变量。累机器相当于统筹大变量,常用于计数,统计。
__元昊__
·
2024-09-11 12:33
比较
Spark
与Flink
Apache
Spark
和ApacheFlink都是目前非常流行的大数据处理引擎,但它们在架构、处理模式、应用场景等方面有一些显著的区别。
傲雪凌霜,松柏长青
·
2024-09-11 04:29
大数据
后端
spark
flink
大数据
Spark
底层逻辑
Apache
Spark
的底层逻辑可以从其核心概念、组件和执行流程等方面来理解。
Spark
提供了一个分布式数据处理框架,其底层逻辑基于批处理架构,能够在大规模集群中高效地处理数据。
傲雪凌霜,松柏长青
·
2024-09-11 04:29
大数据
后端
spark
大数据
Spark
- 升级版数据源JDBC2
在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,在
大猪大猪
·
2024-09-10 17:28
Py
Spark
Py
Spark
的本质确实是Python的一个接口层,它允许你使用Python语言来编写Apache
Spark
应用程序。
静听山水
·
2024-09-10 13:44
Spark
spark
Ubuntu的ssh
sshsudoapt-getupdatesudoapt-getinstallopenssh-server检测ssh是否启动sudops-e|grepssh创建root用户sudopasswdroot配置本机无密码ssh登录cd/home/
spark
0ssh-keygen-trsa-P
请不要问我是谁
·
2024-09-10 03:29
2024年大数据最新实时数仓之实时数仓架构(Hudi)
用于接入数据源;FlinkCDC:如果直接接入业务数据源可以考虑CDC方式,如果通过Kafka缓冲接入业务数据可以忽略;Flink:用于数据ETL,包括接入数据、处理数据及输出数据全链路数据计算任务;
Spark
2401_84185556
·
2024-09-09 19:34
程序员
大数据
架构
实时数仓之实时数仓架构(Hudi)(1),2024年最新熬夜整理华为最新大数据开发笔试题
包括ODS/DWD/DWS/DIM/ADS等;+Doris:OLAP引擎,同步数仓结果模型,对外提供数据服务支持;+Hbase:用来存储维表信息,维表数据来源一部分有Flink加工实时写入,另一部分是从
Spark
2401_84181221
·
2024-09-09 19:04
程序员
架构
大数据
starrocks和clickhouse数据库比较
支持多种数据源的集成,并且可以与其他大数据技术(如Hadoop、
Spark
)协同工作。C
CodeMaster_37714848
·
2024-09-09 16:12
clickhouse
数据库
Office·Word高级·VBA基础概念语法
常量与变量完成度:80%基础概念宏方法和
自定义函数
宏方法定义指令:Sub[宏方法名称]()[内容]EndSub
自定义函数
定义指令:Func
SCscHero
·
2024-09-09 13:48
#
VBA
Windows
OFFICE
VBA
办公自动化
办公软件
Office
Word
实验九 游标操作和
自定义函数
一.实验目的:掌握游标的声明、游标打开、标数据的提取、游标的关闭和游标的释放掌握标量值函数的定义与调用掌握内联表值函数的定义与调用掌握多语句表值函数的定义与调用二.实验内容:(所有题写到实验报告中)1.使用游标打印OrderManagement库中各订单中的总金额,要求按总金额降序排,打印格式如下:2.使用游标提取学生课程库中3-105课的前三名学生的信息和后三名学生的信息,包括学号、姓名、课程名
LANVNAL
·
2024-09-08 20:34
python
自定义函数
参数_python
自定义函数
的参数之四种表现形式
(1)defa(x,y):printx,y这是最常见的定义方式,调用该函数,a(1,2)则x取1,y取2,形参与实参相对应,如果a(1)或者a(1,2,3)则会报错(2)defa(x,y=3):printx,y提供了默认值,调用该函数,a(1,2)同样还是x取1,y取2,但是如果a(1),则不会报错了。上面这俩种方式,还可以更换参数位置,比如a(y=4,x=3)用这种形式也是可以的如果是defa(
weixin_39640024
·
2024-09-08 18:45
python自定义函数参数
python知识点(六)
自定义函数
一、函数(function)定义:一段可以完成某个功能的代码。使用函数:通过函数名即可调用函数,可以让计算机完成某个功能举例:输入两个数,输出两个数中最大的数a=int(input())b=int(input())c=max(a,b)print(c)分析:max()函数功能:返回给定参数的最大值,参数可以为序列。语法:max(x,y,z,....)#参数可以有若干个分类:系统函数:提供给用户的一系
解放南路199号
·
2024-09-08 18:12
python
开发语言
Hive的优势与使用场景
它利用Hadoop的MapReduce或
Spark
来执行查询,具备高度扩展性,适合大数据处理。2.支持SQL-like查询语言(Hi
傲雪凌霜,松柏长青
·
2024-09-08 17:07
后端
大数据
hive
hadoop
数据仓库
Python基础教程 ——
自定义函数
Python基础教程——Python基础教程之
自定义函数
文章目录Python基础教程函数是什么一、内置函数与
自定义函数
1.Python内置函数2.Python
自定义函数
二、使用def
自定义函数
1.创建一个简单的
自定义函数
的步骤
小桃在改bug
·
2024-09-08 17:36
Python基础教程
python
开发语言
算法
数据结构
Spark
3.5.1 升级 Java 17 异常 cannot access class sun.nio.ch.DirectBuffer
异常说明使用
Spark
3.5.1升级到Java17的时候会有一个异常,异常如下SLF4J:Failedtoloadclass"org.slf4j.impl.StaticLoggerBinder".SLF4J
敏叔V587
·
2024-09-08 15:23
spark
java
nio
【无标题】大数据之批处理,流处理,批流一体概念
Spark
和Flink都支持批处理,其中
Spark
使用的是批处理模型,即将一批数据一次性读入内存,然后对其进行处理,处理完成后再将结果写入磁盘。
数字天下
·
2024-09-08 09:43
大数据
python
自定义函数
在Python中,定义一个函数要使用def语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用return语句返回,return满足条件就不再执行下面的语句,也可以用print输出。1.定义函数自定义一个年龄段的判断函数,当输入的年龄大于等于18返回’adult‘,如果输入的值是非×××则返回错误#!/usr/bin/env python3# -*- cod
weixin_33924770
·
2024-09-08 07:56
py
spark
kafka mysql_数据平台实践①——Flume+Kafka+
Spark
Streaming(py
spark
)
蜻蜓点水Flume——数据采集如果说,爬虫是采集外部数据的常用手段的话,那么,Flume就是采集内部数据的常用手段之一(logstash也是这方面的佼佼者)。下面介绍一下Flume的基本构造。Agent:包含Source、Channel和Sink的主体,它是这3个组件的载体,是组成Flume的数据节点。Event:Flume数据传输的基本单元。Source:用来接收Event,并将Event批量传
weixin_39793638
·
2024-09-08 04:34
pyspark
kafka
mysql
<转>
Spark
体系架构
最近看到一篇关于
Spark
架构的博文,作者是AlexeyGrishchenko。
yongjian_luo
·
2024-09-07 20:11
Spark
Spark
分布式计算原理
目录一、RDD依赖与DAG原理1.1RDD的转换一、RDD依赖与DAG原理
Spark
根据计算逻辑中的RDD的转换与动作生成RDD的依赖关系,同时这个计算链也形成了逻辑上的DAG。
NightFall丶
·
2024-09-07 20:40
#
Spark
apache
spark
spark
Python 数据分析— Pandas 基本操作(下)
文章目录学习内容:一、数据分箱二、
自定义函数
三、DataFrame其他常用函数学习内容:一、数据分箱将Series的每个值对应到区间。
fjwangxi
·
2024-09-07 17:50
#
python数据分析
python
数据分析
pandas
pyflink
自定义函数
frompyflink.datastreamimportStreamExecutionEnvironmentfrompyflink.common.typeinfoimportTypesfrompyflink.datastreamimportStreamExecutionEnvironmentfrompyflink.tableimportStreamTableEnvironmentfrompyfli
scan724
·
2024-09-07 15:05
Flink实时计算
python
开发语言
Pyflink教程(三):
自定义函数
该文章例子pyflink环境是apache-flink==1.13.6Python
自定义函数
是PyFlinkTableAPI中最重要的功能之一,其允许用户在PyFlinkTableAPI中使用Python
yuxj记录学习
·
2024-09-07 15:33
学习笔记
学习
pyflink
PyFlink
自定义函数
在PyFlink(ApacheFlink的PythonAPI)中,
自定义函数
分为三种主要类型:ScalarFunction(标量函数)、TableFunction(表函数)和AggregateFunction
吉小雨
·
2024-09-07 14:53
pyflink
flink
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他