E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark入门到精通
Amazon EFS:云端弹性文件系统的多元化应用场景
应用:Hadoop、
Spark
等大数据框架优势:高
ivwdcwso
·
2024-08-22 04:51
运维
EFS
AWS
Apache Paimon:实时湖仓架构构建工具
实时湖仓架构构建工具paimonApachePaimonisalakeformatthatenablesbuildingaRealtimeLakehouseArchitecturewithFlinkand
Spark
forbothstreamingandbatchoperations
乔如黎
·
2024-08-22 03:15
探索实时湖仓架构的新星:Apache Paimon
ApachePaimonpaimonApachePaimonisalakeformatthatenablesbuildingaRealtimeLakehouseArchitecturewithFlinkand
Spark
forbothstreamingandbatchoperations
幸愉旎Jasper
·
2024-08-22 03:39
MAP REDUCE
Apache
Spark
:可以整合进Hadoop,取代MapReduce的框架
Xiao_die888
·
2024-08-22 01:58
大数据分析与应用
mapreduce
27.Python从
入门到精通
—Python异常处理 抛出异常 用户自定义异常 定义清理行为 预定义的清理行为
27.从
入门到精通
:Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中,异常处理是一种处理程序在执行期间可能遇到的错误的方法
以山河作礼。
·
2024-03-29 04:34
#
Python基础入门—详解版
python
java
服务器
Azkaban各种类型的Job编写
command:Linuxshell命令行任务gobblin:通用数据采集工具hadoopJava:运行hadoopMR任务java:原生java任务hive:支持执行hiveSQLpig:pig脚本任务
spark
__元昊__
·
2024-03-28 21:00
【Java初阶(三)】方法的使用
❣博主主页:33的博客❣▶文章专栏分类:Java从
入门到精通
◀我的代码仓库:33的代码仓库目录1.前言2.方法的概念2.1方法定义2.2实参和形参的关系3.方法的重载3.1方法重载的概念4.递归4.1递归的概念
PU-YUHAN
·
2024-03-26 22:13
Java从入门到精通
java
开发语言
递归
方法
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括Hadoop框架、HDFS、MapReduce、YARN以及Hadoop生态系统中的其他关键工具,如
Spark
、Flink、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
【Hadoop】使用Scala与
Spark
连接ClickHouse进行数据处理
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域,Apache
Spark
音乐学家方大刚
·
2024-03-26 09:56
Scala
Hadoop
hadoop
scala
spark
Spark
面试整理-
Spark
是什么?
Apache
Spark
是一个开源的分布式计算系统,它提供了一个用于大规模数据处理的快速、通用、易于使用的平台。它最初是在加州大学伯克利分校的AMPLab开发的,并于2010年开源。
不务正业的猿
·
2024-03-24 13:02
面试
Spark
spark
大数据
分布式
9.从
入门到精通
:Python 字符串格式化,三引号,Unicode 字符串
9.从
入门到精通
:Python字符串格式化,三引号,Unicode字符串Python字符串格式化Python三引号Unicode字符串创建Unicode字符串Python的字符串内建函数Python字符串格式化
摘星月为妆。
·
2024-03-24 02:48
Python从入门到精通
python
开发语言
Spark
Q&A
A:从
Spark
2.1开始,你可以通过启用
spark
.sql.files.ignoreCorruptFiles选项来忽略损毁的文件。
耐心的农夫2020
·
2024-03-19 00:12
React核心⼊⻔-lesson1
自学React从
入门到精通
,从使用到写源码React⼊⻔课堂⽬标资源起步⽂件结构⽂件结构⼀览React和ReactDomJSX使⽤JSX组件组件的两种形式class组件function组件组件状态管理类组件中的状态管理函数组件中的状态管理事件处理组件通信
IT帮
·
2024-03-18 20:31
#
React
react.js
前端
Java开发从
入门到精通
(七):Java的面向对象编程OOP:常用API
Java大数据开发和安全开发(一)Java的常用API1.1Object类1.1toString1.1equals方法1.1对象克隆clone1.1Objects类1.1包装类1.1StringBuilder1.1StringBuffer1.1StringJoiner1.1Math、System、Runtime1.1BigDecimal1.1传统时间:Date日期类、SimpleDateForma
HACKNOE
·
2024-03-18 02:37
Java开发从入门到精通
java
intellij-idea
linux安装单机版
spark
3.5.0
一、
spark
介绍是一种通用的大数据计算框架,正如传统大数据技术Hadoop的MapReduce、Hive引擎,以及Storm流式实时计算引擎等.
Spark
主要用于大数据的计算二、
spark
下载
spark
3.5.0
爱上雪茄
·
2024-03-17 18:57
大数据
JAVA知识
spark
大数据
分布式
2.Python从
入门到精通
—Python 基础语法详细讲解-上
【30天】Python从
入门到精通
详解版—第一天—Python基础语法详细讲解-上Python变量Python数据类型数字类型(Number)字符串类型(String)列表类型(List)元组类型(Tuple
以山河作礼。
·
2024-03-14 16:13
python
开发语言
Python招聘信息爬虫数据可视化分析大屏全屏系统(Django框架) 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-14 15:41
毕设资料
python
开发语言
Spark
的数据结构——RDD
RDD的5个特征下面来说一下RDD这东西,它是ResilientDistributedDatasets的简写。咱们来看看RDD在源码的解释。Alistofpartitions:在大数据领域,大数据都是分割成若干个部分,放到多个服务器上,这样就能做到多线程的处理数据,这对处理大数据量是非常重要的。分区意味着,可以使用多个线程了处理。Afunctionforcomputingeachsplit:作用在
bluedraam_pp
·
2024-03-14 08:32
Spark
spark
数据结构
大数据
python从
入门到精通
(十五):python爬虫完整学习大纲
一、基础知识爬虫的基本概念和工作原理。HTTP协议和网页结构。Python爬虫开发的基础库,如requests、BeautifulSoup等。常见的反爬虫机制和应对方法。二、爬虫逆向的技术代理服务器和IP封锁突破。用户代理和请求头模拟。JavaScript解析和执行。验证码识别和破解。动态网页抓取和爬虫框架。三、数据抓取和处理数据抓取的技巧和策略。数据清洗和预处理。数据存储和数据库操作。数据分析和
HACKNOE
·
2024-03-14 03:24
python
爬虫
学习
大数据开发(
Spark
面试真题-卷一)
大数据开发(
Spark
面试真题)1、什么是
Spark
Streaming?简要描述其工作原理。2、什么是
Spark
内存管理机制?请解释其中的主要概念,并说明其作用。
Key-Key
·
2024-03-13 07:58
大数据
spark
面试
基于HBase和
Spark
构建企业级数据处理平台
摘要:在中国HBase技术社区第十届Meetup杭州站上,阿里云数据库技术专家李伟为大家分享了如何基于当下流行的HBase和
Spark
体系构建企业级数据处理平台,并且针对于一些具体落地场景进行了介绍。
weixin_34071713
·
2024-03-12 22:44
大数据
数据库
爬虫
Python贵州贵阳二手房源爬虫数据可视化分析大屏全屏系统 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-12 16:35
毕设资料
贵州贵阳二手房源爬虫数据可视化
lightGBM专题4:py
spark
平台下lightgbm模型保存
之前的文章(py
spark
lightGBM1和py
spark
lightGBM2)介绍了py
spark
下lightGBM算法的实现,本文将重点介绍下如何保存训练好的模型,直接上代码:frompy
spark
.sqlimport
Spark
Sessionfrompy
spark
.ml.featureimportStringIndexer
I_belong_to_jesus
·
2024-03-12 12:30
大数据
大数据开发(
Spark
面试真题-卷六)
大数据开发(
Spark
面试真题)1、
Spark
HashPartitioner和RangePartitioner的实现?
Key-Key
·
2024-03-12 02:16
大数据
spark
面试
大数据开发(Hadoop面试真题-卷二)
6、
Spark
为什么比MapReduce更快?7、详细描述一
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
【AI】如何创建自己的自定义ChatGPT
如何创建自己的自定义ChatGPT目录如何创建自己的自定义ChatGPT大型语言模型(LLM)GPT模型ChatGPTOpenAIAPILlamaIndexLangChain参考推荐超级课程:Docker快速
入门到精通
小涵
·
2024-03-12 01:14
AI
ChatGPT
ai
chatgpt
openai
llama
langchain
python
语言模型
Java开发从
入门到精通
(一):Java的十大经典排序算法
时间复杂度:指算法执行语句的次数,而并不是计算程序具体运行的时间。空间复杂度:指运行完一个程序所需内存的大小。稳定性:指待排序的序列中有两元素相等,排序之后它们的先后顺序不变。冒泡排序冒泡排序算法的原理如下:比较相邻的两个元素,如果前者比后者大(反之倒序),则交换。对每一对相邻元素做同样的工作,从开始第一对到结尾的最后一对。针对所有的元素重复以上的步骤。持续每次对越来越少的元素重复上面的步骤,直到
HACKNOE
·
2024-03-11 21:38
Java开发从入门到精通
排序算法
算法
数据结构
基于Python电影院在线选座订票系统 (Django框架)答辩常规问题和如何回答(答辩指导)
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-11 03:58
毕设资料
电影院在线选座订票系统
Spark
从
入门到精通
29:
Spark
SQL:工作原理剖析以及性能优化
Spark
SQL工作原理剖析1.编写SQL语句只要是在数据库类型的技术里面,例如MySQL、Oracle等,包括现在大数据领域的数据仓库,例如Hive。
勇于自信
·
2024-03-11 00:20
大数据开发(Hadoop面试真题-卷九)
3、
Spark
mapjoin的实现原理?4、
Spark
的stage如何划分?在源码中是怎么判断属于ShuffleMapStage或ResultStage的?5、
Spark
reduceByKe
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
【DevOps基础篇】一文让你完全理解掌握Docker
推荐超级课程:Docker快速
入门到精通
Docker概念什么是Docker?Docker是一组使用操作系统级虚拟化以称为容器的包形式交付软件的产品。容器之间相互隔离,并捆绑自己的软件、库和配置文件。
小涵
·
2024-03-09 09:35
DevOps企业级项目实战
kubernetes
docker
容器
devops
架构
华为云
linux
Spark
Streaming(二):DStream数据源
1、输入DStream和Receiver输入(Receiver)DStream代表了来自数据源的输入数据流,在之前的wordcount例子中,lines就是一个输入DStream(JavaReceiverInputDStream),代表了从netcat(nc)服务接收到的数据流。除了文件数据流之外,所有的输入DStream都会绑定一个Receiver对象,该对象是一个关键的组件,用来从数据源接收数
雪飘千里
·
2024-03-09 01:28
Python北京二手房源爬虫数据可视化分析大屏全屏系统 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-08 19:16
毕设资料
北京二手房源爬虫数据可视化
Spark
常见问题汇总
注意:如果Driver写好了代码,eclipse或者程序上传后,没有开始处理数据,或者快速结束任务,也没有在控制台中打印错误,那么请进入
spark
的web页面,查看一下你的任务,找到每个分区日志的stderr
midNightParis
·
2024-03-08 03:25
spark
spark
Python湖南长沙二手房源爬虫数据可视化分析大屏全屏系统 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-07 21:17
毕设资料
湖南长沙二手房源爬虫数据可视化
抖音新人上热门技巧
《抖音+运营必备工具大全》《抖音快闪模板》《实战技巧
入门到精通
》课程纲要:一、《原创视频制作》内容包括:如何做一个完整的原创视频,包括如何做片头、片尾、如何去水印、视频剪辑、加字幕、找配音、如何找素材等
rno5555
·
2024-03-06 19:51
从
入门到精通
:Elasticsearch开发实践教程
Elasticsearch是一款开源的搜索引擎,它使用Lucene搜索库作为其核心搜索引擎。Elasticsearch使用RESTfulAPI进行交互,并支持多种数据类型的搜索和聚合。本教程将介绍Elasticsearch的基本原理,如何开发,以及如何在SpringBoot中使用Elasticsearch。Elasticsearch的原理Elasticsearch是一个分布式的文档存储和搜索引擎。
青年老年程序员
·
2024-03-05 19:14
Elasticsearch学习
elasticsearch
jenkins
大数据
Spark
Shop开源可商用,匹配小程序H5和PC端带分销功能!
Spark
Shop(星火商城)B2C商城是基于thinkphp6+elementui的开源免费可商用的高性能商城系统;包含小程序商城、H5商城、公众号商城、PC商城、App,支持页面diy、秒杀、优惠券
行动之上
·
2024-03-05 15:09
源码免费下载
小程序
Python上海美食餐厅餐馆商家爬虫数据可视化分析和推荐查询系统 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-04 20:15
毕设资料
上海美食餐厅餐馆爬虫数据可视化
【Hadoop】在
spark
读取clickhouse中数据
clickhouse数据库数据importscala.collection.mutable.ArrayBufferimportjava.util.Propertiesimportorg.apache.
spark
.sql.SaveModeimportorg.apache.
spark
.sql.
Spark
SessiondefgetCKJdbcProperties
方大刚233
·
2024-03-03 06:54
Hadoop
Scala
hadoop
spark
clickhouse
Python青海西宁二手房源爬虫数据可视化分析大屏全屏系统 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-03 02:20
毕设资料
青海西宁二手房源爬虫数据可视化
Spark
-sql Adaptive Execution动态调整分区数量,调整输出文件数
有时间为了解决小文件问题,我们把
spark
.sql.shuffle.partitions这个参数调整的很小,但是随着时间的推移,数据量越来越大,当初设置的参数就不合适了,那有没有一个可以自我伸缩的参数呢
不想起的昵称
·
2024-03-02 15:03
hive
spark
hive
数据仓库
hive join中出现的数据暴增(数据重复)
我们来看一下案例:
spark
-sql>withtest1as>(select'10001'asuid,'xiaomi'asqid>unionall>select'10002'asuid,'huawei'asqid
不想起的昵称
·
2024-03-02 15:03
hive
大数据
hadoop
hive
hive四种常见的join
1.左连接leftjoin
spark
-sql>withtest1as(>select1asuser_id,'xiaoming'asname>unionall>select2asuser_id,'xiaolan'asname
不想起的昵称
·
2024-03-02 15:33
hive
大数据
hadoop
hdfs
hive
第5章:性能优化《Nginx实战:从
入门到精通
》
在Web服务器的世界里,性能是一个永恒的话题。Nginx已经是一个非常高效的服务器了,但是通过一些优化措施,你可以让它运行得更快、处理更多的请求,同时使用更少的资源。本章将探讨一些提升Nginx性能的策略。Nginx性能调优基础优化Nginx性能的第一步是理解和配置它的工作模式和工作参数,以适应你的具体需求和服务器环境。工作进程和连接数worker_processes:这个指令告诉Nginx启动多
运维家
·
2024-03-02 05:47
性能优化
nginx
运维
Python辽宁沈阳二手房源爬虫数据可视化分析大屏全屏系统 开题报告
所有项目都配有从
入门到精通
的基础知识视频课程,学习后应对毕业设计答辩。
黄菊华老师
·
2024-03-01 12:53
毕设资料
辽宁沈阳二手房源爬虫数据可视化
【Java万花筒】从
入门到精通
:Java实时数据可视化库详解
实时数据可视化:Java开发者必备技能前言在当今数据时代,实时数据可视化已成为企业和个人决策的关键环节之一。作为一名Java开发者,掌握实时数据可视化库的使用,可以帮助您更好地展示数据,提高工作效率和决策质量。本文将为您介绍目前市面上流行的八个Java实时数据可视化库,旨在帮助您快速入门和提高数据可视化能力。【Java万花筒】数据之翼:Java库助您飞跃科学计算高峰【Java万花筒】Java图形库
friklogff
·
2024-03-01 08:48
Java万花筒
信息可视化
java
Spark
整合hive(保姆级教程)
准备工作:1、需要安装配置好hive,如果不会安装可以跳转到Linux下编写脚本自动安装hive2、需要安装配置好
spark
,如果不会安装可以跳转到
Spark
安装与配置(单机版)3、需要安装配置好Hadoop
万家林
·
2024-02-29 09:47
spark
hive
spark
hadoop
Scrapy与分布式开发(1.1):课程导学
Scrapy与分布式开发:从
入门到精通
,打造高效爬虫系统课程大纲在这个专栏中,我们将一起探索Scrapy框架的魅力,以及如何通过Scrapy-Redis实现分布式爬虫的开发。
九月镇灵将
·
2024-02-28 11:23
打造高效爬虫系统
scrapy
分布式
python
爬虫
native sql -ABAP开发从
入门到精通
笔记
NativeSQLSQL概要OPENSQL读取数据SelectSelect...Selectsignle....where.列去重数据Selectdistinct...where...当取多条数据时,select结果会保存到内表中。Select...into...语句的结果不是保存在内保中,而是保存到了wa中,这里就要加一个endselect语句。【如果是selectintowa,就要使用ends
guduchangjian
·
2024-02-27 12:23
sql
笔记
数据库
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他