E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark环境安装
大数据运维实战指南:零基础入门与核心技术解析(第一篇)
)系列文章目录第一篇:大数据运维概述与核心技能体系第二篇:Hadoop生态体系与集群部署实战第三篇:分布式存储系统运维与优化第四篇:资源调度框架YARN/K8s深度解析第五篇:实时计算框架Flink/
Spark
emmm形成中
·
2025-03-09 01:19
大数据
运维
(Pytorch)动手学深度学习:基础内容(持续更新)
深度学习前言
环境安装
(Windows)安装anaconda使用conda或miniconda创建环境下载所需的包下载代码并执行(课件代码)关于线性代数内积(数量积、点乘)外积关于数据操作X.sum(0,
孔表表uuu
·
2025-03-09 01:48
神经网络
深度学习
pytorch
人工智能
Qwen微调-环境配置-week9
在这里插入图片描述](https://img-blog.csdnimg.cn/direct/213a0fb70a2e430684155bbd06a7ff36.png#pic_center)Qwen1.5-4B微调-
环境安装
对
breeze281
·
2025-03-08 23:01
python
人工智能
机器学习
OpenAPI Generator Maven 插件配置详解(SpringBoot集成)
0-1开始Java语言编程之路一、Ubuntu下Java语言环境搭建|MacOS下使用Jenv管理多JDK版本二、Ubuntu下Docker
环境安装
|MacOS下Docker安装与配置三、使用Docker
txzq
·
2025-03-08 22:00
maven
spring
boot
java
Generator
OpenAPI
python量化数据15:计算同花顺涨停次日涨跌幅表现
一、
环境安装
pipinstallpandaspipinstallrequestspipinstallmootdx二、代码frommootdx.quotesimportQuotesimportpandasaspdimportrequestsimporttimeimportjsonclient
ETF股债基指标
·
2025-03-08 20:37
linux
运维
服务器
spark
集群,kafka集群和zookeeper的docker集群快速搭建
准备操作安装docker(宿主机)yuminstalldocker(宿主机时centos用yum管理包)systemctldaemon-reload(重加载deamon服务,是docker的核心)systemctlrestartdocker.service(重启docker服务)docker常用命令dockerps-a查看所有容器dockersearchUbuntu寻找Ubuntu的镜像docke
醉与浮
·
2025-03-08 15:05
tools
docker
spark
kafka
大数据计算框架深入:
Spark
SQL、DataFrame、RDD 性能优化
1.引言Apache
Spark
是当前最流行的大数据计算框架之一,其中
Spark
SQL、DataFrame和RDD(ResilientDistributedDataset)是数据处理的三大核心API。
晴天彩虹雨
·
2025-03-08 10:48
大数据
spark
big
data
python将pdf转换成word
说明:我计划用python,把pdf文件转换成word文件step1:把python
环境安装
好,然后把helloworld跑起来step2:安装依赖:首先需要安装必要的Python库,在终端中运行,会开始下载依赖包
勘察加熊人
·
2025-03-07 07:18
typescript
python
pdf
word
Python核心技术,Django学习基础入门教程(附
环境安装
包)
文章目录前言1.环境准备1.1Python安装1.2选择Python开发环境1.3创建虚拟环境1.4安装Django2.创建Django项目3.Django项目结构介绍4.启动开发服务器5.创建Django应用6.应用结构介绍7.编写视图函数8.配置URL映射9.运行项目并访问视图10.数据库配置与模型创建10.1数据库配置10.2创建模型11.使用Django管理界面11.1创建超级用户11.2
小白教程
·
2025-03-07 02:55
python
python
django
学习
Django项目
Django项目实战
Django教程
Django入门教程
javaEE概述
whatjavaEEjavaEE输入分布式多层的应用程序,javaEE平台用的是分布式多层应用模型为企业应用(由组件构成),根据他们不同的逻辑功能分为不同组件,构成JavaEE应用程序的组件根据应用组件在javaEE的不同
环境安装
到不同机器上
qq_45691343
·
2025-03-07 01:42
Spark
单机伪分布式环境搭建、完全分布式环境搭建、
Spark
-on-yarn模式搭建
搭建
Spark
需要先配置好scala环境。三种
Spark
环境搭建互不关联,都是从零开始搭建。如果将文章中的配置文件修改内容复制粘贴的话,所有配置文件添加的内容后面的注释记得删除,可能会报错。
遇安.YuAn
·
2025-03-06 17:06
Spark
大数据平台组件搭建
hadoop
大数据
Spark
scala
环境搭建
Go-Gin Web 框架完整教程
1.环境准备1.1Go
环境安装
Go语言(或称Golang)是一个开源的编程语言,由Google开发。在开始使用Gin框架之前,我们需要先安装Go环境。
m0_74825656
·
2025-03-06 10:00
面试
学习路线
阿里巴巴
golang
gin
前端
云服务器安装宝塔Linux面板教程(建议收藏)
宝塔安装命令:宝塔面板:一站式云服务管理工具二、宝塔面板的安装命令安装命令2分钟装好面板,一键管理服务器集成LAMP/LNMP
环境安装
,网站、FTP、数据库、文件管理、软件安装等功能Cento
慈云数据
·
2025-03-06 06:56
linux
服务器
linux
运维
使用Docker搭建本地Nexus私有仓库
0-1开始Java语言编程之路一、Ubuntu下Java语言环境搭建二、Ubuntu下Docker
环境安装
三、使用Docker搭建本地NexusMaven私有仓库四、Ubuntu下使用VisualStudioCode
txzq
·
2025-03-06 03:05
JAVA
基础
docker
maven
java
部署Django+nginx+uwsgi到ubuntu服务器
,先拉取新的仓库,再更新安装sudoadd-apt-repositoryppa:jonathonf/python-3.6sudoaptupdatesudoaptinstallpython3.6创建虚拟
环境安装
虚拟环境命令
Mr番茄蛋
·
2025-03-05 20:10
问题解决
python
Linux
RagFlow专题四、RagFlow 代码实战:基于通义千问(百炼平台)的检索增强生成(RAG)实现
1.环境搭建在本次代码实战中,我们需要完成以下准备工作:安装Python运行
环境安装
依赖库(向量数据库+检索库+通义千问APISDK)配置API密钥搭建RagFlow基
伯牙碎琴
·
2025-03-05 13:07
大模型
RagFlow
RAG
检索增强
(一)
spark
是什么?
1.
spark
是什么?
spark
是一个用来实现快速,通用的集群计算平台
spark
适用于各种各样原先需要多种不同的分布式平台的场景,包括批处理,迭代算法,交互式查询,流处理。
一智哇
·
2025-03-05 11:21
大数据框架学习
spark
big
data
大数据
spark
hdfs 常用命令
目录lsrmgettext以下按照使用频率和使用先后顺序排序(纯个人习惯)ls列出hdfs文件系统路径下的目录和文件hdfsdfs-ls列出hdfs文件系统路径下所有的目录和文件hdfsdfs-ls-Rrmhadoopfs-rm...hadoopfs-rm-r...每次可以删除多个文件或目录getlocalfile不能和hdfsfile名字不能相同,否则会提示文件已存在,没有重名的文件会复制到本地
毛球饲养员
·
2025-03-05 11:19
spark
spark
hdfs
常用
spark
命令
--
spark
启动localhost$
spark
-sql--masteryarn启动主节点yarn模式--查看hdfs文件hdfsdfs-ls/
spark
/myDatabase.db查看我们建的表其实是是建立在
会拉小提琴的左脚
·
2025-03-05 11:19
大数据
spark
hadoop
hdfs
Spark
详解二
八、
Spark
部署模式1、Local本地模式:运行于本地
spark
-shell--masterlocal[2](local[2]是说,执行Application需要用到CPU的2个核)2、Standalone
卢子墨
·
2025-03-05 11:13
Spark原理
实战
总结
spark
Spark
基本命令
一、
spark
所在目录cdusr/local/
spark
二、启动
spark
/usr/local/
spark
/sbin/start-all.sh启动Hadoop以及
Spark
:bash.
chenworeng5605
·
2025-03-05 10:42
大数据
scala
shell
spark
vi基本使用
打开文件与创建文件是Linux的内置命令,以命令的方式来运行。命令格式:vi/路径/文件名注意以下两种情况:1.如果这个文件不存在,此时就是新建文件,编辑器的左下角会提示:newfile2.如果文件已存在,此时就打开这个文件,进入命令模式。把文本内容添加到一个全新的文件的快捷方式:echo1>>1.txt三种模式vi编辑器有三种工作模式,分别为:命令模式,输入模式,底线模式。命令模式:所敲按键编辑
忧伤火锅麻辣烫
·
2025-03-05 10:09
笔记
Spark
是什么?可以用来做什么?
Apache
Spark
是一个开源的分布式计算框架,专为处理大规模数据而设计。它最初由加州大学伯克利分校开发,现已成为大数据处理领域的核心工具之一。
Bugkillers
·
2025-03-05 10:37
大数据
spark
大数据
分布式
spark
常见操作命令
配置虚拟机配置即让自己的虚拟机可以联网,和别的虚拟机通讯一、配置vm虚拟机网段。具体设置为:虚拟机左上角点击编辑→虚拟网络编辑器选择VMnet8,要改动两个地方(注意:它会需要管理员权限):1.子网IP改成192.168.10.02.NAT设置→192.168.10.2让所有的VM配置的虚拟机使用NAT时,它们的网段都是一致的。注意:这里的第三个部分的10并不是固定的,我们自己可以约定,但是
小冻梨!!!
·
2025-03-05 10:07
spark
Py
Spark
实现获取S3上Parquet文件的数据结构,并自动在Snowflake里建表和生成对应的建表和导入数据的SQL
Py
Spark
实现S3上解析存储Parquet文件的多个路径,获取其中的数据Schema,再根据这些Schema,参考以下文本,得到创建S3路径Stage的SQL语句和上传数据到Snowflake数据库的
weixin_30777913
·
2025-03-05 08:25
python
aws
sql
spark
37.索引生命周期管理—kibana 索引配置
37.1背景引入索引生命周期管理的一个最重要的目的就是对大量时序数据在es读写操作的性能优化如通过
spark
streaming读取Kafka中的日志实时写入es,这些日志高峰期每天10亿+,每分钟接近100w
大勇任卷舒
·
2025-03-04 23:42
ELK
elasticsearch
大数据
big
data
通过
spark
-redshift工具包读取redshift上的表
spark
数据源API在
spark
1.2以后,开始提供插件诗的机制,并与各种结构化数据源整合。
stark_summer
·
2025-03-04 22:02
spark
spark
redshift
parquet
api
数据
大数据面试临阵磨枪不知看什么?看这份心理就有底了-大数据常用技术栈常见面试100道题
4
Spark
和HadoopMapReduce的区别是什么?5如何在
Spark
中实现数据的持久化?6
Spark
Streaming的工作原理是什么?7如何优化
Spark
作业的性能?
大模型大数据攻城狮
·
2025-03-04 21:59
大数据
面试
职场和发展
面试题
数据仓库
算法
Spark
复习八:简述
Spark
运行流程以及
Spark
分区以及简述
Spark
Context
1.简述
Spark
运行流程:1.构建
Spark
Application的运行环境,启动
Spark
Context2.
Spark
Context向资源管理器(可以是Standalone,Mesos,Yarm)申请运行
IT change the world
·
2025-03-04 21:28
spark
spark
大数据
面试
hadoop
zookeeper
Spark
使用Parqute存储方式有什么好处
列式存储:压缩效率和查询效率谓词下推存储层:查询数据块生态兼容性高:
Spark
,hadoop等都兼容
冰火同学
·
2025-03-04 21:27
Spark
spark
初学者如何用 Python 写第一个爬虫?
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
ADFVBM
·
2025-03-04 16:19
面试
学习路线
阿里巴巴
python
爬虫
开发语言
python流水线自动化项目教程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言1.项目环境准备Python安装选择Python开发
环境安装
必要库2.数据获取与理解4.模型训练流水线6.模型保存7.模型部署
小白教程
·
2025-03-04 12:46
python
python
自动化
开发语言
python自动化
python学习教程
python基础教程
Spark
架构都有那些组件
Spark
组件架构主要采用主从结构,分别是driver驱动器,Excutor执行器,和clusterManager集群管理器这个三个架构组件其中driver驱动器主要负责
spark
执行Excutor的任务分配
冰火同学
·
2025-03-04 11:37
Spark
spark
架构
大数据
hive-staging文件问题——DataX同步数据重复
所以会在相应目录下生成hive-staging文件;2.Hive-sql任务执行过程中出现异常,导致hive-staging文件未删除,未出现异常时,hive会自行删除hive-staging文件;3.使用
spark
-sqlonyarn
Aldebaran α
·
2025-03-03 23:38
Hive
sql
hive
大数据
hdfs
spark
避免Hive和
Spark
生成HDFS小文件
Hive和
spark
-sql是两个在常用的大数据计算分析引擎,用户直接以SQL进行大数据操作,底层的数据存储则多由HDFS提供。
穷目楼
·
2025-03-03 22:36
数据库
大数据
大数据
spark
hive
hadoop
机器学习_Py
Spark
-3.0.3随机森林回归(RandomForestRegressor)实例
机器学习_Py
Spark
-3.0.3随机森林回归(RandomForestRegressor)实例随机森林回归(RandomForestRegression):任务类型:随机森林回归主要用于回归任务。
Mostcow
·
2025-03-03 18:01
数据分析
Python
机器学习
随机森林
回归
大数据
app弱网测试
目录目录1.引言2.什么是弱网测试3.测试用例4.弱网测试工具4.1.charles4.2.QNET5.
环境安装
5.1.安装charles5.2.安装QNET5.3.安装模拟器5.4.连接设备6.使用charles6.1
tcc374254426
·
2025-03-03 16:43
app专项测试
android
java
apache
强者联盟——Python语言结合
Spark
框架
引言:
Spark
由AMPLab实验室开发,其本质是基于内存的快速迭代框架,“迭代”是机器学习最大的特点,因此非常适合做机器学习。
博文视点
·
2025-03-03 12:15
全栈工程师
全栈
全栈数据
Spark
Python
PySpark
Spark
技术系列(三):
Spark
算子全解析——从基础使用到高阶优化
Spark
技术系列(三):
Spark
算子全解析——从基础使用到高阶优化1.算子核心概念与分类体系1.1算子本质解析延迟执行机制:转换算子构建DAG,行动算子触发Job执行任务并行度:由RDD分区数决定(
数据大包哥
·
2025-03-03 12:11
#
Spark
spark
大数据
分布式
大数据经典技术解析:Hadoop+
Spark
大数据分析原理与实践
ApacheHadoop和Apache
Spark
是目前主流开源大数据框架。由于其易于部署、高容错性、并行计算能力强、适应数据量大、可编程、社区支持广泛等特点,大大提升了大数据应用的效率和效果。
AI天才研究院
·
2025-03-03 10:27
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Spark
核心之06:知识点梳理
spark
知识点梳理
spark
_〇一1、
spark
是什么
spark
是针对于大规模数据处理的统一分析引擎,它是基于内存计算框架,计算速度非常之快,但是它仅仅只是涉及到计算,并没有涉及到数据的存储,后期需要使用
小技工丨
·
2025-03-03 07:03
大数据技术学习
SparkSQL
spark
大数据
Airflow和Py
SPARK
实现带多组参数和标签的Amazon Redshift数据仓库批量数据导出程序
设计一个基于多个带标签SQL模板作为配置文件和多组参数的Py
SPARK
代码程序,实现根据不同的输入参数,用Airflow进行调度,自动批量地将AmazonRedshift数据仓库的数据导出为Parquet
weixin_30777913
·
2025-03-02 17:45
python
spark
云计算
Flutter鸿蒙项目—如何添加对华为鸿蒙系统的支持
1.DevEcoStudio4.0Release版鸿蒙
环境安装
打开IDE,按照引导,安装环境即可,注意,nodejs选择v16.20。
不入流HarmonyOS开发
·
2025-03-02 09:58
鸿蒙
HarmonyOS
OpenHarmony
flutter
harmonyos
华为
OpenHarmony
鸿蒙应用开发
鸿蒙开发
鸿蒙
入门Apache
Spark
:基础知识和架构解析
介绍Apache
Spark
Spark
的历史和背景Apache
Spark
是一种快速、通用、可扩展的大数据处理引擎,最初由加州大学伯克利分校的AMPLab开发,于2010年首次推出。
juer_0001
·
2025-03-02 08:19
java
spark
menuconfig+Kconfig的简单配置
目录1.背景2.管理方案2.1:.h中直接定义2.2:.bat+Cmake2.3:Kconfig2.3.1
环境安装
2.3.2代码2.3.2.1目录结构2.3.2.2ble目录下的Kconfig2.3.2.3hardware
S火星人S
·
2025-03-02 08:17
Kconfig
笔记
Spark
核心算子对比:`reduceByKey`与`groupByKey`源码级解析及生产调优指南
Spark
核心算子对比:reduceByKey与groupByKey源码级解析及生产调优指南1.核心机制对比在
Spark
中,reduceByKey和groupByKey都是对键值对RDD(RDD[(K,
数据大包哥
·
2025-03-02 07:13
大数据
spark
分布式
Streampark 入门到生产实践
Streampark入门到生产实践1.StreamPark初探1.1什么是StreamPark1.2Features1.3架构2.
环境安装
要求如何插入一段漂亮的代码片3.安装apache-streampark
大数据学习爱好者
·
2025-03-02 04:53
spark开发和机器学习
数据仓库
数据仓库
大数据
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
京东云开发者
·
2025-03-01 19:46
spark
mapreduce
大数据
Spark
运行问题 java.lang.NoSuchMethodError 解决方案
一般情况,出现这种问题是因为scala和
spark
的版本不匹配,需要重新下载两者相匹配的版本。
@飞往你的山
·
2025-03-01 10:43
spark
scala
如何使用
Spark
Streaming将数据写入HBase
在
Spark
Streaming中将数据写入HBase涉及到几个步骤。以下是一个基本的指南,帮助你理解如何使用
Spark
Streaming将数据写入HBase。
Java资深爱好者
·
2025-03-01 05:02
spark
hbase
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他