E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark安装配置
离线数仓(一)【数仓概念、需求架构】
前言今天开始学习数仓的内容,之前花费一年半的时间已经学完了Hadoop、Hive、Zookeeper、
Spark
、HBase、Flume、Sqoop、Kafka、Flink等基础组件。
让线程再跑一会
·
2024-02-11 11:58
离线数仓
大数据
Hive与ClickHouse的区别
Hive的存储引擎使用HDFS,计算引擎使用MapReduce或
Spark
。Hive本质上是一个元数据管理平台,通过对存储于HDFS上的数据文件附加元数据,赋予HDFS上的文件以数据库表的语义。
晓之以理的喵~~
·
2024-02-11 08:18
Hadoop
大数据
hive
hive
clickhouse
hadoop
FFmpeg
安装配置
指南
ffmpeg01.png
安装配置
将压缩包解压到安装软件的目录,比如D:\Portable\。复制ffmpeg.exe文件所在的目录。
大器待成
·
2024-02-11 08:58
ffmpeg库 pycharm_python+ffmpeg让字符跳动起来
,这里只说Windows下的方式,首先去官网,下载Windows版本的安装包ffmpeg.png2.下载完成后,解压,然后找到目录下的bin文件夹,将该目录配置到环境变量中解压目录.png3.验证是否
安装配置
成功
weixin_39918961
·
2024-02-11 07:33
ffmpeg库
pycharm
Yoga14s 2021 ARH R7 4800H 安装Arch Linux
最后修改时间2021-03-0321:19Yoga14s硬件配置简要CPU:AMDR74800H显卡:AMDVega8集显
安装配置
简要采用systemd-boot方式引导启动采用wayland作为显示引擎使用
雅心姐
·
2024-02-11 07:54
Spark
编程题
数据格式如下:张三|男|23|未婚|北京|海淀李四|女|25|已婚|河北|石家庄求:1.数据中所有人的平均年龄2.数据中所有男性未婚的人数和女性未婚人数3.数据中20-30已婚数量前3的省份答案:package
spark
08importorg.apache.
spark
.rdd.RDDimportorg.apache.spa
不愿透露姓名的李某某
·
2024-02-11 07:09
死磕
spark
中的job、stage、task
写在前面台风夜的电话面试里被问到了
spark
运行任务的过程中stage的划分依据。一下子就给整懵了,支支吾吾答非所问。从事大数据的开发也有一年半光景,
spark
任务的运行原理依旧知之甚少。
NikolasNull
·
2024-02-11 06:11
centos中docker操作+
安装配置
django并使用simpleui美化管理后台
一、安装docker确保系统是CentOS7并且内核版本高于3.10,可以通过uname-r命令查看内核版本。更新系统软件包到最新版本,可以使用命令yumupdate-y。安装必要的软件包,包括yum-utils、device-mapper-persistent-data和lvm2。使用命令yuminstall-yyum-utilsdevice-mapper-persistent-datalvm2
symstandsun
·
2024-02-11 05:42
centos
docker
linux
国外现代并行计算课程CMU-15-418/15-618: Parallel Computer Architecture and Programming
这是与计算物理最相关的CS课程,计算物理方向很容易吃透作为项目写到简历上这部分主要包括多核计算OpenMPSIMD集群计算MPIGPU计算CUDA分布式计算MapReduce
Spark
互联网主要重视分布式计算
wwxy261
·
2024-02-11 05:03
算法
使用docker搭建
spark
(2.3.1)集群
使用Docker快速搭建
Spark
集群。
zealscott
·
2024-02-11 01:12
ubuntu 22.04部署quincy版ceph
ceph集群
安装配置
有多种方式,下方cephadm方式是借助容器部署。cephadm从ceph的octopus版本开始支持。安装需要主机配置安装了容器和python3。
嗨安HiAn
·
2024-02-10 22:26
ceph
linux
ubuntu
大数据毕业设计django+vue.js+scrapy租房推荐系统 租房大屏可视化 租房爬虫 hadoop
spark
58同城租房爬虫 房源推荐系统 计算机毕业设计
博主介绍:✌全网粉丝100W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌由于篇幅限制,想要获取完整文章或者源码,或者代做,可以给我留言或者找我聊天。感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人。文章包含:项目选题+项目展示图片(必看)计算机毕业设计吊
B站计算机毕业设计超人
·
2024-02-10 20:52
大数据毕业设计
大数据
课程设计
scrapy
hadoop
大数据毕业设计
计算机毕业设计
爬虫
Win10
安装配置
pyenv & virtualenv
Win10
安装配置
pyenv&virtualenv安装pyenv安装vitualenv使用镜像源加速安装包pyenv用于管理多个版本的pythonvirtualenv用于管理虚拟环境安装pyenvGitHUb
拾一滴清水
·
2024-02-10 19:10
Python环境准备
Python版本管理
Python虚拟环境安装
正向代理Squid
安装配置
方案
Squid
安装配置
文档说明将安装目录指定到/usr/local/squid目录,用户/用户组为domains:domains可根据实际情况调整#切换到root用户安装#解压tar-zxfsquid-5.5
30醒悟的码农
·
2024-02-10 17:57
服务器
linux
运维
squid
报表任务治理计划
先给大家介绍我们我们公司的报表产出组件图:报表产出图底层平台由HDFS、Yarn分别提供存储和计算支持在这之上我们提供了一套支持MR、
Spark
任务开发、依赖执行的调度系统BI业务同学利用调
liujianhuiouc
·
2024-02-10 12:46
计算机毕业设计Python+
Spark
+LSTM微博大屏情感分析 微博大数据分析 微博情感分析 微博爬虫可视化 微博数据分析 微博采集分析平台
开发技术前端:vue.jsechartswebsocket后端API:springboot+
spark
+mybatis爬虫/算法:python、lstm情感分析(python实现)数据库:mysql创新点
计算机毕业设计大神
·
2024-02-10 12:42
spark
键值对的链接
join连接frompy
spark
import
Spark
Contextif__name__=="__main__":master="local"iflen(sys.argv)==2:master=sys.argv
yanghedada
·
2024-02-10 09:27
python-cx_oracle报错"DatabaseError: DPI-1047: 64-bit Oracle Client library cannot be loaded: "
首先
安装配置
时,必须把握一个点,就是版本一致!包括:系统版本,python版本,oracle客户端的版本
软件干货集合
·
2024-02-10 08:00
15.2 Linux入门(❤❤❤❤)
15.2Linux入门1.Linux基础1.1基础概念1.操作系统2.Linux操作系统3.CentOS操作系统1.2CentOS
安装配置
1.运行要求2.虚拟机与CentOS安装1.3Linux目录结构
与海boy
·
2024-02-10 07:46
Java工程师(后端开发)
linux
运维
服务器
解决:源码安装caffe时遇到libcudnn.so: file not recognized问题
参考教程(19条消息)ubuntu16.04下Detectron+caffe2(Pytorch)
安装配置
过程_张家坎的博客-CSDN博客_caffe2_detectron_ops_gpu.dllhttps
Gracie丹妮
·
2024-02-10 07:24
横扫
Spark
之 - 9个常见的行动算子
水善利万物而不争,处众人之所恶,故几于道文章目录1.collect()2.count()3.first()4.take()5.takeOrdered()6.countByKey()7.saveAS...()8.foreach()9.foreachPartition()***1.collect() 收集RDD每个分区的数据以数组封装之后发给Driver 如果RDD数据量比较大,Driver内存默
阿年、嗯啊
·
2024-02-10 06:04
Spark
spark
大数据
分布式
行动算子
横扫
Spark
之 - 22个常见的转换算子
水善利万物而不争,处众人之所恶,故几于道文章目录1.map()2.flatMap()3.filter()4.mapPartitions()5.mapPartitionsWithIndex()6.groupBy()7.distinct()8.coalesce()9.repartition()10.sortBy()11.intersection()12.union()13.subtract()14.z
阿年、嗯啊
·
2024-02-10 06:01
Spark
spark
大数据
转换算子
Hbase
安装配置
(含分布式ZooKeeper)
server02192.168.255.131=》server03/etc/hosts文件中有这些IP和域名的映射关系配置server01在hadoop用户下可以通过密钥无需密码访问server02和server031.
安装配置
聊码
·
2024-02-10 04:17
ansible
ansiblehttps://bbs.oldboyedu.com/thread-1513-1-1.html
安装配置
自动化运维工具ansibleansible基于python开发的自动化运维工具(saltstack
zwb_jianshu
·
2024-02-10 03:44
新人数据技术如何快速提升
对于数据平台和工具而言,一般情况下都是在Hadoop生态下做开发,但对于一些有特殊要求的团队,
Spark
和Flink已经得
晓阳的数据小站
·
2024-02-09 23:46
数据开发
数据
毕业设计:基于python的反爬虫系统
目录前言设计思路一、课题背景与意义二、算法理论技术2.1
spark
技术2.2反爬虫设计2.3黑名单设计三、检测的实现3.1数据集3.2实验环境最后前言大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备
Krin_IT
·
2024-02-09 22:54
毕业设计
毕设
python
网络爬虫
Android Studio无法安装Git问题解决(折中方案)
安装配置
好studio,往往会使用git克隆github上面的项目,但是却发现git无法正确安装,本文将介绍如何解决git无法安装这一问题。对于git安装,实际比较复杂,可以参考这一篇博客。
牛哥带你学代码
·
2024-02-09 21:15
移动部署
android
studio
git
android
vscode开发FPGA(0)--windows平台搭建
一、从官网下载安装VScodeDownloadVisualStudioCode-Mac,Linux,Windows二、
安装配置
插件1.安装Chinese(simplified)中文汉化包2.安装Verilog-HDL
zidan1412
·
2024-02-09 19:35
FPGA
vscode
编辑器
ClickHouse-简谈OLAP与ClickHouse
在第一届易观OLAP大赛中,在用户行为分析转化漏斗场景里,ClickHouse比
Spark
快了近10倍。在随后几年的
adson1987
·
2024-02-09 18:00
Database
ClickHouse
OLAP
海量数据分析
初识kafka
目前越来越多的开源分布式处理系统如Cloudera、Storm、
Spark
、Flink等都支持与Kafka集成。
tracy_668
·
2024-02-09 14:07
69.Kudu、
Spark
2、Kafka安装—CDH
69.1演示环境介绍CDH集群运行正常操作系统版本为:CentOS6.5CM和CDH版本为:5.12.1CM管理员为:admin用户操作系统用户为:root用户69.2操作演示Kudu安装Kudu的Parcel部署下载Kudu的Parcel包:http://archive.cloudera.com/kudu/parcels/5.12.1/KUDU-1.4.0-1.cdh5.12.1.p0.10-e
大勇任卷舒
·
2024-02-09 14:55
spark
开发中的Zip算子灵活使用
本人开发中,需要聚合的文段举个栗子:RDD中有如下元素kv((a,b),List(7,8,9))((a,b),List(1,2,3))((a,b),List(4,5,6))((c,d),List(4,5,6))。。。。。。reducebyke后要对v操作原理将v中的list前后zip再map每个元素进行逐个元组元素(口,口)的累加。a代表v的前一个元素,b代表v的后一个元素如vala=List(7
Hero.Lin
·
2024-02-09 13:35
spark
scala
开发
spark-core
slurm
安装配置
_Slurm任务调度系统部署和测试(源码)(1)
1.概述slurm任务调度系统,主要应用在HPC集群资源管理和任务调度。具体信息参见slurm官方网站:https://slurm.schedmd.com/部署Slurm任务调度系统,需要部署NTP内网时间同步服务器,LDAP全局认证服务器,Mysql数据库服务器本篇博客主要记录如何部署和使用slurm任务调度系统。1.1节点信息节点主机名操作系统主机地址主机角色node11centos6.5_x
多伦多豪
·
2024-02-09 10:43
slurm安装配置
[python] 使用selenium+pywinauto模块处理弹窗中的图片/文件上传
[python]使用selenium+pywinauto模块处理弹窗中的图片/文件上传前言前期准备selenium模块模块安装驱动
安装配置
pywinauto模块安装实战用例打开弹窗定位弹窗并上传结果展示完整示例代码总结前言在我们使用
颖森
·
2024-02-09 10:55
selenium
python
selenium
开发语言
web
爬虫
自动化
edge
Spark
是什么?与MapReduce的对比
Spark
是一个基于内存的集群计算系统,是一个分布式的计算框架。
Spark
可以将计算任务分发到多个机器并行计算。
Tim在路上
·
2024-02-09 10:27
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2024-02-09 09:54
macos安装local模式
spark
文章目录配置说明安装hadoop安装
Spark
测试安装成功配置说明Scala-3.18+
Spark
-3.5.0Hadoop-3.3.6安装hadoop从这里下载相应版本的hadoop下载后解压,配置系统环境变量
SparklingTheo
·
2024-02-09 08:52
大数据-linux
macos
spark
大数据
安装Python for windows
下载下载地址:https://www.python.org/downloads/release/python-374/选了64位版本
安装配置
将python目录加入环境变量添加环境变量将python目录添加进
瑞恩老湿
·
2024-02-09 08:51
【内网穿透】无公网ip远程访问本地项目
目录前言1.
安装配置
2.隧道配置前言内网穿透是一种将局域网内部的服务或项目暴露给公网访问的技术,这种技术通常用于需要远程访问内部网络中的服务或项目以下是使用内网穿透进行无公网IP远程访问本地项目的基本步骤
码农研究僧
·
2024-02-09 08:09
配置
网络协议
隧道
内网穿透
SQL条件判断语句嵌套window子句的应用【易错点】--HiveSql面试题25
目录0需求分析1数据准备3数据分析4小结0需求分析需求:表如下user_idgood_namegoods_typerk1hadoop1011hive1221sqoop2631hbase1041
spark
1351flink2661kafka1471oozie108
莫叫石榴姐
·
2024-02-09 06:00
SQLBOY1000题
sql
HiveSql面试题
sql
HiveSQL——条件判断语句嵌套windows子句的应用
0需求分析需求:表如下user_idgood_namegoods_typerk1hadoop1011hive1221sqoop2631hbase1041
spark
1351flink2661kafka1471oozie108
爱吃辣条byte
·
2024-02-09 06:58
#
HIve
SQL
大数据
数据仓库
Spark
SQL(十一):与
Spark
Core整合
每日top3热点搜索词统计Demo1、数据格式:日期用户搜索词城市平台版本2、需求:1、筛选出符合查询条件(城市、平台、版本)的数据2、统计出每天搜索uv排名前3的搜索词3、按照每天的top3搜索词的uv搜索总次数,倒序排序4、将数据保存到hive表中3、实现思路:1、针对原始数据(HDFS文件),获取输入的RDD2、使用filter算子,去针对输入RDD中的数据,进行数据过滤,过滤出符合查询条件
雪飘千里
·
2024-02-09 06:34
大数据 -
Spark
系列《五》-
Spark
常用算子
Spark
系列文章:大数据-
Spark
系列《一》-从Hadoop到
Spark
:大数据计算引擎的演进-CSDN博客大数据-
Spark
系列《二》-关于
Spark
在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-09 05:25
spark
大数据
spark
分布式
SQL、Hive中的SQL和
Spark
中的SQL三者联系与区别
SQL、Hive中的SQL和
Spark
中的SQL(即
Spark
SQL)都是用于处理和分析数据的查询语言,但它们在实现、性能、应用场景等方面存在一些明显的区别和联系。
大数据SQLboy
·
2024-02-09 05:20
数据库
Spark
Hive
数据库
py
spark
操作示例
前置pipinstallpy
spark
为了支持py4j的使用,需要进行如下设置,并修改了java_gateway.py中的env['_PY
SPARK
_DRIVER_CALLBACK_HOST']='127.0.0.1
佛系小懒
·
2024-02-09 05:15
keepalived
文章目录一、Keepalived高可用概述VRRP原理二、Keepalived高可用
安装配置
安装keepalived配置master配置backup对比master与Backup的keepalived配置区别启动
Dream visit
·
2024-02-09 05:05
企业服务
keepalived
高可用
winform工具报错处理
winform工具报错处理如图:出现这种错误,工具打不开就是没有这个(.NET)环境,需要根据工具的使用开发环境
安装配置
插件解决方案需要安装如图的插件:选择文件导入报错1.如果之前已安装过AccessDatebase
IT-例子
·
2024-02-09 04:35
C#
winform
C#
c#
spark
从入门到放弃二十八:
Spark
Sql (1)Data Set
文章地址:http://www.haha174.top/article/details/257834项目源码:https://github.com/haha174/
spark
.git1.简介
Spark
Sql
意浅离殇
·
2024-02-09 03:17
git
安装配置
1、下载安装下载地址2、配置git用户gitconfig--globaluser.name"yw"gitconfig--globaluser.email"
[email protected]
"3、gitinit初始化4、生成ssh密钥mkdir.ssh//创建文件夹cd.ssh//进入新建文件夹ssh-keygen-trsa//输入密钥文件名后一直回车5、复制密钥6、gitee上添加即可
风轻_
·
2024-02-09 03:57
git
再聊阴影裁剪与高性能视锥剔除
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2024-02-09 03:24
厚积薄发
Unity优化
阴影
unity
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他