E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark官方文档
py
spark
kafka mysql_数据平台实践①——Flume+Kafka+
Spark
Streaming(py
spark
)
蜻蜓点水Flume——数据采集如果说,爬虫是采集外部数据的常用手段的话,那么,Flume就是采集内部数据的常用手段之一(logstash也是这方面的佼佼者)。下面介绍一下Flume的基本构造。Agent:包含Source、Channel和Sink的主体,它是这3个组件的载体,是组成Flume的数据节点。Event:Flume数据传输的基本单元。Source:用来接收Event,并将Event批量传
weixin_39793638
·
2024-09-08 04:34
pyspark
kafka
mysql
git学习笔记
一、git原理git的
官方文档
有非常详细的介绍git的底层实现,在此膜拜一下linus大神。但是我觉得这一张图会更加清晰:图中左侧为工作区,右侧为版本库。
送你一朵小莲花
·
2024-09-08 03:27
git
git
github
pgAudit - 开源PostgreSQL审计日志
翻译自
官方文档
:传送门能力有限,如有错误请指正介绍PostgreSQL审计扩展(pgAudit)通过标准的PostgreSQL日志记录工具提供详细的会话和(或)对象审计日志记录。
chuitang9764
·
2024-09-08 02:22
数据库
操作系统
git
java邮箱服务器如何配置?java怎么发邮件?
然后,根据java邮箱服务器软件的
官方文档
,下载并解压安装包,按照步骤进行安装。安装过程中,可能
danplus
·
2024-09-08 00:35
EDM邮件营销
邮件营销
服务器
SMTP服务器
API接口
触发式邮件
营销邮件
Mysql 8.0 集群简介【
官方文档
5种方式】
Mysql官方介绍几种集群架构:Replication【主从复制】GroupReplication【组复制】InnoDBClusterInnoDBReplicaSetMySQLNDBCluster8.0网上比较全的介绍比较少,本文机翻了Mysql官网对Mysql8.0几种集群方式的简介。之后会一一研究并实际部署。Replication【主从复制】https://dev.mysql.com/doc/
arroganceee
·
2024-09-08 00:04
文档介绍
mysql
数据库架构
<转>
Spark
体系架构
最近看到一篇关于
Spark
架构的博文,作者是AlexeyGrishchenko。
yongjian_luo
·
2024-09-07 20:11
Spark
Spark
分布式计算原理
目录一、RDD依赖与DAG原理1.1RDD的转换一、RDD依赖与DAG原理
Spark
根据计算逻辑中的RDD的转换与动作生成RDD的依赖关系,同时这个计算链也形成了逻辑上的DAG。
NightFall丶
·
2024-09-07 20:40
#
Spark
apache
spark
spark
Apache Flink 替换
Spark
Stream的架构与实践( bilibili 案例解读)_stream
spark
flink加载udf(1)
bilibili早期使用的引擎是
Spark
Streaming,后期扩展了Flink,在开发架构中预留了一部分引擎层的扩展。最下层是状态存储
2401_84165953
·
2024-09-07 12:44
程序员
flink
spark
架构
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd
DataFrame.show()使用格式:df.show()df.show(1)+---+---+-------+----------+-------------------+|a|b|c|d|e|+---+---+-------+----------+-------------------+|1|2.0|string1|2000-01-01|2000-01-0112:00:00|+---+---
2401_84187537
·
2024-09-07 08:47
数据分析
数据挖掘
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd(1)
dfDataFrame[a:bigint,b:double,c:string,d:date,e:timestamp]####通过由元组列表组成的RDD创建rdd=
spark
.
spark
Context.parallelize
2401_84181368
·
2024-09-07 08:46
程序员
数据分析
数据挖掘
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd(2)
轻松切换到pandasAPI和Py
Spark
API上下文,无需任何开销。有一个既适用于pandas(测试,较小的数据集)又适用于
Spark
(分布式数据集)的代码库。
2401_84181403
·
2024-09-07 08:46
程序员
数据分析
数据挖掘
Py
spark
DataFrame常用操作函数和示例
针对类型:py
spark
.sql.dataframe.DataFrame目录1.打印前几行1.1show()函数1.2take()函数2.读取文件2.1
spark
.read.csv3.获取某行某列的值(
还是那个同伟伟
·
2024-09-07 08:15
Spark
人工智能
机器学习
pandas
pyspark
spark
ubuntu安装docker + 配置国内源和加速器
ubuntu安装Docker
官方文档
:Docker安装教程1环境依赖$sudoapt-getupdate$sudoapt-getinstall\linux-image-extra-$(uname-r)\
好饿呀~~~
·
2024-09-07 07:08
【Linux】
docker
Spark
概念知识笔记
最近总结了个人的各项能力,发现在大数据这方面几乎没有涉及,因此想补充这方面的知识,丰富自己的知识体系,大数据生态主要包含:Hadoop和
Spark
两个部分,
Spark
作用相当于MapReduceMapReduce
kuntoria
·
2024-09-07 05:21
UnityECS-初识
资料:
官方文档
资料地址:https://docs.unity3d.com/Packages/
[email protected]
/api/Unity.Profiling.htmlB站Unity官方
小灰晖l
·
2024-09-06 22:15
ECS
unity3d
pytorch gather() 、sactter()和sactter_()的详解
在
官方文档
中,主要是针对三维进行解释,但是它对数据索引的混乱使用,导致晦涩难懂。所以我主要针对2维的进行解释,更加通俗。1、gather()首先规定好。
读研路上的菜鸡
·
2024-09-06 22:42
pytorch
python
Maven生命周期详解
文中加粗显示的英文是在
官方文档
中出现的术语,我使用的相应术语的中文翻译,不能保证十分准确,严谨起见,在使用中文直译的术语后,使用了对应的英文属于。由于博主水平有限,非常欢迎大家能够批评指正。
明月几时有666
·
2024-09-06 21:10
maven
lifecycle
phase
goal
python xlrd pandas_python处理excel方式(openpyxl,xlrd,xlwt,openpyxl,panda)
一、python操作excel之openpyxl前言根据
官方文档
,openpyxl是一个第三方库,它可以可以处理xlsx/xlsm格式的Excel文件(APythonlibrarytoread/writeExcel2010xlsx
weixin_39715513
·
2024-09-06 20:03
python
xlrd
pandas
大数据秋招面经之
spark
系列
文章目录前言
spark
高频面试题汇总1.
spark
介绍2.
spark
分组取TopN方案总结:方案2是最佳方案。
wq17629260466
·
2024-09-06 19:54
大数据
spark
mysql8.0使用PXC实现高可用
MySQL8.0使用PXC实现高可用1.概述
官方文档
:PerconaXtradbCluster8.0DocumentationPXC(PerconaXtraDBCluster)是一个开源的高可用性、高性能的
帽子运维笔记
·
2024-09-06 15:24
数据库
运维
mysql
数据库
【Python】遇到Python报错:TypeError: `__init__()` got an unexpected keyword argument ‘n_iterations‘
文章目录引言1.错误解析2.错误产生的背景示例情景3.错误原因分析4.解决方案检查
官方文档
示例修正更新和安装库5.防止错误的策略结语引言Python编程中,遇到TypeError是非常常见的一类错误。
E绵绵
·
2024-09-06 15:51
Everything
python
开发语言
每天一个数据分析题(五百一十四)- 决策树算法
D.叶结点(leafnode)数据分析认证考试介绍:点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,
Spark
跟着紫枫学姐学CDA
·
2024-09-06 15:20
数据分析题库
算法
数据分析
决策树
【Python】常见的第三方库及实例
标准库是Python自带的库,在
官方文档
中可以查看第三方库是其他大佬做出来的。库的优点:降低程序员的学习成本提高程序的开发效率常见库datetime我们放在日期管理器中为例:根据日期构造出da
在线OJ的阿川
·
2024-09-06 13:05
python
学习
经验分享
开发语言
学习Halcon可以从以下几个方面入手
官方文档
和教程:阅读Halcon的
官方文档
和教程,这是学习Halcon最直接、最权威的途径。
官方文档
详细介绍了Halcon的各种功能和算子,是学习Halcon不可或缺的资源。
视觉人机器视觉
·
2024-09-06 12:32
机器视觉Halcon大总结
学习
人工智能
深度学习
图像处理
计算机视觉
视觉检测
【
Spark
高级应用】使用
Spark
进行高级数据处理与分析
Spark
高级应用使用
Spark
进行高级数据处理与分析引言在大数据时代,快速处理和分析海量数据是每个企业面临的重大挑战。
爱技术的小伙子
·
2024-09-06 10:47
大数据
spark
ajax
大数据
spark
读取csv文件
测试
spark
读取本地和hdfs文件frompy
spark
.sqlimport
Spark
Session
spark
=
Spark
Session.builder\.appName("ExamplePy
Spark
Script
静听山水
·
2024-09-06 10:44
Spark
spark
Spark
Streaming业务逻辑处理的一些高级算子
packagecom.
spark
scala.streamingimportorg.apache.log4j.{Level,Logger}impor
看见我的小熊没
·
2024-09-06 09:43
sparkStreaming
scala
spark
big
data
scala
Spark
一些个人总结
文章目录前言一、
Spark
是什么二、
Spark
用来做什么三、
Spark
的优势是什么四、为什么用
Spark
五、
Spark
解决了什么问题总结前言随着大数据技术的发展,一些更加优秀的组件被提了出来,比如现在最常用的
易逑实战数据
·
2024-09-06 09:39
大数据
spark
big
data
scala
spark
任务优化参数整理
以下参数中有sql字眼的一般只有
spark
-sql模块生效,例外的时候会另行说明,此外由于总结这些参数是在不同时间段,当时使用的
spark
版本也不一样,因此要注意是否有效,如果本博主已经试过的会直接说明
尘世壹俗人
·
2024-09-06 09:08
大数据Spark技术
spark
大数据
分布式
Spark
与Kafka进行连接
在Java中使用
Spark
与Kafka进行连接,你可以使用
Spark
Streaming来处理实时流数据。以下是一个简单的示例,展示了如何使用
Spark
Streaming从Kafka读取数据并进行处理。
傲雪凌霜,松柏长青
·
2024-09-06 07:27
后端
大数据
spark
kafka
Spark
入门:KMeans聚类算法
聚类(Clustering)是机器学习中一类重要的方法。其主要思想使用样本的不同特征属性,根据某一给定的相似度度量方式(如欧式距离)找到相似的样本,并根据距离将样本划分成不同的组。聚类属于典型的无监督学习(UnsupervisedLearning)方法。与监督学习(如分类器)相比1,无监督学习的训练集没有人为标注的结果。在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。
17111_Chaochao1984a
·
2024-09-06 05:46
算法
spark
kmeans
Spark
MLlib模型训练—聚类算法 K-means
Spark
MLlib模型训练—聚类算法K-meansK-means是一种经典的聚类算法,广泛应用于数据挖掘、图像处理、推荐系统等领域。
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
Spark
MLlib模型训练—聚类算法 Bisecting K-means
Spark
MLlib模型训练—聚类算法BisectingK-means由于传统的KMeans算法的聚类结果易受到初始聚类中心点选择的影响,因此在传统的KMeans算法的基础上进行算法改进,对初始中心点选取比较严格
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
DAG (directed acyclic graph) 作为大数据执行引擎的优点
TL;DR-ConceptuallyDAGmodelisastrictgeneralizationofMapReducemodel.DAG-basedsystemslike
Spark
andTezthatareawareofthewholeDAGofoperationscandobetterglobaloptimizationsthansystemslikeHadoopMapReducewhicha
joeywen
·
2024-09-06 04:43
分布式计算
Storm
Spark
Storm
杂谈
Storm
spark
DAG
Spark
的Web界面
http://localhost:4040/jobs/在顶部导航栏上,可以点击以下选项来查看不同类型的
Spark
应用信息:Jobs-此视图将列出所有已提交的作业,并提供每个作业的详细信息,如作业ID、名称
静听山水
·
2024-09-06 04:40
Spark
spark
【Test 】五种滤波函数你了解多少呢?
2.方框滤波
官方文档
链接代码#include#includeusingnamespa
未来可期LJ
·
2024-09-06 01:23
opencv
人工智能
计算机视觉
【转载】关于Android各个类型手机兼容刘海屏解决方案
引用自小米
官方文档
,这里缩减了一些内容,捡取重要内容。
mr_zengkun
·
2024-09-06 00:44
Android
notch
最全金融数据_Py
Spark
-3(2),大数据开发学习的三个终极问题及学习路线规划
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取frompy
spark
.ml.evaluationimportBinaryClassificationEv
2401_84185145
·
2024-09-05 23:38
大数据
面试
学习
文章汇总 | 2018
12月RIA便签学习法10月财富最好的定义
Spark
分布式原理及碰到的三个坑在不断解决问题(矛盾)的过程进步9月《韭菜的自我修养》-股票交易是零和游戏吗?
学习之术
·
2024-09-05 22:27
Ingest Pipeline & Painless Script
包含3个字段,tags用逗号间隔PUTtech_blogs/_doc/1{"title":"Introducingbigdata......","tags":"hadoop,elasticsearch,
spark
折纸虚桐
·
2024-09-05 22:03
ES学习笔记
elasticsearch
Spark
作业提交
一.作业提交1.1作业提交模式
spark
作业提交使用
spark
-submit命令,作业提交模式有cluster和client两种。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
Spark
基础
一.基础1.RDD机制 1.rdd分布式弹性数据集,简单的理解成⼀种数据结构,是
spark
框架上的通⽤货币。所有算⼦都是基于rdd来执⾏的,不同的场景会有不同的rdd实现类,但是都可以进⾏互相转换。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
Apache
Spark
简介
Apache
Spark
是一个快速而通用的数据处理引擎,用于大规模数据处理和分析。它是由加州大学伯克利分校研究实验室开发的开源项目。
不知名的小Q
·
2024-09-05 17:52
eclipse
java
spring
maven
spark
streaming优点和缺点
优点:
spark
streaming会被转化为
spark
作业执行,由于
spark
作业依赖DAGScheduler和RDD,所以是粗粒度方式而不是细粒度方式,可以快速处理小批量数据,获得准实时的特性;以
spark
scott_alpha
·
2024-09-05 15:42
vue调起微信支付,vue获取openid
参考微信
官方文档
if(document.addEventListener){document.addEventListener('WeixinJSBridgeReady',thi
吴小雨
·
2024-09-05 12:54
VUE
微信公众号充值
vue调起微信支付
vue获取openid
Spark
Spark
是一个快速的、通用的集群计算系统,主要用于大规模数据处理。它最早由加州大学伯克利分校的AMPLab开发,并于2010年开源,后来由Apache软件基金会管理。
傲雪凌霜,松柏长青
·
2024-09-05 11:20
后端
大数据
spark
大数据
分布式
Windows系统下的
Spark
环境配置
一:
Spark
的介绍Apache
Spark
是一个开源的分布式大数据处理引擎,它提供了一整套开发API,包括流计算和机器学习。
eeee~~
·
2024-09-05 11:19
3:大数据技术
实用教程
spark
大数据
分布式
kafka消费者重复消费同一个topic
场景是
spark
streaming消费kafka数据在这里
spark
stream和kafka都是单节点的集群模式。同时起两个不同的groupid的应用,发现会发生后起来的应用消费不到数据。
小琳ai
·
2024-09-05 10:06
大数据
kafka
重复消费
consumer
基础学习之——Docker Compose的安装和使用
可以参考
官方文档
安装Docker:https://docs.docker.com/install/然后,下载适合您操作系统的Docker
北欧人写代码
·
2024-09-05 09:03
学习
docker
前端之路,与大师同行:不容错过的技术大牛博客精选
可以通过阅读
官方文档
、经典书籍、参与在线课程等方式,不断巩固和提升自己的基础能力。前端框架和库:熟悉并掌握当前流行的前端框架
芭拉拉小魔仙
·
2024-09-05 08:55
程序员成长札记
前端
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他