E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark核心技术
Apache Flink 替换
Spark
Stream的架构与实践( bilibili 案例解读)_stream
spark
flink加载udf(1)
bilibili早期使用的引擎是
Spark
Streaming,后期扩展了Flink,在开发架构中预留了一部分引擎层的扩展。最下层是状态存储
2401_84165953
·
2024-09-07 12:44
程序员
flink
spark
架构
MySQL 子查询与复杂查询的优化
⭐️AIGC时代的创新与未来:详细讲解AIGC的概念、
核心技术
、应用领域等内容。⭐️大数据平台建设指南:全面讲解从数据采集到数据可视化的整个过程,掌握构建现代化数据平台的
核心技术
和方法。
野老杂谈
·
2024-09-07 09:23
mysql
数据库
子查询
复杂查询
查询优化
性能提升
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd
DataFrame.show()使用格式:df.show()df.show(1)+---+---+-------+----------+-------------------+|a|b|c|d|e|+---+---+-------+----------+-------------------+|1|2.0|string1|2000-01-01|2000-01-0112:00:00|+---+---
2401_84187537
·
2024-09-07 08:47
数据分析
数据挖掘
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd(1)
dfDataFrame[a:bigint,b:double,c:string,d:date,e:timestamp]####通过由元组列表组成的RDD创建rdd=
spark
.
spark
Context.parallelize
2401_84181368
·
2024-09-07 08:46
程序员
数据分析
数据挖掘
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd(2)
轻松切换到pandasAPI和Py
Spark
API上下文,无需任何开销。有一个既适用于pandas(测试,较小的数据集)又适用于
Spark
(分布式数据集)的代码库。
2401_84181403
·
2024-09-07 08:46
程序员
数据分析
数据挖掘
Py
spark
DataFrame常用操作函数和示例
针对类型:py
spark
.sql.dataframe.DataFrame目录1.打印前几行1.1show()函数1.2take()函数2.读取文件2.1
spark
.read.csv3.获取某行某列的值(
还是那个同伟伟
·
2024-09-07 08:15
Spark
人工智能
机器学习
pandas
pyspark
spark
Spark
概念知识笔记
最近总结了个人的各项能力,发现在大数据这方面几乎没有涉及,因此想补充这方面的知识,丰富自己的知识体系,大数据生态主要包含:Hadoop和
Spark
两个部分,
Spark
作用相当于MapReduceMapReduce
kuntoria
·
2024-09-07 05:21
Python编码系列—Python项目架构的艺术:最佳实践与实战应用
技术导航:人工智能:深入探讨人工智能领域
核心技术
。自动驾驶:分享自动
学步_技术
·
2024-09-06 22:14
Python编码
python
架构
开发语言
大数据秋招面经之
spark
系列
文章目录前言
spark
高频面试题汇总1.
spark
介绍2.
spark
分组取TopN方案总结:方案2是最佳方案。
wq17629260466
·
2024-09-06 19:54
大数据
spark
文本分析之关键词提取(TF-IDF算法)
关键词提取,作为文本分析的
核心技术
之一,正是帮助我们解锁文本信息精髓的关键工具。一、什么是关键词提取?关键词
富士达幸运星
·
2024-09-06 16:32
人工智能
机器学习
tf-idf
每天一个数据分析题(五百一十四)- 决策树算法
D.叶结点(leafnode)数据分析认证考试介绍:点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,
Spark
跟着紫枫学姐学CDA
·
2024-09-06 15:20
数据分析题库
算法
数据分析
决策树
【C语言从不挂科到高绩点】12-数组练习-01
本节课开始重点给大家讲讲C语言中的数组本套课程将会从0基础讲解C语言
核心技术
,适合人群:大学中开设了C语言课程的同学想要专升本或者考研的同学想要考计算机等级证书的同学想要从事C/C++/嵌入式开发的同学
听潮阁
·
2024-09-06 12:03
C语言程序设计
算法
c语言
c++
数组
中国2035年远景目标
二〇三五年基本实现社会主义现代化远景目标,这就是:我国经济实力、科技实力、综合国力将大幅跃升,经济总量和城乡居民人均收入将再迈上新的大台阶,关键
核心技术
实现重大突破,进入创新型国家前列;基本实现新型工业化
光剑书架上的书
·
2024-09-06 12:51
【
Spark
高级应用】使用
Spark
进行高级数据处理与分析
Spark
高级应用使用
Spark
进行高级数据处理与分析引言在大数据时代,快速处理和分析海量数据是每个企业面临的重大挑战。
爱技术的小伙子
·
2024-09-06 10:47
大数据
spark
ajax
大数据
spark
读取csv文件
测试
spark
读取本地和hdfs文件frompy
spark
.sqlimport
Spark
Session
spark
=
Spark
Session.builder\.appName("ExamplePy
Spark
Script
静听山水
·
2024-09-06 10:44
Spark
spark
Spark
Streaming业务逻辑处理的一些高级算子
packagecom.
spark
scala.streamingimportorg.apache.log4j.{Level,Logger}impor
看见我的小熊没
·
2024-09-06 09:43
sparkStreaming
scala
spark
big
data
scala
Spark
一些个人总结
文章目录前言一、
Spark
是什么二、
Spark
用来做什么三、
Spark
的优势是什么四、为什么用
Spark
五、
Spark
解决了什么问题总结前言随着大数据技术的发展,一些更加优秀的组件被提了出来,比如现在最常用的
易逑实战数据
·
2024-09-06 09:39
大数据
spark
big
data
scala
spark
任务优化参数整理
以下参数中有sql字眼的一般只有
spark
-sql模块生效,例外的时候会另行说明,此外由于总结这些参数是在不同时间段,当时使用的
spark
版本也不一样,因此要注意是否有效,如果本博主已经试过的会直接说明
尘世壹俗人
·
2024-09-06 09:08
大数据Spark技术
spark
大数据
分布式
Spark
与Kafka进行连接
在Java中使用
Spark
与Kafka进行连接,你可以使用
Spark
Streaming来处理实时流数据。以下是一个简单的示例,展示了如何使用
Spark
Streaming从Kafka读取数据并进行处理。
傲雪凌霜,松柏长青
·
2024-09-06 07:27
后端
大数据
spark
kafka
海量智库第4期|Vastbase G100
核心技术
介绍之【NUMA架构性能优化技术】
导语NUMA架构优化技术是针对程序在NUMA架构CPU上运行出现资源消耗不均,程序执行效率低等问题进行优化的技术。这种优化技术在现在主流的NUMA架构多核服务器中,可以有效降低访问时延,提升高并发场景下的业务处理能力。NUMA架构优化前:延迟高,性能低NUMA架构,在未优化的情况下,NUMA的内存分配策略对于进程或线程并不公平,这会导致以下问题:Ø高并发时进程或线程频繁进行跨Node调度,上下文切
海量数据库
·
2024-09-06 05:48
数据库
Spark
入门:KMeans聚类算法
聚类(Clustering)是机器学习中一类重要的方法。其主要思想使用样本的不同特征属性,根据某一给定的相似度度量方式(如欧式距离)找到相似的样本,并根据距离将样本划分成不同的组。聚类属于典型的无监督学习(UnsupervisedLearning)方法。与监督学习(如分类器)相比1,无监督学习的训练集没有人为标注的结果。在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。
17111_Chaochao1984a
·
2024-09-06 05:46
算法
spark
kmeans
Spark
MLlib模型训练—聚类算法 K-means
Spark
MLlib模型训练—聚类算法K-meansK-means是一种经典的聚类算法,广泛应用于数据挖掘、图像处理、推荐系统等领域。
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
Spark
MLlib模型训练—聚类算法 Bisecting K-means
Spark
MLlib模型训练—聚类算法BisectingK-means由于传统的KMeans算法的聚类结果易受到初始聚类中心点选择的影响,因此在传统的KMeans算法的基础上进行算法改进,对初始中心点选取比较严格
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
DAG (directed acyclic graph) 作为大数据执行引擎的优点
TL;DR-ConceptuallyDAGmodelisastrictgeneralizationofMapReducemodel.DAG-basedsystemslike
Spark
andTezthatareawareofthewholeDAGofoperationscandobetterglobaloptimizationsthansystemslikeHadoopMapReducewhicha
joeywen
·
2024-09-06 04:43
分布式计算
Storm
Spark
Storm
杂谈
Storm
spark
DAG
Spark
的Web界面
http://localhost:4040/jobs/在顶部导航栏上,可以点击以下选项来查看不同类型的
Spark
应用信息:Jobs-此视图将列出所有已提交的作业,并提供每个作业的详细信息,如作业ID、名称
静听山水
·
2024-09-06 04:40
Spark
spark
NPU技术总结
NPUs的
核心技术
并行性:NPUs利用数据并行性和任务并
技术学习分享
·
2024-09-06 00:47
webgl
processon
最全金融数据_Py
Spark
-3(2),大数据开发学习的三个终极问题及学习路线规划
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取frompy
spark
.ml.evaluationimportBinaryClassificationEv
2401_84185145
·
2024-09-05 23:38
大数据
面试
学习
文章汇总 | 2018
12月RIA便签学习法10月财富最好的定义
Spark
分布式原理及碰到的三个坑在不断解决问题(矛盾)的过程进步9月《韭菜的自我修养》-股票交易是零和游戏吗?
学习之术
·
2024-09-05 22:27
Ingest Pipeline & Painless Script
包含3个字段,tags用逗号间隔PUTtech_blogs/_doc/1{"title":"Introducingbigdata......","tags":"hadoop,elasticsearch,
spark
折纸虚桐
·
2024-09-05 22:03
ES学习笔记
elasticsearch
Spark
作业提交
一.作业提交1.1作业提交模式
spark
作业提交使用
spark
-submit命令,作业提交模式有cluster和client两种。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
Spark
基础
一.基础1.RDD机制 1.rdd分布式弹性数据集,简单的理解成⼀种数据结构,是
spark
框架上的通⽤货币。所有算⼦都是基于rdd来执⾏的,不同的场景会有不同的rdd实现类,但是都可以进⾏互相转换。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
GBase 8c 分布式
核心技术
—CDC数据同步
数据库系统作为企业IT基础设施中的重要组件,其稳定性与可用性是上层系统运行的必要基础。并且随着数字化发展,大量的核心业务对于城市级别容灾提出了更高的要求。作为一款分布式数据库,GBase8c可轻松实现例如两地三中心架构的集群异地灾备。GBase8c异地灾备集群间的不同节点采用各自对应的高可用部署方式,两地间采用同步或者异步复制的备份方式。可以抵御硬件级别故障、机房级别和城市级别灾难,两地之间距离可
manhuai2022
·
2024-09-05 19:11
GBase
8c
数据库
服务器
java
物联网平台开发
核心技术
揭秘-架构设计篇
一书,力推!引言上一篇物联网平台开发实战-初探从宏观层面了解了物联网平台相关内容。随着物联网的快速发展和普及,越来越多的企业和机构开始构建自己的物联网平台。物联网平台是连接大量设备和系统的中心枢纽,通过数据传输和处理,实现设备之间的互联和智能控制。这一篇将讨论物联网平台架构设计,主要从物联网平台的概述、架构设计原则、要素以及设备层、数据处理层讨论。一、物联网平台概述物联网平台是实现物联网的核心组成
架构师修炼
·
2024-09-05 19:09
物联网平台开发实战
网络
物联网
人工智能
java
python
Apache
Spark
简介
Apache
Spark
是一个快速而通用的数据处理引擎,用于大规模数据处理和分析。它是由加州大学伯克利分校研究实验室开发的开源项目。
不知名的小Q
·
2024-09-05 17:52
eclipse
java
spring
maven
spark
streaming优点和缺点
优点:
spark
streaming会被转化为
spark
作业执行,由于
spark
作业依赖DAGScheduler和RDD,所以是粗粒度方式而不是细粒度方式,可以快速处理小批量数据,获得准实时的特性;以
spark
scott_alpha
·
2024-09-05 15:42
Spark
Spark
是一个快速的、通用的集群计算系统,主要用于大规模数据处理。它最早由加州大学伯克利分校的AMPLab开发,并于2010年开源,后来由Apache软件基金会管理。
傲雪凌霜,松柏长青
·
2024-09-05 11:20
后端
大数据
spark
大数据
分布式
Windows系统下的
Spark
环境配置
一:
Spark
的介绍Apache
Spark
是一个开源的分布式大数据处理引擎,它提供了一整套开发API,包括流计算和机器学习。
eeee~~
·
2024-09-05 11:19
3:大数据技术
实用教程
spark
大数据
分布式
Spring Cloud开发实战
本书一共有10章的核心内容,基于IDEA开发工具讲解,并通过Linux系统实现服务的部署,全篇课程的
核心技术
架构组成为:Gradle+RESTful+Nacos2.x+Ribbon+Feign+
yootk
·
2024-09-05 11:47
李兴华原创Java编程教材
spring
cloud
spring
后端
java
spring
boot
mybatis
jvm
kafka消费者重复消费同一个topic
场景是
spark
streaming消费kafka数据在这里
spark
stream和kafka都是单节点的集群模式。同时起两个不同的groupid的应用,发现会发生后起来的应用消费不到数据。
小琳ai
·
2024-09-05 10:06
大数据
kafka
重复消费
consumer
Hbase BulkLoad用法
要导入大量数据,Hbase的BulkLoad是必不可少的,在导入历史数据的时候,我们一般会选择使用BulkLoad方式,我们还可以借助
Spark
的计算能力将数据快速地导入。
kikiki2
·
2024-09-05 07:29
基于Frenet坐标系的无人车路径规划:ROS实现与Python程序详解
基于Frenet坐标系的无人车路径规划:ROS实现与Python程序详解前言在自动驾驶和无人车技术快速发展的今天,路径规划是实现车辆自主行驶的
核心技术
之一。
快撑死的鱼
·
2024-09-05 02:18
算法杂谈
python算法解析
硬件算法实践
python
开发语言
【Docker系列】docker缓存详解
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java
核心技术
,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具
Kwan的解忧杂货铺@新空间代码工作室
·
2024-09-05 02:45
s11
Docker系列
docker
缓存
容器
职场中,更需要聪明的执行力
博鳌论坛上,格力的董总说:从管理上讲,一个成熟的企业,不仅要有人才,技术,
核心技术
,还要有执行力。
黑化后的亚瑟
·
2024-09-05 01:38
EMR组件部署指南
本文将详细介绍如何部署EMR的主要组件,包括:JDK1.8ElasticsearchKafkaFlinkZookeeperHBaseHadoopPhoenixScala
Spark
Hive准备工作所有操作都在
ivwdcwso
·
2024-09-05 00:05
运维
EMR
大数据
开源
运维
9.2
spark
内存管理之 UnifiedMemoryManager
图片来源https://www.ibm.com/developerworks/cn/analytics/library/ba-cn-apache-
spark
-memory-management/index.html1
GongMeng
·
2024-09-04 20:46
Sublime text3+python3配置及插件安装
rayson_666(Rayson开发分享)个人专研技术方向:微服务方向:springboot,springCloud,Dubbo分布式/高并发:分布式锁,消息队列RabbitMQ大数据处理:Hadoop,
spark
raysonfang
·
2024-09-04 19:23
观测云
核心技术
解密:eBPF Tracing 实现原理
前言eBPF是一种强大的内核技术,允许在内核中安全地执行自定义代码。通过eBPF,开发者可以在不修改内核源码的情况下,对内核功能进行扩展和监控。eBPFTracing利用这一技术,对系统调用、内核函数等进行跟踪,从而实现对应用行为的深入洞察。与传统的监控方式相比,eBPFTracing具有以下优势:无侵入性:无需修改应用代码即可进行监控。高性能:在内核层面执行,减少了对应用性能的影响。细粒度:可以
观测云
·
2024-09-04 18:29
网络
ebpf
Java实现的加密与解密算法详解
本文还有配套的精品资源,点击获取简介:加密与解密算法是信息技术中维护数据安全的
核心技术
,确保数据的隐私性和完整性。
数据冰山
·
2024-09-04 13:28
java.io.InvalidClassException(
spark
任务运行失败)
背景:客户集群内偶尔会出现java.io.InvalidClassException:org.apache.kudu.
spark
.kudu.KuduRDD;localclassincompatible:
LATASA
·
2024-09-04 09:30
spark
java
大数据
使用pgrs在wsl中为postgres写拓展
duckdb,zombodb,datafusion等等产品都是数据组合流思路体现,把这套功法练到大成,处于2024年,综合数据规模/相应速度/和数据应用层解耦,就有了一个最佳答案.比以前hadoop,
spark
wangmarkqi
·
2024-09-04 03:19
rust
数据库
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他