E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark大数据
转换算子小案例
2)需求描述统计出每一个省份每个广告被点击数量排行的Top33)需求分析4)功能实现整体思路代码实现packagecom.atguigu.bigdata.
spark
.core.rdd.operator.transformimportorg.apache.
spark
zmx_messi
·
2024-02-06 09:37
spark
大数据
Spark
SQL调优实战
1、新添参数说明//Driver和Executor内存和CPU资源相关配置--是否开启executor动态分配,开启时
spark
.executor.instances不生效
spark
.dynamicAllocation.enabled
sighting_info
·
2024-02-06 09:06
spark
sql
大数据
Python学习路线 - Python高阶技巧 - Py
Spark
案例实战
Python学习路线-Python高阶技巧-Py
Spark
案例实战前言介绍
Spark
是什么PythonOn
Spark
Py
Spark
WhyPy
Spark
基础准备Py
Spark
库的安装构建Py
Spark
执行环境入口对象
mry6
·
2024-02-06 09:34
Python
python
地下停车场智慧监查系统:科技让停车更智能
地下停车场智慧监查系统运用了先进的物联网技术和
大数据
分析技术,可以对停车场进行全方位的实时监控和管理。该系统具备以下几大功能:(1)智能监控:通过高清摄像头和
久数君
·
2024-02-06 08:19
科技
物联网
人工智能
信息可视化
数据分析
FlinkCDC-Hudi:Mysql数据实时入湖全攻略五:FlinkSQL同时输出到kafka与hudi的几种实现
前序:FlinkCDC-Hudi系列文章:FlinkCDC-Hudi:Mysql数据实时入湖全攻略一:初试风云FlinkCDC-Hudi:Mysql数据实时入湖全攻略二:Hudi与
Spark
整合时所遇异常与解决方案
大数据点灯人
·
2024-02-06 08:25
Flink
Kafka
Hudi
kafka
mysql
spark
Redis核心技术与实战【学习笔记】 - 24.Redis 数据分片方案选择:Codis 和 Redis Cluster
简述Redis的切片集群使用多个实例保存数据,能很好的应对
大数据
量的场景。在《4.Redis切片集群》中,介绍了Redis官方提供的切片集群方法RedisCluster。
陈建111
·
2024-02-06 08:43
Redis核心技术学习
redis
Redis
数据分片方案
Codis
Redis
Cluster
机器学习与人工智能、深度学习有什么关系?终于有人讲明白了
导读:“机器学习”一词往往被与“人工智能”“深度学习”混用,也常与“
大数据
”一词一同出现。下面首先简要介绍它们的关系,然后讲述机器学习的基本概念和模式。
大数据v
·
2024-02-06 08:10
人工智能
算法
大数据
编程语言
机器学习
【Flink入门修炼】1-1 为什么要学习 Flink?
一、批处理和流处理早些年,
大数据
处理还主要为批处理,一般按天或小时定时处理数据,代表性的框架为MapReduce、Hive、
Spark
等。
大数据王小皮
·
2024-02-06 07:29
Flink
入门修炼
flink
学习
大数据
MSR架构:推动数据中台进入2.0时代
语义层基于业务对象视图面向业务端用户提供语义化的业务逻辑表达式,支持业务端用户自助开发业务逻辑,业务端的开发者只关注于业务逻辑本身,不需要考虑后台是何种数据计算处理框架(MR、
SPARK
、FLINK、SQL
Trident敏捷数据开发平台
·
2024-02-06 07:54
架构
大数据
数据仓库
数据库开发
PiflowX新增Apache Beam引擎支持
参考资料:ApacheBeam架构原理及应用实践-腾讯云开发者社区-腾讯云(tencent.com)在之前的文章中有介绍过,PiflowX是支持
spark
和flink计算引擎,其架构图如下所示:在piflow
PiflowX
·
2024-02-06 07:54
flink
大数据
【Redis】深入理解 Redis 常用数据类型源码及底层实现(3.详解String数据结构)
常用数据类型源码及底层实现(2.版本区别+dictEntry&redisObject详解)-CSDN博客紧接着前两篇的总体介绍,从这篇开始,我们结合源码依次解析下String、Hash、List、Set、ZSet这五
大数据
结构
AQin1012
·
2024-02-06 07:19
Redis
redis
缓存
中间件
【
大数据
】Flink 中的 Slot、Task、Subtask、并行度
Flink中的Slot、Task、Subtask、并行度1.并行度2.Task与线程3.算子链与slot共享资源组4.Taskslots与系统资源5.总结我们在使用Flink时,经常会听到task,slot,线程以及并行度这几个概念,对于初学者来说,这几个概念以及它们与内存,CPU之间的关系经常搞不清楚,下面我们就通过这篇文章来弄清楚这些概念。1.并行度特定算子的子任务(subtask)的个数称之
G皮T
·
2024-02-06 07:01
#
Flink
大数据
flink
slot
task
subtask
并行度
算子链
ES核心干货学习(原理及数据结构)
2.需要进行分词检索,语义检索3.需要
大数据
分析符合上面特征都可以考虑,如日志收集、订单数据链查询,文章检索等。1.3为啥选
li644872790
·
2024-02-06 07:23
elasticsearch
lucene
java
全文检索
搜索引擎
深度学习驱动下的自然语言处理进展及其应用前景
前言自然语言处理(NLP)是一项正在迅速发展的技术,它利用深度学习和
大数据
技术,让计算机能够更好地理解和生成人类语言。随着NLP的不断进步,我们对于计算机理解和应用语言的能力也取得了显著的提升。
想你依然心痛
·
2024-02-06 07:46
个人总结与成长规划
深度学习
自然语言处理
人工智能
Spark
大数据
分析与实战笔记(第二章
Spark
基础-06)
文章目录每日一句正能量2.6IDEA开发WordCount程序2.6.1本地模式执行
Spark
程序2.6.2集群模式执行
Spark
程序每日一句正能量我们全都要从前辈和同辈学习到一些东西。
想你依然心痛
·
2024-02-06 07:38
#
Spark大数据分析与实战
spark
数据分析
笔记
开源
大数据
集群部署(十)Ranger usersync部署
作者:櫰木rangerusersync部署解压包[
[email protected]
]#pwd/opt/ranger[
[email protected]
]#tar-zxvfranger-2.3.0-usersync.tar.gz-C/opt/[
[email protected]
]#cdranger-2.3.0-usersync修改配置insta
云掣YUNCHE
·
2024-02-06 07:05
开源大数据集群部署
大数据
想学
大数据
?先看完这几本书再说
真正的数据爱好者有很多需要阅读的内容:
大数据
,机器学习,数据科学,数据挖掘等。
yoku酱
·
2024-02-06 06:55
【征稿已开启】第五
大数据
、人工智能与软件工程国际研讨会(ICBASE 2024)
第五
大数据
、人工智能与软件工程国际研讨会(ICBASE2024)20245thInternationalConferenceonBigData&ArtificialIntelligence&SoftwareEngineering2024
艾思科蓝-何老师【H8053】
·
2024-02-06 06:51
大数据
人工智能
软件工程
Spark
SQL on K8s 在网易传媒的落地实践
【作者:鲁成祥易顺】随着云原生技术的发展和成熟,
大数据
基础设施积极拥抱云原生是业内发展的一大趋势。
wangyishufan
·
2024-02-06 06:02
kubernetes
大数据
数据分析
理想汽车基于Flink on K8s的数据集成实践
分享分为四个部分:1.理想数据集成的发展与现状2.数据集成的落地实践3.数据集成云原生的落地实践4.未来规划分享嘉宾|王小静理想汽车高级
大数据
工程师01数据集成的发展与现状理想汽车数据集成的发展经历了四个阶段
架构师小秘圈
·
2024-02-06 06:28
汽车
flink
kubernetes
大数据
容器
华为云GaussDB在新零售云转型上的摸索实验
随着互联网技术的不断发展,充分了解消费者的任务也交给了互联网技术,目前最常用到的方法是“通过
大数据
描绘出消费者的画像”。“人—货—场”是零售中
叶一一yyy
·
2024-02-06 05:28
华为云
gaussdb
零售
Apache Hadoop
解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度MAPREDUCE(分布式运算编程框架):解决海量数据计算_广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈,包括
大数据
处理流程中的各个阶段的软件
VincentLeon
·
2024-02-06 05:28
贴标签
尤其是
大数据
、AI等技术的发展,让人更无所遁行,在网络的世界里,每个人都是有一个画像的。比如,你经常逛淘宝,喜欢买化妆品,买尿不湿,买一些孕婴产品的时候,你已经被贴上了女性、年轻妈妈等等标签了。
A一心向上
·
2024-02-06 04:50
RocketMQ和Kafka的区别,以及如何保证消息不丢失和重复消费
语言多语言支持客户端优缺点RocketMQ十万级javajava模型简单、接口易用,在阿里有大规模应用文档少,支持的语言少Kafka百万级服务端scala,客户端java主流语言均支持天生分布式、性能最好,常用于
大数据
领域运维难度大
Marciaguoguo
·
2024-02-06 04:38
中间件
rocketmq
kafka
分布式
Py
Spark
(四)Py
Spark
SQL、Catalyst优化器、
Spark
SQL的执行流程
目录Py
Spark
SQL基础
Spark
Session对象DataFrame入门DataFrame构建DataFrame代码风格DSLSQL
Spark
SQLShuffle分区数目DataFrame数据写出
独憩
·
2024-02-06 03:14
PySpark
sql
数据库
python
spark
Spark
Shuffle模块详解
Shuffle,具有某种共同特征的一类数据需要最终汇聚(aggregate)到一个计算节点上进行计算。这些数据分布在各个存储节点上并且由不同节点的计算单元处理。以最简单的WordCount为例,其中数据保存在Node1、Node2和Node3;经过处理后,这些数据最终会汇聚到Nodea、Nodeb处理。这个数据重新打乱然后汇聚到不同节点的过程就是Shuffle。但是实际上,Shuffle过程可能会
晓之以理的喵~~
·
2024-02-06 03:14
大数据
Hadoop
Spark
spark
大数据
hadoop
Py
Spark
(三)RDD持久化、共享变量、
Spark
内核制度,
Spark
Shuffle
目录RDD持久化RDD的数据是过程数据RDD缓存RDDCheckPoint共享变量广播变量累加器
Spark
内核调度DAGDAG的宽窄依赖和阶段划分内存迭代计算
Spark
是怎么做内存计算的?
独憩
·
2024-02-06 03:43
PySpark
大数据
python
分布式
spark
NoSQL简介
NoSQL数据库用于实时Web应用程序和
大数据
中,并且其使用随着时间的推移而增加。NoSQL系统有时也称为NoSQL,以强调它们可能支持类似SQL的查询语言这一事实。No
ebook_sea
·
2024-02-06 03:04
2021-11-07
大数据
学习日志——MySQL进阶——报表项目
01_数据表介绍学习目标了解项目使用的数据表结构及表关系课程使用微软的Northwind数据集,零售业务,包含了客户,供应商和订单数据。原始数据集可以在微软GitHub仓库下载。为了满足课程需求,数据库数据在原始数据基础上做了微调。基于此份数据,我们将通过SQL来创建数据报表,满足业务需求。1.1数据表整体概览1.2员工表(employees)保存员工基本信息,包含如下字段:employee_id
王络不稳定
·
2024-02-06 03:03
mysql
数据库
database
python-sql-
spark
常用操作
2.尽量使用
spark
.sql,而不是rdd。sql处理groupby会快很多。基本上10min的rdd,sql只需2min。所以基本除了复杂函数,都用sql解决。
竹竹竹~
·
2024-02-06 03:32
MySQL
python学习
数据处理
python
sql
spark
Spark
On Yarn 运行模式
在
Spark
中,支持4种运行模式:1)Local:开发时使用2)Standalone:是
Spark
自带的,如果一个集群是Standalone的话,那么就需要在多台机器上同时部署
Spark
环境3)YARN
bandi4506
·
2024-02-06 03:02
大数据
java
关于
Spark
/Hadoop中Master/Slave IP不正确的问题
在配置
Spark
StandAloneMode的时候,我遇到了Slave无法向正确的MasterIP发送数据的问题。通常这类问题都来源于没有正确配置.
ecce
·
2024-02-06 02:37
跟上时代发展的步伐,做终身学习者
面对
大数据
、人工智能为代表的高技术革新已经在疫情的催化作用,给社会发展和重整按下了加速键。鸢尾花,不是二月兰因为世界格局的改变,很多以前以重复性执行简单指令就可以胜任的工作,将会被机器、机器人取代。
晓静_628c
·
2024-02-06 02:24
看这一篇就够了,如何写一手好SQL?
MySQL性能最
大数据
量抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。看这一篇就够了,如何写一手好SQL?
AnyL8023
·
2024-02-06 01:42
大模型赋能开发者!海云安荣膺毕马威中国金融科技双50榜单!
系列活动之成都金融科技产业发展大会暨交子金融文化月启动仪式在成都举行,会上,毕马威中国正式对外发布了2023年毕马威中国金融科技企业双50榜单,海云安凭借在金融科技领域丰富的落地成果和突出的市场表现,再次成功登榜“毕马威中国金融科技企业(
大数据
与
海云安
·
2024-02-06 00:01
海云安
金融
科技
人工智能
机器学习漫谈:还有很长的路要走
来源:王宏琳科学网博客链接地址:http://blog.sciencenet.cn/blog-3005681-1285948.html人工智能已经成为
大数据
、机器人和物联网等新兴技术的主要驱动力,在可预见的未来
人工智能学家
·
2024-02-05 23:57
人工智能
大数据
编程语言
机器学习
深度学习
springboot/java/php/node/python解放社区疫情防控智能管理小程序【计算机毕设】
随着信息技术的飞速发展,尤其是移动互联网和
大数据
的应用,智能管理小程序成为提升社区疫
python计算机毕设
·
2024-02-05 23:15
java
spring
boot
php
淘宝返利哪个软件佣金最高?盘点10款超高佣金的返利app
淘宝优惠券返利APP排行榜TOP10这是通过上千万的“网购达人”及“分享达人”用户亲身体验上百款淘宝返利APP后
大数据
统计出的结果,希望可以给大家带来一定的帮助。
氧惠好项目
·
2024-02-05 23:53
区块链的未来前景
在政策、技术、市场等多重力量推动下,区块链创新步伐不断加快,与云计算、
大数据
、物联网等技术深度融合,探索应用的范畴也由数字资产向供应链管理、智能制造、工业互联网、社会公益
清风_c547
·
2024-02-05 22:01
智能网联汽车云控平台标准领航研究
2020年2月,11部委联合发布《智能汽车创新发展战略》,提出构建跨界融合的智能汽车产业生态体系,建设国家智能汽车
大数据
云控基础平台,为我国率先提出车路云一体化智能网联汽车的发展路线奠定基础,为加速汽车智能化网联化深度融合发展提供指导
智能交通技术
·
2024-02-05 22:43
汽车
航道
大数据
应用专项研究报告(附下载)
总体目标充分认识航道
大数据
对行业治理的重要性和必要性,航道
大数据
的开发和利用是建设智慧航道的基础。
智能交通技术
·
2024-02-05 22:40
大数据
在线JSON转CSV工具
https://www.btool.cn/json-to-csv在
大数据
时代,数据处理与交换已经成为日常工作生活中的常态。而JSON和CSV作为两种广泛应用的数据格式,它们在不同场景下发挥着关键作用。
yunmoon01
·
2024-02-05 22:39
json
csv
大数据
开发之机器学习总结(一)
大数据
开发之机器学习总结1.背景在
大数据
开发中,数据分析目的一般分为2大类,一个是基于已有数据,提炼出想要的数据汇总信息。一个是基于已有数据使用算法训练出模型,基于模型预测和分析未来的新数据。
闻香识代码
·
2024-02-05 21:41
大数据
机器学习
用户画像
机器学习
大数据
算法
Spark
Sql---用户自定义函数UDF&&UDAF
文章目录1.UDF2.UDAF2.1UDF函数实现原理2.2需求:计算用户平均年龄2.2.1使用RDD实现2.2.2使用UDAF弱类型实现2.2.3使用UDAF强类型实现1.UDF用户可以通过
spark
.udf
肥大毛
·
2024-02-05 20:08
scala
大数据
spark
spark
大数据
分布式
Spark
Sql---RDD DataFrame DataSet
文章目录1.DataFrame2.DataSet3.RDD、DataFrame、DataSet三者的关系4.使用SQL操作DataFrame类型的数据4.1DSL语法4.2RDD转换为DataFrame4.3DataFrame转换为RDD5.使用SQL操作DataSet的数据5.1使用样例类序列创建DataSet5.2DataSet转换为RDD5.3DataSet和DataFrame相互转换1.D
肥大毛
·
2024-02-05 20:38
大数据
json
sql
hive
hadoop
spark
Spark
Streaming---DStream
3.1.1Transformations3.1.2join3.2有状态转换操作3.2.1UpdateStateByKey3.2.2WindowOperations4.DStream输出1.DStream是什么参考博文
Spark
Streaming
肥大毛
·
2024-02-05 20:06
scala
大数据
spark
spark
scala
sql
大数据
之 ZooKeeper原理及其在Hadoop和HBase中的应用
链接:https://blog.csdn.net/zhang123456456/article/details/78008626ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。简介ZooKeep
yangfhit
·
2024-02-05 20:29
大数据
分析|
大数据
分析的十大应用领域
有许多技术可用于分析
大数据
。这项工作介绍了BDA适用的各种分析技术领域如下。(1)社会分析社交分析是实时数据分析中一个重要且不断发展的分析方法。
封印师请假去地球钓鱼
·
2024-02-05 20:35
统计与数据分析素养max
BDA
大数据分析
数据可视化
大数据分析应用
人工智能在各领域的大放异彩,炒币机器人又真的靠谱吗8-07-11
众所周知,
大数据
、AI、区块链是近几年的科技大热门,关注与否,承认与否,智能机器人都在
玲岚书坊
·
2024-02-05 20:03
大数据
时代的新型数据库 — 图数据库 Neo4j 的应用
概览微云数聚(北京)科技有限公司是一家实力雄厚的
大数据
技术公司,由移动互联网技术专家团队、
大数据
专业团队和建模博士团队组成。
weixin_33766805
·
2024-02-05 19:49
数据库
大数据
人工智能
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他