E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据数据挖掘数据采集
Python
大数据
之PySpark(三)使用Python语言开发Spark程序代码_windows spark python
算子:rdd的api的操作,就是算子,flatMap扁平化算子,map转换算子Transformation算子Action算子步骤:1-首先创建SparkContext上下文环境2-从外部文件数据源读取数据3-执行flatmap执行扁平化操作4-执行map转化操作,得到(word,1)5-reduceByKey将相同Key的Value数据累加操作6-将结果输出到文件系统或打印代码:#-*-codi
2401_84181704
·
2025-02-01 23:09
程序员
大数据
python
spark
《
大数据
时代“快刀”:Flink实时数据处理框架优势全解析》
在数字化浪潮中,数据呈爆发式增长,实时数据处理的重要性愈发凸显。从金融交易的实时风险监控,到电商平台的用户行为分析,各行业都急需能快速处理海量数据的工具。Flink作为一款开源的分布式流处理框架,在这一领域崭露头角,备受瞩目。一、真正实时,毫秒级响应与部分将流处理模拟为微批处理的框架不同,Flink是专为实时流处理打造的“原生”引擎。它直接处理持续不断的事件流,无需将数据攒成批次再处理,这种设计赋
程序猿阿伟
·
2025-02-01 20:15
大数据
flink
园区智能化系统实现管理与服务的智能化转型与创新进阶
通过集成
大数据
分析、物联网和人工智能,园区智能化系统能够为各类园区如工业园、产业园、物流园、写字楼与公寓等提供切实可行的解决方案。“智能化管理不仅是未来的发展趋势,更是提升竞争力的必要手段。”
快鲸智慧楼宇管理系统
·
2025-02-01 19:35
其他
CDH_6.3.2的搭建
一站式搭建
大数据
的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032
我的K8409
·
2025-02-01 17:22
Flink
linux
大数据
分布式
大数据
笔记之 Flink1.17 算子
文章目录前言一、Partition分区(物理分区)1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma
凡许真
·
2025-02-01 17:20
大数据
flink1.17
算子
03-1.python爬虫-爬虫简介
爬虫的应用广泛,比如在
数据挖掘
领域,可收集大量数据用于分析趋势和模式;在信息聚合方面,能将不同网站的特定信息汇总到一处;还可
执着的小火车
·
2025-02-01 14:53
python入门到项目实践
爬虫
python
http
01.双Android容器解决方案
ControlGroups)1.1.3联合文件系统(UnionFileSystem)1.2容器的应用1.2.1微服务架构1.2.2持续集成和持续部署(CI/CD)1.2.3多租户环境1.2.4混合云和多云环境1.2.5
大数据
和机器学习
高桐@BILL
·
2025-02-01 13:46
容器
Android
监控易:智慧高校一体化综合运维解决方案
自“十三五”规划中明确提出“支持各级各类学校建设智慧校园,综合利用互联网、
大数据
、人工智能和虚拟现实技术探索未来教育教学新模式”以来,政策春风也不断加码教育信息化进程,《教育信息化2.0行动计划》以及《
MXsoft618
·
2025-02-01 13:15
运维
信息安全
物联网
监控类
TDengine 做为 FLINK 数据源技术参考手册
ApacheFlink是一款由Apache软件基金会支持的开源分布式流批一体化处理框架,可用于流处理、批处理、复杂事件处理、实时数据仓库构建及为机器学习提供实时数据支持等诸多
大数据
处理场景。
TDengine (老段)
·
2025-02-01 11:02
tdengine
flink
大数据
涛思数据
时序数据库
数据库
Hadoop HA 架构
企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM
大数据
所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过
weixin_30569033
·
2025-02-01 09:49
shell
大数据
守护每一比特的安全——探索基于差分隐私的MySQL数据脱敏之道
在当今数字化时代,随着互联网和
大数据
技术的发展,数据的价值愈发凸显。然而,随之而来的个人隐私泄露风险也日益增加,成为社会广泛关注的问题之一。
墨夶
·
2025-02-01 09:13
数据库学习资料2
安全
mysql
数据库
12.udp
数据传输:适合传输
大数据
,但实际传输受网络MTU等因素限制。2.UDP编程框架(C/S模式)服务器端流程:创建套接字:调用socket()函数,参
就很对
·
2025-02-01 05:40
udp
网络协议
网络
【
大数据
入门核心技术-Hive】(十一)HiveSQL数据分区
目录一、分区的概念二、创建分区1)静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1:通过union方法2:通过or一、分区的概念数据分区的概念以及存在很久了,通常使用分区来水平分散压力,将数据从物理上移到和使用最频繁的用户更近的地方,以及实现其目的。hive
forest_long
·
2025-02-01 03:25
大数据技术入门到21天通关
大数据
hive
hadoop
数据仓库
hdfs
毕设开源 python
大数据
旅游数据分析可视化系统(源码分享)
文章目录0前言1课题背景2数据处理3数据可视化工具3.1django框架介绍3.2ECharts4Django使用echarts进行可视化展示(mysql数据库)4.1修改setting.py连接mysql数据库4.2导入数据4.3使用echarts可视化展示5实现效果5.1前端展示5.2后端展示6最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到
bee_dc
·
2025-01-31 23:26
毕业设计
毕设
大数据
几种不同
数据采集
的概念:遥测、遥控、遥信、遥调、遥视、遥感
遥测、遥控、遥信、遥调、遥视、遥感、遥视:这几种技术在概念上容易混淆,在数据自动采集中常常用到,各自有不同的用途,下面加以简述:遥测(Telemetry):通过远程传输数据来监测远程系统中的各种物理量。如:电压、电流、频率等,数据通过远程系统种的传感器、PLC等方式获取后传输到远方。遥信(Teleprotection):通过远程传输信号来传递系统状态和故障信息。如:当发生故时,遥信系统可以远程传输
CServer_01
·
2025-01-31 23:25
big
data
物联网
大数据
“超能力”:数据安全和隐私该如何保障?
一人人都喜欢超级英雄。不论是超人还是钢铁侠,又或者是小蜘蛛和绿巨人,几乎每一个超级英雄漫画及电影的粉丝,都曾为其不公遭遇打抱不平:“他们明明是在用超能力做好事,拯救人类的,为什么电影里的政府和平民会这么蠢,总对他们缺乏信任,满是提防。”这就是所谓的“叶公好龙”了,因为当你身边真出现了个能把卡车当皮球一样抛来抛去的人时,你的反应恐怕也好不到哪儿去,可能也巴不得有政府出面,逼他接受《超级英雄注册法案》
大数据在线
·
2025-01-31 22:44
云静思园
大数据
数据安全
数据隐私
英特尔
Python爬虫基础知识:从零开始的抓取艺术
在
大数据
时代,网络数据成为宝贵的资源,而Python爬虫则是获取这些数据的重要工具。
egzosn
·
2025-01-31 19:20
python
爬虫
开发语言
探索Oracle数据库的多租户特性:架构、优势与实践
在云计算和
大数据
时代,多租户架构成为数据库设计中的一个重要趋势。
2401_85812026
·
2025-01-31 18:12
数据库
oracle
架构
【Python】解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9A in position xxx: illegal multibyte
tdecodebyte0x9Ainpositionxxx:illegalmultibytesequence博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python
数据挖掘
云天徽上
·
2025-01-31 18:08
python运行报错解决记录
python
numpy
机器学习
深度学习
pandas
「
大数据
」Kappa架构
Kappa架构是一种处理
大数据
的架构,它作为Lambda架构的替代方案出现。
吴维炜
·
2025-01-31 18:07
AIGC架构设计师
大数据
架构
kappa
AIGC
新零售社交电商系统小程序功能开发详细解析
现在的购物方式是越来越有趣了,新零售社交电商系统是互联网、
大数据
、人工智能的技术和咱们熟悉的传统零售深度结合后产生的。它整合线上线下渠道及数据,带来全方位、多渠道、个性化购物体验。
v.15889726201
·
2025-01-31 17:34
零售
小程序
Spark性能调优
1、前言在
大数据
计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。
大数据侠客
·
2025-01-31 16:58
spark相关问题汇总及解决
spark
性能调优
Python学习-九
大数据
类型整合,详细讲解
目录1.int(整型)2.float(浮点型)3.Bool(布尔类型)4.Str(字符串类型)5.None(空值)6.List(列表)7.Tuple(元组)8.Dict(字典)9.Set(集合)(字典,列表,元组,字符串知识点可能不全,可以参考本人之前发的博客进行学习,加油。)1.int(整型)特点和用途:1.可以表示正整数、负整数和零,没有小数部分。2.取值范围取决于您所使用的Python版本和
小伙儿.
·
2025-01-31 16:26
Python
python
开发语言
学习
[碎碎念] 重启学习与博客之旅-我的每日计划
比如说,我最近对人工智能和
大数据
分析特别感兴趣,所以打算每天看点相关的专业书,或
言午coding
·
2025-01-31 16:56
碎碎念
碎碎念
Java 性能优化与新特性
Java学习资料Java学习资料Java学习资料一、引言Java作为一门广泛应用于企业级开发、移动应用、
大数据
等多个领域的编程语言,其性能和特性一直是开发者关注的重点。
来恩1003
·
2025-01-31 16:52
Java
从入门到精通
java
pandas读取
大数据
量的Excel文件
使用pandas快速读取百万行Excel数据的一种方法是使用pandas中的read_excel函数。可以使用以下代码读取Excel文件:importpandasaspddf=pd.read_excel('file_name')这个适合少量数据,如果一旦数据几十万或者上百万,那么程序就很慢有几种优化方法只读取需要的列:使用read_excel函数的usecols参数来指定需要读取的列。这可以减少读
兮知
·
2025-01-31 15:13
python基础
数据分析
pandas
excel
数据分析
低代码产品插件功能一览
暂不支持小程序明道云低代码2支持视图、工作流节点简道云零代码48支持消息、财务、AI等奥哲·氚云零代码8暂不支持文字识别、短信、人脸识别等奥哲·云枢低代码10暂不支持电子签章、AI、ORC等轻流零代码33暂不支持
数据采集
露临霜
·
2025-01-31 14:06
低代码
林子雨《
大数据
技术原理与应用》第五讲——NoSQL数据库
林子雨《
大数据
技术原理与应用》第五讲——NoSQL数据库林子雨《
大数据
技术原理与应用》第五讲笔记NoSQL数据库特点灵活的可扩展性灵活的数据模型和云计算结合查询性能差未形成通用的行业标准维护更加复杂NoSQL
天才代号23
·
2025-01-31 10:06
大数据
数据库
hadoop
nosql
大数据
OLAP引擎比较
doris是一个OLAP数据库,支持对
大数据
的复杂查询,延迟为秒级。doris比sparksql快,主要原因在于针对场景不同导致的架构不同。
小手追梦
·
2025-01-31 10:30
hadoop
rpc
java
大数据
组件ClickHouse介绍(场景、优劣势、性能)
大数据
组件ClickHouse介绍简介使用场景优势与劣势优势劣势性能单个查询吞吐量处理短查询的延时时间处理大量短查询数据写入性能查询性能简介clickhouse是一个高性能的列式存储分析数据库管理系统,
坚持是一种态度
·
2025-01-31 09:46
大数据开发
ClickHouse
大数据
clickhouse
数据库
列式数据库
DB2-Db2StreamingChangeEventSource
在
大数据
和实时数据处理场景中,CDC可以用来同步数据到其他系统,比如数据仓库、数据湖或者流处理平台如ApacheKafka。文章目录前言一、核心功能
DataLu
·
2025-01-31 09:15
DB2-debezium
数据库
数据库开发
大数据
开源
MySQL实战教程:从小白到大神的进阶之路!
发展历程2.1MySQL的起源2.2MySQL的早期发展2.3MySQL的成熟与普及2.4MySQL的商业化与收购2.5MySQL的持续创新3、MySQL应用场景3.1Web应用程序3.2企业级应用3.3
大数据
分析
奔跑吧邓邓子
·
2025-01-31 08:08
项目实战
mysql
数据库
【详细讲解】hive优化
1、开启本地模式大多数的HadoopJob是需要Hadoop提供的完整的可扩展性来处理
大数据
集的。不过,有时Hive的输入数据量是非常小的。
songqq27
·
2025-01-31 06:56
大数据
hive
大规模分布式存储(1)-- 概念、挑战和分类
随着数据的激增,我们已经进入到了一个数据时代,无论是云计算,
大数据
还是互联网公司的各种应用,其后台存储平台的目标都是要构建低成本、高性能、可扩展、易用的分布式存储系统。
叹了口丶气
·
2025-01-31 06:23
HDFS全方位实战
分布式
分类
数据库
logstash(自动拉取,过滤,推送日志的应用,也是elk架构中的l)
elk是指elasticsearch,logstash,kibana三款软件搭配组成的架构logstash是一个
数据采集
加工处理以及传输的工具logstash类似于流水线,有三个模块,分辨是input>
长东737
·
2025-01-31 02:51
elk
架构
大数据
分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型
如果文章对你有帮助的话,欢迎评论点赞收藏加关注+喜欢
大数据
分析项目的小伙伴,希望可以多多支持该系列的其他文章
大数据
分析案例合集
艾派森
·
2025-01-31 01:45
大数据分析案例合集
机器学习
人工智能
python
数据挖掘
回归
move移动语义详解
move移动语义移动语义是C++11引入的一种机制,用于提高程序的性能和资源管理效率,特别是在涉及
大数据
对象的场景下。移动语义通过转移资源所有权,而不是复制资源,减少了不必要的拷贝操作。
Say-hai
·
2025-01-30 21:45
C++
c++
面试
大数据
毕业设计hadoop+spark+hive豆瓣图书数据分析可视化大屏 豆瓣图书爬虫 图书推荐系统
系统总体目标基于Spark的个性化书籍推荐系统是一种基于
大数据
技术的智能推荐系统,它可以根据用户的历史行为和偏好,为用户提供个性化的书籍推荐。
qq_79856539
·
2025-01-30 20:03
javaweb
java
大数据
hadoop
课程设计
企业数字化规划蓝图、企业数字化运营分析管理
大数据
平台建设方案
**企业数字化规划蓝图及运营分析管理
大数据
平台建设方案****一、企业数字化规划蓝图**1.**数字化目标设定**企业在规划数字化进程时,首先需要明确数字化目标。
公众号:优享智库
·
2025-01-30 19:57
数字化转型
数据治理
主数据
数据仓库
大数据
使用Flink进行流式图处理
使用Flink进行流式图处理1.背景介绍1.1
大数据
时代的到来随着互联网、物联网和移动互联网的快速发展,数据呈现出爆炸式增长。根据IDC的预测,到2025年,全球数据量将达到175ZB。
AI天才研究院
·
2025-01-30 19:26
大数据AI人工智能
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
python与excel整合全教程
Python与Excel的整合非常强大,尤其适合处理
大数据
、自动化表格操作以及进行高级数据分析。
刘同学Python学习日记
·
2025-01-30 19:53
python
excel
开发语言
如何写一份合格的
大数据
简历(附简历模板)教程
【编辑/下载】:
大数据
开发简历范文二、简历结构基本信息:包含姓名、性别、联系方式(电话、邮箱)、求职意向。
itLeeyw573
·
2025-01-30 15:46
老板必点的高分简历
sqlite
oracle
mysql
sql
zookeeper
kafka
big
data
MongoDB 大俗大雅,上来问分片真三俗 -- 4 分什么分
开头还是介绍一下群,如果感兴趣PolarDB,MongoDB,MySQL,PostgreSQL,Redis,OceanBase,SqlServer等有问题,有需求都可以加群群内有各
大数据
库行业大咖,可以解决你的问题
Austindatabases
·
2025-01-30 11:48
mongodb
数据库
大数据
技术在数据安全治理中的应用
摘要面对新形势下的数据安全治理挑战,顺应数据安全领域的技术发展趋势,针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题,提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素,并可从多个角度衡量不同含义的权重影响力,识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题,提出一种基于生成对抗网络的用户与实体行为异常检测方法,实验结果表明,所提方法
罗思付之技术屋
·
2025-01-30 11:17
综合技术探讨及方案专栏
大数据
为什么LabVIEW适合软硬件结合的项目?
其强大的硬件接口支持、实时
数据采集
能力、并行处理能力和直观的用户界面,使得它成为工业控制、仪器仪表、自动化测试等领域中软硬件系统集成的理想选择。
LabVIEW开发
·
2025-01-30 11:16
LabVIEW开发案例
LabVIEW开发案例
阿里巴巴
大数据
系统体系架构
数据应用层:这是最顶层,面向不同的用户群体提供服务,包括对内(公司内部使用)、对平台(平台用户)、对商家(商家使用)、对公众(普通消费者)。数据服务与基础工具层:这一层提供了一些基础服务和工具,例如:OneService:可能是一种服务或工具,用于统一数据服务。TDDL+MySQL:TDDL是淘宝分布式数据层的缩写,与MySQL结合使用,提供数据库服务。HBase:一个分布式列存储系统,适合于存储
大连赵哥
·
2025-01-30 09:34
大数据
架构
对比DeepSeek、ChatGPT和Kimi的学术写作摘要能力
提示词:你现在是一名[计算机理论专家],研究方向集中在[人工智能、大模型、
数据挖掘
等计算机相关方向]。我现在需要撰写一篇围绕[人工智能在
AIWritePaper官方账号
·
2025-01-30 07:49
DeepSeek
AIWritePaper
ChatGPT
人工智能
chatgpt
llama
数据分析
论文阅读
python 分布式集群_Python搭建Spark分布式集群环境
前言ApacheSpark是一个新兴的
大数据
处理通用引擎,提供了分布式的内存抽象。Spark最大的特点就是快,可比HadoopMapReduce的处理速度快100倍。
小国阁下
·
2025-01-30 05:32
python
分布式集群
初始Pandas数据结构(DataFrame和Series)
认识PandasPandas是Python语言的一个扩展程序库,用于
数据挖掘
和数据分析,同时也提供数据清洗功能。
aerfaqi
·
2025-01-30 05:59
数据分析
python
数据挖掘
基于Spark的实时计算服务的流程架构
基于Spark的实时计算服务的流程架构通常涉及多个组件和步骤,从
数据采集
到数据处理,再到结果输出和监控。
小小搬运工40
·
2025-01-30 02:08
spark
大数据
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他