E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式大数据
大数据
(Big Data):探索信息时代的海量数据世界
大数据
(BigData):探索信息时代的海量数据世界一、
大数据
的定义与特点
大数据
(BigData),或称巨量资料,是指那些在传统数据处理应用软件无法有效捕捉、管理和处理的数据集合。
hong161688
·
2024-09-06 05:19
大数据
2024年Python最新Python爬虫教程-新浪微博
分布式
爬虫分享(2)
Python编辑器:Pycharm;MongoDB管理工具:MongoBooster;Redis管理工具:RedisStudio)爬虫框架使用Scrapy,使用scrapy_redis和Redis实现
分布式
2401_84584682
·
2024-09-06 05:45
程序员
python
爬虫
新浪微博
猿创征文|【国产数据库】一文学会应用SqlSugar工作单元模式操作多数据库_sqlsugar 工作单元(1)
因此收集整理了一份《2024年最新
大数据
全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
2401_84182392
·
2024-09-06 05:15
2024年程序员学习
数据库
Spark MLlib模型训练—聚类算法 K-means
ApacheSpark提供了K-means聚类算法的高效实现,支持大规模数据的
分布式
计算。本文将详细介绍K-means聚类算法的原理,并结合Spark
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
DAG (directed acyclic graph) 作为
大数据
执行引擎的优点
TL;DR-ConceptuallyDAGmodelisastrictgeneralizationofMapReducemodel.DAG-basedsystemslikeSparkandTezthatareawareofthewholeDAGofoperationscandobetterglobaloptimizationsthansystemslikeHadoopMapReducewhicha
joeywen
·
2024-09-06 04:43
分布式计算
Storm
Spark
Storm
杂谈
Storm
spark
DAG
Java
分布式
ID生成解决方案
Java
分布式
ID生成解决方案参考文章:(1)Java
分布式
ID生成解决方案(2)https://www.cnblogs.com/hxun/p/11451629.html备忘一下。
短期菜鸟
·
2024-09-06 04:10
java
Spark的Web界面
Storage-此视图展示了数据如何在RDDs(弹性
分布式
数据集)之间进行分层存储,以及
静听山水
·
2024-09-06 04:40
Spark
spark
Java 7.1 - 理论 & 算法 & 协议
C:Consistency一致性A:Availability可用性P:Partition分区容错性对于理论计算机科学,CAP定理指出,对于一个
分布式
系统而言,CAP中的三个只能同时满足两个。
没有韭菜的饺子
·
2024-09-06 04:39
java
开发语言
Java 7.4 -
分布式
锁
什么是
分布式
锁?对于单机多线程,我们使用ReentrantLock这类本地锁来控制多个线程对本地共享资源的访问;而对于
分布式
系统,我们使用
分布式
锁来控制多个服务对共享资源的访问。
没有韭菜的饺子
·
2024-09-06 04:39
八股文
java
分布式
开发语言
Java实战:
分布式
ID生成方案
在
分布式
系统的设计与开发过程中,如何生成全局唯一、有序且高可用的ID是一个绕不开的核心问题。尤其是在电商、社交网络、金融交易等领域,ID不仅是业务数据的重要标识,还可能直接影响系统的稳定性和扩展性。
拥抱AI
·
2024-09-06 04:39
java
分布式
开发语言
java
分布式
ID生成组件
1、新建WorkId类packagecom.hua.common.id;importorg.apache.commons.lang3.RandomUtils;importorg.apache.commons.lang3.StringUtils;importjava.net.Inet4Address;importjava.net.UnknownHostException;/***@Deacripti
hong_myth
·
2024-09-06 03:08
微服务
springcloud
Java
Xline v0.2.0: 一个用于元数据管理的
分布式
KV存储
Xline是一个基于Curp协议的,用于管理元数据的
分布式
KV存储。现有的
分布式
KV存储大多采用Raft共识协议,需要两次RTT才能完成一次请求。
达坦科技DatenLord
·
2024-09-06 03:35
Xline
分布式
rust
KV存储
元数据管理
DatenLord达坦科技
Flink生态与未来
本文为《Flink
大数据
项目实战》学习笔记,想通过视频系统学习Flink这个最火爆的
大数据
计算框架的同学,推荐学习课程:Flink
大数据
项目实战:http://t.cn/EJtKhaz核心组件栈Flink
weixin_30394333
·
2024-09-06 02:00
大数据
人工智能
数据库
大厂程序员都会的
分布式
RPC框架,直接无私打包分享,手慢无
一.概述什么是RPC?远程服务调用官方:一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的思想通俗一点:客户端在不知道调用细节的情况下,调用存在于远程计算机上的某个对象,就像调用本地应用程序中的对象一样。市面上常见的rpc框架:dobbo,springCloud,gRPC...那为什么要有RPC,HTTP不好么?因为RPC和HTTP就不是一个层级的东西,所以严格意义上这两个没有可比
卡卡的Java架构笔记
·
2024-09-06 02:56
rpc
java
网络协议
程序人生
JuiceFS 社区版 v1.2 发布,新增企业级权限管理、平滑升级功能
JuiceFS是为云环境设计的
分布式
文件系统,支持超过10种元数据引擎和30种以上的数据存储引擎。
Juicedata
·
2024-09-06 01:24
云原生
运维
经验笔记:RPC与高性能NIO框架
RPC与高性能NIO框架的经验笔记引言随着互联网技术的发展,
分布式
系统逐渐成为了现代软件架构的标准之一。
漆黑的莫莫
·
2024-09-06 01:21
计算机网络
笔记
rpc
nio
终于有人把云计算与数据库的关系讲明白了
作者:李海翔来源:
大数据
DT(ID:hzdashuju)2006年Google的CEO埃里克·施密特首次提出了云计算(CloudComputing)的概念。
大数据v
·
2024-09-06 01:20
数据库
大数据
人工智能
java
python
python
分布式
集群ray_GitHub - Leesire-Python/jd_spider: 两只蠢萌京东的
分布式
爬虫.
使用scrapy,scrapy-redis,graphite实现的京东
分布式
爬虫,以mongodb实现底层存储。
分布式
实现,解决带宽和性能的瓶颈,提高爬取的效率。
weixin_39781930
·
2024-09-06 00:17
python分布式集群ray
最全金融数据_PySpark-3(2),
大数据
开发学习的三个终极问题及学习路线规划
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上
大数据
知识点,真正体系化!
2401_84185145
·
2024-09-05 23:38
大数据
面试
学习
QString使用split处理
大数据
时的低效率问题
QFilefile(filepath1);if(!file.open(QIODevice::ReadOnly)){returndtre;}QTextStreamtxtRead(&file);QStringline=txtRead.readLine();QStringListlist=line.split(QRegExp("\\s+"));file.close();一直在使用QString的spli
junziruyu53
·
2024-09-05 23:07
qt
QString
split
文章汇总 | 2018
12月RIA便签学习法10月财富最好的定义Spark
分布式
原理及碰到的三个坑在不断解决问题(矛盾)的过程进步9月《韭菜的自我修养》-股票交易是零和游戏吗?
学习之术
·
2024-09-05 22:27
浙
大数据
结构:01-复杂度2 Maximum Subsequence Sum
数据结构MOOCPTA习题01-复杂度2MaximumSubsequenceSum#includeusingnamespacestd;constintM=100005;inta[M];intmain(){intk;cin>>k;intf=1;for(inti=0;i>a[i];if(a[i]>=0)//如果出现大于0则进行在线处理f=0;}if(f){//全都小于0coutma){//更新答案ma
_Power_Y
·
2024-09-05 22:31
数据结构浙大
数据结构
c++
浙
大数据
结构:01-复杂度1 最大子列和问题
数据结构MOOCPTA习题01-复杂度1最大子列和问题使用在线处理,遍历数组,如果当前数组和小于0则抛弃,每次更新最大值。我们假设最终结果为数组中间的一段,那么左边剩余的部分和右边剩余的部分和一定小于0,对答案没有贡献。#includeusingnamespacestd;constintM=100005;inta[M];intmain(){intk;cin>>k;for(inti=0;i>a[i]
_Power_Y
·
2024-09-05 22:01
数据结构浙大
数据结构
c++
Spark基础
一.基础1.RDD机制 1.rdd
分布式
弹性数据集,简单的理解成⼀种数据结构,是spark框架上的通⽤货币。所有算⼦都是基于rdd来执⾏的,不同的场景会有不同的rdd实现类,但是都可以进⾏互相转换。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
【研发日记】Matlab/Simulink技能解锁(八)——
分布式
仿真
文章目录前言背景
分布式
仿真使用方式分析和应用总结参考资料前言见《【研发日记】Matlab/Simulink技能解锁(三)——在Stateflow编辑窗口Debug》见《【研发日记】Matlab/Simulink
Mr.Cssust
·
2024-09-05 21:53
Matlab/Simulink
半实物仿真
分布式
Connected
IO
IO
Server
MBD
嵌入式软件
交通智能化的催化剂:大模型技术在城市运营中的实践与展望
王凯博士强调,
大数据
与机器学习技术的飞速发展,使大模型成为智能交通系统的核心,有效提升交通效率,增强城市安全,改善居民出行体验。其演讲不仅
CSDN资讯
·
2024-09-05 21:51
AI
人工智能
智慧交通
华为云
Hadoop组件
Hadoop是一个开源的
大数据
处理框架,由Apache基金会维护。以下是每个组件的简短介绍:HBase:一个
分布式
、面向列的NoSQL数据库,基于GoogleBigTable的设计理念构建。
静听山水
·
2024-09-05 20:14
Hadoop
hadoop
GBase 8c
分布式
核心技术—CDC数据同步
作为一款
分布式
数据库,GBase8c可轻松实现例如两地三中心架构的集群异地灾备。GBase8c异地灾备集群间的不同节点采用各自对应的高可用部署方式,两地间采用同步或者异步复制的备份方式。
manhuai2022
·
2024-09-05 19:11
GBase
8c
数据库
服务器
java
CDC 数据实时同步入湖的技术、架构和方案汇总
博主历时三年精心创作的《
大数据
平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建
大数据
平台太难了!给我发个工程原型吧!》
Laurence
·
2024-09-05 18:33
CDC数据入湖方案
•
合集
大数据专题
CDC
实时
同步
数据湖
方案
架构
技术
小区做核酸检测
本来想去办张交通银行的储蓄卡,因为单位发工资用,结果现在打开地图查看疫情,小区附近三公里范围内,已经出现了三个疫情小区,而银行距离其中一个点比较近,去银行怕被
大数据
扫描到,可真是纠结!小区通知
舒曼_0207
·
2024-09-05 18:11
分布式
架构基础-多线程
分布式
架构基础-多线程基本概念进程:程序的一次执行过程线程:一个进程产生的多个线程并发:偏重于多个任务交替执行,可用于一个CPU并行:用于多个CPU同时执行任务高并发:通常考验指标为响应时间、吞吐量、每秒查询效率
猿日记
·
2024-09-05 18:00
架构师学习
java
多线程
腾讯,干掉 Redis 项目,正式开源、太牛逼啦
项目简介Tendis是腾讯互娱CROSDBA团队&腾讯云数据库团队自主设计和研发的
分布式
高性能KV存储数据库,兼容Redis核心数据结构与接口,可提供大容量、低成本、强持久化的数据库能力,适用于兼容Redis
六月·飞雪
·
2024-09-05 17:53
架构
redis
开源
数据库
Apache Spark简介
Spark的核心概念包括:1.RDD(弹性
分布式
数据集):RDD是Spark的基本计算单元,它代表了一个可并行操作的
分布式
对象集合。RDD可以通过加
不知名的小Q
·
2024-09-05 17:52
eclipse
java
spring
maven
Azkaban:强大的开源工作流调度系统
一、概述在
大数据
生态系统中,随着数据量的爆炸式增长和任务复杂度的提升,管理和调度大规模的批处理任务成为了一项艰巨的挑战。
Hello.Reader
·
2024-09-05 15:15
其他
大数据
开源
大数据
系统架构师考试学习笔记第三篇——架构设计高级知识(13)未来信息综合技术
本课时考点:第13课时主要学习信息物理系统技术、人工智能技术、机器人技术、边缘计算、数字孪生体技术以及云计算和
大数据
技术等内容。
SheldonK
·
2024-09-05 15:15
软件架构师学习分享
学习
笔记
区块链技术
区块链技术是一种去中心化的数据库技术,透过
分布式
账本的方式,记录和验证数据的交易和交流。
寂然如故
·
2024-09-05 15:13
区块链
springboot整合kafka
Kafka是一个
分布式
的发布-订阅消息系统,它可以处理大量数据并提供高吞吐量。在本教程中,我们将使用SpringBoot2.7.2和Kafka2.8.1。
##明天
·
2024-09-05 15:42
kafka
spring
boot
java
1+X云计算运维与开发(中级)实战案例——Kafka集群部署
前言Kafka是一种开源的流处理平台和消息系统,被设计用于构建实时数据管道和流式应用程序,可以处理大规模的实时数据流,并提供高吞吐量、持久性存储和
分布式
处理能力。
kuuuugua
·
2024-09-05 15:41
1+X云计算运维与开发(中级)
云计算
运维
kafka
2023年哪些副业兼职受青睐?
据介绍,该报告数据来源通过兼职猫用户
大数据
分析及10万份用户调研问卷获得。据统计,疫情期间新注册用户年龄以22岁以下为主,占平台总用户的68%,其中18岁以下未成年人突增,占据平台用户的30.9%;从
氧惠佣金真的高
·
2024-09-05 14:58
深度学习的发展历程
深度学习的起源在机器学习中,我们经常使用两种方式来表示特征:局部表示(LocalRepresentation)和
分布式
表示(DistributedRepresentation)。
木亦汐丫
·
2024-09-05 13:00
技术摘抄
深度学习
人工智能
感知机
反向传播
梯度下降
神经网络
Spark
1.核心概念RDD(ResilientDistributedDataset):RDD是Spark的核心抽象,表示一个
分布式
的、不变的集合。它提供了对
大数据
集的容错机制,支持并行操作。
傲雪凌霜,松柏长青
·
2024-09-05 11:20
后端
大数据
spark
大数据
分布式
Windows系统下的Spark环境配置
一:Spark的介绍ApacheSpark是一个开源的
分布式
大数据
处理引擎,它提供了一整套开发API,包括流计算和机器学习。
eeee~~
·
2024-09-05 11:19
3:大数据技术
实用教程
spark
大数据
分布式
Spring Cloud开发实战
SpringCloud是当今Java开发行业最为流行的
分布式
开发架构,使用其可以方便的搭建高可用、高性能、
分布式
的系统服务架构,本课程基于SpringCloudAlibaba的套件进行了实现架构的完整讲解
yootk
·
2024-09-05 11:47
李兴华原创Java编程教材
spring
cloud
spring
后端
java
spring
boot
mybatis
jvm
GIT代码托管工具
Git是一个开源的
分布式
版本控制系统,用于敏捷高效地处理任何或小或大的项目。
Rebirth-LSS
·
2024-09-05 11:16
笔记
git
Hadoop-MapReduce机制原理
MapReduce特点3、MapReduce局限性4、MapTask5、Map阶段步骤:6、Reduce阶段步骤:7、MapReduce阶段图1、MapReduce概述 HadoopMapReduce是一个
分布式
计算框架
H.S.T不想卷
·
2024-09-05 11:46
大数据
hadoop
mapreduce
大数据
Git核心概念
1.概念Git就是一个典型的
分布式
版本控制系统,这类系统,客户端不只是提取最新版本的文件快照,而是把代码仓库完整的镜像下来,这样一来,任何一处协同工作用的服务器发生故障,事后都可以用任何一个镜像出来的本地仓库恢复
众愿
·
2024-09-05 09:34
git
大数据
给你带来的物业管理新变化!
from=jianshu在互联网与云计算的影响下,我们正在进入
大数据
全面渗透的信息时代。
数据观数据分析平台
·
2024-09-05 09:01
Git 的基本概念和使用方式
Git是一种
分布式
版本控制系统,是用于跟踪文件的修改和协作工作的工具。它允许多个开发者同时对同一个代码库进行更改,并能够有效地处理并合并这些更改。
汽车软件工程师001
·
2024-09-05 08:52
Git
GIT
大数据
生态圈里的一致性算法
大数据
生态圈中,保证一致性的方式举不胜举Hadoop用Zookeeper(Zab,Paxos+事务顺序)ElasticSearch用Hash路由算法(非一致性Hash)Cassandra用Gossip闲话算法
宇宙湾
·
2024-09-05 07:35
速盾:高防 CDN 是一种有效的 DDoS 防御解决方案
在当今数字化时代,网络安全问题日益凸显,尤其是DDoS(
分布式
拒绝服务)攻击,给企业和个人带来了巨大的损失和困扰。
速盾cdn
·
2024-09-05 07:17
ddos
web安全
安全
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他