E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据中台
大数据
之 Spark DAG
SparkDirectedAcyclicGraph(DAG)是ApacheSpark中的核心概念,它用于描述作业(job)的计算逻辑。在Spark中,用户通过对RDD(ResilientDistributedDatasets)的操作构建一系列转换和动作,这些操作会形成一个有向无环图结构。DAG的构成:节点(Vertices):DAG中的每个节点代表了对数据的一次转换或动作。在Spark中,转换如m
转身成为了码农
·
2024-02-01 12:00
大数据
spark
hadoop
大数据
之 Spark 与 Hadoop MapReduce 对比
ApacheSpark和ApacheHadoopMapReduce是两个广泛用于
大数据
处理的开源框架,它们在设计目标、性能表现和功能特性上有显著的不同点:执行模型:MapReduce(MR):基于批处理模式
转身成为了码农
·
2024-02-01 12:30
大数据
spark
hadoop
大数据
之 Spark Shuffle 和 Hadoop MapReduce Shuffle的区别
SparkShuffle和HadoopMapReduceShuffle是分布式计算框架中处理中间结果的关键阶段,它们的主要区别在于设计原理、执行效率和资源利用率:HadoopMapReduceShuffleSort-based:HadoopMapReduce的Shuffle过程基于排序。在Map阶段结束后,每个Mapper会将不同key对应的value按照key进行排序,并且通常会对数据进行分区(
转身成为了码农
·
2024-02-01 12:30
大数据
spark
hadoop
大数据
之 Spark 比 MapReduce 快的原因
Spark比MapReduce(MR)快的原因可以总结如下:内存计算:Spark的核心设计是基于内存的计算模型,它将中间数据尽可能保留在内存中。这意味着在多次迭代或连续操作时,数据无需反复读写磁盘,从而显著减少I/O开销。相比之下,MapReduce的每个阶段之间都涉及到大量的磁盘读写操作,特别是shuffle过程中的排序和合并,这会导致显著的性能瓶颈。DAG执行引擎:Spark支持有向无环图(D
转身成为了码农
·
2024-02-01 12:57
大数据
spark
mapreduce
快速上手医学影像组学和机器学习(训练营:2023.11.7~11.14)
★课程简介★随着
大数据
、人工智能的深入融合发展,一项新的研究方法开始用于临床研究,它就是影像组学。它可以对普通影像图像进行更深层
茗创科技
·
2024-02-01 12:54
Python+
大数据
-Linux-day01(黑马)
Python+
大数据
day01(黑马)Linux服务器系统常见目录结构目录作用/bin二进制命令所在的目录/boot系统引导程序所需要的文件目录/dev设备软件目录,磁盘,光驱,/etc系统配置,启动程序
呆猛的呆呆小哥
·
2024-02-01 11:10
python+大数据
大数据
linux
服务器
2019年6月人力资源领域投融资动态汇总(共9起)
据悉,本轮投资方是用友集团产业投资,其重点的投资领域在以云计算、
大数据
、人工智能、区块链等信息技术驱动的企业级服务领域。
个人发展教练张帅
·
2024-02-01 11:37
大数据
之Redis:Redis简介
目录1.Redis简介2.Redis优势3.Redis应用场景1.Redis简介Redis(REmoteDIctionaryServer)是一个完全开源免费的,高性能的key-value数据库存储系统,是热门的NoSql数据库之一;1.Redis支持存储的多种key-value类型,包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash(
浊酒南街
·
2024-02-01 11:11
大数据系列一
redis九
大数据
类型数据结构及底层源码
一,String字符串1.存储原理1)数据模型sethelloword为例,因为Redis是KV的数据库,它是通过hashtable实现的(我们把这个叫做外层的哈希)。所以每个键值对都会有一个dictEntry(源码位置:dict.h),里面指向了key和value的指针。next指向下一个dictEntry。typedefstructdictEntry{void*key;/*key关键字定义*/
学nm个锤子
·
2024-02-01 11:11
redis高级特性
redis
数据结构
大数据
系列——Redis理论
概述RemoteDictionaryServer(Redis)是一个由SalvatoreSanfilippo写的key-value存储系统,是跨平台的非关系型数据库,也属于一种nosql数据库,通常被称为数据结构服务器。Redis是一个开源的使用ANSIC语言编写、遵守BSD协议、支持网络、可基于内存、分布式、可选持久性的键值对(Key-Value)存储数据库,并提供多种语言的API。Redis与
mql007007
·
2024-02-01 11:36
数字化转型
redis
big
data
缓存
大数据
学习之Redis,十
大数据
类型的具体应用(四)
3.8Redis基数统计(HyperLogLog)需求统计某个网站的UV、统计某个文章的UV什么是UVuniqueVisitor,独立访客,一般理解为客户端IP大规模的防止作弊,需要去重复统计独立访客比如IP同样就认为是同一个客户需要去重考虑用户搜索网站的关键词的数量统计用户每天搜索不同词条个数是什么?去重复统计功能的基数估计算法-就是HyperLogLogRedisHyperLogLog是用来做
十二点的泡面
·
2024-02-01 11:02
学习
redis
数据库
Git系列---远程操作
作者简介:RO-BERRY学习方向:致力于C、C++、数据结构、TCP/IP、数据库等等一系列知识日后方向:偏向于CPP开发以及
大数据
方向,欢迎各位关注,谢谢各位的支持引用1.理解分布式版本控制系统2.
RO-BERRY
·
2024-02-01 10:39
git
JVM工作原理与实战(三十一):诊断内存泄漏的原因
专栏导航JVM工作原理与实战RabbitMQ入门指南从零开始了解
大数据
目录专栏导航前言一、诊断原因二、MAT内存泄漏检测的原理总结前言JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,
橘子-青衫
·
2024-02-01 10:13
JVM工作原理与实战
jvm
java
后端
架构
从零开始 Linux(一):基础介绍与常用指令总结
Linux是一个开源免费的操作系统,具有很好的稳定性、安全性,且有很强的处理高并发的能力Linux的应用场景:可以在Linux下开发项目,比如JavaEE、
大数据
、Python,PHP、C/C++等应用领域或者变成语言的项目个人桌面应用
*Soo_Young*
·
2024-02-01 09:57
linux
运维
服务器
由一则新闻想到
曾经看到这样一份资料,资料中讲到2019本科录取结束有些机构利用
大数据
分析后发现一些我们看来一些冷门的专业零零后确主动报这样的专业。一些我们看来很热的专业,今年却集体遇冷,例如财经类大学。
悠然_6547
·
2024-02-01 09:48
大数据
开发之离线数仓项目(用户行为采集平台)(可面试使用)
第1章:数据仓库概念数据仓库,是为企业指定决策,提供数据支持的,可以帮助企业,改进业务流程、提高产品质量等。数据仓库的输入数据通常包括:业务数据、用户行为数据和爬虫数据等。业务数据:就是各行业在处理事务过程中产生的数据。比如用户在电商网站中登录、下单、支付等过程中,需要和网站后台数据库进行增删改查交互,产生的数据就是业务数据。业务数据通常存储在mysql、oracle等数据库中。用户行为数据:用户
Key-Key
·
2024-02-01 08:46
大数据
面试
职场和发展
hadoop
分布式
弹性分布式数据集
spark
泰迪智能科技大模型微调项目训练营已开营
泰迪智能科技大模型微调项目训练营开营跟张良均老师学
大数据
人工智能项目一:医疗诊疗对话意图识别项目二:中医问答系统项目三:某平台股票评论情感识别学习流程:项目一:医疗诊疗对话意图识别项目背景:“互联网+医疗
泰迪智能科技
·
2024-02-01 08:40
大模型
科技
开门见“山”|24年我们去火山引擎转了转
随着
大数据
、物联网、云计算、5G等关键技术的不断突破发展,企业的云上业务规模增长迅猛,混合云、多云逐渐成为企业普遍选择的部署方式。云安全正伴随着云计算,逐步嵌入到各类应用场景之中。
FreeBuf_
·
2024-02-01 08:35
火山引擎
安全
实战Vue.js与MySQL:爱心商城项目开发指南
专业做Java、Python、微信小程序、安卓、
大数据
、爬虫、Golang、大屏等实战项目。⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流!
计算机编程指导师
·
2024-02-01 08:35
大数据实战集
Java实战集
Python实战集
vue.js
mysql
前端
spring
boot
java
javascript
爱心商城
测试开发:一文教你从0到1搞懂
大数据
测试!
1.什么是
大数据
大数据
是一个大的数据集合,通过传统的计算技术无法进行处理。这些数据集的测试需要使用各种工具、技术和框架进行处理。
测试开发技术
·
2024-02-01 08:22
大数据
- Spark系列《二》- 关于Spark在Idea中的一些常用配置
上一篇:
大数据
-Spark系列《一》-从Hadoop到Spark:
大数据
计算引擎的演进-CSDN博客目录1.Idea中配置LiveTemplates来快速生成代码片段2.Idea中配置文件模板自定义初始代码
王哪跑nn
·
2024-02-01 07:53
spark
Idea日常操作
大数据
spark
intellij-idea
大数据
- Spark系列《一》- 从Hadoop到Spark:
大数据
计算引擎的演进
开发工程搭建1.开发语言选择:2.依赖管理工具:1.4.2Spark编程流程1.获取sparkcontext对象2.加载数据3.处理转换数据4.输出结果,释放资源1.4.3简单代码实现-wordCount在
大数据
领域
王哪跑nn
·
2024-02-01 07:43
spark
大数据
spark
hadoop
多线程事务如何回滚?
背景介绍1,最近有一个
大数据
量插入的操作入库的业务场景,需要先做一些其他修改操作,然后在执行插入操作,由于插入数据可能会很多,用到多线程去拆分数据并行处理来提高响应时间,如果有一个线程执行失败,则全部回滚
码出天空
·
2024-02-01 07:07
spring
java
数据库
开发语言
关于MongoDB
大数据
量下远程备份本地恢复操作
背景需要将远程服务的MongoDB数据拷贝到本地环境数据量很大,单表数据在100亿,占用硬盘存储空间270G左右没有远程服务器的操作权限,但是可以连接远程mongo备份操作使用mongodump远程服务和本地环境的MongoDB环境一致,或者本地环境的为高版本./mongodump--uri="mongodb://user:passWord@host:port/database?ssl=false
夜白宋
·
2024-02-01 07:07
MongoDB
mongodb
数据库
智能运维之告警聚合技术介绍
网络运维的告警风暴挑战随着云计算、
大数据
、物联网等技术的快速发展,IT基础设施开始云化、应用运行环境容器化、系统架构开始微服务化,新的IT系统规模不断扩大升级,每天都可能产生海量的数据,这使得运维工作量越来越大
H3C-Navigator
·
2024-02-01 07:35
网络
运维
运维
大数据
(Bigdata)数据集
一.京东消费者数据分析二.世界杯数据集三.淘宝用户购物行为分析四.物流行业数据分析五.星巴克全球位置信息数据集六.抑郁症数据集分析
py爱好者~
·
2024-02-01 07:03
数据挖掘
大数据
数据库
big
data
实战教程:使用Spring Boot和Vue.js开发社区团购管理系统
专业做Java、Python、微信小程序、安卓、
大数据
、爬虫、Golang、大屏等实战项目。⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流!
计算机编程指导师
·
2024-02-01 06:24
Python实战集
Java实战集
大数据实战集
spring
boot
vue.js
后端
java
spring
社区团购
架构
语言革命:NLP与GPT-3.5如何改变我们的世界
技术进步1.2应用场景二、挑战与前景三、伦理和社会影响四、实践经验五、总结与展望前言自然语言处理(NaturalLanguageProcessing,NLP)是人工智能领域的一个重要分支,随着深度学习和
大数据
技术的进步
屿小夏
·
2024-02-01 06:51
IT杂谈
chatgpt
nlp
自然语言
人工智能
HBase介绍
一、HBase简介1.1、HBase是什么Google在200-2006发表了GFS、MapReduce、BigTable三篇论文,号称“三驾马车”,开启了
大数据
的时代。
M.Rambo
·
2024-02-01 06:09
hbase
数据库
大数据
分布式
java
Android性能优化-缓存的使用
考虑极端环境下的用户体验断网情况网速慢的情况节省客户端流量减少服务器压力什么样的数据需要缓存首先最需要缓存的就是图片了(这个不多说)其次就是一些非常重要的数据(如app首页数据)常见的数据缓存方法以及优缺点文件缓存优点可以缓存超
大数据
wfunny
·
2024-02-01 06:19
商机 |
大数据
/政务云采购清单 招标4起,最高招标价为2642.7万(10.14-10.17)
文|36
大数据
奥兰多一、政府、企事业单位
大数据
/政务云中标成交清单,一共6起,最高成交价为678.9万二、政府、企事业单位
大数据
/政务云招标清单一共4起,最高招标价为2642.7万【招标】【363.6万
36大数据
·
2024-02-01 05:57
大数据
挖掘培训就业前景怎么样?好找工作吗?
众所周知,
大数据
已经不简简单单是数据大的事实了,而最重要的现实是对
大数据
进行分析挖掘,只有通过分析才能获取很多智能的,深入的,有价值的信息。
kuntoria
·
2024-02-01 04:52
也谈抖音
抖音的风行正是这个道理,打开抖音,
大数据
根据你上一次浏览查找你喜爱的,不知不觉时间就过去了。打开两次抖音,不知不觉就陷进去了,回头一看,一个小时过去了,两个小时过去了。
美女米豆
·
2024-02-01 04:33
Hadoop
大数据
技术原理与应用
Hadoop
大数据
技术原理与应用
大数据
概述定义特征大量,多样,高速,价值研究意义应用场景医疗,金融,零售Hadoop概述历史优势扩容能力强,成本低,高效率,可靠性,高容错Hadoop生态分布式存储系统(
kk8_
·
2024-02-01 04:33
hadoop
大数据
hdfs
Sqoop数据迁移工具
概述ApacheSqoop(SQL-to-Hadoop)项目旨在协助RDBMS与Hadoop之间进行高效的
大数据
交流。
小希 fighting
·
2024-02-01 03:55
sqoop
hadoop
hive
分布式
大数据
数据库
sql
法律视角下的数据出境《2023年数据出境合规年鉴》
关注国际云安全联盟CSA公众号,回复关键词“数据安全”获取报告在全球数字产业以及
大数据
和云计算技术快速发展的背景下,数据流动对世界经济的影响日益显著。
云安全联盟大中华区
·
2024-02-01 02:00
数据安全
CSA大中华区
数字安全
《区块链简易速速上手小册》第10章:区块链的未来与趋势(2024 最新版)
区块链在身份管理和隐私保护中的应用10.2新兴技术与区块链的融合10.2.1基础知识10.2.2主要案例:AI与区块链的结合10.2.3拓展案例1:区块链与物联网(IoT)10.2.4拓展案例2:区块链与
大数据
江帅帅
·
2024-02-01 02:53
《区块链简易速速上手小册》
区块链
智能合约
分布式账本
共识算法
去中心化
web3
信任链
未来软件测试行业发展的10大趋势,&就业钱景
特别是在软件开发和测试领域在不断创新,并可能将人工智能、机器学习、
大数据
等新兴技术结合起来的当下。
不是Y君
·
2024-02-01 02:26
夏天
大数据
工程学院龙英2020402067树上的知了叫个不停,一群孩子,嘴里吸着果味的汽水,从我面前嘻嘻哈哈地走过。闭上眼睛,深深吸口气,夏日的气味弥漫在我鼻子周围。放眼望去,绿油油的稻田,叮咚的泉水。
没有春秋_b270
·
2024-02-01 02:24
大数据
高频面试题一:hive和Oracle的区别
Hive和Oracle数据库最大的区别在于存储和计算方面:Hive存储在hdfs上(Hadoop分布式文件系统容错性高),Oracle将数保存在本地文件系统中。Hive中不建议对数据的改写,而Oracle中的数据需要经常进行修改的。Hive支持很大规模的数据计算(支持TB,PB级别),Oracle支持的数据规模就比较小。Hive的计算依赖于hadoop的MR,本身没有计算功能,oralce是在本机
半亩书田
·
2024-02-01 02:47
面试题
hive
hadoop
大数据
存内计算——发展史与近期成果
随着
大数据
时代的到来,存内计算由于其结构特点以及摩尔定律的“失效”,被认为是提升处理器能效和性能以及加速神经网络运算的新出路。接下来我们将从存内计算的源头出发,介绍它的发展史与近期取得的成果。
存内计算开发者
·
2024-02-01 02:16
边缘计算
人工智能
科技
架构
神经网络
机器学习
深度学习
大数据
分析利器ElasticSearch入门(一)
1为什么要学习ElasticSearch?1.1为什么要学习ElasticSearchElasticSearch(ES)作为一款优秀的分布式搜索分析引擎,越来越收到很多大型互联网公司的关注,像小米、滴滴出行、携程旅游、阿里云和腾讯云都在使用ElasticSearch。最著名的公司就是github,它采用ES作为搜素引擎对代码进行搜索,虽然它是一款分布式搜索引擎,但是它强大的查询、分析和聚合能力使他
heshengfu1211
·
2024-02-01 02:37
分布式
elasticsearch
数字奇观:普通人如何通过数据可视化驾驭
大数据
时代
在迅速发展的
大数据
时代,数据可视化为普通人提供了一副魔法镜,让我们得以更轻松、更直观地适应这个充满数字信息的世界。下面我就以可视化从业者的角度,来简单聊聊这个话题。
希艾席蒂恩
·
2024-02-01 01:44
数据可视化
信息可视化
数据分析
数字孪生
数据可视化
数字巨轮航行
大数据
海洋:数据可视化引领时代潮流
在
大数据
时代的潮流中,数据可视化如同一艘畅行无阻的科技巨轮,引领我们穿越数字浩瀚的大海,使我们在信息的航程中游刃有余。
希艾席蒂恩
·
2024-02-01 01:44
数据可视化
信息可视化
数据可视化
可视化大屏
大数据
数据挖掘
数据的绘画:数据可视化为我们打开信息的画卷
在迅猛发展的
大数据
时代,数据可视化成为我们逐步适应信息激增的得力工具。通过直观展示庞大复杂的数据,数据可视化不仅简化了信息的理解,更为我们提供了深入洞察的机会。
希艾席蒂恩
·
2024-02-01 01:43
数据可视化
软件推荐
信息可视化
数据可视化
数字孪生
数据分析
数据挖掘
大数据
架构简述流处理、批处理、交互式查询
我们将
大数据
处理按处理时间的跨度要求分为以下几类基于实时数据流的处理,通常的时间跨度在数百毫秒到数秒之间基于历史数据的交互式查询,通常时间跨度在数十秒到数分钟之间复杂的批量数据处理,通常的时间跨度在几分钟到数小时之间
叫我老村长
·
2024-02-01 01:09
4.2 数据可视化
大数据
可视化分析利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力。
helloooi
·
2024-02-01 00:59
#
大数据技术导论
信息可视化
《
大数据
之路:阿里巴巴
大数据
实践》学习笔记,持续更新ing
笔记链接(飞书):https://t0s016els2a.feishu.cn/docx/JrNydGljUonH1ExcGCpcoC8unTb密码:r6@61391该书籍部分目录如下:文章目录第1篇数据技术篇第2章日志采集2.1浏览器的页面日志采集2.1.1页面浏览日志采集流程2.1.2页面交互日志采集2.1.3页面日志的服务端清洗和预处理2.2无线客户端的日志采集2.2.1页面事件2.2.2控件
helloooi
·
2024-02-01 00:27
#
业务理解
模型建设
大数据
学习
笔记
伟大的科幻作者都在指引着我们的思考-2
现在使用新语言来实现AI、进行
大数据
分析都工程师,对于各种高级算法接口、成熟的数据库分析等都轻车熟路。在这种情况下,当年的汇编等基础的语言虽然没有消失,但是,仍然在有汇编语
读书跑步
·
2024-02-01 00:42
数据思维:收集数据
6.
大数据
:到底有什么不一样?======================================================
1cb86c72d091
·
2024-02-01 00:26
上一页
32
33
34
35
36
37
38
39
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他