E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据——hadoop
大数据
Hadoop
/Hive学习笔记一(基础概念)
大数据
Hadoop
/Hive学习笔记一(基础概念)一,概念介绍:
大数据
:
大数据
一般用来描述一种数量庞大,复杂的数据集,传统数据处理应用程序难以应对。
lucky_myj
·
2024-01-25 09:46
大数据
hadoop
Hudi学习笔记(一)
大数据
发展背景Hudi用于管理分布式文件系统上大型分析数据集存储,支持Spark和Flink整合。它能够是DFS数据集在分钟级时延内支持变更,也支持下游系统对这个数据集的增量处理。
一一|一一一亅
·
2024-01-25 09:37
学习
笔记
Hadoop
-HDFS写流程(从命令行到完成)
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客,这里先贴下官网架构图:二、源码分析源码中写的肯定是最真实的,下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4
隔着天花板看星星
·
2024-01-25 09:23
hadoop
hdfs
大数据
Hadoop
-HDFS高可用
原理参考官网介绍:Apache
Hadoop
3.3.6–HDFSHighAvailabilityUsingtheQuorumJournalManager二、背景在
Hadoop
2.0.0之前,NameNode
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
Hadoop
-MapReduce使用说明
MapReduce是一个开源的分布式软件框架,可以让你很容易的编写程序(继承Mapper和Reducer,重写map和reduce方法)去处理
大数据
。
隔着天花板看星星
·
2024-01-25 09:52
hadoop
mapreduce
大数据
Hadoop
-YARN概览
一、什么是YARNYetAnotherResourceNegotiator,另一种资源协调者,简称YARN。基本思想是将资源管理和作业调度/监视的功能拆分为单独的守护进程。其想法是拥有一个全局ResourceManager(RM)和每个应用程序的ApplicationMaster(AM)。可以支持单个作业,也可以支持多个作业的DAG。被称为另一种资源协调者,那就证明有一种比YARN更早的资源协调者
隔着天花板看星星
·
2024-01-25 09:52
hadoop
大数据
分布式
Hadoop
-HDFS读流程(从输入命令到回显)
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客,这里先贴下官网架构图:二、静静的思考一会儿爱因斯坦说过:想象力比知识更重要。想象力推动世界,是知识进化的源泉。我们先不看源码,先通过官方架构图和我们对HDFS的了解来想象下读流程是什么样的。我要读HDFS上的一份文件,首先需要知道它在哪台节点上,HDFS上存储的文件都是以块的形式存放在各个DataNode节点上。因此需要知道这
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
Hadoop
-MapReduce-源码跟读-客户端篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、从WordCount进入源码用idea将源码加载进来后
隔着天花板看星星
·
2024-01-25 09:52
hadoop
mapreduce
eclipse
hadoop
三种运行方式
一、本地运行方式1创建在
hadoop
-3.3.5文件下面创建一个wcinput文件夹[antares@
hadoop
1
hadoop
-3.3.5]$mkdirwcinput[antares@
hadoop
1
hadoop
Snower_2022
·
2024-01-25 09:51
hadoop
大数据
分布式
Hadoop
-MapReduce-跟着日志理解整体流程
一、数据准备viinput_01.txtviinput_02.txtviinput_03.txt文本内容如下:-----------------input_01.txt----------------javascalapythonc++javajsgogovbaccc++javascalapythonphpcsshtmljsjavajavascalavbac#.netRRRjava--------
隔着天花板看星星
·
2024-01-25 09:49
hadoop
mapreduce
大数据
HBase学习五:运维排障之备份与恢复
HBase的所有文件都存储在HDFS上,因此只要使用
Hadoop
提供的文件复制工具distcp将HBASE目录复制到同一HDFS或者其他HDFS的另一个目录中,就可以完成对源HBase集群的备份工作copyTable
Studying!!!
·
2024-01-25 09:49
中间件
hbase
学习
运维
从零实现RPC框架之 5.序列化
序列化:序列化以及编解码属于七层网络中的表示层序列化和反序列化的选型却是系统设计或重构一个重要的环节,在分布式、
大数据
量系统设计里面更为显著。
Seajunnn
·
2024-01-25 09:48
RPC框架
rpc
java
网络协议
ElasticSearch基本api操作
ElaticsearchElasticSearch概述Elaticsearch,简称为es,es是一个开源的高扩展的分布式全文检索引擎,它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别(
大数据
时代
陈平安"
·
2024-01-25 08:38
elasticsearch
搜索引擎
大数据
学习
大数据
所以需要的java基础(2)
这里写自定义目录标题String介绍String概述String的实现原理String的创建String拓展构造面试题判断方法String的Get方法String的转换方法分割功能StringBulider介绍StringBuilder的使用String和StringBuilder以及StringBuffer区别Stream流stream介绍及示例Stream流的获取几个重要的类Math类BigI
龙俊俊
·
2024-01-25 08:38
java
学习
大数据
AWS实战(二)之Java连接AWS的 Kinesis Data Firehose,实现数据上传S3中
上文已经提到了KinesisDataFirehose在我的设计中处在我的client和S3之间实现了
大数据
信息收集存储的功能;KinesisDataFirehoseAPI提供两种向传输流发送数据的操作:
从北码到南
·
2024-01-25 07:45
AWS
Kinesis
S3
大数据收集
IOT
AWS
云服务
利用 Amazon Lambda 将 Kinesis Data Stream 数据批量自动写入 Amazon MSK
这些应用程序统一从ApacheKafka中拉取实时数据做分析和处理,例如监控系统、
大数据
分析平台等。由于业务发展需要,用户将这些工作负载部分迁移到了Amazon上,或者在Amazon上构建新的应用。
亚马逊云开发者
·
2024-01-25 07:15
kafka
大数据
分布式
大数据
平台组件日常运维操作说明(
Hadoop
/Zookeeper/Kafa/ES/Mysql/Spark/Flume/Logstash/Tomcat)
Hadoop
日常运维操作说明hdfs生产环境
hadoop
为30台服务器组成的集群,统一安装配置,版本号为2.7.7部署路径:/opt/
hadoop
启动用户:
hadoop
配置文件:/opt/
hadoop
/
love6a6
·
2024-01-25 07:12
大数据
java-zookeeper
运维
ElasticSearch
一、搜索引擎介绍在互联网项目中,涉及到检索的业务需求很多,我们可以通过对数据库的模糊查询实现检索功能,但是针对
大数据
量的操作,基于数据库的检索就显得力不从心了。
__追梦人
·
2024-01-25 07:29
搜索引擎
基于CentOS7
Hadoop
-2.7.2伪分布式部署
1、基本环境Linux版本:CentOS7.0JDK版本:jdk-7u79-linux-x64.tar.gz
Hadoop
版本:
hadoop
-2.7.2.tar.gzjdk以及
Hadoop
安装在/usr目录下
程序员小H
·
2024-01-25 07:23
Hadoop
HDFS 实现原理图文详解
一、HDFS体系结构1.1HDFS简介
Hadoop
分布式文件系统(HDFS)是运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
禅与计算机程序设计艺术
·
2024-01-25 07:49
ElasticSearch分词器介绍
在
大数据
时代,搜索技术变得尤为重要。ElasticSearch作为一款强大的开源搜索引擎,提供了丰富的功能来满足各种搜索需求。
Dxy1239310216
·
2024-01-25 07:20
Elasticsearch
elasticsearch
大数据
搜索引擎
吴军《信息论》中
大数据
思维应用之语音识别
生活中,我们总要解决各式各样的问题,我们如何拆解问题,把问题变成关于
大数据
思维在当下最常见,也是最成功的四类应用。第一类是解决人工智能问题,把那些过去
高高_02c9
·
2024-01-25 07:44
天津
大数据
培训班推荐,数据分析过程的常见错误
大数据
”是近年来IT行业的热词,目前已经广泛应用在各个行业。
大数据
,又称海量信息,特点是数据量大、种类多、实时性强、数据蕴藏的价值大。
qq_38453958
·
2024-01-25 06:57
大数据培训
天津大数据培训
天津大数据培训班
天津大数据培训机构
天津大数据培训学校
大数据培训
掌握技术脉搏:程序员如何在技术变革中保持领先,避免被裁员
一、当今的技术变革有哪些当今的技术变革包括移动互联网、
大数据
、人工智能、区块链、虚拟现实和增强现实等技术的快速发展和应用。
wd90119
·
2024-01-25 06:15
职场和发展
使用Python和PyTorch库构建一个简单的文本分类大模型:
在当今的
大数据
时代,文本分类任务在许多领域都有着广泛的应用,如情感分析、垃圾邮件过滤、主题分类等。为了有效地处理这些任务,我们通常需要构建一个强大的文本分类模型。
GT开发算法工程师
·
2024-01-25 05:57
python
pytorch
分类
自然语言处理
语言模型
Hive运行机制与使用
hive介绍hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
小猪Harry
·
2024-01-25 05:09
10年软件测试工程师感悟——写给还在迷茫中的朋友
当然,我说的是最基础的功能测试的岗位需求已经很少了,而自动化、性能、安全乃至于以后可能出现的
大数据
测试、AI测试仍存在着非常多的机会。“长江后浪推前浪,前浪死在沙滩上”,曾经一句让人会心一笑
程序员阿沐
·
2024-01-25 05:40
Redis学习——入门篇①
Redis学习——入门篇①1、2:Redis入门概述3:Redis安装配置10安装Redis-cli命令4:Redis——十
大数据
类型11redis数据类型12命令查阅13key常用命令介绍14类型大小写和帮助命令
_Matthew
·
2024-01-25 05:15
Redis
redis
学习
数据库
大数据
运维到底是什么 又需要做些什么
疫情期间,
大数据
的广泛应用发挥了巨大的作用,作为新兴的IT领域技术,
大数据
行业受到越来越多的人关注,于是想要入行的、转行的纷纷选择
大数据
学习,那么
大数据
运维到底是什么?又需要做些什么?
科技资讯快报
·
2024-01-25 05:38
chatgpt赋能python:Python转C++编译器:将高级语言转换为本地代码的新趋势
Python转C++编译器:将高级语言转换为本地代码的新趋势Python是一门很流行的高级编程语言,随着人工智能、
大数据
、机器学习等领域的发展,其在实际应用中得到越来越广泛的应用。
李自提
·
2024-01-25 05:32
ChatGpt
chatgpt
python
c++
计算机
2019-01-16(霄)
《
大数据
环境下群体性事件的智能预警》读后感研究意义:互联网的出现改变了群体性事件的发生发展格局,群体性事件向互联网的转移也使其呈现出不同于以往的新特征、新动态,而传统模式难以应对新时期的群体性事件。
18郎师门
·
2024-01-25 04:49
深度机器学习满足网络安全
来源:deepmachinelearningmeetscybersecurity一、问题1、恶意软件成指数级增长每个小时有超过100k的恶意代码变种产生2、安全防御是一个
大数据
问题3、坏的行动者具有自动性能够产生大量的恶意代码
Threathunter
·
2024-01-25 04:28
城院大讲堂:
大数据
AI时代的机遇挑战及我们的应对策略
2023年12月18日晚上19点,陈天伟老师在四川城市职业学院眉山校区4A101开展城院大讲堂——《
大数据
AI时代的机遇挑战及我们的应对策略》专项讲座,各个专业报名150多人参加了讲座。
陈天伟老师
·
2024-01-25 04:51
大数据
一带一路暨金砖国家技能发展国际联盟
大数据
和人工智能专业委员会名单
四川城市职业学院和陈老师在序号:158,300一带一路暨金砖国家技能发展国际联盟
大数据
和人工智能专业委员会名单各相关单位:一带一路暨金砖国家技能发展国际联盟
大数据
和人工智能专业委员会于2023年11月12
陈天伟老师
·
2024-01-25 04:20
大数据
人工智能
类似66手游的折扣平台有哪些 类似66手游的折扣平台排行榜
现在的手游平台很多,每家几乎都是不一样的福利水准,所以说选择一个靠谱的平台是玩家最基本的原则,本期小编就根据现在的
大数据
统计来盘点几个值得推荐的内部福利手游平台,一起来瞧瞧有哪些吧!
会飞的鱼儿
·
2024-01-25 04:27
大数据
处理,Pandas与SQL高效读写大型数据集
大家好,使用Pandas和SQL高效地从数据库中读取、处理和写入大型数据集,以实现最佳性能和内存管理,这是十分重要的。处理大型数据集往往是一项挑战,特别是在涉及到从数据库读取和写入数据时。将整个数据集加载到内存中的传统方法可能会导致系统崩溃和处理时间缓慢。本文将探讨一种更好的解决方案:简化分块读写数据的过程。这种技术能够高效地处理大量数据,对于任何与数据库和数据帧一起工作的人来说都是一种宝贵的工具
python慕遥
·
2024-01-25 03:12
SQL
Pandas
pandas
sql
oracle
Spark难点 | Join的实现原理
其实,HashJoin算法来自于传统数据库,而Shuffle和Broadcast是
大数据
在分布式情况下的概念,两者结合的产物。因此可
王知无
·
2024-01-25 03:35
国内首个!亚信安全获得CCRC数据分类分级产品认证证书
亚信安全信数数据分类分级系统AISDCV1.0,荣获中国网络安全审查认证和市场监管
大数据
中心颁发的首个数据分类分级产品IT产品信息安全认证证书!
亚信安全官方账号
·
2024-01-25 03:52
大数据
安全
运维
网络安全
人工智能
web安全
大数据
时代的税收
信息时代,
大数据
时代,什么最重要?人才?钱?都不是是数据!!!国家通过个税扣除获取更加详尽的个人信息。尤其是房租这一块。房屋在中国是一大块,出租房子房东是要交税的,但是很少交,过去不好管理。
追梦者wang
·
2024-01-25 02:48
【
大数据
】Flink 系统架构
Flink系统架构1.Flink组件1.1JobManager1.2ResourceManager1.3TaskManager1.4Dispatcher2.应用部署2.1框架模式2.2库模式3.任务执行4.高可用设置4.1TaskManager故障4.2JobManager故障Flink是一个用于状态化并行流处理的分布式系统。它的搭建涉及多个进程,这些进程通常会分布在多台机器上。分布式系统需要应对
G皮T
·
2024-01-25 02:56
#
Flink
大数据
flink
系统架构
JobManager
TaskManager
ResourceManager
【
大数据
】流处理基础概念(一):Dataflow 编程基础、并行流处理
流处理基础概念(一):Dataflow编程基础、并行流处理流处理基础概念(二):时间语义(处理时间、事件时间、水位线)流处理基础概念(三):状态和一致性模型(任务故障、结果保障)如果您觉得这篇文章有用✔️的话,请给博主一个一键三连吧(点赞、关注、收藏)!!!您的支持将激励博主输出更多优质内容!!!流处理基础概念(一):Dataflow编程基础、并行流处理1.Dataflow编程基础1.1Dataf
G皮T
·
2024-01-25 02:25
#
Flink
大数据
flink
流处理
窗口
算子
数据交换
实时计算
【
大数据
】流处理基础概念(二):时间语义(处理时间、事件时间、水位线)
流处理基础概念(一):Dataflow编程基础、并行流处理流处理基础概念(二):时间语义(处理时间、事件时间、水位线)流处理基础概念(三):状态和一致性模型(任务故障、结果保障)如果您觉得这篇文章有用✔️的话,请给博主一个一键三连吧(点赞、关注、收藏)!!!您的支持将激励博主输出更多优质内容!!!流处理基础概念(二):时间语义1.流处理场景下一分钟的含义2.处理时间3.事件时间4.水位线5.处理时
G皮T
·
2024-01-25 02:25
#
Flink
大数据
flink
时间语义
处理时间
事件时间
水位线
watermarks
【
大数据
】流处理基础概念(三):状态和一致性模型(任务故障、结果保障)
流处理基础概念(一):Dataflow编程基础、并行流处理流处理基础概念(二):时间语义(处理时间、事件时间、水位线)流处理基础概念(三):状态和一致性模型(任务故障、结果保障)如果您觉得这篇文章有用✔️的话,请给博主一个一键三连吧(点赞、关注、收藏)!!!您的支持将激励博主输出更多优质内容!!!流处理基础概念(三):状态和一致性模型1.任务故障1.1什么是任务故障2.结果保障2.1AT-MOST
G皮T
·
2024-01-25 02:55
#
Flink
大数据
flink
实时计算
状态
一致性模型
结果保障
【
大数据
】流处理基础概念(三):状态和一致性模型(任务故障、结果保障)
流处理基础概念(一):Dataflow编程基础、并行流处理流处理基础概念(二):时间语义(处理时间、事件时间、水位线)流处理基础概念(三):状态和一致性模型(任务故障、结果保障)如果您觉得这篇文章有用✔️的话,请给博主一个一键三连吧(点赞、关注、收藏)!!!您的支持将激励博主输出更多优质内容!!!流处理基础概念(三):状态和一致性模型1.任务故障1.1什么是任务故障2.结果保障2.1AT-MOST
G皮T
·
2024-01-25 02:54
#
Flink
大数据
flink
实时计算
状态
一致性模型
结果保障
【
大数据
】流处理基础概念(二):时间语义(处理时间、事件时间、水位线)
流处理基础概念(一):Dataflow编程基础、并行流处理流处理基础概念(二):时间语义(处理时间、事件时间、水位线)流处理基础概念(三):状态和一致性模型(任务故障、结果保障)如果您觉得这篇文章有用✔️的话,请给博主一个一键三连吧(点赞、关注、收藏)!!!您的支持将激励博主输出更多优质内容!!!流处理基础概念(二):时间语义1.流处理场景下一分钟的含义2.处理时间3.事件时间4.水位线5.处理时
G皮T
·
2024-01-25 02:24
#
Flink
大数据
flink
时间语义
处理时间
事件时间
水位线
watermarks
01-经济
受制裁的包括:两家视频监控公司海康威视及大华股份;人工智能公司科大讯飞、旷视科技、商汤科技和依图科技;还包括自称为中国电子数据取证行业龙头企业、网络空间安全及
大数据
信息化专家的美亚柏科,以及总部位于上海的微米和纳米制造设备供应商溢鑫科创科技
别醒nice
·
2024-01-25 01:37
智慧仓储物流远程监控方案分析
智慧仓储物流远程监控方案分析随着物联网、
大数据
、云计算等技术的快速发展,智慧仓储物流逐渐成为现代物流发展的重要方向。远程监控作为智慧仓储物流的重要组成部分,可以有效提高仓储物流的效率、准确性和安全性。
蓝蜂物联网
·
2024-01-25 01:48
plc
物联网
物联网云平台
远程控制
大数据
开发之Spark(累加器、广播变量、Top10热门品类实战)
第3章:累加器累加器:分布式共享只写变量。(executor和executor之间不能读数据)累加器用来把executor端变量信息聚合到driver端。在driver中定义的一个变量,在executor端的每个task都会得到这个变量的一份新的副本,每个task更新这些副本的值后,传回driver端进行合并计算。1、累加器使用1)累加器定义(sparkcontext.accumulator(in
Key-Key
·
2024-01-25 00:25
大数据
spark
分布式
大数据
开发之SparkSQL
第1章:sparksql概述1.1什么是sparksql1、sparksql是spark用于结构化数据处理的spark模块1)半结构化数据(日志数据)2)结构化数据(数据库数据)1.2为什么要有sparksqlhiveonspark:hive既作为存储元数据又负责sql的解析优化,语法是hql语法,执行引擎编程了spark,spark负责采用rdd执行。sparkonhive:hive只作为存储元
Key-Key
·
2024-01-25 00:24
大数据
hadoop
毕业设计:python人脸识别考勤系统 签到系统 深度学习 Flask框架 Dlib库 MySQL数据库
大数据
(源码+论文)✅
大家好,今天给大家分享一个Python项目,感兴趣的可以先收藏起来,点赞、关注不迷路!大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业。1、项目介绍技术栈:Python语言、MySQL数据库、Flask框架、Echarts可视化、Dlib库、刷脸签到、多角色登录课堂考勤签到是教育教学中的重要环节,可以实现学生出勤情况的管理,同时也是学生学习过程中的重要参考。传统
vx_biyesheji0002
·
2024-01-25 00:18
biyesheji0002
毕业设计
biyesheji0001
python
数据库
课程设计
大数据
毕业设计
深度学习
人脸识别
上一页
53
54
55
56
57
58
59
60
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他