E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据基础
数据中台建设方案-基于大数据平台(下)
大数据基础
平台技术能力的高低,主要依赖于该层组件的发展。本建设方案满足甲方对于数据计算层建设的基本要求:利用了MapReduce、Spar
FRDATA1550333
·
2024-09-11 03:49
大数据
数据库架构
数据库开发
数据库
大数据基础
之Flume——Flume基础及Flume agent配置以及自定义拦截器
Flume简介Flume用于将多种来源的日志以流的方式传输至Hadoop或者其他目的地 -一种可靠、可用的高效分布式数据收集服务Flume拥有基于数据流上的简单灵活架构,支持容错、故障转移与恢复由Cloudera2009年捐赠给Apache,现为Apache顶级项目Flume架构Client:客户端,数据产生的地方,如Web服务器Event:事件,指通过Agent传输的单个数据包,如日志数据通常对
Clozzz
·
2024-09-03 03:17
Flume
大数据
flume
hadoop
大数据学习路线基础指南
提供一份从零基础到精通的大数据学习指南希望对大家有所帮助一、基础阶段:掌握核心概念与技能1.了解
大数据基础
学习大数据的定义、特点、价值以及应用领域。理解大数据与传统
一马什么梅一
·
2024-08-27 23:24
大数据
学习
阿里云计算平台
大数据基础
工程技术团队直聘!!!
大数据基础
工程技术团队,隶属于阿里云智能集团计算平台事业部,是一支负责阿里集团、公共云和混合云场景计算平台大数据&AI产品的稳定性建设、架构&成本优化、运维产品ABM(ApsaraBigdataManager
·
2024-02-19 11:20
大数据
大数据基础
必备,大数据是什么?
随着互联网时代的到来,颠覆了传统行业的盈利模式,大家都把注意力集中在了互联网上。前几年大数据时代的来临,为各行各业提供了更加开阔的数据用作分析。大数据学习群:199427210百科对于大数据是这样解释的:麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据
大数据05
·
2024-02-11 08:31
自学大数据:大数据学习线路及各阶段学习书籍
阶段一、
大数据基础
——java语言基础方面(1)Java语言基础Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术
yoku酱
·
2024-02-09 21:46
区块链和大数据有什么关系?
大数据核心产业链大致可以分为以下三部分:产品部分:包括
大数据基础
软件和大数据应用软件等大数据软件产品相关行业。数据部
离开的人
·
2024-02-06 18:36
大数据基础
和硬件介绍
目录1大数据课程导论1.1大数据概念1.2大数据的特点1.3大数据能干啥1.4大数据发展前景1.5企业数据部的业务流程分析2服务器基本介绍3存储磁盘基本介绍3.1SCSI接口硬盘介绍3.2、SAS接口硬盘介绍3.3、FDE/SDE接口硬盘介绍3.4、SATA硬盘基本介绍3.5、SSD硬盘介绍4.交换机基本介绍5.网卡的介绍6.局域网基本介绍7.机架基本介绍8.IDC数据中心介绍9.磁盘阵列9.1、
赵广陆
·
2024-02-06 16:35
bigdata
大数据
SparkSQL on K8s 在网易传媒的落地实践
【作者:鲁成祥易顺】随着云原生技术的发展和成熟,
大数据基础
设施积极拥抱云原生是业内发展的一大趋势。
wangyishufan
·
2024-02-06 06:02
kubernetes
大数据
数据分析
以数仓视角切入学习路线,大数据真正需要学习的内容有哪些?
本期精选问题作为数仓开发,需要学习哪些
大数据基础
知识?当整个数据链路过长时,如何进行模型优化?
语兴数据
·
2024-01-30 15:30
java
数据库
大数据
面试
[AIGC
大数据基础
] 大数据流处理 Kafka
在当今信息时代,我们生活在一个数据爆炸的世界中。大数据处理已成为各行各业中不可或缺的一部分。在大数据处理的过程中,流处理变得越来越重要,因为我们需要实时地处理和分析数据,以便做出及时的决策。在这篇博客中,我们将介绍一种流行的大数据流处理工具——Kafka,并探讨它在大数据处理中的重要性和应用。文章目录什么是Kafka?Kafka的应用场景总结什么是Kafka?Kafka是一种开源的分布式流处理平台
程序员三木
·
2024-01-29 05:32
大后端
AI
AIGC
大数据
kafka
[AIGC
大数据基础
] Spark 入门
大数据处理已成为当代数据领域的重要课题之一。为了高效地处理和分析大规模数据集,许多大数据处理引擎应运而生。其中,Spark作为一个快速、通用的大数据处理引擎备受关注。本文将从“是什么、怎么用、为什么用”三个角度来介绍Spark。首先,我们会详细探讨Spark的基本概念和主要特点,让读者对Spark有一个清晰的认识。接着,我们将介绍Spark的使用方法,包括编程语言和API、运行环境等方面的内容。最
程序员三木
·
2024-01-28 12:32
大后端
大数据
AIGC
spark
[AIGC
大数据基础
] Flink: 大数据流处理的未来
Flink是一个分布式流处理引擎,它被广泛应用于大数据领域,具有高效、可扩展和容错的特性。它是由Apache软件基金会开发和维护的开源项目,并且在业界中受到了广泛认可和使用。文章目录什么是FlinkFlink的特点真正的流处理高性能和低延迟弹性扩展性丰富的API和库大数据生态系统整合Flink的应用场景总结什么是FlinkFlink建立在事件驱动的基础之上,可以处理高吞吐量和低延迟的数据流。与批处
程序员三木
·
2024-01-27 07:28
大后端
AI
大数据
AIGC
flink
[AIGC
大数据基础
] 浅谈hdfs
HDFS介绍什么是HDFS?HDFS(HadoopDistributedFileSystem)是ApacheHadoop生态系统的一部分,是一个分布式文件系统。它被设计用于存储和处理大规模数据集,并且能够容错、高可靠和高性能地处理文件。HDFS是为了支持Hadoop的分布式计算和存储而开发的,是Hadoop的核心组件之一。它可以在普通的硬件上运行,并且可以适应大型数据集和并行计算的需求。HDFS使
程序员三木
·
2024-01-27 01:00
大后端
大数据
AIGC
hdfs
产品解读 | 新一代湖仓集存储,多模型统一架构,高效挖掘数据价值
星环科技TDH一直致力于给用户带来高性能、高可靠的一站式
大数据基础
平台,满足对海量数据的存储和复杂业务的处理需求。
星环科技
·
2024-01-26 07:40
架构
大数据
人工智能
“研学测”好帮手,三步带你安装体验TDH社区开发版
星环科技TDH社区开发版,作为一款单机可部署、开箱即用的
大数据基础
平台产品,大幅降低了用户的资源成本和使用门槛。
星环科技
·
2024-01-26 07:10
人工智能
大数据
教你三步实现CDH到星环TDH的平滑迁移
TranswarpDataHub(TDH)是星环科技自主研发的企业级一站式多模型
大数据基础
平台,其领先的多模型技术架构提供统一的接口层,统一的计算引擎层,统一的分布式存储管理层,统一的资源调度层,以及异构存储引擎层
星环科技
·
2024-01-26 07:08
大数据
数据库
大数据平台
big
data
数据仓库
hadoop
[AIGC
大数据基础
]hive浅谈
在当今大数据时代,随着数据量的不断增大,如何高效地处理和分析海量数据已经成为一个重要的挑战。为了满足这一需求,Hive应运而生。Hive作为一个基于Hadoop的数据仓库基础设施,为用户提供了类SQL的查询语言和丰富的功能,使得处理大规模数据变得更加简单和高效。通过对数据进行分区、压缩以及并行处理,Hive能够快速地处理PB级数据。本博客将从“是什么、怎么用,为什么用”三个角度对Hive进行介绍。
程序员三木
·
2024-01-25 14:17
大后端
大数据
AIGC
hive
大数据基础
设施搭建 - Hbase
文章目录一、解压压缩包二、配置环境变量三、修改配置文件3.1修改hbase-env.sh3.2修改hbase-site.xml3.3修改regionservers四、解决HBase和Hadoop的log4j兼容性问题,使用Hadoop的jar包五、HBase远程发送到其他集群六、启动七、停止八、基本操作8.1进入Hbase客户端8.2namespace8.3DDL8.3.1创建表8.3.2查看表8
m0_46218511
·
2024-01-24 06:04
大数据
hbase
数据库
大数据基础
设施搭建 - Redis
一、上传压缩包二、解压压缩包[mall@mallsoftware]$tar-zxvfredis-6.2.1.tar.gz-C/opt/module/三、查看gcc是否安装redis是用c写的,因此安装redis需要c语言的编译环境,即需要安装gcc[mall@mallmodule]$gcc-v四、编译[mall@mall~]$cd/opt/module/redis-6.2.1/[mall@mall
m0_46218511
·
2024-01-23 05:09
大数据基础设施搭建
大数据
redis
数据库
实战讲解|Trino 在袋鼠云数栈的探索与实践
袋鼠云数栈作为新一代一站式
大数据基础
软件,其核心优势在于不仅提供了快速便捷、易于上手的底层数据开发模块,更推出了涵盖质量、标签及指标等上层偏业务功能模块。
袋鼠云数栈
·
2024-01-20 21:44
大数据
大数据基础
-测试过程
一、大数据:大数据是一个大的数据集合,通过传统的计算技术无法处理。这些数据集的测试需要用各种工具、技术、框架进行处理。大数据涉及数据创建,存储、检索、分析,而且它在数量、多样性、速度都很出色。二、大数据的测试类型:验证其数据处理、性能和功能测试是关键处理:批量、实时、交互数据质量测试:字段一致性、准确性、重复性、有效性、数据完整性性能测试三、大数据的测试步骤step1:数据阶段验证:pre-Had
测试界吖吖
·
2024-01-18 11:37
软件测试
大数据
功能测试
软件测试
自动化测试
程序人生
职场和发展
如何设计实时数据平台(设计篇)
本文仅为笔者平日学习记录之用,侵删原文:https://mp.weixin.qq.com/s/OyQ0_BhFzEknqOdF0VaeWA导读:本文将会分上下两篇对一个重要且常见的
大数据基础
设施平台展开讨论
longLiveData
·
2024-01-18 05:11
Hadoop(一)之初识大数据与Hadoop
Hadoop(一)之初识大数据与Hadoop阅读目录(Content)一、引言(大数据时代)1.1、从数据中得到信息1.2、大数据表象概念二、
大数据基础
2.1、什么是大数据?
筱若水qq
·
2024-01-15 14:04
hadoop
2024年统一大数据应用场景的技术
大数据技术正处于高速发展时期,有些应用场景基本已经统一了技术选型,有些技术场景的赛道正在互相角力,本文基于特定技术统一应用场景这个目的展开讨论;对于应用场景默认技术选型的技术,我们可以当做
大数据基础
能力学习
i7杨
·
2024-01-04 03:07
大数据技术分析
大数据
Mac M1 Datasophon 安装
MacM1Datasophon安装什么是DatasophonDataSophon是致力于自动化监控、运维、管理
大数据基础
组件和节点的,帮助您快速构建起稳定,高效的大数据集群服务。
青涩的芒果汁
·
2023-12-30 06:00
技术分享
macos
IDC 中国数字化转型盛典:兴业银行「基于悦数图数据库」的「智能大数据云平台」获奖
01基于图计算的【智能大数据云平台】荣获行业权威奖项认可兴业银行的智能大数据云平台即
大数据基础
平台,由悦数图数据库提供图构建、图计算、图
悦数图数据库
·
2023-12-29 10:03
大数据
数据库
云计算
ETLCloud与简道云结合,实现企业信息同步
提供开放的组件市场,企业通过本平台可以快速构建
大数据基础
底座,同时快速打通ERP、MES、OA、SaaS、API、MQ、IOT等数据构建
ETLCloud数据集成社区
·
2023-12-29 09:27
ETL
数据集成
实时数据
基于python编写的服务器之间流量传输netflow_exporter
一、背景通常企业会在多个机房部署IT系统,在
大数据基础
服务组件中会集群跨机房部署或是跨机房抽取数据的场景,在抽数任务时间节点没有错开的时候,经常会造成带宽打满的情况,跨机房的带宽费用比较昂贵,不考虑成本去扩跨机房的带宽是不现实的
运维仙人
·
2023-12-28 10:54
大数据
Python
python
开发语言
大数据开发都要学习什么?什么是大数据平台?
大数据开发培训大数据开发专业需要学习的内容包括三大部分,分别是
大数据基础
知识、大数据平台知识、大数据场景知识。
大数据基础
知识:有三个主要部分,分别是数学、统计学和计算机等学科。
金光闪闪耶
·
2023-12-24 14:49
聪明高效能力广,AGI如何赋能内容管理?
大数据基础
设施提供商爱数就是其中之一。
智能相对论
·
2023-12-21 19:48
Al
Tensorflow 数据预读取--Queue
深度学习训练模型通常是建立在
大数据基础
上,一般情况下可以把数据都加载到内存避免训练时数据读取IO。但是,当数据占用空间较大,如图片集或者视频集,无法全部载入内存;另一种方式是在训练时再
yalesaleng
·
2023-12-21 05:39
大数据基础
理论——Lambda与Kappa架构的区别
Lambda架构基本介绍NathanMarz根据他在Backtype和Twitter使用分布式数据处理系统的经验,提出了Lambda体系结构(LA)一词,用于通用、可扩展且容错的数据处理体系结构。LA旨在满足对健壮系统的需求,该系统具有容错能力,既能防止硬件故障,也能防止人为错误,能够服务于广泛的工作负载和用例,并且需要低延迟的读取和更新。最终的系统应该是线性可扩展的,并且应该向外扩展而不是向上扩
Axton_
·
2023-12-18 22:03
Flink面试
Hudi 在 vivo 湖仓一体的落地实践
作者:vivo互联网大数据团队-XuYu在增效降本的大背景下,vivo
大数据基础
团队引入Hudi组件为公司业务部门湖仓加速的场景进行赋能。主要应用在流批同源、实时链路优化及宽表拼接等业务场景。
vivo互联网技术
·
2023-12-18 03:15
数据湖
大数据计算与存储
效率提升
大数据基础
知识
为了一场紧急考试,没有正经系统学习过大数据知识的我开始恶补概念涉及Hadoop、Hbase、Spark、Flink、Flume、Kafka、Sqoop、HDFS、Hive、Mapreduce、Impala、Spark-Sql、Elasticsearch、Yarn、Hue、ClouderaManager,这篇文章的目的就是作为小白要把这些相关的知识概念还有可能的考点整理出来。大数据-概念什么是大数据
偶余杭
·
2023-12-15 17:22
大数据基础
设施搭建 - 数据装载
文章目录一、概述二、数据装载(HDFS->Hive)2.1创建Hive表2.1.1业务全量表建表语句2.1.2业务增量表建表语句2.1.3流量增量表建表语句2.2数据装载2.2.1初始化装载省份和地区表2.2.2业务数据装载(1)开发脚本(2)授予脚本执行权限(3)定时调度2.2.3日志数据装载(1)开发脚本(2)授予脚本执行权限(3)定时调度一、概述入仓时机:业务数据、日志数据都同步到HDFS后
m0_46218511
·
2023-12-04 17:50
大数据基础设施搭建
大数据
数据装载
大数据基础
设施搭建 - 业务数据同步策略
文章目录一、全量同步1.1梳理需要全量同步的业务表1.2Sqoop:MySQLToHDFS1.2.1开发脚本1.2.2授予脚本执行权限1.2.3执行脚本1.2.4定时调度二、增量同步2.1梳理需要增量同步的业务表2.2Maxwell:MySQLToKafka2.2.1首次全量同步2.2.2每日增量同步2.2.2.1编写Maxwell配置文件2.2.2.2启动Maxwell2.3Flume:Kafk
m0_46218511
·
2023-12-03 16:42
大数据基础设施搭建
大数据
业务数据同步
大数据基础
设施搭建 - Sqoop
文章目录一、上传压缩包二、解压压缩包三、配置环境变量(TODO)四、修改配置文件五、拷贝MySQL驱动六、测试能否连接数据库七、importMySQLtoHDFS一、上传压缩包官网:http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/简介:Hadoop和关系数据库之间传输数据部署节点:在Hadoop集群的任意节点部署都可以,因为Hadoop配置文件中指出了N
m0_46218511
·
2023-12-01 19:52
大数据基础设施搭建
大数据
sqoop
大数据基础
设施搭建 - Maxwell
文章目录一、上传压缩包二、解压压缩包三、启用MySQLBinlog3.1修改MySQL配置文件3.2重启MySQL服务3.3测试四、创建Maxwell所需数据库和用户4.1创建数据库4.2调整MySQL数据库密码级别4.3创建Maxwell用户并赋予其必要权限4.4测试五、修改配置文件5.1修改Maxwell配置文件名称5.2修改Maxwell配置文件六、增量数据同步6.1创建KafkaTopic
m0_46218511
·
2023-12-01 19:19
大数据基础设施搭建
大数据
Maxwell
Python
大数据基础
之数据清洗(数据转换篇)
数据转换是指将数据转换或统一成适合于挖掘的形式。数据规范化大致分为三种最大最小规范化、z-score规范化、按小数定标规范化。一、z-score规范化z-score规范化:又称标准差规范化或零均值规范化,数据处理后服从标准正态分布,也是比较常用的规范化方法。其中为对应特征的均值,为标准差。python中有两种方法实现:利用Pandas中DataFrame的apply函数;利用sklearn库已经封
小华6不6
·
2023-11-28 07:58
数据挖掘
人工智能
python
机器学习
大数据基础
HDFS客户端操作
一、Maven概述Maven是一个专门用于管理和构建Java项目的工具。我们之所以要使用Maven,是因为Maven可以为我们提供一套标准化的项目结构、一套标准化的构建流程和一套方便的依赖管理机制,这些功能可以使得我们的项目结构更加清晰,导入jar包的方式更加方便和标准,进而使得我们的开发更加的便捷高效。maven是Apache的顶级项目,解释为“专家,内行”,它是一个项目管理的工具,maven自
星星失眠️
·
2023-11-26 19:05
大数据开发技术
大数据
hdfs
hadoop
人工智能学习1
2.新一代人工智能呈现出“深度学习、跨界融合、人机协同、群智开放和自主智能的新特点”,新一代人工智能主要是
大数据基础
上的人工智能。
yyuanse
·
2023-11-26 00:49
人工智能
学习
大数据基础
设施搭建 - Hive
文章目录一、上传压缩包二、解压压缩包三、配置环境变量四、初始化元数据库4.1配置MySQL地址4.2拷贝MySQL驱动4.3初始化元数据库4.3.1创建数据库4.3.2初始化元数据库五、启动元数据服务metastore5.1修改配置文件5.2启动/关闭metastore服务六、启动hiveserver2服务6.1修改配置文件6.2启动/关闭hiveserver2服务七、访问Hive7.1通过hiv
m0_46218511
·
2023-11-25 13:15
大数据基础设施搭建
大数据
hive
「Flink实时数据分析系列」1. 有状态流处理简介
来源|「StreamProcessingwithApacheFlink」作者|FabianHueskeandVasilikiKalavri翻译|吴邪大数据4年从业经验,目前就职于广州一家互联网公司,负责
大数据基础
平台自研
数据与智能
·
2023-11-25 06:49
数据库
大数据
分布式
编程语言
hadoop
大数据基础
中台-数据仓库建设
一、数据模型架构原则数仓分层原则优秀可靠的数仓体系,往往需要清晰的数据分层结构,即要保证数据层的稳定又要屏蔽对下游的影响,并且要避免链路过长。那么问题来了,一直在讲数仓要分层,那数仓分几层最好?目前市场上主流的分层方式眼花缭乱,不过看事情不能只看表面,还要看到内在的规律,不能为了分层而分层,没有最好的,只有适合的。分层是以解决当前业务快速的数据支撑为目的,为未来抽象出共性的框架并能够赋能给其他业务
SmartBrain
·
2023-11-24 12:22
大数据平台架构设计
数据仓库
big
data
hadoop
大数据、人工智能与云计算的融合与应用
但当遇到了大数据与分布式技术的发展,解决了计算力和训练数据量的问题,开始产生巨大的生产价值;同时,大数据技术通过将传统机器学习算法分布式实现,向人工智能领域延伸;此外,随着数据不断汇聚在一个平台,企业
大数据基础
平台服务各个部门以及分支机构的需求越来越迫切
ShuYunBIGDATA
·
2023-11-24 09:26
大数据
大数据基础
设施搭建 - Flume
文章目录一、上传压缩包二、解压压缩包三、监控本地文件(filetokafka)3.1编写配置文件3.2自定义拦截器3.2.1开发拦截器jar包(1)创建maven项目(2)开发拦截器类(3)开发pom文件(4)打成jar包上传到Flume3.2.3修改配置文件3.3创建KafkaTopic3.4启动Flume3.5停止Flume四、监控Kafka(kafkatohdfs)3.0将lib文件夹下的g
m0_46218511
·
2023-11-23 13:37
大数据基础设施搭建
大数据
flume
米哈游大数据云原生实践
背景简介为了解决原有架构缺乏弹性、运维复杂、资源利用率低等问题,2022年下半年,我们着手调研将
大数据基础
架构云原生化,并最终落地了Spark
云布道师
·
2023-11-23 02:26
阿里云
大数据基础
设施搭建 - Kafka(with ZooKeeper)
文章目录一、简介二、单机部署2.1上传压缩包2.2解压压缩包2.3修改配置文件(1)配置zookeeper地址(2)修改kafka运行日志(数据)存储路径2.4配置环境变量2.5启动/关闭2.6测试(1)查看当前服务器中的所有topic(2)创建topic等增删改查操作未测试,担心后面升级为集群模式时出问题。三、集群部署3.0清空log.dirs目录并删除zookeeper的kafka节点3.1同
m0_46218511
·
2023-11-21 15:57
大数据基础设施搭建
大数据
kafka
便捷、高效、智能—从运维视角看星环科技
大数据基础
平台TDH
日前,星环科技发布了
大数据基础
平台TDH8.1.0,新版本围绕页面布局重构,集群升级和超大集群管理能力等方面进行了全新升级,极大程度地提升了用户数据开发管理体验。
星环科技
·
2023-11-21 00:00
大数据
运维
big
data
数据库
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他