E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据(hadoop
2024-JAVA-
大数据
-面试汇总_
大数据
java部门面试(1)
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能33.说说内部表和外部表的区别?
2401_84141419
·
2025-02-07 19:15
程序员
java
大数据
面试
顺丰
大数据
开发面试题及参考答案
Flink的提交过程是怎样的?Flink的提交过程通常包含以下步骤:代码编写与打包:开发人员首先使用Flink提供的API编写数据处理逻辑,包括定义数据源、转换操作和数据sink等。完成代码编写后,将项目打包成可执行的JAR文件,其中包含了所有依赖的库和资源。选择提交方式:Flink支持多种提交方式,如命令行提交、WebUI提交和通过客户端API提交。命令行提交适用于在终端中进行快速部署,用户可以
大模型大数据攻城狮
·
2025-02-07 19:15
大数据
大厂面试
大数据面试
牛客网
手撕
离线数仓
leetcode
爬虫学习--1.前导知识
初始爬虫前言引入随着
大数据
时代的来临,网络爬虫在互联网中的地位将越来越重要。
F——
·
2025-02-07 19:14
爬虫
爬虫
学习
开发语言
python
大数据
-267 实时数仓 - ODS Lambda架构 Kappa架构 核心思想
目前已经更新到了:
Hadoop
(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis
m0_74823336
·
2025-02-07 16:57
面试
学习路线
阿里巴巴
大数据
架构
Hbase基础
1.HBase简介HBASE理论HBase是一个基于
Hadoop
的分布式、面向列的开源数据库,对
大数据
实现了随机定位和实时读写。
yandao
·
2025-02-07 13:38
hadoop
hbase
big
data
hadoop
一文带你了解Spark4新特性,开启
大数据
处理新篇章
一文带你了解Spark4新特性,开启
大数据
处理新篇章在
大数据
处理的广袤天地中,ApacheSpark始终是熠熠生辉的存在,宛如一颗璀璨的明星框架,吸引着无数开发者与数据分析师的目光。
敏叔V587
·
2025-02-07 12:59
大数据
nginx+flume网络流量日志实时数据分析实战_日志数据分析(1)
得到visits模型
hadoop
jar/export/data/mapreduce/web_log.jarcn.itcast.bigdata.weblog.clickstream.ClickStreamVisit
2401_84182578
·
2025-02-07 11:22
程序员
nginx
flume
数据分析
当大模型遇上Spark:解锁
大数据
处理新姿势
它们各自在人工智能和
大数据
处理领域大放异彩,而当这两者相遇,又会碰撞出怎样的火花呢?让我们先来分别认识一下大模型和Spark。
敏叔V587
·
2025-02-07 11:52
spark
大数据
分布式
【
大数据
入门核心技术-Flume】(二)Flume安装部署
目录一、准备工作1、基本
Hadoop
环境安装2、下载安装包二、安装1、解压2、修改环境变量3、修改并配置flume-env.sh文件4、验证是否安装成功一、准备工作1、基本
Hadoop
环境安装参考
Hadoop
forest_long
·
2025-02-07 08:33
大数据技术入门到21天通关
big
data
hadoop
大数据
hbase
flume
智能运维 AIOps
1、什么是AIOpsArtificialIntelligenceforITOperations(AIOps,IT智能运维)是指结合
大数据
和MachineLearning(机器学习),将包括异常检测、事件关联以及运营数据采集和处理在内的
数字化信息化智能化解决方案
·
2025-02-07 04:05
智能运维
AIOps
文武双全!为什么数据分析师需要既懂业务又懂技术
感谢关注天善智能,走好数据之路↑↑↑欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,
大数据
分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!
R3eE9y2OeFcU40
·
2025-02-07 04:35
为什么尽量避免使用 IN 和 NOT IN?
一、效率问题1.NOTIN的性能瓶颈在SQL查询中,NOTIN往往会导致性能问题,尤其是在处理
大数据
集时。以下
我码玄黄
·
2025-02-07 03:25
后端
数据库
教你一招
数据库
后端
为什么全网都在看衰数据中台,数据中台是陷阱,还是利器?
“数据中台是
大数据
的下一站”“还没有构建数据中台,你的企业OUT了”“为什么说建设数据中台是企业数字化转型的必要环节”...相信很多人,在前两年都在网上看过类似的文章,没错,前两年数据中台的地位很高,说它是
云 祁
·
2025-02-07 02:23
人工智能
大数据
集群搭建基础:
Hadoop
完全分布式搭建学习指南!!
Hadoop
完全分布式搭建学习指南
Hadoop
版本:
Hadoop
2.XJDK版本:JDK1.8一、准备工作设置主机名和IP在三台CentOS7.4机器上分别设置主机名和IP:node1:192.168.14.10node2
初次知晓
·
2025-02-07 01:16
大数据
分布式
hadoop
如何处理大规模数据集中的数据处理:Spark和ApacheFlink
文章目录1.简介2.基本概念术语说明数据处理(DataProcessing)任务调度(TaskScheduling)
Hadoop
ApacheSparkApacheFlink3.核心算法原理和具体操作步骤以及数学公式讲解
AI天才研究院
·
2025-02-07 01:43
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Hudi VS Doris 使用分析
Hudi(
Hadoop
UpsertsDeletesandIncrementals)定位-面向数据湖的增量写入、更新与删除技术。
sunxunyong
·
2025-02-07 01:13
数据库
Hive-Container killed by YARN for exceeding memory limits. 9.2 GB of 9 GB physical memory used. Cons...
Jobabortedduetostagefailure:Task3instage0.0failed4times,mostrecentfailure:Losttask3.3instage0.0(TID62,
hadoop
7
嘣嘣嚓
·
2025-02-07 01:41
spark
hive
boosting
scala
big
data
Java
大数据
数据虚拟化:整合异构数据源的策略(41)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、本博客的精华专栏:
青云交
·
2025-02-07 00:09
大数据新视界
Java
大视界
大数据
数据虚拟化
异构数据源
ETL
实时数据整合
联邦查询
数据映射
java
CDH+Kylin三部曲之三:Kylin官方demo
《CDH+Kylin三部曲之二:部署和设置》:完成CDH和Kylin部署,并在管理页面做好相关的设置;现在
Hadoop
、Kylin都就绪了,接下来实践Kylin的官方demo;Yarn参数设置Yarn的内存参数设置之后一定要重启
2401_89740692
·
2025-02-07 00:07
kylin
大数据
【
大数据
平台】
大数据
平台的成本管理
⭐️
大数据
平台建设指南:全面讲解从数据采集到数据可视化的整个过程,掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python:初识、了解与热恋》:涵盖了Pytho
野老杂谈
·
2025-02-06 21:19
大数据平台建设指南
大数据
成本管理
大数据平台
云资源
TCO
ROI
数据开发八股文整理-
Hadoop
什么是
hadoop
Hadoop
是一个分布式系统基础架构,主要解决海量数据的存储和海量数据的分析计算问题
Hadoop
运行模式本地模式和为分布式模式都是单机运行完全分布模式即是多台服务器组成分布式环境
Hadoop
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hadoop
大数据
分布式
HIVE常见面试题
1.简述hiveHive是一个构建在
Hadoop
之上的数据仓库工具,主要用于处理和查询存储在HDFS上的大规模数据。
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hive
hadoop
数据仓库
Java 大视界 -- Java
大数据
在生物信息学中的应用与挑战(67)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-02-06 18:57
大数据新视界
Java
大视界
大数据
生物信息学
基因序列分析
蛋白质结构预测
数据质量
计算资源
机器学习
Java 大视界 -- Java
大数据
中的异常检测技术与应用(61)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-02-06 18:27
大数据新视界
Java
大视界
大数据
异常检测
基于统计方法
基于机器学习方法
基于深度学习方法
Spark
Streaming
Flink
Java
大数据
模型部署与运维:生产环境的挑战与应对(43)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、本博客的精华专栏:
青云交
·
2025-02-06 18:57
大数据新视界
Java
大视界
模型部署
运维
生产环境
环境一致性
性能优化
分布式部署
大数据
java
Java
大数据
自动化机器学习(AutoML):框架与应用案例(36)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、本博客的精华专栏:
青云交
·
2025-02-06 18:27
大数据新视界
Java
大视界
大数据
自动化机器学习
AutoML
应用案例
金融风控
框架
电商推荐
java
从招聘到离职:HR管理软件全流程优化企业人力资源管理
一、HR行业现状分析数据化与智能化趋势随着
大数据
和人工智能的不断发展,HR管理工作逐步从传
·
2025-02-06 17:21
从招聘到离职:HR管理软件全流程优化企业人力资源管理
一、HR行业现状分析数据化与智能化趋势随着
大数据
和人工智能的不断发展,HR管理工作逐步从传
·
2025-02-06 17:41
如何学习
大数据
治理:轻松上手指南
如何学习
大数据
治理:轻松上手指南开场白:从零开始,不再迷茫你有没有过这样的经历?听到“
大数据
治理”这个词时,感觉脑袋里一团乱麻。
狮歌~资深攻城狮
·
2025-02-06 15:08
大数据技术
学习
大数据
Elasticsearch 就业形势
Elasticsearch就业形势1.市场需求概况技术趋势推动需求增长随着
大数据
和云计算技术的迅猛发展,企业对高效、可扩展的数据处理和分析能力的需求日益增强。Elasticsearch凭借
狮歌~资深攻城狮
·
2025-02-06 14:05
jenkins
运维
网络安全模型_网络安全等级保护2.0云计算安全合规能力模型
网络安全等级保护制度在2.0时代着重于全方位的主动防御、动态防御、精准防护和整体防控的安全防护体系,将云计算、物联网、移动互联、工业控制信息系统和
大数据
等新应用、新技术纳入等级保护扩展要求。
weixin_39593340
·
2025-02-06 14:35
网络安全模型
如何搭建
Hadoop
高可用集群
一、集群配置图在搭建集群之前,我们要考虑好集群中各个机器的配置。这里以四台机器为例,配置图如下:集群配置图ant151ant152ant153ant154NameNodeNameNodeDataNodeDataNodeDataNodeDataNodeNodeManagerNodeManagerNodeManagerNodeManagerResourceManagerResourceManagerJ
Alcaibur
·
2025-02-06 13:24
hadoop
大数据
java
快速掌握用python写并行程序
一、
大数据
时代的现状当前我们正处于
大数据
时代,每天我们会通过手机、电脑等设备不断的将自己的数据传到互联网上。
python2021_
·
2025-02-06 12:18
python
开发语言
Java的NIO提供了非阻塞I/O机制的包
它的引入主要是为了解决传统I/O机制在处理大量连接或
大数据
量时所带来的性能瓶颈和可扩展性问题。
铁松溜达py
·
2025-02-06 09:59
前端
java
开发语言
1. 初识spark
本文通过介绍的是
大数据
领域优秀框架spark,打开分布式实时计算的大门1.spar
wlyang666
·
2025-02-06 08:20
大数据之spark
spark
大数据
分布式
大数据
存储引擎 NoSQL极简教程 An Introduction to Big Data: NoSQL
本文路线图:NoSQL简介文档数据库键值数据库图数据库Here’stheroadmapforthisfourthpostonNoSQLdatabase:IntroductiontoNoSQL
AI天才研究院
·
2025-02-06 07:49
大数据AI人工智能
nosql
大数据
数据库
java
开发语言
从MySQL迁移到PostgreSQL的完整指南
与MySQL相比,PostgreSQL在处理复杂查询和
大数据
集时表
m0_74823878
·
2025-02-06 07:17
mysql
postgresql
数据库
Scala语言的安全开发
Scala语言以其强大的功能和灵活性,在
大数据
处理和并发编程中受到了广泛的关注与应用。
萧月霖
·
2025-02-06 07:14
包罗万象
golang
开发语言
后端
使用python实现
Hadoop
中MapReduce
Hadoop
包含HDFS(分布式文件系统)、YARN(资源管理器)、MapReduce(编程模型)。
qq_44801116
·
2025-02-06 06:10
Python
python
hadoop
mapreduce
【
大数据
技术】编写Python代码实现词频统计(python+
hadoop
+mapreduce+yarn)
编写Python代码实现词频统计(python+
hadoop
+mapreduce+yarn)搭建完全分布式高可用
大数据
集群(VMware+CentOS+FinalShell)搭建完全分布式高可用
大数据
集群
Want595
·
2025-02-06 06:05
Python大数据采集与分析
大数据
python
hadoop
【硬刚
大数据
之面试篇】2021年从零到
大数据
专家面试篇之ClickHouse篇
本文是对《【硬刚
大数据
之学习路线篇】2021年从零到
大数据
专家的学习指南(全面升级版)》的面试部分补充。硬刚
大数据
系列文章链接:2021年从零到
大数据
专家的学习指南(全面升级版)2021
王知无(import_bigdata)
·
2025-02-06 04:18
大模型技术对
大数据
生态链的全面革新
大模型技术对
大数据
生态链的全面革新在数字化浪潮汹涌澎湃的当下,
大数据
和人工智能技术已成为推动各行业发展的关键力量。
敏叔V587
·
2025-02-06 04:15
大数据
Hadoop
1.0和2.0的主要区别
Hadoop
1.0指的是版本为Apache
Hadoop
0.20.x、1.x或者CDH3系列的
Hadoop
,组件主要由HDFS和MapReduce两个系统组成,HDFS是一个分布式文件存储系统,MapReduce
web_15534274656
·
2025-02-06 03:43
java
hadoop
大数据
hdfs
dubbo
java-zookeeper
Hadoop
1.0-HDFS介绍
Hadoop
是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括
Hadoop
Common、HDFS与MapReduce。
szjianzr
·
2025-02-06 03:13
HADOOP介绍
hadoop
HDFS
SQL on
Hadoop
SQL_on_
Hadoop
SQLon
Hadoop
概述
Hadoop
提供了一种分布式存储和计算的平台,为了解决传统关系型数据库无法处理海量数据的问题,通过扩展SQL的方式在
Hadoop
上执行分布式查询,称之为
Lostgreen
·
2025-02-06 03:42
大数据管理
sql
hadoop
数据库
笔记
学习
分布式
智能运维分析决策系统:赋能数字化转型的新引擎
智能运维分析决策系统(AIOps,ArtificialIntelligenceforITOperations)应运而生,它利用
大数据
、机器学习、人工智能等技术,实现了运维的自动化、智能化,极大地提升了运维效率与质量
我的运维人生
·
2025-02-06 02:30
运维
运维开发
技术共享
物联网架构之
Hadoop
hadoop
体系结构
Hadoop
是一个开源的分布式计算平台,主要用于存储和处理大规模数据集。
moluxiangfenglo
·
2025-02-06 01:54
架构
hadoop
大数据
突破X86和ARM架构,RISC-V成为第三势力?
随着AI、物联网、
大数据
和云计算的高速发展,低成本
weixin_34306593
·
2025-02-05 22:35
嵌入式
人工智能
大数据
DeepSeek: 深度搜索与深度挖掘技术的前景与应用
这种技术在
大数据
时代尤为重要,因为它能够帮助企业和研究人员从海量数据中提取出关键信息。这篇文章将深入探讨DeepSeek的背景、原理、应用以及未来发展。
·
2025-02-05 21:12
数据驱动产品设计:把数据作为驱动力,为产品提供更有质感、更个性化的体验
作者:禅与计算机程序设计艺术1.简介在过去的几年里,随着移动互联网、
大数据
、云计算等新兴技术的不断涌现,产品设计也在发生着革命性的变化。
AI天才研究院
·
2025-02-05 21:27
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他