E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据[hadoop]
大数据
面试之路 (二) hive小文件合并优化方法
大量小文件容易在文件存储端造成瓶颈,影响处理效率。对此,您可以通过合并Map和Reduce的结果文件来处理。一、合并小文件的常见场景写入时产生小文件:Reduce任务过多或数据量过小,导致每个任务输出一个小文件。动态分区插入:分区字段基数高,每个分区生成少量数据,形成大量小文件。频繁追加数据:通过INSERTINTO多次追加数据,导致文件碎片化。二、合并小文件的核心方法方法1:调整Reduce任务
愿与狸花过一生
·
2025-03-12 12:11
大数据
大数据
hive
hadoop
第八课:Scrapy框架入门:工业级爬虫开发
在当今
大数据
时代,数据抓取已成为信息获取的重要手段。Scrapy作为一个基于Python的开源网络爬虫框架,凭借其高效、灵活的特性,在工业级爬虫开发中占据重要地位。
deming_su
·
2025-03-12 11:05
Python
scrapy
爬虫
python
flink(十一):Table&Sql实现窗口水印计算
文章目录分享说明实现讲解代码总结分享
大数据
博客列表说明本博客每周五更新一次。
羽落风起
·
2025-03-12 11:34
大数据
flink
flink
【愚公系列】2023年10月 WPF控件专题 Path控件详解
《博客内容》:.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、
大数据
、人
愚公搬代码
·
2025-03-12 09:18
wpf
51-53 CVPR 2024 | DriveWorld:通过自动驾驶世界模型进行 4D 预训练场景理解 (含模型数据流梳理)
DriveWorld在UniAD的基础上又有所成长,提升了自动驾驶目标检测、目标追踪、3D占用、运动预测及规划的性能,后期扩
大数据
集和调整骨干网络大小应该会
深圳季连AIgraphX
·
2025-03-12 08:43
aiXpilot
智驾大模型1
自动驾驶
人工智能
AIGC
stable
diffusion
计算机视觉
智慧城市
智能制造中的工业
大数据
分析实践
智能制造中的工业
大数据
分析实践关键词:智能制造,工业
大数据
,数据分析,机器学习,深度学习,预测性维护,质量控制,生产优化文章目录智能制造中的工业
大数据
分析实践1.背景介绍1.1问题的由来1.2研究现状1.3
AI天才研究院
·
2025-03-12 08:12
LLM大模型落地实战指南
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Java 大视界 -- 基于 Java 的
大数据
可视化交互设计与实现技巧(105)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-12 07:07
大数据新视界
Java
大视界
java
信息可视化
可视化交互
ECharts
Three.js
实时渲染
AR
可视化
Java 大视界 -- Java
大数据
中的时间序列数据异常检测算法对比与实践(103)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-03-12 07:07
大数据新视界
Java
大视界
java
大数据
算法
时间序列分析
异常检测
孤立森林
LSTM
实施一套先进的智能摄像头服务系统。
一、项目背景随着物联网、人工智能和
大数据
技术的飞速发展,智能摄像头已成为家庭、企业以及公共安全领域的重要设备。其便捷、高效、智能的特点,使得市场需求日益增长。
合方圆~小文
·
2025-03-12 07:04
4G低功耗
模块
A-I智能
人工智能
硬件工程
大数据
记一次多线程导入问题排查过程
记一次多线程导入问题排查过程1.需求2.遇到问题3.排查解决问题1.需求
大数据
量的核对:现在有1000个excel文件,每个excel文件内有21个sheet页,现在要对这些数据进行核对,需要先将这些数据导入到库中
程序辕日记
·
2025-03-12 04:07
java
MySql
java
spring
boot
【
大数据
】
大数据
处理-Lambda架构-Kappa架构
大数据
处理-Lambda架构-Kappa架构elasticsearch-headElasticsearch-sqlclientNLPchina/elasticsearch-sql:UseSQLtoqueryElasticsearch360
weixin_33884611
·
2025-03-12 04:37
大数据
系统架构
2024年
大数据
技术4:Lambda和Kappa架构区别_lambda架构和kappa架构区别,2024年最新你花了多久弄明白架构设计
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上
大数据
知识点,真正体系化!
2401_84182146
·
2025-03-12 03:32
程序员
大数据
面试
学习
大数据
技术4:Lambda和Kappa架构区别_lambda架构和kappa架构区别(3)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!Lambda架构总共由三层系统组成:批处理层(Batc
2301_76348014
·
2025-03-12 03:32
程序员
大数据
面试
学习
mySQL和Hive的区别
SQL和HQL的区别整体1、存储位置:Hive在
Hadoop
上;Mysql将数据存储在设备或本地系统中;2、数据更新:Hive不支持数据的改写和添加,是在加载的时候就已经确定好了;数据库可以CRUD;3
iijik55
·
2025-03-12 00:41
面试
学习路线
阿里巴巴
hive
mysql
大数据
tomcat
面试
【时间序列聚类】从数据中发现隐藏的模式
在
大数据
时代,时间序列数据无处不在。无论是股票市场的价格波动、天气的变化趋势,还是用户的点击行为,这些数据都随着时间推移而产生。然而,面对海量的时间序列数据,我们如何从中提取有价值的信息?
T-I-M
·
2025-03-11 22:45
机器学习
人工智能
时间序列
家居巨头的觉醒,永洪科技为林氏家居开启一站式智慧决策
永洪科技与林氏家居的合作,是共同开发了一个企业级的一站式
大数据
分析平台。在合作多年的积累下,已逐步成为家居行业数字化转型的代表性案例。
永洪科技
·
2025-03-11 19:53
科技
大数据
人工智能
数据分析
数据可视化
报表
flink-cdc实时增量同步mysql数据到elasticsearch
1.环境准备mysqlelasticsearchflinkonyarn说明:如果没有安装
hadoop
,那么可以不用yarn,直
大数据技术派
·
2025-03-11 19:51
#
Flink
elasticsearch
flink
mysql
Hive在
大数据
集群下的部署
hive安装1)把apache-hive-3.1.3-bin.tar.gz上传到Linux的/opt/software目录下2)解压apache-hive-3.1.3-bin.tar.gz到/opt/module/目录下面tar-zxvf/opt/software/apache-hive-3.1.3-bin.tar.gz-C/opt/module/3)修改apache-hive-3.1.3-bin
正在绘制中
·
2025-03-11 18:47
大数据
大数据
hive
搭建分布式Hive集群
title:搭建分布式Hive集群date:2024-11-2923:39:00categories:-服务器tags:-Hive-
大数据
搭建分布式Hive集群本次实验环境:Centos7-2009、
Hadoop
逸曦玥泱
·
2025-03-11 18:17
大数据运维
分布式
hive
hadoop
Hadoop
、Spark和 Hive 的详细关系
Hadoop
、Spark和Hive的详细关系1.Apache
Hadoop
Hadoop
是一个开源框架,用于分布式存储和处理大规模数据集。
夜行容忍
·
2025-03-11 18:46
hadoop
spark
hive
Windows系统下解压".tar"文件出错,提示:无法创建符号链接,可能需要以管理器身份运行winrar
1、解压文件出错,如下信息:D:\tools\
hadoop
-3.1.2.tar.gz:无法创建符号链接D:\tools\
hadoop
-3.1.2\
hadoop
-3.1.2\lib\native\lib
hadoop
.so
ruangaoyan
·
2025-03-11 18:45
斐波拉契数列
大数据
版:斐波拉契数列-
大数据
版输入描述一个正整数n(1≤n≤104)。输出描述斐波那契数列的第n项F(n)。由于结果可能很大,因此将结果对10007取模后输出。样例1输入1输出1解释边界定义:F
RichardK.
·
2025-03-11 17:10
c++
学习
大数据
技术生态圈:
Hadoop
、Hive、Spark的区别和关系
大数据
技术生态圈:
Hadoop
、Hive、Spark的区别和关系在
大数据
领域中,
Hadoop
、Hive和Spark是三个常用的开源技术,它们在
大数据
处理和分析方面发挥着重要作用。
雨中徜徉的思绪漫溢
·
2025-03-11 17:07
大数据
hadoop
hive
flink+kafka实现流数据处理学习
1、概念介绍flink:是一个分布式、高可用、高可靠的
大数据
处理引擎,提供了一种高效、可靠、可扩展的方式来处理和分析实时数据。
上海研博数据
·
2025-03-11 17:06
java
大数据
面试之路 (一) 数据倾斜
记录
大数据
面试历程数据倾斜
大数据
岗位,数据倾斜面试必问的一个问题。一、数据倾斜的表现与原因表现某个或某几个Task执行时间过长,其他Task快速完成。
愿与狸花过一生
·
2025-03-11 17:34
大数据
面试
职场和发展
ZooKeeper学习总结(1)——ZooKeeper入门介绍
1.概述Zookeeper是
Hadoop
的一个子项目,它是分布式系统中的协调系统,可提供的服务主要有:配置服务、名字服务、分布式同步、组服务等。
一杯甜酒
·
2025-03-11 17:03
ZooKeeper学习总结
Zookeeper
Zookeeper+kafka学习笔记
Zookeeper是Apache的一个java项目,属于
Hadoop
系统,扮演管理员的角色。
CHR_YTU
·
2025-03-11 16:01
Zookeeper
麒麟arm架构系统_安装nginx-1.27.0_访问500 internal server error nginx解决_13: Permission denied---Linux工作笔记072
[root@
hadoop
173nginx1.27.0]#wget-chttp://nginx.org/download/nginx-1.27.0.tar.gz--2024-07-0509:47:00--
添柴程序猿
·
2025-03-11 16:54
java
nginx-1.27.0
nginx最新版安装
麒麟v10
arm架构
麒麟v10
安装nginx
Zookeeper与Kafka学习笔记
一、Zookeeper核心要点1.核心特性分布式协调服务,用于维护配置/命名/同步等元数据采用层次化数据模型(Znode树结构),每个节点可存储<1MB数据典型应用场景:
Hadoop
NameNode高可用
上海研博数据
·
2025-03-11 15:51
zookeeper
kafka
学习
一文理清:阿里系数据中台-数据治理工具集(傻傻也能分清楚)
阿里云提供的
大数据
与数据分析产品种类较多,各产品的定位和核心功能有所不同。
Debug_Snail
·
2025-03-11 14:09
Hadoop
Big
Data
技术工具
人工智能
hadoop
数据仓库
使用LangChain访问个人数据第一章-简介
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序正文在
大数据
时代
明志刘明
·
2025-03-11 12:24
大模型学习手册
langchain
架构生命周期(演进史)技术应服务于业务
饿了么(工商局)4、
大数据
+云计算5、AI未来以来时代…第一时期单一应用架构allinone。所有的模块和代码都在一起。技术也不分层。(2000年左右)网站的初
Limbo1213
·
2025-03-11 09:59
java架构
生命周期演进史
MySQL-关于如何保存“
大数据
”
作者:赵师的工作日(赵明中)现役OracleACE、MySQL8.0ocp、TiDBPCTA\PCTP、ElasticsearchCertifiedEngineer微信号:mzzhao23微信公众号:赵师的工作日墨天轮社区:赵师的工作日CSND:赵师的工作日数据库的种类有很多,各类数据库充分发挥各自的优势从而保证业务稳定运行,mysql轻量级、关键数据,redis缓存、快,ES搜索,Mongodb
赵师的工作日
·
2025-03-11 08:55
mysql
大数据
数据库
PIPCA个人信息保护合规审计师认证介绍!
个人信息保护合规审计师"(PersonalInformationProtectionComplianceAuditor-CCRC)是中国网络安全审查认证中心与市场监管
大数据
中心为深入贯彻实施《
熙丫 13381482386
·
2025-03-11 07:50
大数据
Apache Doris 实现毫秒级查询响应
1.引言1.1数据分析的重要性随着
大数据
时代的到来,企业对实时数据分析的需求日益增长。快速、准确地获取数据洞察成为企业在竞争中脱颖而出的关键。
随风九天
·
2025-03-11 07:19
匠心数据库
服务
java
apache
Apache
Doris
ClickHouse Keeper 源码解析
作者简介:范振(花名辰繁),阿里云开源
大数据
-OLAP方向负责人。内容框架背景架构图核心流程图梳理内部代码流程梳理Nuraft关键配置排坑结论关于我们R
阿里云云栖号
·
2025-03-11 05:01
云栖号技术分享
java
开发语言
后端
基于
大数据
架构的就业岗位推荐系统的设计与实现【java或python】—计算机毕业设计源码+LW文档
摘要随着互联网技术的迅猛发展和
大数据
时代的到来,就业市场日益复杂多变,求职者与招聘方之间的信息不对称问题愈发突出。为解决这一难题,本文设计并实现了一个基于
大数据
架构的就业岗位推荐系统。
qq_375279829
·
2025-03-11 05:59
大数据
架构
python
课程设计
算法
供应链工作效率如何提升
提升供应链工作效率可以从以下几个关键方面入手:1.优化供应链管理数据驱动决策:利用AI和
大数据
分析,提高预测准确性,优化库存管理。
dev.null
·
2025-03-11 04:21
社会
供应链
【人工智能】农业工程与信息技术文献推荐
2.农业
大数据
与决策支持《农业
大数据
:理论与实践》作者:梅方权内容简
lisw05
·
2025-03-11 00:23
人工智能
农业信息技术
机器人
phoenix无法连接hbase shell创建表失败_报错_PleaseHoldException: Master is initializing---记录020_
大数据
工作笔记0180
今天发现,我的phoenix,去连接hbase集群,怎么也连不上了,奇怪了...弄了一晚上org.apache.
hadoop
.hbase.PleaseHoldException:Masterisinitializing
添柴程序猿
·
2025-03-11 00:52
hbase连接报错
phoenix连接hbase
phoenix
PleaseHoldExcep
物联网-电路局“一杆一档”管理
电路局“一杆一档”管理及设备管理维修的技术实现为了实现电路局对电杆及其安装设备的“一杆一档”管理,并结合设备管理、维修等相关工作,可以通过物联网(IoT)、地理信息系统(GIS)、
大数据
、人工智能(AI
小赖同学啊
·
2025-03-10 23:45
智能硬件
物联网
2025最新Linux系统深度优化指南:20个核心技巧与实战案例解析
2025最新Linux系统深度优化指南:20个核心技巧与实战案例解析摘要:随着Linux在云计算、
大数据
、AI等领域的广泛应用,系统性能优化成为运维工程师的核心技能。
emmm形成中
·
2025-03-10 19:15
linux应用实操
服务器
linux
github
大数据
与hdfs创建文件夹
注意事项:在hdfs上操作的文件,创建文件的时候注意他与linux是不一样的(模式如下:)hdfsdfs-mkdir/test1错误示例:否则,无论如何hdfsdfs-ls/test1/都没有文件的
猫猫头有亿点炸
·
2025-03-10 17:30
大数据
hdfs
hadoop
【基础5】归并排序
优缺点优点缺点✅稳定排序(相等元素顺序不变)❌额外空间(需O(n)临时数组)✅时间复杂度稳定O(nlogn)❌递归可能栈溢出(极
大数据
流光听风语
·
2025-03-10 17:29
基础算法
排序算法
算法
Java 中操作 R:深度整合与高效应用
Java中操作R:深度整合与高效应用引言随着
大数据
和机器学习的快速发展,R语言在数据分析和可视化方面扮演着越来越重要的角色。
froginwe11
·
2025-03-10 15:18
开发语言
数据集与云计算:云端数据集的管理与应用
1.背景介绍1.1
大数据
时代的数据挑战步入21世纪,我们见证了信息技术的爆炸式增长,数据以前所未有的速度产生、存储和使用。
AI天才研究院
·
2025-03-10 10:45
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
AI 大模型应用数据中心建设:数据中心成本优化
随着AI模型和
大数据
量的增长,数据中心的建设和管理成本逐渐成为AI技术落地和应用的核心挑战之一。为了优化数据中心成本,同时保持高性能
杭州大厂Java程序媛
·
2025-03-10 09:38
DeepSeek
R1
&
AI人工智能与大数据
java
python
javascript
kotlin
golang
架构
人工智能
Hadoop
的运行模式
Hadoop
的运行模式1、本地运行模式2、伪分布式运行模式3、完全分布式运行模式4、区别与总结
Hadoop
有三种可以运行的模式:本地运行模式、伪分布式运行模式和完全分布式运行模式1、本地运行模式本地运行模式无需任何守护进程
对许
·
2025-03-10 09:35
#
Hadoop
hadoop
大数据
分布式
信号处理应用:电力系统中的信号处理_(9).基于电力系统信号的数据挖掘技术
随着
大数据
和人工智能技术的发展,数据挖掘技术在电力系统中的应用越来越广泛。本节将介绍如何利用数据挖掘技术对电力系统中的信号进行处理和分析,以提高系统的可靠性和效率。
kkchenkx
·
2025-03-10 08:27
信号处理技术仿真模拟
信号处理
数据挖掘
人工智能
CCF-GESP Python一级考试全解析:网络协议+编程技能双突破
Python一级考试作为入门级认证,主要考察考生对计算机基础逻辑、编程工具使用及网络基础概念的掌握程度,证书受教育部认可,为后续人工智能、
大数据
等领域学习奠定基石。
奕澄羽邦
·
2025-03-10 07:50
python
网络协议
开发语言
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他