E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据~Kafka
基于centos6.5安装ElasticSearch
前面我们讲述了solr的安装搭建过程,今天讲讲ElasticSearch,ElasticSearch是另一款作为分词和搜索的服务器,相比solr,ElasticSearch在做
大数据
方面更有优势,因为其天然支持分布式
小码农叔叔
·
2025-01-28 21:51
ElasticSearch
linux与容器实战
ElasticSearch
ES安装
分布式微服务系统架构第88集:
kafka
集群
在维护
Kafka
或底层系统时,使用集群可以确保为客户端提供高可用性。需要多少个broker一个
Kafka
集群需要多少个broker取决于以下几个因素。
掘金-我是哪吒
·
2025-01-28 18:27
分布式
微服务
系统架构
kafka
架构
大数据
开发的底层逻辑是什么?
大数据
开发的底层逻辑主要围绕数据的生命周期进行,包括数据的采集、存储、处理、分析和可视化等环节。
瑰茵
·
2025-01-28 18:56
大数据
AI智能获客工具的意义是什么
1.2精准定位潜在客户利用机器学习和
大数据
分析技术,AI
雪叶雨林
·
2025-01-28 17:49
AI
行业资讯
人工智能
大数据
和智能数据应用架构系列教程之:
大数据
与人工智能
作者:禅与计算机程序设计艺术1.背景介绍概述“
大数据
”是指海量、高维、多样化的数据集合。随着人类对数据处理和管理的需求越来越复杂,越来越依赖机器学习、人工智能等新兴技术。
AI天才研究院
·
2025-01-28 14:28
AI实战
大数据AI人工智能
Python实战
大数据
人工智能
语言模型
Java
Python
架构设计
Scala在
大数据
和分布式计算领域的应用与优势
大数据
和分布式计算是当今信息技术领域的热点话题,它们处理着海量数据并需要高效的计算能力。Scala,作为一种多范式编程语言,因其在并发编程和函数式编程方面的优势,成为
大数据
和分布式计算领域的理想选择。
夜色呦
·
2025-01-28 14:24
scala
大数据
开发语言
图文详解 MapReduce on YARN
前言本文隶属于专栏《1000个问题搞定
大数据
技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
Shockang
·
2025-01-28 13:20
大数据技术体系
大数据
mapreduce
yarn
360
大数据
面试题及参考答案
数据清理有哪些方法?数据清理是指发现并纠正数据文件中可识别的错误,包括检查数据一致性,处理无效值和缺失值等。常见的数据清理方法有以下几种:去重处理:数据中可能存在重复的记录,这不仅会占用存储空间,还可能影响分析结果。通过对比每条记录的关键属性,若所有关键属性值都相同,则判定为重复记录,可保留其中一条,删除其余重复项。例如在客户信息表中,若有两条记录客户姓名、联系方式、地址等关键信息都一样,就可进行
大模型大数据攻城狮
·
2025-01-28 12:42
大数据
数据治理
jvm内存
CAS
数据开发
指标开发
数据分析
【MQ】如何保证消息队列的高性能?
零拷贝
Kafka
使用到了mmap和sendfile的方式来实现零拷贝。
Forest 森林
·
2025-01-28 09:24
消息队列
MQ
kafka
【MQ】如何保证消息队列的高可用?
异步复制主节点返回消息给客户端的时候是否需要同步从节点Dledger:要求至少消息复制到半数以上的节点之后,才给客户端返回写入成功slave定时从master同步数据(同步刷盘、异步刷盘),master一旦挂了,slave提供消费服务,不能写入消息
Kafka
Kafka
Forest 森林
·
2025-01-28 09:24
消息队列
MQ
kafka
大数据
小白系列——YARN(1)
这是
大数据
小白系列,YARN的第一篇,准确的说是介绍YARN的“前身”,即MapReduce第一版(下称MRv1)中的资源管理系统。
weixin_44386638
·
2025-01-28 07:13
大数据
大数据
人工智能
机器学习
数据挖掘
数据分析
TaskManager的JVM OOM退出配置
在
大数据
领域中,TaskManager是执行并行任务的关键组件之一。它负责管理任务的执行和资源分配。在处理大规模数据时,内存管理是一个重要的考虑因素。
艾丽丝的爱情
·
2025-01-28 02:06
jvm
大数据
【面试题】构建高并发、高可用服务架构:技术选型与设计
监控系统消息队列缓存层数据存储层应用层Web层负载均衡与流量分配GrafanaPrometheusAlertmanager消息队列
Kafka
/RabbitMQ集群/镜像队列缓存层Redis/Memcached
言之。
·
2025-01-28 02:05
redis
python
面试
架构
JVM垃圾回收器的原理和调优详解!
全文目录:开篇语前言摘要概述垃圾回收器分类及原理1.Serial垃圾回收器2.Parallel垃圾回收器3.CMS垃圾回收器4.G1垃圾回收器源码解析示例代码使用案例分享案例1:Web服务的GC调优案例2:
大数据
任务的
喵手
·
2025-01-28 02:34
零基础学Java
jvm
EmEditort v24.5.3世界上最快的文本编辑器
支持宏,Unicode,代码段插件,还能处理
大数据
以及CSV文件,无需Excel,堪称最强CSV编辑器。软件自带简体中文,支持32位和64位版
jiamianAA
·
2025-01-27 23:39
经验分享
电脑
Crawl4AI:用几行代码打造强大的网页爬虫
Crawl4AI:用几行代码打造强大的网页爬虫在人工智能和
大数据
时代,数据的获取和处理变得尤为重要。尤其是在大型语言模型(LLM)的研究和应用中,如何高效地抓取和整理网络数据成为了一个关键的挑战。
海豹工匠
·
2025-01-27 21:30
爬虫
大数据
技术之MapReduce
一、MapReduce概述1、MapReduce简介MapReduce是一个分布式运算程序的编程框架,是基于Hadoop的数据分析计算的核心框架。MapReduce处理过程分为两个阶段:Map和Reduce。Map负责把一个任务分解成多个任务,Reduce负责把分解后多任务处理的结果汇总。2、MapReduce优缺点MapReduce优点:MapReduce易于编程:它简单的实现一些接口,就可以完
wespten
·
2025-01-27 20:21
Hadoop
Hive
Spark
大数据安全
大数据
mapreduce
hadoop
非凸科技荣登脉脉2024“年度职得去雇主”榜单
本届评选依据脉脉独有的“雇主指数”以及专家评审意见综合评选而出,综合考量了企业在脉脉社区广场、同事圈、行业圈等多个频道口碑,并基于职场
大数据
训练的专属大模型,客观反映企业在职场人心中的口碑。
·
2025-01-27 18:39
招聘
2024第五届全球数字经济产业大会:前沿技术引领未来
云计算与
大数据
云计算和
大数据
技术作为数字经济的基石,一直是大会的焦点。本届大会上,众多企业展示了他们在云计算平台的创新和
大数据
应用方面的最新进展。通
·
2025-01-27 18:36
javascript
anaconda中pyspark_自学
大数据
——9 Anaconda安装与使用pyspark
首先从Anaconda官网上下载Anaconda。一、解压安装包sudobashAnaconda3-2020.07-Linux-x86_64.shchown-Rhadoop:hadoop/opt/anaconda/vi/etc/profileexportANACONDA_HOME=/opt/anacondaexportPATH=$PATH:$ANACONDA_HOME/bin:source/etc
步六孤陆
·
2025-01-27 17:59
2022-02-09
大数据
学习日志——PySpark——Spark快速入门&Standalone集群
第一部分Spark快速入门01_Spark快速入门【Anaconda软件安装】[掌握]使用Python编写Spark代码,首先需要安装Python语言包,此时安装Anaconda科学数据分析包。Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。Anaconda是跨平台的,有Windows、MacOS、Linux版本。#下载地址:ht
王络不稳定
·
2025-01-27 17:28
spark
big
data
大数据
kafka
开启kerberos
一、基本环境准备创建票据创建Kerberos主体(Principal):使用kadmin.local或kadmin命令为Zookeeper和
Kafka
服务创建Kerberos主体。
蘑菇丁
·
2025-01-27 16:55
debian
运维
大数据
之Spark运行流程
文章目录前言(一)SparkOnYarn集群的Client模式运行流程(二)SparkOnYarn集群的Cluster模式运行流程总结前言上篇文章有讨论到SparkOnYarn的两种部署模式,如果有不清楚的地方,可以再看看,附上对应文章的链接:Spark的部署模式,本篇文章主要讨论SparkOnYarn两种部署模式的运行流程。(一)SparkOnYarn集群的Client模式运行流程该模式的Dri
「已注销」
·
2025-01-27 15:17
Spark
大数据
spark
hadoop
R语言学习笔记6-数据框
DataFrame)介绍数据框用途创建数据框从矩阵创建数据框索引和切片添加和修改列数据框的预处理数据框的排序数据框的筛选处理缺失值应用函数处理数据重塑数据框使用dplyr进行数据框的管道操作数据框的时间序列操作
大数据
框的处理数据框的绘图数据框的文本处理数据框的连接与关联按行或列连接数据框按键值关联数据框数据框的条件处理与逻辑操作条件筛选逻辑操作数据框的汇总与统计分析
Colin♛
·
2025-01-27 15:17
r语言
学习
笔记
开发语言
信息可视化
华为OD机试C卷-- 精准核酸检测(Java & JS & Python & C)
现在根据传染病流调以及
大数据
分析,得到了每个人之间在时间、空间上是否存在轨迹交叉。现在给定一组确诊人员编号(X1,X2,X3,…,Xn),在所有人当中,
飞码创造者
·
2025-01-27 14:35
华为OD机试题库
华为od
c语言
java
javascript
python
matlab
大数据
计算技巧(持续更新中)
在matlab中,当数据比较大时,运算起来就困难了,有时候还会outofmemory(例如4000*4000的矩阵,要算矩阵乘法都比较吃力)。此文会记录我学到的一些解决办法:1.将数据的存储类型从double转换成single在matlab中double数据类型占8个字节,single类型占4个字节。把数据类型从double类型转换成single类型可以节省一半的空间。单精度浮点数single的取
tina_lulu_21
·
2025-01-27 14:04
matlab
matlab
string
存储
Matlab:读取和处理
大数据
表格文本文件
Matlab:读取和处理
大数据
表格文本文件在实际的数据分析应用中,往往需要处理海量数据。针对大型数据文件,Matlab提供了快速高效的读取和处理工具,可以便捷地完成数据处理任务。
追逐程序梦想者
·
2025-01-27 13:01
matlab
大数据
开发语言
赛事 Q&A × 培训预告:2024 年(第 17 届)中国大学生计算机设计大赛
大数据
主题赛正式开赛!
大赛下设不同领域的十一个大类,和鲸科技自2021年起,连续四年作为
大数据
应用大类中
大数据
主题赛的协办方倾力配合大赛组委会与各承办单位,
ModelWhale
·
2025-01-27 13:30
中国大学生计算机设计大赛
大数据
人工智能
编程
竞赛
大数据
StarRocks(六) :Catalog_starroccks支持oracle外部表了吗(1)
StarRocks自2.3版本起支持Catalog(数据目录)功能,实现在一套系统内同时维护内、外部数据,方便您轻松访问并查询存储在各类外部源的数据。1.基本概念内部数据:指保存在StarRocks中的数据。外部数据:指保存在外部数据源(如ApacheHive™、ApacheIceberg、ApacheHudi、DeltaLake、JDBC)中的数据。2.Catalog当前StarRocks提供两
2401_84181975
·
2025-01-27 11:51
程序员
大数据
oracle
数据库
springboot
kafka
配置与使用
springboot
kafka
配置与使用引入spring-
kafka
依赖org.springframework.
kafka
spring-
kafka
application配置可以根据情况只配置生产着或消费者
摘星喵Pro
·
2025-01-27 10:43
java
web
编程技巧
kafka
spring
boot
java
基于SpringBoot+Vue码头船只货柜管理系统
期待与各位高校教师、企业讲师以及同行交流合作主要内容:Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与
大数据
、单片机开
qq_469603589
·
2025-01-27 08:28
Java项目实战
信息管理类项目
spring
boot
vue.js
后端
推荐开源项目:WeDataSphere - 智慧数据服务平台
推荐开源项目:WeDataSphere-智慧数据服务平台去发现同类优质开源项目:https://gitcode.com/是一款由微众银行金融科技团队开发的开源
大数据
处理和应用框架,旨在简化数据分析流程,
劳泉文Luna
·
2025-01-27 07:52
Java 大视界 -- Java
大数据
中的隐私增强技术全景解析(64)
一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:
大数据
新视
青云交
·
2025-01-27 07:51
大数据新视界
Java
大视界
java
使用Pyecharts绘制地理图表
Pyecharts是一个基于Python的强
大数据
可视化库,它提供了丰富的图表类型和交互功能。其中,Pyecharts能够轻松绘制地理图表,帮助我们展示地理数据的分布和变化趋势。
前端设计家
·
2025-01-27 05:14
信息可视化
python
数据分析
Python
MQ的可靠消息投递机制
例如:
Kafka
、RabbitMQ等都支持持久化消息。
Kafka
通过将消息存储在日志文件中,而RabbitMQ通过磁盘队列持久化消息。
言之。
·
2025-01-27 03:02
面试
架构
面试
大数据
平台建设整体架构设计方案
《
大数据
平台建设整体架构设计方案》关键词:
大数据
平台、分布式存储、分布式计算、数据仓库、数据湖、数据安全、数据质量管理、数据治理、数据挖掘、机器学习、图计算、自然语言处理、Hadoop、Spark、Flink
AI天才研究院
·
2025-01-27 02:55
ChatGPT
AI大模型企业级应用开发实战
大数据AI人工智能
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
企业信息化5:后勤管理系统
前言:随着企业各业务板块在信息化的浪潮中积极转型升级,后勤板块往往成为了一个企业信息化的短板,后勤业务
大数据
无法融入企业信息化数据湖,进而影响企业整体运营的效率和质量。
mosquito_lover1
·
2025-01-27 02:52
制造业企业全业务流程信息化
python
flask
开源
大数据
Lambda架构
Lambda架构介绍Lambda是用于同时处理离线和实时数据,可容错、可扩展的分布式系统架构。有批处理层、加速层、服务层。同时以流计算和批处理计算合并视图。Lambda架构的批处理层采用不可变存储模型,不断地往主数据集后追加新的数据。Lambda架构优缺点<
奋进学堂
·
2025-01-26 23:00
系统架构设计师考试
架构
Lambda架构
原文地址:https://www.cnblogs.com/xiaodf/p/11642555.html首先我们来看一个典型的互联网
大数据
平台的架构,如下图所示:在这张架构图中,
大数据
平台里面向用户的在线业务处理组件用褐色标示出来
leveretz
·
2025-01-26 22:54
大数据
lambda
ES聚合分析原理与代码实例讲解
ES聚合分析原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着
大数据
时代的到来,企业级应用需要处理的数据量呈爆炸式增长
AI大模型应用之禅
·
2025-01-26 22:21
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大数据
技术4:Lambda和Kappa架构区别_lambda架构和kappa架构区别
Lambda架构缺点:虽然Lambda架构使用起来十分灵活,并且可以适用于很多的应用场景,但在实际应用的时候,Lambda架构也存在着一些不足,主要表现在它的维护很复杂。(1)同样的需求需要开发两套一样的代码:这是Lambda架构最大的问题,两套代码不仅仅意味着开发困难(同样的需求,一个在批处理引擎上实现,一个在流处理引擎上实现,还要分别构造数据测试保证两者结果一致),后期维护更加困难,比如需求变
2401_84181501
·
2025-01-26 22:50
大数据
架构
kafka
-保姆级配置说明(consumer)
bootstrap.servers=#deserializer应该与producer保持对应#key.deserializer=#value.deserializer=##fetch请求返回时,至少获取的字节数,默认值为1##当数据量不足时,客户端请求将会阻塞##此值越大,客户端请求阻塞的时间越长,这取决于producer生产效率和网络传输能力fetch.min.bytes=1##如果broker
xiao-xiang
·
2025-01-26 20:11
kafka
kafka
分布式
kafka
-部署安装
一.简述:
Kafka
是一个分布式流处理平台,常用于构建实时数据管道和流应用。二.安装部署:1.依赖:a).Java:
Kafka
需要Java8或更高版本。
xiao-xiang
·
2025-01-26 20:40
kafka
kafka
分布式
简述
kafka
生产者ack确认机制
一、总结该章节主要探讨造成数据丢失问题生产者ack确认机制(目的是要有多少个分区副本收到消息,生产者才认为该消息写入成功;acks参数对数据是否丢失起重要的作用)(1)ack=0,就是表示生产者不会和broker确认消息是否写入成功。这就有可能造成服务器broker因出现问题,导致没有接收到生产者的消息,而生产者却无从得知。这也就造成数据的丢失。--较低延迟和高吞吐量,但是以消息丢失的高风险为代价
技匠三石弟弟
·
2025-01-26 20:35
数据开发
kafka
Kafka
生产者中的ack的配置
此时ack有3个配置:1.ack=0
kafka
-cluster不需要任何的broker收到消息,就⽴即返回ack给⽣产者,最容易丢消息的,效率是最⾼的2.ack=1(默认):多副本之间的leader已经收到消息
欧阳冰轩
·
2025-01-26 20:04
Kafka
kafka
分布式
kafka
生产者发送流程
Kafka
是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。
Kafka
是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。
jxj_cd
·
2025-01-26 19:30
mysql
数据库
【53】Camunda8-Zeebe核心引擎-Partitions分区与Internal processing内部处理
如果使用过
Kafka
,这部分内容是比较相似的。每当部署流程时,都会将其部署到第一个分区。然后,该流程将分发到所有分区。在所有分区上,此流程接收相同的key和版本,以便可
AlieNeny
·
2025-01-26 18:25
Camunda
camunda8
流程引擎
zeebe
partitions
分区
Kafka
生产者ACK参数与同步复制
目录生产者的ACK参数ack等于0ack等于1(默认)ack等于-1或all
Kafka
的同步复制使用误区生产者的ACK参数
Kafka
的ack机制可以保证生产者发送的消息被broker接收成功。
WannaRunning
·
2025-01-26 18:24
kafka
分布式
Redis线上阻塞要如何排查
哪些情况会让指令变慢:1.指令获取的数据很多,比如
大数据
量下执行keys、hgetall、smembers等指令。
思静鱼
·
2025-01-26 17:12
#
Redis-缓存
redis
数据库
缓存
Apache Hive 聚合函数与 OVER 窗口函数:从基础到高级应用
在
大数据
时代,ApacheHive是处理和分析海量数据的强大工具。Hive提供了丰富的聚合函数和强大的OVER窗口函数,能够帮助我们高效地进行数据分析。
大鳥
·
2025-01-26 11:04
sql
hive
apache
hive
hadoop
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他