E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
余老师带你学习大数据-
Spark
快速大数据处理第十章Kafka第八节Kafka-Connect
kafkaKafkaConnect基本概念1、KafkaConnect是Kafka流式计算的一部分,左侧是数据源包括了数据库、hadoop、文本等等,右侧是数据结果包括了文本、hadoop、数据库,中间上层就是KafkaConnect,它里面会有很多的输入,将输入的内容的读取进来转交给Kafka里,也有可能将kafka里的内容拿出来放到我们的外部数据源中。2、KafkaConnect主要用来与其他
weixin_45810046
·
2024-01-20 03:41
kafka
记录JVM的学习
虚拟机常用参数:在虚拟机中输入java就可以启动一个java虚拟机,以横杠开头的都是标准参数;以-X开头的都是非标准参数,当在系统中输入java-X的时候,系统会把所有的非标准参数都列举出来;一般真正用来
调优
的参数是以
花里胡哨的菜只因
·
2024-01-20 03:24
jvm
学习
kylin安装学习教程
ApacheKylin是一个开源的分布式分析引擎,提供Hadoop/
Spark
之上的SQL接口及多维分析(OLAP)能力以支持大数据分析,最初由eBayInc.开发并贡献到开源社区。
打工人何苦为难打工人
·
2024-01-20 03:07
kylin
Kylin安装学习教程
ApacheKylin是一个开源的分布式分析引擎,提供Hadoop/
Spark
上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。
终将老去的穷苦程序员
·
2024-01-20 03:04
kylin
CVE-2023-46226 Apache iotdb远程代码执行漏洞
它具有体量轻、性能高、易使用的特点,完美对接Hadoop与
Spark
生态,适用于工业物联网应用中海量时间序列数据高速写入和复杂分析查询的需求。
棱镜七彩
·
2024-01-20 02:27
apache
iotdb
Nginx架构设计
七大核心应用场景:反向代理、虚拟主机、域名解析、负载均衡、防盗链、url重定向、https高性能web服务器,负载均衡大型服务器的流量网关,应用网关,日志服务器,文件存储服务器模块化扩展,复杂功能的二次
调优
浪里摸鱼
·
2024-01-19 22:37
nginx
运维
高并发缓存问题分析以及分布式锁的实现
从数据库入手也是
调优
性价比最高的切入点。因此需要对我们的程序进行优化.一般采取两种方案:①从数据库自身出发:优化sql,通过分析sql給sql建立索引,优化查询
豆豆的java之旅
·
2024-01-19 20:04
分布式缓存
缓存
分布式
如何对 OceanBase 进行 SQL 诊断和
调优
作者简介:田逸飞(义博):OceanBase高级开发工程师一、SQL执行流程SQL发送到OBServer后,会先由OBServer对其进行快速参数化,参数化后的SQL进入PlanCache尝试命中计划缓存。如果找到一个可以使用的计划,则直接将计划交由SQL的执行引擎去执行,并将执行完成后的结果返回给用户;如果没有找到可以使用的计划,则会重新为此SQL生成计划,完整地执行SQL的Parser、Res
OB小话唠
·
2024-01-19 19:19
数据库
OceanBase
社区版
OceanBase
sql
数据库
database
【日志分析系统】ELK 企业级日志分析系统
——————————————————————1.环境准备2.部署Elasticsearch软件(1)安装elasticsearch—rpm包(2)修改elasticsearch主配置文件(3)es性能
调优
参数
思华年^O^
·
2024-01-19 17:27
运维
ELK
企业级日志分析系统
elk
自然语言处理大数据:
spark
ML Word2Vec详解
简介Word2Vec是一种著名的词嵌入(WordEmbedding)方法,它可以计算每个单词在其给定语料库环境下的分布式词向量(DistributedRepresentation,亦直接被称为词向量)。词向量表示可以在一定程度上刻画每个单词的语义。如果词的语义相近,它们的词向量在向量空间中也相互接近,这使得词语的向量化建模更加精确,可以改善现有方法并提高鲁棒性。词向量已被证明在许多自然语言处理问题
nnnancyyy
·
2024-01-19 17:23
机器学习
python
人工智能
自然语言处理
深度学习
华为外包数据库面试问题分享20211225
数据库方面做过哪些,例如安装部署、开发支持、运维、
调优
?SQL
调优
这块你是怎么在做的。数仓的东西了解多少。数据库开发支持这方面你做过哪些。你现在的工作中的SQL开发,具体是作了哪些。
钦䲹
·
2024-01-19 16:05
数据库
华为
面试
大数据学长面试之OPPO面试题
1)技术部分(1)
Spark
Streaming消费方式及区别,
Spark
读取HDFS的数据流程(2)Kafka高性能(3)Hive
调优
,数据倾斜(4)Zookeeper怎么避免脑裂,什么是脑裂。
大数据小理
·
2024-01-19 16:01
大数据1
大数据
面试
职场和发展
某汽车外包-大数据开发-面试
4.
spark
的提交参数有那些命令5.
spark
rdd,dataframe,dataSe解释一下。
劝学-大数据
·
2024-01-19 16:28
大数据面试题
大数据
AI大模型里经常提到的“炼丹”、“挖矿”、“蒸馏”是什么意思?
炼丹重点描述模型
调优
的过程。这个过程往往需要大量的尝试和经验,包括选择合
AI明说
·
2024-01-19 14:02
AIGC
AIGC
chatgpt
人工智能
语言模型
深度学习
spark
读取MySQL数据机器学习预测存入MySQL
importorg.apache.
spark
.
Spark
Confimportorg.apache.
spark
.ml.classification.
大数据驱动
·
2024-01-19 14:12
#
spark
mysql
机器学习
关于jenkins集成python的单元测试
最近在研究jenkins的集成,然后想把自己写的python工具也用jenkins集成一下废话少说,来看结构
spark
ing.py@author:lianying'''class
Spark
ing:@staticmethoddefget_num_of_zero
百晓生说测试
·
2024-01-19 13:21
软件测试
jenkins
python
单元测试
自动化测试
软件测试
功能测试
程序人生
java 垃圾回收GC(CMS、G1)原理及
调优
概述本文介绍GC基础原理和理论,GC
调优
方法思路和方法,基于Hotspotjdk1.8,学习之后将了解如何对生产系统出现的GC问题进行排查解决阅读时长约30分钟,内容主要如下:GC基础原理,涉及
调优
目标
A゛孤青
·
2024-01-19 13:44
java
java
开发语言
JVM垃圾回收
目录1回收对象判断2回收算法3分代回收4垃圾回收器4.1三种垃圾回收器对比4.2G14.2.1阶段划分4.2.2跨代引用4.2.3版本特性4.3Remark理解4.4FullGC5GC
调优
1回收对象判断
bone_ds
·
2024-01-19 13:10
jvm
jvm
java
算法
html源码(html+css)
运维&从测试>UI设计>产品>我的课程表继续学习程序语言设计正在学习-使用对象继续学习程序语言设计正在学习-使用对象继续学习程序语言设计正在学习-使用对象全部课程精品推荐JQuery
Spark
MySQLJava
奇遇少年
·
2024-01-19 11:26
html
css
html5
css3
其他
Flink TaskManager内存管理机制介绍与
调优
总结
内存模型因为TaskManager是负责执行用户代码的角色,一般配置TaskManager内存的情况会比较多,所以本文当作重点讲解。根据实际需求为TaskManager配置内存将有助于减少Flink的资源占用,增强作业运行的稳定性。TaskManager内存模型如下。如上图所示,下表中列出了FlinkTaskManager内存模型的所有组成部分,以及影响其大小的相关配置参数。我们可以看到,有些内存
暴走的贼宇
·
2024-01-19 08:25
flink
大数据
JVM实战(19)——JVM
调优
工具概述
作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬学习必须往深处挖,挖的越深,基础越扎实!阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析阶段5、深入jvm源码解析一、简介前面章节,我们已经介绍了如何通过GC日志去分析系统的运行情况。本
smart哥
·
2024-01-19 08:51
jvm专题
jvm
Flink1.17 基础知识
Flink1.17基础知识来源:B站尚硅谷目录Flink1.17基础知识Flink概述Flink是什么Flink特点Flinkvs
Spark
StreamingFlink的应用场景Flink分层APIFlink
魅美
·
2024-01-19 08:16
大数据基础
大数据
flink
智算让大模型触手可及
要做好AI原生应用,有三个关键的因素:基础大模型好不好,根据业务数据及反馈对模型的
调优
好不好,以及大模型开发、应用方式好不好。百度及市场上的友商已经提供
百度Geek说
·
2024-01-19 07:27
dubbo
prompt
大模型
人工智能
深度学习和机器学习中针对非时间序列的回归任务,有哪些改进角度?
引言1数据预处理2数据集增强3特征选择4模型选择5模型正则化与泛化6优化器7学习率8超参数
调优
9性能评估与模型解释引言在非时间序列的回归任务中,深度学习和机器学习都是常用的方法。
Better Bench
·
2024-01-19 07:23
机器学习
深度学习
机器学习
深度学习
回归
非时间序列回归
回归任务
改进角度
baseline改进
送别歌
记得在上学期间,学弹吉它时,有一首弹唱曲«送别歌»,曲中唱道:“长亭外,古道边,芳草碧连天……”由于是慢节奏抒情,曲
调优
美,历经几十年传唱经久不衰,而成为经典。
望风侠
·
2024-01-19 07:20
spark
dateformat源码排错
背景有一个任务yyyy写成了YYYY,导致年份不对触发告警selectfrom_unixtime(unix_timestamp(),'YYYY-MM-ddHH:mm:ss')第一时间用
spark
dateformat
这个程序猿可太秀了
·
2024-01-19 06:47
spark
大数据
数据仓库
利用 Apache
Spark
和 Databricks 进行企鹅种类预测的机器学习实践入门
这里演示使用Apache
Spark
和Databricks平台进行企鹅物种预测的完整机器学习流程。
AI普惠大师
·
2024-01-19 06:17
机器学习
人工智能
spark
+phoenix读取hbase
spark
直接操作hbase也是通过hbase的原语操作,操作起来比较繁琐,下面就是将
spark
和phoenix相结合的方法步骤。我用的是scala语言,首先pom.xml中添加依赖o
潮落拾贝
·
2024-01-19 06:16
spark
hbase
大数据
py
spark
笔记:窗口函数window
窗口函数相关的概念和基本规范可以见:py
spark
笔记:over-CSDN博客1创建Py
spark
dataFramefrompy
spark
.sql.windowimportWindowimportpy
spark
.sql.functionsasFemployee_salary
UQI-LIUWJ
·
2024-01-19 06:15
python库整理
笔记
Spark
基础学习--基础介绍
1.
Spark
基本介绍1.1定义
Spark
是可以处理大规模数据的统一分布式计算引擎。
Yan_bigdata
·
2024-01-19 06:37
spark
学习
大数据
mapreduce
对比
入门案例
词频统计
Py
spark
安装(Mac M2版)
引言本文为个人本地部署py
spark
遇到的问题以及解决办法,包含个人的一些理解,仅供参考。
矮人三等
·
2024-01-19 06:35
工具
java
相关
macos
spark
python
使用Apache
Spark
处理Excel文件的简易指南
对此,我们可借助Apache
Spark
这一分布式计算框架,凭借其强大的计算与数据处理能力,快速有效地处理Excel数据。这些数据进行一个分析,整理
i查拉图斯特拉如是
·
2024-01-19 06:33
apache
spark
excel
LightGBM On
Spark
通常业务中对计算性能有要求时,通常不使用GPU跑tf,会使用xgbooston
Spark
来解决,既保证速度,准确率也能接受。LightGBM是使用基于树的学习算法的梯度增强框架。
wong小尧
·
2024-01-19 04:10
EMQX 性能
调优
:最大连接与文件描述符
在对EMQX(https://www.emqx.io)进行性能测试的过程中,当客户端连接达到一定数量以后,你可能会发现EMQX无法接入更多连接,并且在控制台或/var/log/emqx/emqx.log.N中出现以下错误日志:[error]Accepterroron0.0.0.0:1883:EMFILE(Toomanyopenfiles)这说明目前EMQX打开的文件描述符数量达到了最大限制。当然,
EMQX
·
2024-01-19 04:54
linux
MQTT
EMQX
spark
读取hive的数据
下载源码包:
spark
-2.3.3.tgz解压:tar-xzvf
spark
-2.3.3.tgz进入目录:cd
spark
-2.3.3.
IT烧麦
·
2024-01-19 04:17
MySQL数据库入门到大牛_高级_00_MySQL高级特性篇的内容简介
文章目录一、整个MySQL的思维导图二、MySQL高级特性篇大纲1.MySQL架构篇2.索引及
调优
篇3.事务篇4.日志与备份篇一、整个MySQL的思维导图下图为整个MySQL内容,01-05是基础篇,06
十月旧城
·
2024-01-19 04:16
#
MySQL
数据库
mysql
jvm初入门
Java内存模型的组成部分Java内存模型的工作原理Java类加载机制类加载的过程类加载器的类型及其区别类加载器的工作原理Java字节码什么是Java字节码字节码指令的作用和分类字节码的执行方式JVM
调优
一个好汉
·
2024-01-19 03:42
FineBI实战项目一(25):实战项目一总结
没有集群,hdfs、hive、
spark
、kafka、flink等等都没有2解决方案mysql数据同步尽量和业务系统保持一致,以便后期出现问题排查。mysql同步到数仓,数仓
不死鸟.亚历山大.狼崽子
·
2024-01-19 02:39
FineBI
finebi
kafka学习笔记-- 文件清理策略与高效读写数据
如有侵权、联系速删视频教程链接:【尚硅谷】Kafka3.x教程(从入门到
调优
,深入全面)文章目录文件清理策略delete清理策略:将过期数据删除compact清理策略:将过期数据压缩高效读写数据文件清理策略
向着百万年薪努力的小赵
·
2024-01-19 01:25
#
Kafka学习--入门到调优
kafka
学习
笔记
py
spark
结构数据处理
现在随着技术的更新,数据化实现越来越高效便捷,一整套大数据系统,至少需要从数据建模、技术选型、页面交互三方面实现。数据建模如水流,贯穿整个数据分析系统;技术选型是基础设施,支撑整个系统高效运转;页面交互是面向用户,用数据说话,对业务增长进行数据赋能,实现数据驱动。在复杂的数据分析场景中,通常需要基于用户画像与用户行为,对用户进行OLAP多维自由交叉组合分析。因此,对于百万级以上的产品业务,使用My
haleyprince
·
2024-01-19 00:20
【性能
调优
】local模式下flink处理离线任务能力分析
文章目录一.flink的内存管理1.Jobmanager的内存模型2.TaskManager的内存模型2.1.模型说明2.2.通讯、数据传输方面2.3.框架、任务堆外内存2.4.托管内存3.任务分析二.单个节点的带宽瓶颈1.带宽相关理论2.使用speedtest-cli测试带宽3.任务分析3.其他工具使用介绍本文相关讨论flink内存对任务性能的影响:通过了解内存模型,了解这些模型都负责那些工作,
roman_日积跬步-终至千里
·
2024-01-18 23:18
#
flink性能调优
#
flink
实战
flink
大数据
2019-12-29
Elasticsearch之安装、参数设置前言Elasticsearch用过一段时间了,今天汇总下基本的安装及参数,本篇文章分为三个部分:系统参数设置、ES配置文件设置其中还有跟业务相关的ES参数
调优
,
逗逼程序员
·
2024-01-18 22:56
shell
spark
-submit提交之后获取appid,并在程序中扫描状态
首先看一下提交脚本#/sbin/bash/opt/cloudera/parcels/
SPARK
2/bin/
spark
2-submit\exportJAVA_HOME=/opt/jdk1.8.0_31TASK_TYPE
南修子
·
2024-01-18 22:16
ELK 分离式日志
Kiabana:Logstash:可以添加的其它组件:ELK的工作原理:二.部署ELK节点都设置Java环境:每台都可以部署Elasticsearch软件:修改elasticsearch主配置文件:性能
调优
参数
伍dLu
·
2024-01-18 21:18
elk
大数据之
Spark
知识体系完整解读
Spark
简介
Spark
是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey
金乐笑
·
2024-01-18 20:15
Python高阶编程面试题
目录前言一、Python的内存管理机制及
调优
手段?二、什么是lambda函数,有什么好处?三、你对装饰器的理解?
测试小婉
·
2024-01-18 18:19
软件测试
面试
职场和发展
自动化
python
单元测试
spark
streaming实时写入hive
pom文件
spark
-streaming-kafka-0-10_2.112.1.0
spark
-core_2.11
spark
-sql_2.11scala-library采用的是scala2.11.8实现逻辑
会飞的蜗牛66666
·
2024-01-18 16:11
通义灵码使用指南和教程
基于通义大模型,国内Copilot平替产品,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云SDK/OpenAPI的使用场景
调优
落小小
·
2024-01-18 16:49
AI编程
copilot
阿里云
深度解析Elasticsearch索引数据量过大的优化与部署策略
1.1.4高可用性1.2.副本策略1.2.1冗余和可用性1.2.2查询性能1.2.3存储需求2.硬件和资源配置优化2.1选择高性能硬件2.1.1存储2.1.2内存2.1.3处理器2.1.4网络2.2.JVM
调优
喔的 喔的嘛呀
·
2024-01-18 15:40
elasticsearch
大数据
搜索引擎
vsftpd并发参数
调优
vsftpd并发参数
调优
文章目录vsftpd并发参数
调优
一、前言二、压力测试1.压力测试工具2.java代码压测三、结论1.max_per_ip默认值是502.vsftpd并发数可达理论值(TPS低)一
搬山境KL攻城狮
·
2024-01-18 14:52
性能优化
常用
ftp
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他