E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
influxdb问题排查
Sidecar-详解 JuiceFS CSI Driver 新模式
这个全新的功能将帮助用户在ServerlessKubernetes环境中使用JuiceFS;与传统的MountPod模式相比,
问题排查
更方便、客户端管理更简单。
Juicedata
·
2023-04-04 13:29
docker
kubernetes
容器
JuiceFS CSI Driver 常见
问题排查
指南
Kubernetes作为资源调度和应用编排的开源系统,正在成为云计算和现代IT基础架构的通用平台。JuiceFSCSIDriver实现了容器编排系统的存储接口,使得用户可以在Kubernetes中以原生的方式使用JuiceFS。由于Kubernetes自身的复杂性,用户反馈在部署和使用JuiceFSCSIDriver时,会遇到不少疑难问题。本文将为大家介绍JuiceFSCSIDriver架构、常见
Juicedata
·
2023-04-04 13:28
kubernetes
容器
云原生
日志收集系统架构
背景应用服务器多,日志文件被分散在各个应用服务器上,需要依次登录每台设备才能查看日志,效率低下,且不利于服务器安全管控,加大生产服务器的风险;日志文件不统一,各项目日志没有统一的规范,不利于管理和
问题排查
火蓝2008
·
2023-04-04 08:27
LINUX
系统架构
服务器
数据库
高级-常见
问题排查
)学习笔记
上一篇:(14.高级-MaterializeMySQL引擎)学习笔记文章目录1分布式DDL某数据节点的副本不执行2数据副本表和数据不一致3副本节点全量恢复4数据副本启动缺少zk表5ZKtablereplicas数据未删除,导致重建表报错6Clickhouse节点意外关闭7其他问题参考1分布式DDL某数据节点的副本不执行问题:使用分布式ddl执行命令createtableonclusterxxxx某
yuan_404
·
2023-04-04 05:29
ClickHouse
学习
clickhouse
记一次线上FGC
问题排查
引言本文记录一次线上GC问题的排查过程与思路,希望对各位读者有所帮助。过程中也走了一些弯路,现在有时间沉淀下来思考并总结出来分享给大家,希望对大家今后排查线上GC问题有帮助。背景服务新功能发版一周后下午,突然收到CMSGC告警,导致单台节点被拉出,随后集群内每个节点先后都发生了一次CMSGC,拉出后的节点垃圾回收后接入流量恢复正常(事后排查发现被重启了)。告警信息如下(已脱敏):多个节点几乎同时发
是咕咕鸡
·
2023-04-04 05:59
jvm
java
性能优化
记一次线上FullGC
问题排查
问题起因2022-03-13在钉钉工作通知中收到申请其中一台机器的预警。预警信息显示FullGC的次数持续超过指定的阈值。我们知道FullGC非常耗时。当一个GC线程执行FullGC时,会严重影响其他线程的正常工作,造成系统卡顿的现象。通常情况下,它被认为可以停止这个世界。所以这台机器果断重启,但是没过多久,其他机器就开始陆续报出FullGC警告。实在没办法,于是重启了整个应用,重启后应用运行恢复
大厂那些事
·
2023-04-04 05:55
jvm
java
c mysql 查询慢_记录一次线上Mysql慢查询
问题排查
过程
问题排查
排查Mysql数据库我看到sql后第一反应就是是不是数据库出问题了,每个小时都有业务,偏偏白天业务高峰时间段正常,凌晨业务量很少时候出问题,让运维先检查了数
叶磊Nic
·
2023-04-04 05:54
c
mysql
查询慢
java项目上线mysql查询慢_原创 记录一次线上Mysql慢查询
问题排查
过程
问题排查
排查Mysql数据库我看到sql后第一反应就是是不是数据库出问题了,每个小时都有业务,偏偏白天业务高峰时间段正常,凌晨业务量很少时候出问题,让运维先检查了数
摸摸谢
·
2023-04-04 05:23
记一次线上sql
问题排查
首先我查询线上日志,很轻松就定位出有问题的sql然后我连上生产数据库查看了表的数据量好家伙,一亿多条记录,而我们的sql是这样的selectzion_core_task.uk_task_idfromzion_core_taskWHEREzion_core_task.scene_id=36732ORDERBYzion_core_task.gmt_createDESCLIMIT1我直接在数据库工具上执
dray_
·
2023-04-04 05:51
mysql
sql
数据库
mysql
记一次线上Dubbo线程池爆满问题的排查过程
随手翻有道云笔记,发现2020年12月份的一篇
问题排查
日记,感觉有点意义,发出来分享给大家一、客户端现象1)不定期无规律出现dubbo接口调用超时错误Failedtoinvokethemethodxxxintheservicexxxlasterroris
老吕架构
·
2023-04-04 05:49
其它
java
数据库
分布式
大数据
spring
记一次线上OOM
问题排查
过程!
公众号后台回复“学习”,获取作者独家秘制精品资料扫描下方海报二维码,试听课程:上周运维反馈线上程序出现了OOM,程序日志中的输出为Exceptionin thread"http-nio-8080-exec-1027" java.lang.OutOfMemoryError:JavaheapspaceExceptionin thread"http-nio-8080-exec-1031" java.la
石杉的架构笔记
·
2023-04-04 05:14
记录一次线上频繁Full GC
问题排查
问题排查
1.先别着急重启服务,先导出此时栈信息以及堆信息先输入`jps`找出当前进程的pid导出栈信息到statck.txt
@潘小小
·
2023-04-04 05:06
java
java
jvm
eclipse
记一次线上接口慢查询
问题排查
目录问题描述解决方案1消息中间件2代码及数据库优化3ConcurrentLinkedQueue方案定时任务异步处理业务流程其他参考文献问题描述有一个分类预测的接口,主要业务逻辑是输入一段文本,接口内部调用模型对文本进行分类预测。模型数据是直接在内存中,所以预测的过程本身很快。预测完成之后,往预测记录表插入一条数据。后续有其他应用会对该记录进行矫正,判断是否预测成功,以便后续进行自学习。接口上线初期
凉茶冰
·
2023-04-04 05:36
后端
java
记一次线上内存溢出
问题排查
最近线上的服务出现了一次内存溢出的报错,但是服务进程在GC后自动恢复了,记录下本次问题的排查过程。1.服务日志监控,在某个时间点,日志中有java.lang.OutOfMemoryError:Javaheapspace的报错,并且服务线程数有飙升的情况,在经历GC后,服务恢复。2.由于线上以前出现过JVM内存溢出的问题,在JVM启动参数中加了内存溢出时,dump出当前堆内存快照的指令-XX:+He
coferla
·
2023-04-04 05:33
JVM
TiDB K8S 删除备份阻塞
问题排查
作者:jiyf原文来源:https://tidb.net/blog/84463016【是否原创】是【首发渠道】TiDB社区问题背景之前阅读学习tidboperator备份恢复相关的代码时候,做了上面部分笔记,有下面一段总结:在备份设置了需要删除情况下,如果删除backupcrd,那么会创建cleanjob清理数据,然后删除crd的操作会阻塞;如果cleanjob失败,那么会一直阻塞的然后这个问题今
TiDB 社区干货传送门
·
2023-04-04 05:57
kubernetes
tidb
容器
云原生
TiDB K8S 定时备份状态异常
问题排查
作者:jiyf原文来源:https://tidb.net/blog/75e8c99e【是否原创】是【首发渠道】TiDB社区问题场景在进行tidboperator定时备份测试环境中,配置了使用br定时备份到s3的测试。定时备份backupschedulecrd关键参数是这样的:maxReservedTime:1hschedule:'*/10****'代表每10分钟进行一次定时备份,备份数据保留时长为
TiDB 社区干货传送门
·
2023-04-04 05:27
kubernetes
tidb
云原生
docker
容器
记一次线上查询
问题排查
在实际应用中,查询慢是一个常见的问题,需要通过逐步排查来找到根本原因。在这篇文章中,我们将介绍如何解决查询慢的问题,并分享我们的实际案例。事件的背景:因某些原因我们需将服务从阿里云的华南区迁移至华东区,为避免问题,选择的服务器及MySQL配置均与原集群相同。发现问题:迁移后验证时发现某个页面查询耗时过长,达到了7s+,对比原集群耗时为700ms。排查问题:由于程序并没有变更,所以排查方向定位为服务
strawbingo
·
2023-04-04 05:50
java
vue 组件多开,数据被覆盖
问题排查
及解决方案
vue-route详情页面多开时,前面的页面数据被新开的页面数据覆盖了。详情页面的路由,使用动态路由匹配。{path:"/drugReturnManage/detail/:prescriptionId",name:"DrugReturnManageDetail",component:()=>import("@/views/drug_return_manage/Detail.vue"),meta:{
Y、seventeen
·
2023-04-04 01:35
vue
前端
javascript
开发语言
Flutter 集成百度地图后闪退
问题排查
记录
问题描述APP集成百度地图后,开发者模式直接连接真机可以打开地图,打包成apk后安装,应用直接闪退2、手机环境验证了3个环境a、Android6.0b、Android9.0c、Android8.13、
问题排查
过程真机
走码人
·
2023-04-04 01:01
Java开发必须掌握的线上
问题排查
命令
前言作为一个合格的开发人员,不仅要能写得一手还代码,还有一项很重要的技能就是排查问题。这里提到的排查问题不仅仅是在coding的过程中debug等,还包括的就是线上问题的排查。由于在生产环境中,一般没办法debug(其实有些问题,debug也白扯。。。),所以我们需要借助一些常用命令来查看运行时的具体情况,这些运行时信息包括但不限于运行日志、异常堆栈、堆使用情况、GC情况、JVM参数情况、线程情况
java架构进阶
·
2023-04-04 00:15
记一次K8S网络
问题排查
过程,kube-proxy的ipvs模式转发失败,修改iptables模式
问题分析:calico-node服务需要连接Master节点的kube-apiserver服务,由于网络不通导致连接失败,服务也就启动失败,问题转化成K8S网络
问题排查
。解决方案:查看日
安逸的程序猿
·
2023-04-03 23:17
云原生记录系列
kubernetes
云原生
华为奔腾ARM服务器离线安装pyarrow
前提:使用
influxdb
导出监控数据太大,就寻思压缩一下,用feather存储。结果安装feather-format库时,提示需要安装pyarrow。
SherryGo
·
2023-04-03 22:32
python
linux
运维
服务器
kubectl get node慢
问题排查
问题描述在k8s集群第一个master节点(node1)上执行kubectlgetnode大概需要8s的时间才有数据返回,而另外的master上执行同样的命令却是很快返回。通过kube-apiserver的日志来看,是无法连接上cert-manager、metrics-server等服务,从而导致超时。pod网络无法ping通网关排查结果本集群环境中使用的cni是kube-ovn,pod网络的网卡
魏志标
·
2023-04-03 20:36
k8s
k8s
flannel网络问题:node节点flannel网络问题导致该node上的pod与其他node节点网络不通的排查思路与解决
flannel网络问题:node节点flannel网络问题导致该node上的pod与其他node节点网络不通的排查思路与解决一、问题发现二、
问题排查
一、问题发现在部署一个replicas:4的nginxdeployment
王大雏
·
2023-04-03 18:08
故障排错
网络
kubernetes
docker
linux
docker安装错误:错误:软件包:docker-ce-rootless-extras-20.10.8-3.el7.x86_64 (docker-ce-stable)跳过(依赖问题)
docker安装错误:错误:软件包:docker-ce-rootless-extras-20.10.8-3.el7.x86_64跳过(依赖问题)
问题排查
思路1、先按提示尝试添加--skip-broken
王大雏
·
2023-04-03 18:08
故障排错
yum
centos
linux
PostgreSQL WAL 文件数量长期持续增加
问题排查
1.提出问题最近遇到一个自己运维DB的开发同学反馈:"我们的业务量较小,但现在数据库积累了大量的WAL,一个月的时间pg_wal目录和归档的目录均超过了80GB,且WAL增长的速度较快,由于虚拟机的磁盘不大,几乎把磁盘撑爆了,我应该怎么处理呢?可以先人工删一下吗?”针对这个现象,我们需要分析如下几个问题:几乎没有业务为什么WAL还会增加且增加的还很快?WAL会一直增加直至把磁盘撑爆吗?DBMS有参
黑科技王子
·
2023-04-03 14:24
postgresql
Java进程CPU占用率过高
问题排查
占用率过高的线程6355root20036247769311287544S198.024.94643:34java可以看到进程PID为:6355的进程此时的cpu占用率为:198%,内存使用率是:24.9%
问题排查
查看该进程的线程情况根据
大风过岗
·
2023-04-03 07:46
Grafana Docker 部署搭建(史上最全)
Grafana介绍grafana是一个非常好用的数据可视化平台,常常应用于显示监控数据,底层数据源可以支持
influxDb
、graphite、elasticSeach等等https://github.com
liyinchi1988
·
2023-04-03 02:50
服务端
容器
开发
docker
grafana
容器
influxdb
连续查询
项目场景:
InfluxDB
是一个由InfluxData开发的开源时序型数据。它由Go写成,着力于高性能地查询与存储时序型数据。
willjay01
·
2023-04-03 00:34
linux
时序数据库
influxdb
时序数据库知识点个人记录合集
influxdb
时序数据库知识点个人记录合集官网传送门:https://docs.influxdata.com/
influxdb
/v1.7/query_language/data_exploration
niceguyº
·
2023-04-03 00:26
SQL
influxdb时序数据库
influxdb
sql
时序数据库
1024程序员节
使用
Influxdb
自带函数查询
influxdb
提供了一些内置函数,这些函数方便grafana拉取数据。
钟哥哥实在帅
·
2023-04-03 00:49
个人
sql
数据库
database
influxdb
查询语句_
InfluxDB
源码学习:查询优化
InfluxDB
2.0使用Flux作为它的查询语言,分析一下下面这个查询语句(简称QueryA)是如何被执行的:(bucket:
InfluxDB
作为数据库同样设计了逻辑查询计划和物理查询计划的创建和优化环节
weixin_39530509
·
2023-04-03 00:19
influxdb查询语句
influxdb
基础入门
编者注:
InfluxDB
是一个开源的时序数据库,使用GO语言开发,特别适合用于处理和分析资源监控数据这种时序相关数据。
luoxn28
·
2023-04-03 00:16
InfluxDB
模糊查询
InfluxDB
模糊查询通过正则表达式的方式查询正则表达式点击教程以【模糊条件】开头的查询方式SELECT*FROM"tablename"wherecolumn=~/^模糊条件/limit1000以【模糊条件
FreyFan
·
2023-04-02 23:20
时序库
InfluxDB
时序库
查询
like
模糊
Influxdb
1.5版本 占CPU高 和 内存高问题
1、关闭上传报告给
Influxdb
reporting-disabled=false2、配置相关的#wal日志落盘周期,官方建议0-100ms#尝试了100ms,50ms,20ms之后,目前折中采用50mswal-fsync-delay
渴望蜕变
·
2023-04-02 23:05
Influxdb
Influxdb
InfluxDB
的查询优化
首先,在学习
influxDB
的查询优化之前,我们要先学习下
InfluxDB
的解释器profiler(类似于mysql的Explain语句,不一样的是,sql,hivesql是提前查看执行计划等,Influx
程序员的三板斧
·
2023-04-02 23:02
InfluxDB
数据库
python
大数据
sql
java - JVM堆外内存泄漏故障排查记录
记录一次线上JVM堆外内存泄漏问题的排查过程与思路,其中夹带一些「JVM内存分配的原理分析」以及「常用的JVM
问题排查
手段和工具分享」,希望对大家有所帮助。
渲杭爸
·
2023-04-02 21:12
java面经
面试
java - JVM CPU100%,
问题排查
前段时间我们新上了一个新的应用,因为流量一直不大,集群QPS大概只有5左右,写接口的rt在30ms左右。因为最近接入了新的业务,业务方给出的数据是日常QPS可以达到2000,大促峰值QPS可能会达到1万。所以,为了评估水位,我们进行了一次压测。压测过程中发现,当单机QPS达到200左右时,接口的rt没有明显变化,但是CPU利用率急剧升高,直到被打满。压测停止后,CPU利用率立刻降了下来。于是开始排
渲杭爸
·
2023-04-02 21:42
java面经
面试
线上
问题排查
一、了解机器连接数情况问题:1.2.3.4的sshd的监听端口是22,如何统计1.2.3.4的sshd服务各种连接状态(TIME_WAIT/CLOSE_WAIT/ESTABLISHED)的连接数。常见方法:netstat-n|grep1.2.3.4:22|awk'/^tcp/{++S[$NF]}END{for(ainS)printa,S[a]}'netstat-lnpta|grepssh|egre
西三旗靓仔
·
2023-04-02 20:48
es集群
问题排查
、常用命令、参数解析
一、常用命令#1.集群健康状态[wlsadmin@elastic-01~]$curl-XGET"http://10.219.27.00:7116/_cluster/health?pretty"{clustername":"cluster""status":"yellow",#集群状态"timedout":false,"numberofnodes":3,#集群的节点数"number_ofdatano
一夜暴富--gogogo
·
2023-04-02 17:10
Linux日志收集
elasticsearch
linux
Redis性能分析案例二:redis Timeout wait for idle object
问题排查
一、业务背景公司的业务场景主要是利用Redis来做集群节点间session共享;二、报错原因Timeoutwaitforidleobject意即Redis连接池里面没有空闲连接,没有空闲连接那说明池里面的连接泄漏或者连接始终保留active状态被占用(即Redis是阻塞状态,所有命令阻塞,保持active连接);由于代码上线很久,同时最近没有改动过,所以连接泄漏的情况是可以忽略的;那么我们直接排查
wf_feng
·
2023-04-02 17:49
性能
调优
Redis
redis
数据库
nosql
Flink cdc写入kafka数据出现null的
问题排查
与解决
Flinkcdc是目前实时同步binlog数据非常方便的工具,今天业务在消费同步的数据发现其中有很多的null数据,经过排查,总结出以下特点:null数据的出现有一定规律,几乎每个+U(upsert_after)类型的数据前就有一条null数据数据在出现null前,同步逻辑做过更改,添加了where语句过滤数据,在此前没有过null数据首先,我需要确定null数据是什么。查询官方文档可以知道在up
soaring0121
·
2023-04-02 12:59
flink-cdc
kafka
flink
大数据
flink-cdc
upsert-kafka
线上故障之-CPU飙高
线上故障之-CPU飙高序列化问题引起的应用服务CPU飙高序列化问题引起的应用服务CPU飙高FULLGC引起的应用服务CPU飙高gc问题导致调用端出现RpcException
问题排查
批处理数据过大引起的应用服务
Ybb_studyRecord
·
2023-04-02 11:32
架构
lamda
CPU
序列化
慢sql
网络丢包
问题排查
使用ethtool-S查看网口收发包的统计情况MTU:Maximumtransmissionunit——thesizeofthelargestpacketthatanetworkprotocolcantransmitMTU是IP数据包每次能传输的最大数据单元,超过此大小将会进行分包,而若设置不能进行分包,则会导致丢包。MSS就是IP数据包每次能传输的最大数据分段,这个值是MTU值减去IP数据包头大
wwwlyj123321
·
2023-04-02 10:18
服务器运维
net
Linux丢包
问题排查
思路
Linux丢包
问题排查
思路判断问题与网络丢包有关通过抓tcpdump,通过wireshark提示查看数据包状态。比如客户端重传多次失败,服务端提示丢包等错误,均是可能由于丢包导致的异常。
djp304
·
2023-04-02 09:06
linux
服务器
网络
使用kubeadm搭建k8s集群
准备工作2所有节点安装docker3所有节点安装kubeadm,kubelet和kubectl4部署K8S集群5所有节点部署网络插件flannel6将node节点加入到集群7安装kuboard界面8常见
问题排查
问题
bacawa
·
2023-04-02 07:30
kubernetes
kubernetes
docker
容器
Python之常见报错missing 2 required positional arguments的2种
问题排查
方法
报错:TypeError:wait_assert_sql()missing2requiredpositionalarguments:'assert_sql'and'value'@propertydefwait_assert_sql(self,assert_sql,value): print("assert_sql") print("value")Request.wait_assert_sql(
qq_41845402
·
2023-04-02 05:35
接口自动化实践
python
记一次死锁
问题排查
过程
一背景某天业务运维人员反馈,在前一天的某一时刻,业务在1分钟内业务交易超时率上升,1分钟后恢复正常。想让我们在数据库层面做个分析,查看是不是当时数据库出现异常导致业务缓慢。二分析过程通过ash(awr)对当时的等待事件统计情况进行查询:ASH:selectash.sample_time,awr.event,count(*)fromv$active_session_historyashwhereto
王小那个鑫
·
2023-04-02 04:28
dba
数据库
oracle
记一次线上数据库的死锁
问题排查
过程
线上数据库的死锁
问题排查
过程前言现象背景死锁日志
问题排查
加锁原理解决方法总结与思考前言前几天,线上发生了一次数据库死锁问题,这一问题前前后后排查了比较久的时间,这个过程中自己也对数据库的锁机制有了更深的理解
Fong灵
·
2023-04-02 04:51
线上问题排查
数据库
mysql
记一次死锁
问题排查
前言某一天晚上服务发生报警,但是由于发生报警的时间过晚,到第二天开始查找问题原因,经排查,竟然发现是mysql死锁导致的!!!一、原因分析2021-12-28深夜,我负责的服务发生报警,通过查看错误日志,发现是mysql死锁导致的,如图:次日上午,通过查看sql:DELETEFROMtableWHEREupdate_time
我们都爱松松吧
·
2023-04-02 04:58
Java实用型
mysql
java
数据库锁
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他