v-code

分布式存储研发 --- 2年经验面试总结

文章目录

深信服(ceph存储研发)
旷世科技(ceph存储研发)
百度基础架构部（分布式存储研发工程师）
快手（基础架构：分布式存储研发工程师）
金山云（分布式文件系统研发）
阿里云(polardb 分布式存储研发)

本人从2.16号疫情期间开始投递简历到3.30结束找工作，基本面试了所有的大厂（互联网公司/科技公司）。面试的过程很艰辛，发现了很多不足，但是也收获到了满意的offer，特此做一轮总结，方便后续的伙伴参考借鉴。

面试的公司包括深信服、旷世科技、滴滴、百度 (基础架构部)、阿里(polardb 分布式存储研发)、金山云、快手、BIGO、头条、华为（公有云）

岗位：分布式存储研发工程师，我个人毕业后两年内从事的是ceph存储系统的运维和开发（其实水平远远达不到开发的程度，毕竟只有不到两年，都没有向社区commit过代码）

深信服(ceph存储研发)

深信服一面(深信服有较强的ceph研发背景，如果各位没有深入到底层代码，建议不要轻易尝试，否则会被怼)

自我介绍
项目介绍 --30分钟
bluestore状态机的实现
bluestore如何保证数据一致性；bluestore的有那些回调，分别是用来做什么的
bluestore wal事务都具体包括哪一些内容（详细信息）
当数据落盘但是元数据还未落盘，存储下电是否会对数据一致性有影响（考察bluestore的写流程：数据和元数据的写）
当数据未落盘，客户端触发针对改对象的读请求，是否能正常读出
pg状态机用来做什么，为什么要有状态机
pg状态机中post_event()，discard_event分别是用来做什么的
bluefs 元数据文件的保存方式，存储在哪里，加载方式
db分区中的.log和.sst文件分别保存了什么
cache-tier有哪一些模式，各自功能是什么，有遇到什么问题吗(他们提交的一个cache tier的bug-fix，好像在write-back模式下有数据一致性问题)
在EC 模式下，数据怎么分片；EC 和副本模式区别是什么
操作系统IO栈简单讲一下，每一层都是做什么的
sync和direct有什么区别
如果对同一个设备文件分别使用direct和sync方式打开会有什么影响
线程间同步方式
多线程条件变量中pthread_cond_wait参数为什么要传入一个mutex互斥变量

一面的话整体还是能感觉到深信服ceph做的还是比较深入，毕竟有不少参与社区贡献的人员。

深信服二面(leader面)

自我介绍
项目介绍 – 20分钟
bluestore 状态机有哪一些线程，每个线程都在做什么（感觉他们非常看重ceph底层核心实现）
社区源码贡献了多少行
自己修改源码多少行，做了哪些改动，核心功能是什么

整体感觉他们还是更看重CEPH的核心研发经验，对底层编码以及操作系统基础并未关注太多

旷世科技(ceph存储研发)

旷世一面

自我介绍+项目介绍 30分钟
bluestore写机制(simple + deferr 分别描述一下)
bluestore怎么保证数据一致性
pglog的作用
peering的过程，每一个状态都在做什么
ceph整体可靠性的体现
操作系统IO栈优化思路(我简历写了熟悉IO栈的优化)
通用块层做什么，有哪一些调度算法，每个调度算法讲讲，分别用在哪一些场景

旷世二面

自我介绍+项目介绍 10分钟
写算法：给定一个数，求其2进制中1的个数（位运算）
写算法：求一个无序数列中第K大的数，时间复杂度要求O(n)。开始想了最小堆O(nlogk)，后来提示快排可以，写出来了
ceph 的可靠性怎么体现（正常写时的可靠性，出现节点冗余时的可靠性）
ceph 负载均衡怎么实现(crush算法)

旷世三面

自我介绍+项目问题 30分钟
Linux IO栈架构讲讲
ext4文件系统介绍一下，inode,dentry的管理方式
虚拟进程内存分布
物理内存和虚拟内存怎么进行映射(内存管理中的页表实现)
写算法：给定一个无序字符串“aa.b…c/.d” ，将其组合成linux可以访问的目录输出（只要输出一个即可）

旷世四面(leader面)

项目题问 20分钟
linux内存管理机制(进程虚拟内存–》页表–》物理内存，高速缓冲区(buffer,page cache)，内存分配机制，回收机制)
熟悉内存优化是吧，讲讲内存问题怎么排查，常用的工具，有哪些优化思路
怎么获取这一些知识的，有线上实践过吗，举个例子
。。。一堆技术无关的

旷世有四轮技术面试，这还是让我很惊讶，总体感觉旷世的CEPH积累显然没有深信服足，毕竟他们的存储只是给他们深度学习平台做数据处理和加工的，并没有相关的存储产品。

百度基础架构部（分布式存储研发工程师）

百度一面

项目介绍+ 提问30分钟
CEPH的负载均衡实现(crush算法的实现)
有什么方式能追踪一个IO从客户端到磁盘过程
ceph怎么保证高可靠性（主要问集群有节点异常时数据的恢复方式，是否能对外提供正常的读写请求）
EC 和副本的区别
Linux内存管理机制
段式内存管理和页式内存管理区别
进程内存分布
cache是怎么实现的，用什么数据结构(read系统调用的实现过程)
buffer cache和page cache的区别
讲讲你的内存优化思路
C++ static关键字的作用
C++类实例化的过程，构造函数压栈都有哪一些参数
多态怎么实现的
智能指针有哪些，分别用在什么场景，shared_ptr循环引用问题怎么解决
写算法：Z字型打印二叉树(二叉树的层序遍历做一些修改)
有什么想问的吗，简单介绍了一下百度基础架构部的自研文件系统架构，规模，发展方向

百度二面

项目介绍 + 提问 30分钟
bluestore写方式，元数据包括哪一些
bluestore cache怎么实现的，管理哪一些内容
CEPH怎么保证数据一致性
CephFs的实现（mds的inode,dentry管理方式，mds的负载均衡实现）
cephfs怎么保证数据一致性（IO正在落盘，但是mds所在节点异常时）
Linux IO栈优化思路讲讲
写算法：合并k个有序链表
写代码：根据实际场景出的一个类的设计代码（主要是考察map）

百度三面(leader)

项目+提问 20分钟
Linux IO瓶颈分析使用哪一些工具，怎么分析
通用块层的作用？哪一些调度算法，分别做什么？怎么做IO合并
项目中遇到哪一些问题，怎么解决的，难点是什么？
职业规划。。。期望薪资，什么时候能入职

百度的面试体验很不错，面试的过程比较专业，而且效率也很高

只是技术面之后的HR面流程太长，效率太低了。

快手（基础架构：分布式存储研发工程师）

快手面了两个岗位，第一个是高级研发（后面因为能力不匹配被拒了，自己失误，显然能力不匹配呀），第二个是比较契合的研发工程师岗位

高级研发岗位(ceph方向)

一面

项目+提问 20分钟
ceph-fuse 和 fuse的区别
数据从cephfs 到落盘的过程,ceph-fuse怎么处理
cephfs 元数据管理机制
mds的active+active模式和 active+stand by模式的区别，当有主mds所在节点异常时怎么保证cephfs的正常服务，数据可靠性怎么保证
read系统调用的实现
简单讲讲 linux内存管理机制
malloc和free的区别
大页表的实现，用在什么场景
OOM机制讲讲
ext4文件系统懂吗？讲讲（只能说一下inode和dentry的管理方式）
inode,dentry,superblock 各自有什么用，有什么联系？怎么查看以上三者？
写算法：非递归后序遍历二叉树

二面

项目+提问 20分钟
觉得ceph有什么问题？
cephfs使用的时候有什么问题？ceph-fuse实现
cephfs处理大量小文件写的时候是否有性能问题？卡在了哪里？是否尝试过优化？
peering过程说一下，主要哪几个状态，每个状态做什么事情
数据库的ACID 属性讲讲
B+树了解吗，基本原理是什么
linux 文件系统IO流程
写算法：给定一个数组，求其中三数之积最大的值 (leetcode原题)。要求：时间复杂度优于O(n^3)

二面之后就因为个人面试中并没有太突出的表现，约了三面，后面因为面试官较忙，同时综合评估能力未达到高级的程度就拒了，接下来内推了快手的中级别研发岗位：分布式存储研发工程师

分布式存储研发岗位

一面、二面、三面基本和之前的技术方向接近差异的问题如下：

写算法：给定一个无序的数组，有正有负，求最大的子序和，以及该子序的起始下标。–简单动态规划，可以看leetcode的动态子序和
写算法：层序遍历二叉树
C++ const 关键字的用法，修饰类的成员函数有什么作用
内联函数和define宏定义的函数有什么区别
new的过程，new的返回值，malloc的内核态过程，malloc的返回值（成功返回什么，失败返回什么），new和malloc的区别
设计模式了解吗？单例模式和懒汉模式的区别，工厂模式用在什么场景（建议23种设计模式都过一遍）
一台设备，1G的内存，怎么实现10G数据的排序（我能想到的就是分治了）

快手整体面试效率很高，如果你时间充足，可能就是连续的三轮技术面试。

面试官也很nice,对于一时回答不上来的会给你提示，并且会和你一起探讨解决办法，并不会表现出不屑或者不耐烦的情绪。后续的HR沟通反馈效率也非常高，有问必答那种。

PS：快手福利待遇相当不错！

金山云（分布式文件系统研发）

金山云一面

项目+提问 20分钟
cephfs实现原理
cephfs元数据管理方式，inode和dentry是怎么管理的，如果主mds所在节点异常了cephfs怎么保证高可靠性
ceph mds负载均衡怎么实现
TCP连接可靠性的体现(3次握手、4次挥手)，怎么实现数据包的保序，流量控制和拥塞控制的区别
DHCP 服务的作用
arp协议的作用，网络通信中什么时候会用到arp协议
怎么检测网络是否达到瓶颈（netperf、ifstat）
常用的路由算法有哪些，各自怎么实现最短路由的
linux内存管理讲讲，怎么确定内存瓶颈？怎么进行优化？swap的作用是什么，什么时候会用到swap，优劣是什么
数据库了解吗？（分布式存储基本没接触过数据库，表示只知道ACID属性）
ACID中隔离性是怎么实现的(这里脏读、幻读之类的描述了一下，从熟知的ceph bluestore层描述了一下隔离性的实现)
写算法：给定一个链表，两辆反转，输出反转后的结果
思考题：如何证明连续的三个数之积能够被6整除（数学归纳法）

金山云二面（现场面–好像直接就leader面了）

项目+题问 20分钟
ceph高性能，高可靠性的体现（从集群正常、集群节点异常两个场景说明）
Linux IO栈优化思路讲一下(性能指标–》性能工具–》性能瓶颈–》IO栈每一层的基本优化方法)
IO调度算法有哪些，分别用在什么场景
数据库有了解吗？（ACID属性）
B树和B+树的区别(不了解)
后面介绍了一下部门情况，业务发展之类的

金山云的公有云市场份额在不断被阿里云，华为云，腾讯云大头挤压，竞争力不是很强。

个人感觉金山云技术还行，但是还没有快手、百度这种互联网公司的基础技术雄厚，分布存储也是比不过阿里、深信服这种专门买存储系统的，个人建议。

阿里云(polardb 分布式存储研发)

阿里云一面（凉凉，总结下来就是no zuo no die，在真正的大佬面前还是规规矩矩的好）

项目介绍 + 提问 20分钟（讲项目的过程中会打断，题问感兴趣的点）
快照的原理是什么，快照过程中都有哪一些数据做备份，元数据在快照过程中起什么作用（自己当时根本不了解快照的，），悲剧就此展开
EC原理是什么，EC和副本的区别，EC可靠性和副本可靠性的差异（都得实现6个9及以上的可靠性），为什么你们会选择副本模式做cache tier
你们代码架构的都是怎么设计的，怎么实现功能的添加修改而不影响其他功能（代码设计模式）
CEPH可靠性的实现（bluestore层），正常接收IO时节点异常，ceph怎么保证可靠性
你负责的最有挑战性的任务时什么，遇到过哪一些困难，怎么解决的，完成计划是如何安排的
这个时候其实已经感觉凉凉了（阿里一面主要是部门内部的研发人员面试，这次面试因为作了一下，完全将自己的劣势体现出来，而面试官感知能力极强，立即发现自己讲的有一些不太清楚，接下来就穷追问底，真是极大的失误）。

总体总结下来自己还有很多方面不足：

分布式存储系统底层实现细节还差很多（快照、数据一致性在存储引擎bluestore的实现）—如果有机会接触自研存储系统，需长时间的积累沉淀，挖掘系统内部核心技术（流控，负载均衡，数据可靠性。。。）的实现
编码：设计模式欠缺较多（23种设计模式得一点一点梳理，熟悉，应用），算法能力需持续提高（需后期的工作中刻意练习）
操作系统各个子模块实现
网络协议应用—实现

路漫漫兮其修远，分布式存储技术仅仅是分布式技术中的一个分支，仍需加油努力，用鲁棒的基础搭配庞大且结构化的知识，持续精进总结，一定能够登顶分布式高峰。

【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
2024年最全Flutter如何和Native通信-Android视角，Electron开发Android界面 2401_84544531 程序员 android 面试学习
总结【Android详细知识点思维脑图（技能树）】其实Android开发的知识点就那么多，面试问来问去还是那么点东西。所以面试没有其他的诀窍，只看你对这些知识点准备的充分程度。so，出去面试时先看看自己复习到了哪个阶段就好。虽然Android没有前几年火热了，已经过去了会四大组件就能找到高薪职位的时代了。这只能说明Android中级以下的岗位饱和了，现在高级工程师还是比较缺少的，很多高级职位给的薪
ceph KVM使用rbd做存储 SkTj
博客：https://blog.csdn.net/bobpen/article/details/40112939博客：http://www.aboutyun.com/thread-13195-1-1.html导言很多cepher都会使用RBD块存储功能，下面介绍qemu-kvm访问RBD的方法。操作目前Ubuntu14.04.x和CentOS7.1(如使用CentOS7建议升级到7.1，CentO
Web3入门指南：从基础概念到实际应用 dingzd95 去中心化 web3 区块链人工智能智能合约
Web3，即“去中心化的第三代互联网”，正在逐步改变我们对互联网的传统认知。从最初的静态网页（Web1.0）到互动平台和社交媒体为主的互联网（Web2.0），Web3的目标是让用户重新掌握对数据和数字资产的控制权。什么是Web3？Web3被视为互联网的下一代发展阶段，其核心是去中心化。与以往依赖中心化服务器和大公司控制的数据模式不同，Web3通过区块链技术实现了数据的分布式存储和处理。这一去中心化
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
前端技能树，面试复习第 29 天—— 简述 Babel 的原理 | Webpack 构建流程 | Webpack 热更新原理 | Git 常用命令编程轨迹_ 前端面试复习笔记前端面试面经前端工程化 Webpack Babel 前端面试大厂面试题
31b3479814f74acbb70b9f63f2e80012.gif"width=“100%”>⭐️本文首发自前端修罗场(点击加入社区，参与学习打卡，获取奖励)，是一个由资深开发者独立运行的专业技术社区，我专注Web技术、答疑解惑、面试辅导以及职业发展。。1.Babel的原理是什么?babel的转译过程也分为三个阶段，这三步具体是：解析、转换、生成解析Parse:将代码解析⽣成抽象语法树（AS
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十一）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
KVM+GFS分布式存储系统构建 KVM 高可用 wkysdhr 分布式
一、案例分析本案例主要使用KVM及GlusterFS技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，GlusterFS会自动同步同一组卷
2024年Android开发60条技术经验总结，2024年最新面试安卓系统架构 2301_82243733 程序员 android 面试学习
总结【Android详细知识点思维脑图（技能树）】我个人是做Android开发，已经有十来年了，目前在某创业公司任职CTO兼系统架构师。虽然Android没有前几年火热了，已经过去了会四大组件就能找到高薪职位的时代了。这只能说明Android中级以下的岗位饱和了，现在高级工程师还是比较缺少的，很多高级职位给的薪资真的特别高（钱多也不一定能找到合适的），所以努力让自己成为高级工程师才是最重要的。这里
【mysql】mysql之优化向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
前端技能树，面试复习第 54 天—— 手写代码：情景题编程轨迹_ 前端面试复习笔记前端面试题手写题真题场景题
⭐️本文首发自前端修罗场(点击加入社区，参与学习打卡，获取奖励)，是一个由资深开发者独立运行的专业技术社区，我专注Web技术、区块链、Web3、答疑解惑、面试辅导以及职业发展。本文已收录至前端面试题库专栏：《前端面试复习笔记》（点击订阅）。1.循环打印红黄绿下面来看一道比较典型的问题，通过这个问题来对比几种异步编程方法：红灯3s亮一次，绿灯1s亮一次，黄灯2s亮一次；如何让三个灯不断交替重复亮灯？
python 物理引擎摩擦力_Python物理引擎简单的艾伦 python 物理引擎摩擦力
Python的强大源自众多领域大牛的支持，例如物理引擎方面，就有N多模块支持PyODEPyODEisasetofopen-sourcePythonbindingsforTheOpenDynamicsEngine,anopen-sourcephysicsengine.PyMunkpymunkisaeasy-to-usepythonic2dphysicslibrarythatcanbeusedwhen
ELK架构介绍星河漫漫l elk elasticsearch 运维服务器
一、ELK简介ELK是由三个开源软件组成的，分别是：Elasticsearch、Logstash和Kibana，这三个软件各自在日志管理和数据分析领域发挥着重要作用。Elasticsearch提供分布式存储和搜索能力；Logstash负责数据收集和处理，而Kibana则提供数据可视化和分析界面。他们共同构成了一个完整的日志管理解决方案，帮助企业高效利用日志数据进行监控、分析和安全审计。1.Elas
Hbase、hive以及ClickHouse的介绍和区别？ damokelisijian866 hbase hive clickhouse
一、Hbase介绍：HBase是一个分布式的、面向列的开源数据库，由ApacheSoftwareFoundation开发，是Hadoop生态系统中的一个重要组件。HBase的设计灵感来源于Google的Bigtable论文，它通过提供类似于Bigtable的能力，在Hadoop之上构建了一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase主要用于存储大量结构化数据，并支持随机读写访问，
k8s 存储(PV、PVC、SC、本地存储、NFS) 大江东去了吗 kubernetes java linux
存储持久化相关三个概念:PersistentVolume(PV)是对具体存储资源的描述，比如NFS、Ceph、GlusterFS等，通过PV可以访问到具体的存储资源;PersistentVolumeClaim(PVC)Pod想要使用具体的存储资源需要对接到PVC，PVC里会定义好Pod希望使用存储的属性，通过PVC再去申请合适的存储资源(PV)，匹配到合适的资源后PVC和PV会进行绑定，它们两者是
java 实现前后端分离_详解前后端分离之Java后端 bfecoder java 实现前后端分离
前后端分离的思想由来已久，不妨尝试一下，从上手开始，先把代码写出来再究细节。前言以前服务端为什么能识别用户呢？对，是session，每个session都存在服务端，浏览器每次请求都带着sessionId(就是一个字符串)，于是服务器根据这个sessionId就知道是哪个用户了。那么问题来了，用户很多时，服务器压力很大，如果采用分布式存储session，又可能会出现不同步问题，那么前后端分离就很好的
seurat提取表达矩阵_10X scRNA免疫治疗学习笔记-3-走Seurat标准流程幸福的小酒瓶 seurat提取表达矩阵
刘小泽写于19.10.15笔记目的：根据生信技能树的单细胞转录组课程探索10XGenomics技术相关的分析课程链接在：http://jm.grazy.cn/index/mulitcourse/detail.html?cid=55第二单元第7讲：走Seurat标准流程【文章结构总-分-总，结尾有完整的代码，熟悉者前面可以跳过，去看后面8min完成的代码】前言前面介绍了自己利用cellrangerc
cephadm搭建ceph文件集群存储 L__liurs 服务器
一、基础配置1、配置主机名[root@ecs-cd34~]hostnamectlset-hostnamenode1[root@ecs-cd34~]execbash#主机名生效2、配置hosts解析（根据自己的服务器id修改）cat>>/etc/hosts/etc/docker/daemon.json<
先进制造业数字化转型：典型场景存储需求及实践解析 XSKY星辰天合云计算
在上一篇《先进制造业数字化转型，为什么基于传统存储无法完成？》中，我们分析了先进制造企业在数字化转型过程中所面临的存储架构挑战，企业需要更高性价比的存储系统，更需要实现全局数据的秒级查询，这些是传统存储无法满足的。本文将从先进制造企业数字化转型中典型场景的存储需求出发，结合XSKY分布式存储的实际案例，看分布式存储如何帮助企业进行存储转型，满足相关的数据使用需求。01 本地硬盘存储方案的
存储集群消除pg数量过多的告警大大金 ceph
[root@xxxxxxxxxxxxxx~]#ceph-scluster334cfe7e-9ccc-483d-8d2c-218fde3a5fdehealthHEALTH_WARNtoomanyPGsperOSD(307>max300)nodeep-scrubflag(s)setmonmape1:3monsat{node1=100.88.28.11:6789/0,node2=100.88.28.12
linux搭建ceph集群浓黑的daidai linux ceph 服务器
linux三节点搭建ceph集群主机IP主机名称172.26.50.75node1172.26.50.112node2172.26.50.228node3ceph-mon，ceph-mgr，ceph-mds都搭建在node1上，node2和node3上搭建ceph-osd，每个机器1个osdCeph是一个分布式的存储系统，可以在统一的系统中提供唯一的对象、块和文件存储，Ceph的大致组件如下：1.
3. ceph-mimic版本部署 Martin_wjc 7 存储 ceph chrome 前端
ceph-mimic版本部署一、ceph-mimic版本部署1、环境规划2、系统基础环境准备2.1关闭防火墙、SELinux2.2确保所有主机时间同步2.3所有主机ssh免密2.4添加所有主机解析3、配置ceph软件仓库4、安装ceph-deploy工具5、ceph集群初始化6、所有ceph集群节点安装相关软件7、客户端安装ceph-common软件8、在ceph集群中创建cephmonitor组
upmap的存储池osd坏盘处理问题奋斗的松鼠 ceph
写在前面喜欢ceph的话欢迎关注奋斗的cepher微信公众号阅读更多好文！在《坏盘处理时osd为什么不要rm》文章中，松鼠哥对比了多组各种osd处理与数据的情况，有一个细节，那就是如果osd在重建前后要保持pg映射的一致性，那么存储池做均衡使用的是crush-compat模式，同时有读者老铁留言，说当存储池使用了upmap模式做存储池均衡的话，osd重建前后将不能保持相同的pg映射。因为松鼠哥对存
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十四）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（十九）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十三）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
【初出江湖】分布式之什么是分布式存储？无休居士微服务与分布式分布式分布式存储分布式存储的应用场景集中式存储分布式数据库分布式文件系统
目录标题分布式存储分布式存储系统特点分布式存储原理分布式存储的应用场景分布式存储和集中式存储的区别分布式存储分布式存储是一种将数据分散存储在多个节点上的存储方式。与传统的集中式存储相比，分布式存储将数据分布在多个节点上，每个节点都可以独立地存储和访问数据。这种分布式的存储方式可以提供更高的可靠性、可扩展性和性能。在分布式存储系统中，数据通常被分割成多个块或对象，并分布在多个存储节点上。每个节点都可
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

分布式存储研发 --- 2年经验 面试总结