高可用架构

数据库容器化的价值——反驳数据库不适合容器化的错误观点

前几天高可用架构文章《数据库不适合Docker及容器化的7大原因》（后面简称7文）,在群里引起一些讨论，我个人是有一些不同的观点，不过争论未必能说得非常清楚透彻，后来我说写文章回应。于是有了这篇文章。

这篇文章不仅仅是反驳该文，同时也想说说应用容器化以及云化的价值。阅读本文时建议先阅读一下本人上周发的《2016年容器技术思考: Docker, Kubernetes, Mesos将走向何方?》（后面简称容文），本文中会直接引用该文的一些观点。

《7文》虽然列举了7大原因，总结一下其实主要是两点：

容器化数据库没有带来太多额外价值，数据库不需要经常构建和部署，也不需要经常升级，数据库实例的环境也不需要经常变，用 Ansible 也可以轻松部署和设置。
引入容器带来的，安全，IO，网络等方面的技术成本和风险，如非必要，勿增实体。

本文主要也从这两点开始，逐个分析。因为该文其实本质上是在分析一项通用技术的价值，所以我们先聊下如何对一项通用技术做价值评估。

如何对一项通用技术做价值评估

任何通用的技术，都承载着一定的技术使命，有其历史背景和最终目标。评价其价值是要思考它的使命和目标，不能单纯的从自己的个例出发。

比如以该文中提到的 Ansible 来说，一次我给一技术负责人推荐 Ansible 的时候，他说 Ansible 的功能我们自己用 shell 写的一套框架已经搞定了，完全没必要引入额外的工具增加复杂度。我说 Ansible 可以屏蔽操作系统的细节，容易些写出跨操作系统的通用配置脚本，他说我们的操作系统都是 ubuntu ，这个功能对我们没价值。我说 Ansible 可以把变量和配置脚本分离，提高脚本的复用程度，他说我们的脚本也一定程度上做了变量分离，我们只分离必要的，满足我们当前的项目了。我说 Ansible 文档详细，学习成本低，他说 shell 脚本看看源码就会了，并且改起来也容易。最后这个争论没有任何结果，谁都没说服谁。

后来我也一直在思考，到底问题在哪儿？其实每种技术的推广时，无论是工具，框架还是语言，都会遇到类似的争论。后来我想明白了，任何通用的技术的最重要的目标其实是增加软件的复用能力，无论是该技术本身还是由该技术衍生出来的产物，但如果不考虑复用，应用到具体的场景时效果都会打折，所以不能只用具体的场景去评估通用技术的价值。

再拿前面的 Ansible 为例，Ansible 本身是一个服务器配置管理工具，它的目标是让服务器的配置变更代码化（Configuration management Infrastructure as Code），然后让应用的安装以及配置的能力组件化，它称之为 Playbook，然后可以共享复用。所以你可以在网上搜索到各种 Ansible 的 Playbook，比如数据库集群的安装配置等。它为了实现这个目标，抽象了一套配置语法，通过声明式的配置来定义服务器上的基础设施状态，也一定程度上屏蔽了操作系统细节（实在屏蔽不了的，也可以通过简单的配置规则来适配），同时做了变量和配置的分离，避免和具体的环境的耦合。也就是说，只有能接受它的核心思想 ---- 服务器基础设施变更代码化，然后考虑到复用价值，复用别人的 Playbook 或者将自己的 Playbook 复用到更多的项目或者团队，Ansible 的价值才会体现出来。比如前面争论的那个案例，如果考虑到以后会有更复杂的操作系统环境，可能有更多的，更复杂的项目需要管理，避免运维手动操作引入不预期的变更，导致无法追踪，才值得引入 Ansible。

所以，不要仅仅从自己当前的业务需求来断定一个通用技术的价值，比如该文章的标题如果改成《我们当前的数据库不适合 Docker 以及容器化的 7 大原因》，争议就小很多。看一个文章要搞清楚它是在做具体的选型分析还是通用的价值判断。

数据库容器化的目标和价值

我们再从数据库容器化这个场景分析一下。

当前我们开发出的任何软件，到用户部署运行变成一个服务，之间是有巨大的鸿沟的。比如以数据库（MySQL/PostgreSQL）为例，厂商交付给用户的是一个安装包，而用户期望得到的是一个主从的数据库集群，能支持故障主从切换，自动迁移恢复，自动备份，还要能监控报警，当然要是有个 dashboard 来通过界面操作，实现自动升级，就更好了，更复杂的需求可能还需要支持读写分离和自动数据库切分。可以看出，二者之间是有巨大的鸿沟的，而这个鸿沟当前是靠用户的运维人员来填充的。

运维人员怎么填充呢？先从网上找到一些技术资料，怎么做 MySQL 主从复制，怎么做高可用（keepalived，虚 IP 等），怎么做双主，怎么通过代理做读写分离，然后将这些组件用脚本粘结起来，部署到服务器上。当然这还是运维实例比较强的，如果运维实力不够（大多数创业公司不可能在这种基础设施上投入研发精力的）可能连主从和备份都做不好，即便是自己用脚本写了一些简单的工具，由于测试不够充分，环境异常考虑不周，正式用的时候可能就出错了，比如前一段时间的 gitlab 删库事件。

简单回顾下 gitlab 事件，本来单节点的数据删除是不应该影响整个集群的，但因为从库数据同步不完备（所以可以推断从库应该是没有启用过，没有做读写分离），不能直接升级从库为主库，而其他的多种备份工具都没生效。

这大概是大多数公司的现状，有一些基础设施工具，但基本都是和环境耦合的脚本，也正如《7文》中所说，数据库等基础服务部署后很少需要去做变动，并且随着数据越来越多，越来越不敢动，每次变更，比如升级等，就是一个复杂的工程，差不多要发起一场战役，但一旦出现预期外的故障，就缺少必要的工具和经验去应对。那如何避免这种问题呢？左耳朵耗子的文章《从GITLAB误删除数据库想到的 [1]》提出了一个建议：『设计出一个高可用的系统，通过自动化的方式去处理问题』。

但是这个基础设施的自动化高可用系统，有那么容易设计么？一方面大多数公司受限于研发实力，没时间和精力做这种系统，另外一方面即便是有研发实力，这种系统并不能直接产生价值，如何得到高层的支持？能得到多大资源支持？数据库厂商或者其他商业公司能否提供这样一个数据库服务，再或者能否通过开源项目打造出一个数据库服务，用户可以一键部署？这样就能将各公司的运维经验沉淀成具体的工具和组件。而不是像现在，运维经验的沉淀和传播基本都只能通过技术分享或者人员流动，这对业界是一种很大的浪费。

那我们设想一下，如果要做前面描述的这样一个系统，都需要什么条件？

首先，得有一种应用的安装包的环境无关的封装，如果要适配不同的操作系统，解决不同的环境异构问题，就很难了。
其次，基础环境可编程化，可以在程序中实现网络，存储等环境的动态适配。再次，要有一个调度层，可以做动态迁移。
最后，需要一个编排文件来定义各种组件，以及一种打包格式，将多个组件封装到同一个包中做分发。

Ansible/Puppet 等配置管理工具一直想做这个事情，并想封装成可复用的组件，可惜由于基础设施的环境不统一，不可编程化，而配置管理工具只能一定程度解决部署时的复杂性，应对不了动态的故障，基本很难达到这个目标。

IaaS 云实现了基础设施的标准化，可编程化，可动态调度。所以现在 IaaS 云基本都有 RDS（Relational Database Service），功能和前面的描述的用户需求非常类似。但 IaaS 的问题是当前 IaaS 的 API 基本都是指令式的，是面向资源的，不是面向应用的，第三方很难通过这种 API 来调度应用，所以这种服务第三方很难实现，基本都是云厂商自己定制（IaaS 上也有镜像市场，但只能是单个镜像的应用，不能实现复杂的应用），同时 IaaS 的镜像都是 VM，很难实现跨云的分发。

于是，Docker 出现了。Docker 的镜像，几乎完美实现了前面提到的安装包的环境无关的封装，也就是大家说的集装箱能力，又通过镜像仓库提供了分发机制。上面封装一层编排调度系统（Swarm，Kubernetes，Mesos)，再加上标准化的网络和存储，于是基本达到了我们上面所描述的条件。

我在《容文》中也论述了

容器平台的最终目标其实是屏蔽分布式系统的资源管理细节，提供分布式应用的标准运行环境，同时定义一种分布式应用的 package，对开发者来说降低分布式系统的开发成本，对用户来说降低分布式应用的维护成本，对厂商来说降低分布式应用的分发成本，也就是 DataCenter OS 或 Distributed OS，可简称 DCOS。

也就是说，仅仅把数据库弄成容器镜像，这仅仅是第一步，是为了后面的目的服务的。有了这一步，才有可能依托容器编排调度系统封装更高级的通用服务。

有了这种能力后，运维的经验就可以沉淀成代码，积累成具体的工具和服务。软件的价值在于复用，可复用的频次越高范围越广，产生的价值越大，越值得投入。比如 RDS 这种服务，研发本身的复杂度本来不高，关键在对各种异常情况的处理方案的经验积累。一个公司遇到的异常状况肯定有限，只有放在社区中逐渐积累改进才会逐渐完备。IaaS 云的 RDS 的优势其实也是这一点，积累了云上的各种用户的各种使用场景和异常处理经验，无论是业务增长还是错误使用带来的异常。前两天 Instapaper 由于MySQL数据文件过大、达到 ext3 的 2TB 文件大小限制，而导致其数据库故障，业务中断31个小时，用的就是 AWS 上的 RDS 。虽然使用 RDS 并不能避免故障，但经过这次故障之后，AWS 肯定会改进 RDS，将这种故障的应对经验沉淀到产品中去，其他用户就可以避免再次踩坑了。

当然还会有人问，我们当前没有任何精力做更高级的封装，只是把数据库简单的用容器镜像跑起来，还有意义么？也正如我在《容文》中说的，对容器技术可以做渐进式的接纳，第一步先当做安装包使用，第二步考虑隔离，引入网络解决混合部署带来的网络冲突，第三步再考虑调度编排系统。《7文》中也承认了容器在开发测试环境中的意义，既然开发测试环境中可以接纳容器，保持环境的一致性不更好么？我在文章《基础设施服务的微服务化 [2]》中分析了为什么应该将基础服务也作为微服务的组件，一体化管理。只有将数据库等基础设施作为微服务的一个组件，和业务应用的微服务互相可以感知，才能实现最终意义上的全自动化。

当然，只是有了标准化的运行环境，并不一定能带来丰富的应用，还得依赖商业模式。这种基础设施服务原来的商业模式基本只能是 on-premise 私有部署模式，销售和实施成本非常高。企业应用领域是否可能出现一个类似于 Apple 的 AppStore 的市场来降低销售和实施成本？这方面很多厂商都在尝试，各容器平台都在尝试推出自己的应用规范，IaaS 厂商也在考虑提供声明式的编排 API，让渡出基础设施服务，由第三方实现（比如 QingCloud 即将发布的 AppCenter）。如果这个商业模式成熟，不仅独立的基础设施服务以及中间件公司会涌现出来，同时各公司的基础研发部门可能会从原来的支撑部门，变为 2B 业务的营收部门。

引入容器带来的技术成本和风险

引入任何技术都会带来技术成本和风险，当然容器也不例外。但成本和风险是可以评估的。

安全经常有人拿容器和虚拟机的安全做比较，然后说明容器的安全有问题。但实际上，大多数场景下容器并不是用来替代虚拟机的。如果用户只是用容器来封装原来直接运行在宿主机上的服务进程，那安全系数是增加了呢还是降低了？肯定是增加了啊，因为容器多了一层基于 cgroup 和 namespace 的隔离，最差的情况是这层隔离没有生效，那也和进程直接运行在宿主机上的安全效果一样。容器也并没有额外对外暴露端口等增加网络接触面，如果不是将容器直接暴露出去让第三方用户当虚拟机一样部署应用程序，容器并没有额外增加安全性问题。
IO 性能影响容器默认情况下一般都不会对 IO 进行限制，并且经过很多测试，基本上容器中的 IO 和宿主机基本没有差距，影响甚微，基本可以忽略。至于《7文》中所说的丢数据的影响，明显是一个错误的表述，Docker 中持久化数据，一般是通过 volume 或者和宿主机目录映射，并不会直接直接写到镜像的 AUFS 上。
网络性能影响 首先不确定《7文》中所说的 Docker 1.9 版本中依然存在的网络问题是什么问题，该文也没给出 issue 链接。即便是容器的网络方案不成熟，但 Docker 的网络标准 libnetwork 以及 Kubernetes 的容器网络标准 CNI，都是插件式的，用户可以选择更成熟的。如果服务已经运行在云上，容器一般都是可以复用云的 SDN 来实现网络的，比如 AWS 上的基于 VPC 路由的容器网络方案，QingCloud 上的 SDN 网络直通（SDN Passthrough）方案，和直接使用宿主机网络效果差距很小或者基本一样。再退一步说，如果网络性能真那么重要，并且一台服务器只运行一个服务，那可以直接用 host 模式么。
成本容器的接纳成本已经非常小了，即便是复杂一些的 Kubernetes，相对于 OpenStack 也简单许多，所以才有人通过 Kubernetes 去部署 OpenStack 么。

所以说，容器引入的成本和风险相对于收益来说，绝对是可以接受的，即便是它现在存在着许多问题，但绝对是一个潜力股，值得投入。

总结下，对技术的接纳很多情况下其实是纯粹的观念问题。最初 IaaS 出来的时候，不也有很多人说，数据库服务不适合跑在虚拟机上了，大数据服务不适合跑在虚拟机上了，现在不也有很多用户用的很好。合适不合适，脱离具体的业务场景和需求，是说不清楚的，对于大多数用户和产品来说，数据库的易用性，易维护性，可用性，要大于性能等其他方面的要求的，对另外一部分用户来说，数据库肯定要跑到物理机上，甚至 PC 服务器都不能满足。所以还是不要仅仅从自己的当前的业务需求来断定一个技术通用价值。

本文链接

http://coolshell.cn/articles/17680.html
http://jolestar.com/infrastructure-service-as-microservice/

推荐阅读

数据库不适合Docker及容器化的7大原因
2016年容器技术思考: Docker, Kubernetes, Mesos将走向何方?

本文由王渊命向高可用架构供稿，转载请注明出处，技术原创及架构实践文章，欢迎通过公众号菜单「联系我们」进行投稿。

高可用架构

改变互联网的构建方式

长按二维码关注「高可用架构」公众号

LeetCode剑指offer题目记录4 t.y.Tang LeetCode记录 leetcode python 矩阵
leetcode刷题开始啦,每天记录几道题.目录剑指offer07.重建二叉树题目描述示例思路python改进剑指offer09.用两个栈实现队列题目描述示例思路python剑指offer10-1.斐波那契数列题目描述思路pythonC++剑指offer10-2.青蛙跳台阶问题问题描述思路C++剑指offer07.重建二叉树题目描述输入某二叉树的前序遍历和中序遍历的结果，请构建该二叉树并返回其根节
假如我有一台新电脑, 我要做些什么? t.y.Tang 随笔闲谈经验分享
有时候我要重装系统,或者买了一台新电脑,或者帮别人清理电脑,我个人感觉是有一条还算清晰的整理思路的.今天把它写下来做个备份,方便以后年龄大了记不清事情了还能查阅.所以以后想到什么补充的也会添加进来.本人常用的是windows系统,所以说的也是windows系统.目录安装过程中电脑分区分区方案初始设置进入系统后更新系统处理一些设置项更新MicrosoftStore应用卸载不用的预装应用文件资源管理器
华为云计算产品系列 | 云上迁移工具RainBow实战详解降世神童云计算技术专栏华为华为云云计算
华为云计算产品系列|云上迁移工具RainBow实战详解1.迁移方案2.迁移流程3.迁移实验3.1.Windows系统迁移3.2.Linux系统迁移3.3.存储层迁移1.迁移方案 RainBow可以将物理机或者虚拟机上的业务迁移到华为的虚拟化平台和私有云平台（6.5.1以上支持），还可以实现低版本私有云迁移到高版本私有云。 Rainbow是华为自研迁移工具，支持X86架构下主流的Linux、Wi
mysql的数据如何进kafka_MySQL数据实时增量同步到Kafka IT巫师
一、go-mysql-transfergo-mysql-transfer是一款MySQL实时、增量数据同步工具。能够实时解析MySQL二进制日志binlog，并生成指定格式的消息，同步到接收端。go-mysql-transfer具有如下特点：1、不依赖其它组件，一键部署2、集成多种接收端，如：Redis、MongoDB、Elasticsearch、RabbitMQ、Kafka、RocketMQ，不
微服务即时通讯系统的实现（客户端）----（2） Smile丶凉轩项目微服务架构云原生
目录1.将protobuf引入项目当中2.前后端交互接口定义2.1核心PB类2.2HTTP接口定义2.3websocket接口定义3.核心数据结构和PB之间的转换4.设计数据中心DataCenter类5.网络通信5.1定义NetClient类5.2引入HTTP5.3引入websocket6.小结7.搭建测试服务器7.1创建项目7.2服务器引入http7.3服务器引入websocket7.4服务器引
使用hel-micro微服务实现在jsp项目中引入react组件小灰灰学编程微服务微服务 react.js jsp hel-micro
以下是一个完整的示例，涵盖React子应用配置、JSP主应用集成以及样式隔离的实现细节。我们将通过CSSModules和ShadowDOM确保React样式与JSP样式互不干扰。一、React子应用配置1.项目结构react-module/├──src/│├──index.js#模块入口文件│├──App.js#React组件│└──App.module.css#组件样式（CSSModules）├
StarRocks中优雅处理JSON与列表字段的初步示例 t.y.Tang 数据库 mysql json
StarRocks是一种兼容MySQL语法,自带对JSON,ARRAY等格式支持的数据库.文章目录一StarRocks是什么？与MySQL有何关系？二JSON格式的好处三JSON数组字段的应用和缺点四实例:StarRocks处理JSON数组的方法示例表结构场景1:筛选包含特定事件的用户场景2:提取数组中的嵌套字段场景3:展开数组为多行(UNNEST)场景4:复杂条件过滤(结合`$`索引)五,性能优
微服务即时通信系统---（五）框架学习 YangZ123123 微服务即时通信系统学习微服务算法
目录ODB介绍安装build2安装odb-compiler安装ODB运行时库安装mysql和客户端开发包安装boostprofile库安装总体打包安装总体卸载总体升级头文件包含和编译时指明库ODB常见操作介绍类型映射ODB编程类与接口介绍mysql连接池对象类mysql客户端操作句柄类mysql事务操作类针对可能为空的字段封装的类似于智能指针的类型针对查询结果所封装的容器类和条件类mysql操作句
Vue——Vue-cli脚手架+前端路由 pdsu_zhao Vue Vue学习之旅 vue v-router v-resource vue-cli ES6
Vue-cli是Vue的脚手架工具可以进行目录结构、本地调试、代码部署、热加载、单元测试1、MVVM框架View——ViewModel——Model（视图）（通讯）（数据）“DOM”“观察者vue实例”“Javascript”注意：交互为双向的特点：（1）针对具有复杂交互逻辑的前端应用；（2）提供基础的架构抽象；（3）通过Ajax数据持久化，保证前端用户体验。2、什么是Vue.js它是一个轻量级M
链接-简介 zhubo_1117 深入理解计算机系统
链接是将代码和数据合成一个文件的一个过程，生成的文件可以直接拷贝到存储器中并且执行。链接可以在程序编译时，加载时，甚至运行时执行。1.编译器的驱动程序编译器系统中包含编译驱动程序，驱动程序主要包含：预处理器，编译器，汇编器和连接器。处理过程如下：预处理器编译器汇编器main.c------------------>main.i----------------------->main.s------
AsyncHttpClient使用说明书有梦想的攻城狮 netty学习专栏 Java asynchttpclient 异步处理 netty
[[toc]]AsyncHttpClient（AHC）是一个高性能、异步的HTTP客户端库，广泛用于Java和Scala应用中，特别适合处理高并发、非阻塞的HTTP请求。它基于Netty或Java原生的异步HTTP客户端实现，支持HTTP/1.1和HTTP/2协议，适用于微服务、API调用、爬虫等场景。1.核心特性特性说明异步非阻塞基于事件驱动模型，避免线程阻塞，支持高并发（如每秒数千请求）。HT
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
标题word技巧：匹配所有的 [数字]，替换成上标 jay编程 word
标题word技巧：匹配所有的[数字]，替换成上标+颜色为红色匹配所有的[数字]，替换成上标可以看到如下界面：如果要替换为红色字体，则鼠标光标停留在“替换为”中，然后点击下面的格式，那么弹出来的框框是替换字体，而不是搜索字体。现在就可以自己设置替换颜色为红色啦
vue面试题合集（强烈推荐）前端念初前端 javascript
2022最新Vue面试题1、Vue的最大的优势是什么？（必会）2、Vue和jQuery两者之间的区别是什么？（必会）3、MVVM和MVC区别是什么？哪些场景适合？（必会）4、Vue数据双向绑定的原理是什么?（必会）5、Object.defineProperty和Proxy的区别（必会）6、Vue生命周期总共分为几个阶段？（必会）7、第一次加载页面会触发哪几个钩子函数？（必会）8、请说下封装Vue组
华为od 员工派遣 C++ 优秀是一种习惯啊 huawei 华为od c++开发语言
华为od员工派遣C++题目描述某公司部门需要派遣员工去国外做项目。现在，代号为x的国家和代号为y的国家分别需要cntx名和cnty名员工。部门每个员工有一个员工号（1,2,3,…），工号连续，从1开始。部长派遣员工的规则：规则1：从[1,k]中选择员工派遣出去规则2：编号为x的倍数的员工不能去x国，编号为y的倍数的员工不能去y国。问题：找到最小的k，使得可以将编号在[1,k]中的员工分配给x国和y
a4如何打印双面小册子_a4如何排版打印双面小册子? weixin_39908082 a4如何打印双面小册子
我来告诉你！！你手上这种册子的装订方式是骑马订！这种装订方式在adobepdf里面用拼版插件拼版非常快，不过非专业人士都不会用！有的打印机的打印驱动页面里面也有小册子打印的方式，可以直接打印出来！重点来了，以上的方法你都用不了的话，就只能用最费事的方法了！在word或者wps里面一张一张的排！1.页面数，骑马订册子的页面数必须是4的倍数，不够的话就得加空白页，空白页最好加在封二或者封三(封面的背面
阿里云在使用 Docker 过程中踩过的坑 weixin_34293059 运维
昨天下午朋友在微信上丢给我一条新闻，看看，我们阿里云支持Docker企业版了。我打开一看，果然，阿里云发布了飞天敏捷版，开始支持企业级的Docker容器。美国中部时间4月19日，阿里云在容器技术大会DockerCon2017上正式推出了ApsaraStackAgility，也就是飞天的敏捷版。Docker公司首席执行官BenGolub在大会上宣布了ApsaraStackAgility的正式发布，这
linux内核路由子系统,深入理解Linux网络技术内幕——路由子系统的概念与高级路由... 罗心澄 linux内核路由子系统
本文讨论IPv4的路由子系统。(IPv6对路由的处理不同)。基本概念路由子系统工作在三层，用来转发入口流量。路由子系统主要设计路由器、路由、路由表等概念。路由器：配备多个网络接口卡(NIC)，并且能利用自身网络信息进行入口流量转发的设备。路由：流量转发，决定目的地的过程路由表：转发信息库，该库中储存路由需要本地接收还是转发的信息，以及转发流量时所需要的信息。(即，信息库用来判断，要不要转发，如果要
如何用Pyhton实现成绩等级转换（初学者教程）笼中鸟·世间人 python
使用多分枝if-elif-else语句形式如下：if布尔表达式1：语句块1elif布尔表达式2：语句块2elif布尔表达式n：语句块nelse:布尔表达式n：语句块n+1以下的代码不仅可以判断一般的分数，还可以判断负数和超过100的不合法分数。（代码如下）#成绩等级转换.py'''将同学的百分制成绩转化等级：score>=90-->'优秀'，score>=80-->'良好'，score>=70--
Linux 内核数据结构解析--哈希链表 Black8Mamba24 Linux内核数据结构
一、Hash表的基本定义1.1Hash的概念散列表（Hashtable，也叫哈希表）,是一种数据结构，可以用于存储Key-Value键值对。也就是说，通过Key来映射到具体的Value。通常用于查找。将Key映射到Value的函数叫做Hash函数，而存储Key-Value的表叫做Hash表。Hasn表常用数组来存储。1.2常用的Hash函数1.3常用的处理碰撞的方法如果说存储空间是无线的，那只要定
使用 Airbyte Typeform 加载器进行数据文档化 shuoac python
在数据集成的世界中，Airbyte是一个非常强大的平台，它为我们的ETL管道提供了从API、数据库和文件到数据仓库和湖泊的连接器。但是，随着技术的快速发展，某些工具和方法可能会被弃用，例如AirbyteTypeform加载器。不过这并不意味着不能使用其他更好的解决方案。因此，这篇文章就带大家一起了解如何使用Airbyte原生支持的加载器来处理Typeform的数据文档化。技术背景介绍Airbyte
使用Couchbase实现高效的AI应用缓存与数据存储 scaFHIO 人工智能缓存 python
在当今AI应用的开发中，除了模型本身的性能，数据存储和缓存的效率也至关重要。Couchbase作为一款分布式NoSQL云数据库，其性能、可扩展性以及对AI、边缘计算应用的支持能力，使其成为优秀的选择。在本文中，我们将探讨如何通过Couchbase来实现高效的数据存储与缓存，尤其是在AI应用中。技术背景介绍随着AI应用规模的扩大和复杂度的增加，我们需要可靠的数据存储解决方案来满足实时性要求，同时减少
使用Titan Takeoff进行高效的自然语言处理模型推理 scaFHIO 自然语言处理人工智能 python
在自然语言处理(NLP)领域，每一家企业都在寻求更高效的模型训练和推理解决方案。TitanML的平台通过训练、压缩和推理优化帮助企业构建和部署更佳、更小、更便宜、更快速的NLP模型。特别是其推理服务器TitanTakeoff，使得在本地硬件上轻松部署大语言模型(LLMs)成为可能。技术背景介绍TitanTakeoff是TitanML提供的一项服务，它允许用户在本地硬件上运行推理工作负载。支持大多数
React的状态管理——Redux miraculous111 react.js javascript 前端
Redux与计数器配套工具使用ReactToolkit创建counterStore为React注入storeReact组件使用store中的数据React组件修改store中的数据绑定用户交互效果展示action传参Redux异步状态管理React中的Redux就像Vue中的Vuex和Pinia一样，都是状态管理工具，通过这种方式可以很方便的实现各个组件中的通信。下面的代码是通过Redux实现一个
如何恢复已受损磁盘中的数据 MingDong523 硬件工程
恢复受损磁盘中的数据需要谨慎操作，避免进一步损坏数据。以下是分步骤的解决方案：一、立即停止使用磁盘关键原因：继续使用可能导致数据被覆盖或损坏加剧。操作建议：断开磁盘连接，避免写入新数据。二、判断磁盘损坏类型逻辑损坏（软件问题）表现：文件系统错误、分区丢失、误删除等。解决方案：使用数据恢复软件修复。物理损坏（硬件故障）表现：磁盘异响、无法识别、频繁卡顿。解决方案：停止通电，联系专业数据恢复机构。三、
如何将微信接受的文件保存到IPhone的 Files App中？ MingDong523 iphone
如何将微信接受的文件保存到IPhone的FilesApp中？在iPhone上，将微信接收的文件保存到系统自带的**FilesApp（文件应用）**需要通过手动操作，以下是分步骤的详细方法：方法一：通过微信直接保存到FilesApp适用于：文档、图片、视频等文件打开微信文件在微信聊天或群组中，找到接收到的文件（如PDF、Word、Excel、压缩包等），长按文件，选择“用其他应用打开”（或“其他应用
Java的包结构 MingDong523 笔记
Java的包结构类就相当于文件夹(目录)。包结构的作用一般有以下两个方面第一个就是Java的包是根据Java文件的功能和性质来区分，方便区分和查找另一个就是重复的文件名可以存在于不同的包(文件夹)里。当我们选择去创建Java包时有两种创建方式，其中一种就是手动创建，手动创建包太过繁琐，不推荐。而另一种就是使用代码去创建(打包语句package)，当我们使用打包语句时要注意一下几点1.在写packa
Java中String类型的20个方法 MingDong523 笔记
根据长度来使用的方法：返回类型：int方法签名：String.length()作用：用来计算String中字符的个数根据数组来使用的方法：返回类型：byte类型的数组byte[]方法签名：String.getBytes()作用：将String类型转换成byte类型的数组返回类型：char类型的数组char[]方法签名：String.toCharArray()作用：将String类型转变成char类
AF3 rot_matmul 和 rot_vec_mul函数解读 qq_27390023 生物信息学深度学习 pytorch python
AlphaFold3rigid_utils模块的rot_matmul和rot_vec_mul函数实现了手动计算两个旋转矩阵的乘法A×B以及矩阵-向量乘法R×t，避免了直接用矩阵乘法的AMP（AutomaticMixedPrecision）问题。源代码：defrot_matmul(a:torch.Tensor,b:torch.Tensor)->torch.Tensor:"""Performsmatr
深度剖析linux内核万能--双向链表,Hash链表模版 Engineer-Bruce_Yang C语言-算法与数据结构编程 C语言在开发中的应用
我们都知道，链表是数据结构中用得最广泛的一种数据结构，对于数据结构，有顺序存储，数组就是一种。有链式存储，链表算一种。当然还有索引式的，散列式的，各种风格的说法，叫法层出不穷，但是万变不离其中，只要知道什么场合用什么样的数据结构，那就行了。那么，标题说的内核万能链表，其实就是内核链表，它到底和我们平常大学学的数据结构的链表有什么不同呢？？内核链表，是在linux内核里的一种普遍存在的数据结构，比如
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

数据库容器化的价值——反驳数据库不适合容器化的错误观点

如何对一项通用技术做价值评估

数据库容器化的目标和价值

引入容器带来的技术成本和风险

你可能感兴趣的:(数据库容器化的价值——反驳数据库不适合容器化的错误观点)