anhuidelinger

谷歌技术"三宝"之BigTable

2006年的OSDI有两篇google的论文，分别是BigTable和Chubby。Chubby是一个分布式锁服务，基于Paxos算法；BigTable是一个用于管理结构化数据的分布式存储系统，构建在GFS、Chubby、SSTable等google技术之上。相当多的google应用使用了BigTable，比如Google Earth和Google Analytics，因此它和GFS、MapReduce并称为谷歌技术"三宝"。

与GFS和MapReduce的论文相比，我觉得BigTable的论文难懂一些。一方面是因为自己对数据库不太了解，另一方面又是因为对数据库的理解局限于关系型数据库。尝试用关系型数据模型去理解BigTable就容易"走火入魔"。在这里推荐一篇文章：Understanding HBase and BigTable，相信这篇文章对理解BigTable/HBase的数据模型有很大帮助。

1 什么是BigTable

Bigtable是一个为管理大规模结构化数据而设计的分布式存储系统，可以扩展到PB级数据和上千台服务器。很多google的项目使用Bigtable存储数据，这些应用对Bigtable提出了不同的挑战，比如数据规模的要求、延迟的要求。Bigtable能满足这些多变的要求，为这些产品成功地提供了灵活、高性能的存储解决方案。

Bigtable看起来像一个数据库，采用了很多数据库的实现策略。但是Bigtable并不支持完整的关系型数据模型；而是为客户端提供了一种简单的数据模型，客户端可以动态地控制数据的布局和格式，并且利用底层数据存储的局部性特征。Bigtable将数据统统看成无意义的字节串，客户端需要将结构化和非结构化数据串行化再存入Bigtable。

下文对BigTable的数据模型和基本工作原理进行介绍，而各种优化技术（如压缩、Bloom Filter等）不在讨论范围。

2 BigTable的数据模型

Bigtable不是关系型数据库，但是却沿用了很多关系型数据库的术语，像table（表）、row（行）、column（列）等。这容易让读者误入歧途，将其与关系型数据库的概念对应起来，从而难以理解论文。Understanding HBase and BigTable是篇很优秀的文章，可以帮助读者从关系型数据模型的思维定势中走出来。

本质上说，Bigtable是一个键值（key-value）映射。按作者的说法，Bigtable是一个稀疏的，分布式的，持久化的，多维的排序映射。

先来看看多维、排序、映射。Bigtable的键有三维，分别是行键（row key）、列键（column key）和时间戳（timestamp），行键和列键都是字节串，时间戳是64位整型；而值是一个字节串。可以用 (row:string, column:string, time:int64)→string 来表示一条键值对记录。

行键可以是任意字节串，通常有10-100字节。行的读写都是原子性的。Bigtable按照行键的字典序存储数据。Bigtable的表会根据行键自动划分为片（tablet），片是负载均衡的单元。最初表都只有一个片，但随着表不断增大，片会自动分裂，片的大小控制在100-200MB。行是表的第一级索引，我们可以把该行的列、时间和值看成一个整体，简化为一维键值映射，类似于：

[javascript] view plaincopyprint?

table{
"1" : {sth.},//一行
"aaaaa" : {sth.},
"aaaab" : {sth.},
"xyz" : {sth.},
"zzzzz" : {sth.}
}

列是第二级索引，每行拥有的列是不受限制的，可以随时增加减少。为了方便管理，列被分为多个列族（column family，是访问控制的单元），一个列族里的列一般存储相同类型的数据。一行的列族很少变化，但是列族里的列可以随意添加删除。列键按照family:qualifier格式命名的。这次我们将列拿出来，将时间和值看成一个整体，简化为二维键值映射，类似于：

[javascript] view plaincopyprint?

table{
// ...
"aaaaa" : { //一行
"A:foo" : {sth.},//一列
"A:bar" : {sth.},//一列
"B:" : {sth.} //一列，列族名为B，但是列名是空字串
},
"aaaab" : { //一行
"A:foo" : {sth.},
"B:" : {sth.}
},
// ...
}

或者可以将列族当作一层新的索引，类似于：

[javascript] view plaincopyprint?

table{
// ...
"aaaaa" : { //一行
"A" : { //列族A
"foo" : {sth.}, //一列
"bar" : {sth.}
},
"B" : { //列族B
"" : {sth.}
}
},
"aaaab" : { //一行
"A" : {
"foo" : {sth.},
},
"B" : {
"" : "ocean"
}
},
// ...
}

时间戳是第三级索引。Bigtable允许保存数据的多个版本，版本区分的依据就是时间戳。时间戳可以由Bigtable赋值，代表数据进入Bigtable的准确时间，也可以由客户端赋值。数据的不同版本按照时间戳降序存储，因此先读到的是最新版本的数据。我们加入时间戳后，就得到了Bigtable的完整数据模型，类似于：

[javascript] view plaincopyprint?

table{
// ...
"aaaaa" : { //一行
"A:foo" : { //一列
15 : "y", //一个版本
4 : "m"
},
"A:bar" : { //一列
15 : "d",
},
"B:" : { //一列
6 : "w"
3 : "o"
1 : "w"
}
},
// ...
}

查询时，如果只给出行列，那么返回的是最新版本的数据；如果给出了行列时间戳，那么返回的是时间小于或等于时间戳的数据。比如，我们查询"aaaaa"/"A:foo"，返回的值是"y"；查询"aaaaa"/"A:foo"/10，返回的结果就是"m"；查询"aaaaa"/"A:foo"/2，返回的结果是空。

图1是Bigtable论文里给出的例子，Webtable表存储了大量的网页和相关信息。在Webtable，每一行存储一个网页，其反转的url作为行键，比如maps.google.com/index.html的数据存储在键为com.google.maps/index.html的行里，反转的原因是为了让同一个域名下的子域名网页能聚集在一起。图1中的列族"anchor"保存了该网页的引用站点（比如引用了CNN主页的站点），qualifier是引用站点的名称，而数据是链接文本；列族"contents"保存的是网页的内容，这个列族只有一个空列"contents:"。图1中"contents:"列下保存了网页的三个版本，我们可以用("com.cnn.www", "contents:", t5)来找到CNN主页在t5时刻的内容。

再来看看作者说的其它特征：稀疏，分布式，持久化。持久化的意思很简单，Bigtable的数据最终会以文件的形式放到GFS去。Bigtable建立在GFS之上本身就意味着分布式，当然分布式的意义还不仅限于此。稀疏的意思是，一个表里不同的行，列可能完完全全不一样。

3 支撑技术

Bigtable依赖于google的几项技术。用GFS来存储日志和数据文件；按SSTable文件格式存储数据；用Chubby管理元数据。

GFS参见谷歌技术"三宝"之谷歌文件系统。BigTable的数据和日志都是写入GFS的。

SSTable的全称是Sorted Strings Table，是一种不可修改的有序的键值映射，提供了查询、遍历等功能。每个SSTable由一系列的块（block）组成，Bigtable将块默认设为64KB。在SSTable的尾部存储着块索引，在访问SSTable时，整个索引会被读入内存。BigTable论文没有提到SSTable的具体结构，LevelDb日知录之四： SSTable文件这篇文章对LevelDb的SSTable格式进行了介绍，因为LevelDB的作者JeffreyDean正是BigTable的设计师，所以极具参考价值。每一个片（tablet）在GFS里都是按照SSTable的格式存储的，每个片可能对应多个SSTable。

Chubby是一种高可用的分布式锁服务，Chubby有五个活跃副本，同时只有一个主副本提供服务，副本之间用Paxos算法维持一致性，Chubby提供了一个命名空间（包括一些目录和文件），每个目录和文件就是一个锁，Chubby的客户端必须和Chubby保持会话，客户端的会话若过期则会丢失所有的锁。关于Chubby的详细信息可以看google的另一篇论文：The Chubby lock service for loosely-coupled distributed systems。Chubby用于片定位，片服务器的状态监控，访问控制列表存储等任务。

4 Bigtable集群

Bigtable集群包括三个主要部分：一个供客户端使用的库，一个主服务器（master server），许多片服务器（tablet server）。

正如数据模型小节所说，Bigtable会将表（table）进行分片，片（tablet）的大小维持在100-200MB范围，一旦超出范围就将分裂成更小的片，或者合并成更大的片。每个片服务器负责一定量的片，处理对其片的读写请求，以及片的分裂或合并。片服务器可以根据负载随时添加和删除。这里片服务器并不真实存储数据，而相当于一个连接Bigtable和GFS的代理，客户端的一些数据操作都通过片服务器代理间接访问GFS。

主服务器负责将片分配给片服务器，监控片服务器的添加和删除，平衡片服务器的负载，处理表和列族的创建等。注意，主服务器不存储任何片，不提供任何数据服务，也不提供片的定位信息。

客户端需要读写数据时，直接与片服务器联系。因为客户端并不需要从主服务器获取片的位置信息，所以大多数客户端从来不需要访问主服务器，主服务器的负载一般很轻。

5 片的定位

前面提到主服务器不提供片的位置信息，那么客户端是如何访问片的呢？来看看论文给的示意图，Bigtable使用一个类似B+树的数据结构存储片的位置信息。

首先是第一层，Chubby file。这一层是一个Chubby文件，它保存着root tablet的位置。这个Chubby文件属于Chubby服务的一部分，一旦Chubby不可用，就意味着丢失了root tablet的位置，整个Bigtable也就不可用了。

第二层是root tablet。root tablet其实是元数据表（METADATA table）的第一个分片，它保存着元数据表其它片的位置。root tablet很特别，为了保证树的深度不变，root tablet从不分裂。

第三层是其它的元数据片，它们和root tablet一起组成完整的元数据表。每个元数据片都包含了许多用户片的位置信息。

可以看出整个定位系统其实只是两部分，一个Chubby文件，一个元数据表。注意元数据表虽然特殊，但也仍然服从前文的数据模型，每个分片也都是由专门的片服务器负责，这就是不需要主服务器提供位置信息的原因。客户端会缓存片的位置信息，如果在缓存里找不到一个片的位置信息，就需要查找这个三层结构了，包括访问一次Chubby服务，访问两次片服务器。

6 片的存储和访问

片的数据最终还是写到GFS里的，片在GFS里的物理形态就是若干个SSTable文件。图5展示了读写操作基本情况。

当片服务器收到一个写请求，片服务器首先检查请求是否合法。如果合法，先将写请求提交到日志去，然后将数据写入内存中的memtable。memtable相当于SSTable的缓存，当memtable成长到一定规模会被冻结，Bigtable随之创建一个新的memtable，并且将冻结的memtable转换为SSTable格式写入GFS，这个操作称为minor compaction。

当片服务器收到一个读请求，同样要检查请求是否合法。如果合法，这个读操作会查看所有SSTable文件和memtable的合并视图，因为SSTable和memtable本身都是已排序的，所以合并相当快。

每一次minor compaction都会产生一个新的SSTable文件，SSTable文件太多读操作的效率就降低了，所以Bigtable定期执行merging compaction操作，将几个SSTable和memtable合并为一个新的SSTable。BigTable还有个更厉害的叫major compaction，它将所有SSTable合并为一个新的SSTable。

遗憾的是，BigTable作者没有介绍memtable和SSTable的详细数据结构。

7 BigTable和GFS的关系

集群包括主服务器和片服务器，主服务器负责将片分配给片服务器，而具体的数据服务则全权由片服务器负责。但是不要误以为片服务器真的存储了数据（除了内存中memtable的数据），数据的真实位置只有GFS才知道，主服务器将片分配给片服务器的意思应该是，片服务器获取了片的所有SSTable文件名，片服务器通过一些索引机制可以知道所需要的数据在哪个SSTable文件，然后从GFS中读取SSTable文件的数据，这个SSTable文件可能分布在好几台chunkserver上。

8 元数据表的结构

元数据表（METADATA table）是一张特殊的表，它被用于数据的定位以及一些元数据服务，不可谓不重要。但是Bigtable论文里只给出了少量线索，而对表的具体结构没有说明。这里我试图根据论文的一些线索，猜测一下表的结构。首先列出论文中的线索：

The METADATA table stores the location of a tablet under a row key that is an encoding of the tablet's table identifier and its end row.
Each METADATA row stores approximately 1KB of data in memory（因为访问量比较大，元数据表是放在内存里的，这个优化在论文的locality groups中提到）.This feature（将locality group放到内存中的特性） is useful for small pieces of data that are accessed frequently: we use it internally for the location column family in the METADATA table.
We also store secondary information in the METADATA table, including a log of all events pertaining to each tablet(such as when a server begins
serving it).

第一条线索，元数据表的行键是由片所属表名的id和片最后一行编码而成，所以每个片在元数据表中占据一条记录（一行），而且行键既包含了其所属表的信息也包含了其所拥有的行的范围。譬如采取最简单的编码方式，元数据表的行键等于strcat(表名，片最后一行的行键)。

第二点线索，除了知道元数据表的地址部分是常驻内存以外，还可以发现元数据表有一个列族称为location，我们已经知道元数据表每一行代表一个片，那么为什么需要一个列族来存储地址呢？因为每个片都可能由多个SSTable文件组成，列族可以用来存储任意多个SSTable文件的位置。一个合理的假设就是每个SSTable文件的位置信息占据一列，列名为location:filename。当然不一定非得用列键存储完整文件名，更大的可能性是把SSTable文件名存在值里。获取了文件名就可以向GFS索要数据了。

第三个线索告诉我们元数据表不止存储位置信息，也就是说列族不止location，这些数据暂时不是咱们关心的。

通过以上信息，我画了一个简化的Bigtable结构图：

结构图以Webtable表为例，表中存储了网易、百度和豆瓣的几个网页。当我们想查找百度贴吧昨天的网页内容，可以向Bigtable发出查询Webtable表的(com.baidu.tieba, contents:, yesterday)。

假设客户端没有该缓存，那么Bigtable访问root tablet的片服务器，希望得到该网页所属的片的位置信息在哪个元数据片中。使用METADATA.Webtable.com.baidu.tieba为行键在root tablet中查找，定位到最后一个比它大的是METADATA.Webtable.com.baidu.www，于是确定需要的就是元数据表的片A。访问片A的片服务器，继续查找Webtable.com.baidu.tieba，定位到Webtable.com.baidu.www是比它大的，确定需要的是Webtable表的片B。访问片B的片服务器，获得数据。

这里需要注意的是，每个片实际都由若干SSTable文件和memtable组成，而且这些SSTable和memtable都是已排序的。这就导致查找片B时，可能需要将所有SSTable和memtable都查找一遍；另外客户端应该不会直接从元数据表获得SSTable的文件名，而只是获得片属于片服务器的信息，通过片服务器为代理访问SSTable。

参考文献

[1] Bigtable: A Distributed Storage System for Structured Data. In proceedings of OSDI'06.

[2] Understanding HBase and BigTable.

2025最新“科研创新与智能化转型“暨AI智能体开发与大语言模型的本地化部署、优化技术实践 weixin_贾 Python MATLAB python 深度学习 MATLAB编程人工智能
第一章、智能体(Agent)入门1、智能体（Agent）概述（什么是智能体？智能体的类型和应用场景、典型的智能体应用，如：GoogleDataScienceAgent等）2、智能体（Agent）与大语言模型（LLM）的关系3、智能体（Agent）的五种能力（记忆、规划、工具、自主决策、推理）4、多智能体（Multi-Agent）协作5、智能体（Agent）构建的基本步骤6、案例演示与实操练习第二章
Kubernetes深度解析：云原生时代的容器编排引擎这个懒人云原生 kubernetes 容器
一、背景与演进1.容器革命的必然产物Kubernetes（K8s）诞生于2014年，是Google基于其内部Borg系统的开源实现。在传统单体应用向微服务架构转型的浪潮中，容器技术（如Docker）解决了应用打包和环境隔离问题，但大规模容器集群的管理仍面临三大挑战：调度复杂性：如何高效分配数千容器的计算资源服务治理难题：动态环境下的服务发现与流量管理运维自动化：故障自愈、滚动升级等运维需求截至20
Google 停止开源 Android？云水木石开源 android
今天看到有很多消息称谷歌将停止开源Android，比如这一篇《谷歌决定终止开源Android》。对此消息有些将信将疑，毕竟这些年被各种反转虐了无数回。抱着掌握第一手材料的态度，去外面的世界看了看。谷歌确实对Android开发方式有所改变，但并非将Android闭源。比如下面这篇就将前因后果讲得比较清楚：https://www.androidauthority.com/google-android-
运维知识：如何让你的服务器达到最大化的加载速度和更稳定的运行？浩特-ht 运维服务器 linux
运维知识：如何让你的服务器达到最大化的加载速度和更稳定的运行？一、为什么需要服务器优化？性能问题：慢加载速度导致用户流失（Google数据：页面加载延迟1秒，转化率下降20%）。稳定性问题：硬件故障、资源耗尽、服务崩溃可能导致业务中断。目标：通过系统级优化、服务调优、监控预警实现QPS提升30%+和全年99.99%可用性。二、服务器优化核心维度系统层内核参数资源管理服务层Web服务器数据库网络层C
基于pytorch的卷积神经网络量化实现踟蹰横渡口,彳亍上滩舟。 pytorch量化感知训练稀疏训练模型剪枝学习教程深度学习神经网络机器学习 pytorch
#卷积神经网络量化1，神经网络和卷积神经网络模型量化方法，主要包括线性量化和聚类量化两种方法。2，可指定模型进行定点话，并输出量化后参数统计和finetune，可设置任意bit量化。3，支持MLP,Lenet,Alexnet,VGG,GoogleNet系列,Resnet系列，MobileNet系列的量化。下载地址：下载地址#部分代码--线性量化#!/usr/bin/envpython#coding
当DeepSeek成为“谣言工厂“：AI幻觉率14.3%如何重塑中文互联网信息生态？小小鸭程序员 github spring spring boot docker 人工智能
一、AI幻觉：技术狂欢下的认知危机1.1推理模型的"聪明反被聪明误"GoogleGemini2.0Flash：0.7%幻觉率（医疗诊断场景）DeepSeek-V3：3.9%幻觉率（金融分析场景）DeepSeek-R1：14.3%幻觉率（知识问答场景）#大模型幻觉率对比可视化importmatplotlib.pyplotaspltmodels=['Gemini','DeepSeek-V3','Dee
yapf设置python函数调用参数格式 pythonyapf
需求说明python函数调用时，输入参数的字符数未达到一行最大的字符数限制，不换行。如果第i个输入参数最末字符超过了一行最大字符限制，则另起一行，且另起的行，起始位置要与第一个参数左对齐。并且函数调用结束后的")"，最后一个输入参数所在行的代码+")"，总字符<=一行最大字符限制，那么这个")"不要另起一行。即这个函数调用处的代码风格与这个googlecpp代码风格保持一致。https://zh-
cpp_isort, 一个模仿python中的isort, 对头文件按照google C++代码风格排序的脚本 c++
工具说明脚本地址https://github.com/chuzhixing/isort免责声明与风险提醒重要提示：本脚本可能存在误删除源代码内容的风险。请务必仔细阅读以下内容。本Python脚本旨在模仿isort的功能，用于对C++源代码文件中的#include头文件进行排序。但请注意，本脚本并非完善，功能可能存在缺陷（bugs）。强烈建议您在使用本脚本之前，务必对您的C++源代码进行完整备份。使
TensorFlow 深度学习框架详解奶油话梅糖深度学习 tensorflow 人工智能
TensorFlow深度学习框架详解1.框架概述TensorFlow是由GoogleBrain团队开发的开源机器学习框架，其名称源于处理多维数据数组（张量）的数据流图（Flow）的运行方式。核心特点：跨平台支持：可在CPU/GPU/TPU上运行多语言接口：原生支持Python，通过API支持JS/Java/C++生态丰富：集成Keras、TF-Lite、TFX等工具链2.核心概念解析2.1张量（T
Linux下安装Zookeeper教程 .猫的树 Linux java-zookeeper zookeeper linux
ZooKeeper简介ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。一、下载ZooKe
解决linux centos ubuntu等无法启动谷歌chrome浏览器问题 Mumunu- linux centos ubuntu
命令启动chrome时候提示：Runningasrootwithout--no-sandboxisnotsupported.Seehttps://crbug.com/638180.解决无法启动谷歌chrome浏览器：cd/usr/bin发现目录下有google-chromegoogle-chrome-stable执行：vimgoogle-chrome#然后对文件最下面代码追加上--no-sandb
阿里全模态模型Qwen2.5-Omni现已开源，其7B尺寸的版本实现了全球顶尖的性能表现万才博客 ai AI编程
今日，通义千问Qwen2.5-Omni-7B正式开源，作为通义系列首个端到端全模态大模型，它能够同时处理文本、图像、音频、视频等多类型输入，并实时生成文本与自然语音合成输出。在权威多模态融合任务OmniBench等测评中，Qwen2.5-Omni刷新业界纪录，在各个维度远超Google的Gemini-1.5-Pro等同类模型。通义千问Qwen2.5-Omni以接近人类的多感官方式“立体”认知世界并
CI/CD 糖醋_诗酒软件测试技术及工具 ci/cd
A.概念CI/CD是持续集成（ContinuousIntegration）持续交付（ContinuousDelivery）持续部署（ContinuousDeployment）的缩写B.工具和平台Jenkins：一个开源的自动化服务器，支持CI/CD流程GitLabCI/CD：GitLab内置的CI/CD服务AWSCodePipeline、AzureDevOps、GoogleCloudBuild：云
Selenium——入门暗夜小白白 Selenium selenium 测试工具
一、Selenium简介Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。适用于自动化测试，js动态爬虫（破解反爬虫）等领域。二、Selenium组成1）SeleniumIDE：嵌入到Firefo
解决浏览器不支持访问FTP服务器的问题彼岸花@开 linux 服务器运维
1.抛出问题由于安全性和性能方面的考虑，GoogleChrome在版本72之后停止了对FTP协议的支持。因此，如果你想查看FTP目录，你可以考虑以下几种方法：使用专门的FTP客户端软件：可以使用一些专门的FTP客户端软件，如FileZilla、WinSCP等。这些软件提供了直观的用户界面，可以方便地连接到FTP服务器，并浏览、上传、下载文件。使用其他支持FTP的浏览器：虽然GoogleChrome
如何使用Anthropic Chat模型：快速入门指南 shuoac python 开发语言
如何使用AnthropicChat模型：快速入门指南Anthropic提供了多个聊天模型，这篇文章将帮助你快速入门。详细文档请参考AnthropicAPI文档。技术背景介绍Anthropic提供了多种聊天模型，这些模型可以通过AWSBedrock和GoogleVertexAI进行访问。使用Anthropic你可以快速创建高效的对话代理。核心原理解析Anthropic模型支持结构化输出、JSON模式
主流云平台（AWS、华为云、阿里云、Google Cloud等）的**大数据及人工智能技术栈**及其核心组件的深度解析无级程序员云计算平台大数据 aws 华为云阿里云云原生
云计算系列文章：1.GCP（Cloud-nativestack）的云原生技术栈介绍2.主流云厂商的云原生技术栈（Cloud-nativestack）及其核心组件对比3.主流云平台（AWS、华为云、阿里云、GoogleCloud等）的大数据及人工智能技术栈及其核心组件的深度解析目前项目要用到大数据及AI，于是在网上研究了一下各大平台的技术栈及其核心组件，现分享一下，包括AWS、华为云、阿里云、Goo
Flutter常用功能教程：新手入门指南网络安全天地 http udp https websocket 网络安全网络协议 tcp/ip
Flutter常用功能教程本文提供了详细的Flutter常用功能教程，涵盖环境搭建、布局与UI设计、导航与路由管理、状态管理入门、数据获取与网络请求以及保存用户数据等内容，帮助开发者快速上手Flutter开发。Flutter简介及环境搭建Flutter是什么Flutter是Google开发的一套开源UI软件开发工具包，支持创建高性能、美观的原生应用程序，可在iOS和Android上运行。Flutt
Flutter入门教程：从零开始的Flutter开发指南技术博主狂热者 http udp https websocket 网络安全网络协议 tcp/ip
Flutter入门教程：从环境搭建到应用发布概述本文提供了全面的Flutter入门教程，涵盖环境搭建、基础Widget使用、界面设计与美化，以及实战项目开发等内容。通过本教程，开发者能够快速上手Flutter开发，掌握开发跨平台应用的基本流程，包括集成第三方库和发布应用到各大应用商店。Flutter简介什么是FlutterFlutter是由Google开发的一个开源UI框架，它使用Dart语言编写
谷歌决定终止开源Android 云端源想开源 android
据新黄河，3月27日消息，Google宣布将停止Android开源项目（AOSP）。AOSP是Google主导的开源项目，为所有Android设备提供基础框架和核心组件。它就像一个“毛坯房”，开发者可以自由下载、修改和分发代码，基于它构建定制化系统。无论是XiaomiHyperOS、vivoOriginOS还是OPPO的ColorOS，甚至Pixel手机使用的Android系统，都是从AOSP发展
CAP理论12年后再思考：分布式系统的“三选二“真的是铁律吗？码农技术栈 java spring boot spring cloud 微服务架构分布式
从GoogleSpanner到现代数据库，为什么CAP理论的实际应用比想象中更灵活？一、CAP理论的起源：一个简单的“三选二”规则？2000年，加州大学伯克利分校的EricBrewer教授提出了CAP理论（Consistency一致性、Availability可用性、PartitionTolerance分区容错性），指出在分布式系统中，最多只能同时满足其中的两个特性。两年后，MIT的SethGil
大数据内容分享(五)：Hadoop各组件的主要功能及作用详解之乎者也· 大数据（Hadoop）内容分享大数据 hadoop 分布式
目录前言存储类型组件计算分析引擎组件任务调度和集群管理组件其它组件总结前言虽然hadoop的生态体系已经有好多年了，而且越来越多的做大数据的可能会觉得hadoop体系在数据处理方面有一些笨重，但是作为大数据的分布式系统领域的鼻祖，我们还是好好学习一下。Hadoop体系最初建立于2005年，是由DougCutting和MikeCafarella开发的。它的设计灵感来自于Google的MapReduc
Kubernetes z小天才b Kubernetes kubernetes 容器云原生
Kubernetes简介什么是Kubernetes？Kubernetes（通常简称为K8s）是一个开源的容器编排平台，旨在自动化应用程序的部署、扩展和管理。它最初由Google设计并开源，现在由CloudNativeComputingFoundation(CNCF)维护。Kubernetes的核心功能：服务发现和负载均衡：Kubernetes可以使用DNS名称或自己的IP地址公开容器，并在多个容器
如何评价Flutter？值的学吗？ yuanlaile flutter
Flutter是由Google开发的一款开源移动应用开发框架，它以其独特的优势在移动开发领域获得了广泛的关注和应用。不清楚Flutter是什么的话可以看看以下的视频介绍：17Flutter介绍-FlutterWindowsAndroid环境搭建真机调试我们团队使用Flutter已经快三年了，有很多人问过我们对Flutter的评价。今天在这里回顾一下三年前选择Flutter时的原因，以及Flutte
Google开源机器学习框架TensorFlow SegFormer优化深海水人工智能行业发展 IT应用探讨 tensorflow 人工智能 python 机器训练机器学习深度学习 ai
一、SegFormer的TensorRT加速优化TensorRT是NVIDIA推出的深度学习推理加速库，可以显著提高SegFormer在GPU上的推理速度。1.TensorRT加速流程目标转换SegFormer为TensorRT格式优化FP16/INT8计算提升推理速度（FPS）主要步骤导出TensorFlow模型转换为ONNX格式使用TensorRT进行优化运行TensorRT推理2.代码实现（
AI搜索革命：企业未来三年的生死竞速白雪讲堂人工智能 gpt 文心一言 gpu算力搜索引擎数据分析
AI搜索革命：企业未来三年的生死竞速——从流量分配到认知嵌入的战略跃迁一、技术迭代正在重构商业基础设施（数据支撑：Gartner+IDC）交互方式质变多模态搜索请求占比达43%（Google2024Q1趋势报告）智能硬件出货量年增254%（IDC2023中国AIoT报告）商业影响：用户决策场景从手机屏扩展到智能眼镜、车载系统、智能家居三大新战场认知效率跃升对话式搜索使信息获取速度提升6.2倍（MI
多图超详细安装flutter&Android Studio开发环境，并配置插件技术博主狂热者 http udp https websocket 网络安全网络协议 tcp/ip
Flutter开发环境搭建指南Flutter是Google推出的一款跨平台移动应用开发框架，能够帮助开发者快速构建高性能的iOS和Android应用。虽然网上有很多关于Flutter安装的教程，但很多内容已经过时，或者步骤繁琐。本文将分享我从零开始安装Flutter开发环境并成功运行示例Demo的过程，希望能帮助大家少走弯路。第一步：安装FlutterSDK访问Flutter中文网获取最新的Flu
Android系统的安全问题 - Android的加密小馬佩德罗 #Android系统的安全问题 android 安全
Android加密机制详解Android提供了多层次的加密方案来保护用户数据安全，从全盘加密到文件级加密，从硬件支持到软件实现。以下是Android加密系统的全面解析：参考：Google官方文档加密1.全盘加密(FullDiskEncryption,FDE)实现时间：Android5.0开始引入工作原理：使用AES-128或AES-256算法加密整个用户数据分区密钥由用户密码/PIN/图案派生密钥
您的数据是如何出现在暗网上的？网络研究观网络研究观网络数据隐私安全信息暗网
暗网是互联网上的一个隐秘角落，人们可以在那里保持匿名。暗网经常与深网混淆，但它们并不完全相同。深网是指网络上所有未被搜索引擎索引的内容。这包括电子邮件帐户、私人数据库和付费服务等。这并不违法，只是无法通过简单的Google搜索找到。然而，暗网是深网中一个特定的、隐藏的部分。要访问它，你需要像Tor这样的特殊软件。虽然暗网主要以非法活动而闻名，但它也是注重隐私的个人和组织的平台，例如压迫政权下的记者
Android开发入门——从零开始构建第一个Android App AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介首先，让我们回顾一下Android系统的特性。Android是一个开源、免费的移动操作系统，最初起源于Google，后被开源。它提供统一的API，使得手机厂商可以针对不同版本的Android系统定制不同的应用。同时，Android也支持对设备硬件进行二次开发，可以实现一些高级功能。例如，通过Android的相机应用接口，可以轻松地拍照上传至网上；通过蓝牙接口，可
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

谷歌技术"三宝"之BigTable

你可能感兴趣的:(Google,bigtable)