李兆龙的博客

从一到无穷大 #19 TagTree，倒排索引入手是否是优化时序数据库查询的通用方案？

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

本作品 (李兆龙博文, 由李兆龙创作)，由李兆龙确认，转载请注明版权。

文章目录

文章主旨
时序数据库查询的一般流程
- 扫描
- 维度聚合
- 时间聚合
- 管控语句
TagTree
- 整体结构
- 索引结构
- 可能的问题
测试

文章主旨

文章针对的问题点在于现有的倒排索引实现在高基数的情况下性能较差，现有方法问题如下：

使用外部数据库管理tag信息时，时间序列数据库需要为每次用户查询向外部数据库发送请求，从而大大增加了tag查询延迟。
将tag索引与时间序列数据一起存储在多个时间分段文件中，每个数据段包含一个时间窗口中的所有时间序列数据以及将时间序列映射到数据的倒排索引，此时跨越多个时间窗口的时间序列元数据将存储在多个时间段中，从而导致元数据重复。这种重复的元数据会带来巨大的内存消耗和 I/O 开销以及多个分段的额外搜索开销。

文章的主要思想是设计一个全局共享的倒排索引，与时间分区方法相比，内存消耗和存储空间占用可以大大减少，此外倒排索引在内部进行了时间分区。对于每个tag，seriesId被分为多个分区，每个分区对应一个时间段，时间段本身也被编码在key中，这意味着对于多个时间段的查询可以很好的利用B+树的有序特性，元数据的扫描只需要一次；对于单次的查询也可以根据查询时间范围快速定位所需的分区，避免稀疏数据带来的额外扫描数据的开销（不做时间分区可能存在大量时间线指定时间区间内无数据）。

时序数据库查询的一般流程

以influxdb引擎举例子，引擎侧查询侧涉及TSI（基于Predicate筛选SeriesID），SeriesFile（基于SeriesID获取原始SerieKey）和TSM（基于SeriesID扫描压缩后的数据）三个结构。而不同的sql涉及的瓶颈则各不相同，举几个例子：

扫描

select field1，field2 from car where “taga” = ‘lizhaolong’
select aggregate（field1） from car where “taga” = ‘lizhaolong’
select selector（field1） from car where “taga” = ‘lizhaolong’

此时查询的开销基本集中在TSI和TSM，且大概率集中在TSM，但是也于数据本身的稀疏程度，基数有关

维度聚合

select field1，field2 from car where “taga” = ‘lizhaolong’ group by tagb
select aggregate（field1） from car where “taga” = ‘lizhaolong’ group by tagb
select selector（field1） from car where “taga” = 'lizhaolong group by tagb

通过TSI获取此次查询涉及到的SeriesIDSets后，需要基于SeriesID反查SeriesFile获取实际的tag组合，最后扫描数据

数据的稀疏程度，基数，写入流程中涉及到的时间线分布（影响反查SeriesFile）

时间聚合

select field1，field2 from car where “taga” = ‘lizhaolong’ group by tagb, time(12m)
select aggregate（field1） from car where “taga” = ‘lizhaolong’ group by tagb, time(12m)
select selector（field1） from car where “taga” = 'lizhaolong group by tagb, time(12m)

在之前的基础上，此时CPU的计算可能成为瓶颈，因为涉及到大量数据的聚合计算

管控语句

show tag values
show series cardinality

此时瓶颈基本存在在TSI查询和SeriesIDs的合并流程（虽然基于RoaringBitmap的合并很快，但是有时仍旧会成为瓶颈）

TagTree

从上一节可以看到，工程上的查询优化的流程并不是简单的替换某个结构就可以完成的，因为基于不同的条件，查询的瓶颈并不相同，所以对于结构的修改一般非常谨慎，我们需要衡量其优势和劣势，并针对于业务的场景做决策。

回到论文本身，TagTree的思路其实非常简洁，即通过合并多个时间分片中的倒排索引结构，并实现高效的B+树，和定期与磁盘结构合并的内存索引，以做到：

去除磁盘上重复的元数据存储
去除查询多个时间分片中倒排索引带来的内存消耗， I/O 开销以及额外搜索开销
写入性能不受影响

整体结构

优点看完了，我们来过一遍TagTree的设计，思考这样做可能存在的问题：

整体的设计有三个地方比较重要：

symbol table is a list of all strings that appear in the tags to reduce space overhead for duplicate strings.
The memory index and the index tree implement the inverted index which finds series IDs by tag sets.
The series manager contains a list of series entries that hold the metadata for each time series.

基于这里可以看出设计tagTree的团队至少已经意识到了tagkey/tagvalue本身带来的磁盘空间占用问题，所以引入symbol table，这里我认为可以理解为字典化减少存储开销

其次可以看到Index Tree和Series Manager的实现是基于Page cache的，而不是基于mmap，这样的好处我已经不想说了，influxdb使用mmap的行为目前来看实在是架构上最为错误的决定，带来了性能上的致命缺陷，而自己管理page cache和淘汰才是最优方案。

文中把倒排索引看作一个键值存储，那键的编码自然非常重要，文中认为每个唯一键都可以代表一个这个tag组合的SeriesSets的一个分段。

键本身分为四个部分：

tagkey的哈希值
tagvalue的哈希值
分区的起始时间戳
segment selector

key编码中加入时间最大的优势是查询中的Predicate在KeyNameSpace中被编码为一个区间，这个区间包含某个Predicate涉及的所有时间区间可以被一次B+树的查询找到起始点，随后利用B+树的有序优势，迅速索引到剩下的时间区间。

segment selector的概念其实是因为tagTree希望利用到seriesID到有序特性，SeriesSets在磁盘中采用bitmap存储，这样一个4kb的页可以存储32k个seriesID，但是因为seriesID本身是有序的，而tagTree全局唯一后SeriesID的分配也必将全局唯一，这样就导致伴随着时间的移动，可能存在一大片区间bitmap中永远为0，所以可以把SeriesSet的存储划分为N段，分段 1 涵盖 ID 为 0 至 32k 的时间序列，分段 2 涵盖 32k 至 64k 的时间序列，tagTree使用最低两个字节来指代SeriesSet的特定段，这意味着tagTree最多可以支持2^16*32k=2147450880的时间线上限，基本已经足够，但是我想说这样的做法不一定更节省存储（极端情况需要用4kb代表一个时间序列），而且以时序数据库的磁盘利用率来看这里也并不是瓶颈。

当然SeriesSets的页面还存储了这个tagkey对应在符号表中的引用，为了正则操作可以正确的进行。

从架构来看，Series Manager也是TagTree很重要的模块，功能可以类比influxdb中的SeriesFile，但是文中只是提了寥寥几笔，可以理解为这里的实现没有什么创新点，但是也同时可以看到series-cache的概念已经被用于非常多的时序数据库（Lindorm）。

The series manager contains a list of series entries and each entry is a tuple of the series ID of a time series and its tag set. The series entries are stored on the disk and the series manager maintains a series-cache in the memory to accelerate the access to the most recent time series. The series manager also handles loading series entries from the disk.

索引结构

索引本身的实现的高效依赖于copy-on-write B±tree，它以一种存储效率高的格式存储索引数据，但只支持通过内存组件进行分批插入。

内存中的结构不必多说，tagkey->tagvalue->SeriesSets，这里需要的是一个内存友好的倒排索引，在内存到达阈值后触发异步索引合并流程

异步索引合并对张贴列表页和树节点页都采用了写时复制的方法。

对于每个tag组合都需要顾及seriesSet的大小（前文提到是用segment selector+bitmap实现的），其次确定最小时间戳，与现有B+数中的分段执行合并后写入 shadow pages，随后从根节点开始修改PageID指向，创建新版本的copy-on-write tree。

新的时间序列已经被保留在磁盘，就可以截断WAL，丢弃内存数据，从而将内存索引的大小保持在阈值以下。

可能的问题

事实上优化思路是没错的，工程不是学术，对于一个新结构我们最关心的是这个特性的普适程度以及各种负载下的稳定性，目前看到的问题有这些：

现有的云数据库全面拥抱Parquet（IotDB tsfile）不是没道理的，分离索引设计带来的性能/存储开销一般来看不是性能瓶颈，反而带来了允许批量导入的极大优势，合并倒排索引后基本上断了批量导入就只能慢慢悠悠的写数据了，就连打包迁移都不好做。
Copy-on-write B+树本身的问题，
a. 数据一致性：在高并发环境中，读取操作可能会遇到数据一致性问题。虽然COW策略可以减少锁的使用，但在写操作发生时，读操作可能会读到旧的数据，因为它可能在新数据被完全写入之前就已经开始了。
b. 内存使用：由于COW需要在写操作时复制节点，这可能会导致内存使用的短暂增加，尤其是在大量写操作发生时。
c. 稳定的实现需要时间
优化的仅仅是TSI的查询部分，大多数查询语句瓶颈不在这里

测试

Q1 (single-groupby-1-1-1): Select one metric for one host (point query).
Q2 (cpu-max-all-1): Find all metrics for one host.
Q3 (single-groupby-1-8-1): Find one metric for each of 8 hosts.
Q4 (cpu-max-all-8): Find all metrics for 8 hosts.
Q5 (single-groupby-5-8-1): Find 5 metrics for each of the 8 hosts.
Q6: cpu{ metric !=“usage user”} This query selects time series for all CPU usages except usage user for all hosts. This query selects 90% of all time series in the database. This query is to test the performance of range queries with a large result set.

tagTree在时间跨度较长，Predicate涵盖范围较多，数据量较少，数据集不稀疏，计算较少，性能相对于一般倒排索引结构会有显著提升，显然测试中的case就是这样。

参考：

Reducing the storage overhead of main-memory oltp databases with hybrid indexes sigmod 2016
Db2 Event Store，A Purpose-Built IoT Database Engine
ByteSeries: an in-memory time series database for large-scale monitoring systems
TagTree: Global Tagging Index with Efficient Querying for Time Series Databases

你可能感兴趣的:(从一到无穷大,时序数据库,数据库)

为什么wal会提升数据库性能浩澜大大数据库
由于对于一个数据库内会存在很多张表，那么当数据库更新表数据时（1）直接写入磁盘实际写入的位置，会根据表的不同对应到不同的磁盘位置，在写入数据的时候，就会不停的寻找磁盘地址，找到地址后再去写入，对于机械硬盘来说，无规律的寻址是非常耗时的，对应SSD来说虽然性能提升很多，但是也会消耗时间；（2）先写入日志，在写入磁盘（WAL）WAL的过程，由于总是按照在文件末尾追加，只要找到文件写入位置，写入修改后，
数据结构奇妙旅程之深入解析快速排序山间漫步人生路数据结构排序算法算法
快速排序（QuickSort）是一种高效的排序算法，它使用了分治法的策略来将一个数组排序。其基本思想是选择一个基准元素，通过一趟排序将待排序的数据分割成独立的两部分，其中一部分的所有数据都比基准元素小，另一部分的所有数据都比基准元素大，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。工作原理选择基准：从待排序的序列中选一个元素作为基准（pivo
被隔离的日子（五）@三七会写作营三七会萍海临风
从隔离的初期，我们三人都不适应，彼此说话都还火药味十足。后随着时间的推移，到现在，我们仨人能够心平气和，幽默地对待彼此。看来，时间可真是个好东西，不仅能见证一个人的心性，还能看清自己的需求、他人的本质。今天晚上，孩子跑到厨房，告诉我她给人捐款了。我纳闷，不是给河南捐过款了么。当时，我还落后于她捐的呢。这次又捐给谁？看到我一脸狐疑，孩子说，还记得初四给她补课的那个男老师么？当让记得，当时，就因为是男
通俗易懂：MySQL中如何设置只读实例并确保数据一致性？大龄下岗程序员 mysql java mysql spring
在MySQL中设置只读实例主要应用于构建高可用性和扩展性的数据库环境，通常是为了分担读取负载或者用于备份和灾难恢复。以下是创建MySQL只读实例并确保数据一致性的基本步骤：1.创建并配置只读实例-主从复制设置-首先，你需要有一个主数据库实例（Master）负责接收所有的写操作。-创建一个或多个从数据库实例（Slave），并将它们配置为主数据库的复制品。这通常通过设置主从复制（Replication
《对我而言危险的他》：“假千金”归来，携手神秘霸总共破迷局入骨影评
由樊治欣李墨之主演的都市悬疑爱情剧《对我而言危险的他》在网上平台一次性播出全集。虽然是个小成本网剧，呈现出来的效果却十分有诚意。剧中从车祸到坠海、再到徒手灭火等惊险场面都是实景拍摄和主演们的无替身上场。说起樊治欣这个名字可能大家都不熟悉，但提起他演过的剧，大家都不陌生。饰演过《暗格里的秘密》中的学长苏柏从的樊治欣在这部剧中饰演霸总严星呈，即便同样戴着眼镜，却给人不一样的观感。该剧主要讲述了女主沈漫
男人请珍惜十六七岁陪在你身边的女孩吧小朋友嘿哈
你相信那种从校服到婚纱的爱情吗。01朋友阿伟18岁的时候就是一混混，放学不是和这个学校的学生约架，就是那个小弟被欺负了要为此出头，溜冰场上看谁不顺眼，一个字：打。当然，放学蹲点泡妞是常事，看到这个学生妹浓妆艳抹，搭讪，看到那个前凸后翘的，搭讪。阿伟也不例外，他说：“我当时和几个兄弟在学校后门的小卖部抽烟，姗姗背着双肩背包，扎着马尾辫，看到我们几个混混有些害怕的低着头快步走过我们面前，那时候我在想啊
第一章山洞传来牛铃声满眼荷花
春夏时节，田野一片青碧，山林薄雾蔼蔼，水草萋萋的小河边静静立着一只白鹭，像一位白头钓翁，在耐心地等鱼。王三乐牵着一头老黄牛，正在河边田埂上放牛。看见白鹭，他百无聊赖地捡起一块小石头扔了过去。白鹭动作舒缓、姿势优美地飞起避过，在空中飞行一段后，宛若晴空一片云，翩然而下，又静静立于河边青草间，继续呈现完美的画面。王三乐也觉得自己很无聊，这也难怪，从他记事起就开始放牛，一直到现在都大学毕业了，还没丢下放
浙江女大学生“卖淫日记”曝光，震惊全网：背后还藏着一个真相地球上的星星_272e
作者/在风来源/微信公众号：自黑思维最近，一个新闻震碎无数人的三观：在浙江农林大学，有一位女大学生，在网上公开自己的“卖淫日记”，无论是文字还是图片，都非常露骨。而目前关于这事的瓜，都已经被删得七七八八，但我有保留截图的习惯，所以才有了这篇文章。首先，必须要强调的一点，就是这事不是谣传，是真的，学校已经出来证实过。只是学校表示该名女学生有精神病。但到底是不是真的精神有问题？我们可以从她的日记里，略
C#中的PLINQ和LINQ的效率对比搬砖的诗人Z C#c#linq 开发语言
PLINQ（ParallelLINQ）和LINQ（LanguageIntegratedQuery）都是.NET框架中的功能，用于对集合进行查询和操作。它们之间的主要区别在于并行处理能力。LINQ:LINQ是一种用于在.NET应用程序中进行数据查询和操作的语言集成功能。它提供了一种统一的方式来查询各种数据源，如集合、数组、XML、数据库等。LINQ是在单线程环境中执行查询操作的，因此对于大型数据集或
chrome扩展，“manifest_version“: 3, chrome 扩展图标点击事件徐同保 chrome 前端
在Chrome扩展中，从ManifestV3开始，后台脚本（backgroundscripts）被服务工作线程（serviceworkers）所取代。这改变了扩展图标点击事件（通常称为浏览器操作或者页面操作）的处理方式。在ManifestV3中，您需要使用chrome.action.onClicked监听器来处理扩展图标的点击事件。下面是一个如何设置扩展图标点击事件处理器的示例：在manifest
2022-03-10 花满三春
梦想花开六月的风吹在我的脸上，在我的心里留下了遗憾，看着这惨不忍睹的分数，我收起了我的年少轻狂。天气很热，但我的心很冷，我盯着镜子中的自己，握紧了拳头，眼睛红红的，突然，一行晶莹的液体从我脸上滑落，那些晶莹的液体不断地在我脸上落下，唉？镜子中的我脸怎么有泪痕？哦，我原来哭了,我笑了，我不知道我到底在笑什么，是笑我怎么这么懦弱，还是笑我这么不争气。努力复习了这么久，小考才考这么点分，我放任我的泪水，
看上你是见色起意，但追求你却是真心实意16 时光总是姗姗而来
咚咚咚，“谁啊，请进”经理稍微有些失落的回应着，“经理，有人找你。”“谁啊”“不认识，他在后面”“好，让他进来吧。”听到经理让我进去，我跟工作人员示意了一下，然后就进去了，“你好，请问，你有什么事吗？”经理客气的问道。“我想，我能帮你把你的这个娱乐城，从现在的人烟稀少，变的繁荣昌盛。”经理一听，有些无奈，但也随便回应了一下“哦是嘛，我现在是什么办法都没有了，你有什么办法嘛？”我看到经理的脸色有些失
如何呵护孩子的兴趣婉叶老师
“老师你教国画吗？”又一个微友这样问我。“怎么啦？”我很想听她后面的言外之意。“我觉得我家孩子很喜欢画画的，可是感觉她画得一般，没什么天赋啊……”感觉这位妈妈有些小焦虑。“传些作品给我看看呢。”那位妈妈传了三张。我先不看画怎样，只看孩子的状态。因为一个孩子是否对参加的课外班真有兴趣这是关键。我看孩子笑得很开心，手里的画也已经有了一些浓淡变化。按专业的眼光看，虽说从造型上、笔法上有待进一步提升，但是
docker怎么端口映射 Lance_mu docker 容器运维
1、默认固定的端口#Web服务器：WebApache或Nginx通常使用80端口HTTP：80HTTPS：443#数据库服务器MySQL：3306PostgreSQL：5432MongoDB：27017Redis：6379#邮件服务器SMTP：25POP3：110IMAP：143#其他服务SSH：22FTP：21DNS（域名解析）：53代理服务器Squid：3128版本控制系统Git：9418(S
放飞自我朵朵颐
图片发自App这个图是今天我分享的视频截屏下来的，设计师的创意让人感动，看着这个设计就会想设计师的灵感来源于哪里？设计师是一个什么样的人？设计师一定是一个放飞自我的人了，我心中充满喜悦之情去欣赏这个设计，它的精彩之处是每个人都可以从自己的角度去看待这个艺术品，我觉得它像一个镜头，光圈、焦距、快门。。。中间白色的一圈是最终曝光的地方，我想创意来源于手动变焦相机。听完马云的讲话，我脑海里浮现出“放飞自
新注册的阿里云账号有哪些优惠？阿里云新用户必看优惠大合集阿里云最新优惠和活动汇总
很多用户看到阿里云各种活动中的云服务器、云数据库、企业邮箱等云产品都仅限新用户购买之后，都纷纷直接注册了阿里云新账号之后购买，其实，阿里云新用户不仅可以优惠购买活动中的各种云产品，还有很多优惠，下面是“阿里云最新优惠和活动汇总”整理汇总的阿里云新用户必看优惠大合集。新注册的阿里云账号在购买活动中的云产品之前，还有免费领云产品通用代金券、抽取无门槛代金券、免费试用云服务器和正式购买云服务器等阿里云产
【真诚子】通晓鬼谷第七篇读书日记。真诚子l通晓鬼谷
今天把个人品牌，从193读到208页，书的内容质量出奇的高，尤其是这一段。对标学习法，找一个比自己强，或者你期望成为的人进行模仿性学习，对标学习，不是到处，去找人对标兵学习很多人的优点，或是学习自己认为好的方面，而是找准一个对标高手，然后全方位的学习这个人。我在做品牌咨询时就对标，学习了一个在国内很有名的行业顶尖大咖。我先找到他公司的方案，进行完全模仿，连PPT的排版都一样，而且我只参照他一个人的
“播下种子，亲近梦想”北京研学营日记Day2 贝壳Bella
到目前为止，没有收到同学们想家的反馈，应该没有孩子哭，从门外听到的也是一片安静，估计一个个都进入了梦想。从6:30至9:00回到酒店，的确有些辛苦。有些孩子坚持得很好，有些在下午五点离开科技馆时已经疲惫不堪，嚷嚷着回酒店。于是，餐后在车上立了一个规矩，明天在长城上喊累不能超过三次，因为这也是会传染的。图片发自App从科技馆步行至鸟巢，在等红绿灯时居然就有同学蹲下了。有些孩子一上车睡觉，养好精神，路
flutter boost 如何从native跳转到flutter页面 Icarus_ flutter flutter
FlutterBoost是一个Flutter插件，它可以帮助开发者在原生应用和Flutter应用之间无缝跳转。以下是一些基本步骤，展示了如何使用FlutterBoost从原生（Native）页面跳转到Flutter页面。1.配置FlutterBoost在你的Flutter项目中集成FlutterBoost插件。这通常涉及到修改`pubspec.yaml`文件来添加依赖项，并根据FlutterBoo
掌握Flutter底部导航栏：畅游导航之旅繁依Fanyi xml json sql flutter 开发语言前端 git
1.引言在移动应用开发中，底部导航栏是一种常见且非常实用的用户界面元素。它提供了快速导航至不同功能模块或页面的便捷方式，使用户可以轻松访问应用程序的各个部分。在Flutter中，底部导航栏也是一项强大的功能，开发者可以利用Flutter框架提供的丰富组件和灵活性，轻松实现各种样式和交互效果的底部导航栏。本文将深入探讨Flutter中底部导航栏的实现方法，从基础的结构搭建到高级功能的应用，带领读者逐
地缚少年花子君，一个小小的甜甜圈，源光看见了源辉内心的小秘密 ACGN安乐
大家好我是小安，很高兴又和大家见面了，话不多说我们直接进入正题，不知大家对日本动画《地缚少年花子君》中海鸥学院高等部二年级生，学生会的会长源辉了解多少呢？源辉从第一集中就已经登场，他是源光的哥哥，也是八寻宁宁的理想对象之一，源辉除了有学生这层身份之外和他的弟弟源光一样都是拔除师，也就是我们统称的除妖师，从表面来看源辉是个高颜值帅哥，脾气很好同时也有很多女孩子想做他的女朋友，但金无足赤人无完人大家也
MyBatis高级面试题-2024 my_styles mybatis java 开发语言面试题
MyBatis的核心组件有哪些？首先第一个是，SqlSessionFactory，它就像是一个会话工厂。它的任务是创建SqlSession对象，这个对象是我们与数据库交互的主要途径。SqlSessionFactory的作用很重要，因为它可以帮我们配置数据库连接信息和事务管理等。一旦这个工厂被建立起来，它就会加载一些必要的配置和映射文件，为后续的数据库操作提供一个可靠的基础。第二个是SqlSessi
SQLite版本3中的文件锁定和并发(七）代码工匠云数据库 SQLite C与c++sqlite c++数据库
返回：SQLite—系列文章目录上一篇：自己编译SQLite或将SQLite移植到新的操作系统（六）下一篇：SQLite—系列文章目录正文：1.0SQLite版本3中的文件锁定和并发SQLite版本3.0.0引入了新的锁定和日志功能旨在提高SQLite版本2的并发性的机制并减少作家的饥饿问题。新机制还允许交易的原子提交涉及多个数据库文件。本文档介绍新的锁定机制。目标受众是想要理解和/或修改的程序员
上班族适合兼职的副业有哪些？分享五个适合上班族做的副业高省张导师
对于许多上班族来说，除了日常工作外，还有大量的空闲时间，因此兼职成为了一项非常普遍的选择。下面将向您介绍五个不错的兼职副业，每个兼职都可以很容易地从家中启动，同时也是一个短期见效的方式，可以让您很快增加收入。大家好，我是高省APP最大团队，【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码520888，注册送2皇冠会员，送万元推广大礼包。1、社交导购电商
如何把大象装进冰箱的思考 210624 大丁_初心生活
央视春晚曾有个小品，宋丹丹问赵本山，如何把大象装进冰箱。赵本山说不知道。宋丹丹得意地说，第一步，把冰箱门打开。第二步，把大象装进去。第三步，把冰箱门关上。我相信很多人看了都是一笑了之，我们也从潜意识上给出了否定的答案。樊登老师给出了不一样的解读，他认为这其实是解决问题的经典方法。“把大象装冰箱”，目标十分明确，宋丹丹给出的执行步骤也十分清晰。可赵本山却不会？难道赵本山不知道这三个步骤吗？肯定知道。
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
生活中的很多事是既令人生气又令人伤感，但却还无可奈何城中隐士
今天一打开手机，就看到姨娘家的姐姐兰兰在抖音上发了一则信息，信息内容如下：“我绝对不是我爸妈亲生的，不知他们是从哪儿把我捡回来的”。图源网络，侵则必删今天一大早，天刚蒙蒙亮，姨父就着急莫慌给姨妈家姐姐来一电话，说是家里今天有急事，喊她赶紧回去。还没等姐姐反应过来，姨父就草草地挂断了电话。吓得姐姐立马清醒，以为家里不知出了多大的事？她赶紧从床上爬起来以最快速度第一时间从温江赶到中江。等她顶着烈日，风
追逐梦想悦读山人
你要想飞翔，不必成为鸟，但一定要行动。只要你坚信自己所信奉的，自己都不知道自己会做到怎样的极致。当生活中，遇到这样的坚持，会被谓之为“犟”、“固执”、“顽固”，而当我们看到这样的坚持最终也会散发不一样的光辉时，心里就有别样的感动。看《血战钢锯岭》，被道斯和多萝西的理解和坚持所感动。戴斯蒙德·道斯拒绝携带武器上战场，从他发誓不摸枪那刻起，就真的不摸枪了，哪怕入伍、上战场。他是为救人而去，而非为杀人而
2018-12-02 子分小
姓名：张颖公司：菲尔德国际英语【反省总结第146天，始于20180709今天是20181202】【知～学习】六项精进大纲背诵3遍每天十个单词坚持第181天每天学习一篇英文文章第94天英语流利说课程第71天学习30分钟【行～实践】一、修身：（对自己个人）步行5000步二、齐家：（对家庭和家人）无三、建功：（对工作)完成与Arti活动课和两节Demo准备开班事宜｛积善｝：发愿从2018年7月9日起1年
『阅读•思考•灵性新苑‖第九辑/358/1001』《冥想》2作者：[印]斯瓦米·拉玛（Swami Rama）译者：刘海凝景熙惟
部分节选当我们仔细审视生活，就会意识到：从幼年开始，我们接受的教育就仅仅止于观察和了解外部世界。从来没人教导过我们，应当如何向内看、发现和了解内在。因此我们在渴望了解别人的同时，对自己而言却依然是一个陌生人。由于缺乏自我了解，我们的人际关系并不那么称心如意，生活中也常常充满了困惑与失望。事实上，常规教育体系只开发了我们大脑的一小部分。而另外负责做梦、睡眠以及用于存储所有经历的无意识领域，仍不为人知
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他