google 面试复习资料

发信人: mudhoof (正在长牙的羊), 信区: JobHunting
标题: 这么热闹, 我也报Google offer
发信站: BBS 未名空间站 (Tue Feb 23 12:32:47 2010, 美东)

今天刚刚通知的, 特别感谢一起讨论的krone, geniusxsy, hnm, 特别是blaze教了我很
多, 还要特别感谢mitbbs59的总结帖

一起报offer, 好事成三, 大吉大利, 包子分光为止

贴下我的复习材料

题目大全:

http://toptechnotes.blogspot.com/search/label/algorithm
http://www.spellscroll.com/viewquestions/?tag=algorithm
http://www.thecareerplus.com/?page=resources&cat=10
http://interviewcyclopedia.blogspot.com/
http://www.doctorinterview.com/A.html

版面总结
http://www.mitbbs.com/article/JobHunting/31505215_4.html

Bitwise题目
http://graphics.stanford.edu/~seander/bithacks.html

DP 经典
http://people.csail.mit.edu/bdean/6.046/dp/

算法进阶
http://www.topcoder.com/tc?module=Static&d1=tutorials&d2=alg_index

复习书籍 (csdn 都很容易找到)

Algorithm in C by Robert Sedgewick
CLRS
careercup top 150 question
programing interview exposed
programming pearls
effective c++
design patterns

练习编程强烈推荐topcoder, 不过要挑着做, 针对算法相关题目

另外我强力推荐这篇帖子, 以前贴过但是很快沉了

发信人: phylips (星星||一年磨十剑), 信区: Algorithm
标题: 大数据量，海量数据处理方法总结
发信站: 兵马俑BBS (Thu Nov 26 16:32:38 2009), 本站(bbs.xjtu.edu.cn)
最近有点忙，稍微空闲下来，发篇总结贴。

大数据量的问题是很多面试笔试中经常出现的问题，比如baidu google 腾讯这样的一
些涉及到海量数据的公司经常会问到。

下面的方法是我对海量数据的处理方法进行了一个一般性的总结，当然这些方法可能并
不能完全覆盖所有的问题，但是这样的一些方法也基本可以处理绝大多数遇到的问题。
下面的一些问题基本直接来源于公司的面试笔试题目，方法不一定最优，如果你有更好
的处理方法，欢迎与我讨论。

1.Bloom filter

适用范围：可以用来实现数据字典，进行数据的判重，或者集合求交集

基本原理及要点：
对于原理来说很简单，位数组+k个独立hash函数。将hash函数对应的值的位数组置1，
查找时如果发现所有hash函数对应位都是1说明存在，很明显这个过程并不保证查找的
结果是100%正确的。同时也不支持删除一个已经插入的关键字，因为该关键字对应的位
会牵动到其他的关键字。所以一个简单的改进就是 counting Bloom filter，用一个
counter数组代替位数组，就可以支持删除了。

还有一个比较重要的问题，如何根据输入元素个数n，确定位数组m的大小及hash函数个
数。当hash函数个数k=(ln2)*(m/n)时错误率最小。在错误率不大于E的情况下，m至少
要等于n*lg(1/E)才能表示任意n个元素的集合。但m还应该更大些，因为还要保证bit数
组里至少一半为 0，则m应该>=nlg(1/E)*lge 大概就是nlg(1/E)1.44倍(lg表示以2为底
的对数)。

举个例子我们假设错误率为0.01，则此时m应大概是n的13倍。这样k大概是8个。

注意这里m与n的单位不同，m是bit为单位，而n则是以元素个数为单位(准确的说是不同
元素的个数)。通常单个元素的长度都是有很多bit的。所以使用bloom filter内存上通
常都是节省的。

扩展：
Bloom filter将集合中的元素映射到位数组中，用k（k为哈希函数个数）个映射位是否
全1表示元素在不在这个集合中。Counting bloom filter（CBF）将位数组中的每一位
扩展为一个counter，从而支持了元素的删除操作。Spectral Bloom Filter（SBF）将
其与集合元素的出现次数关联。SBF采用counter中的最小值来近似表示元素的出现频率。

问题实例：给你A,B两个文件，各存放50亿条URL，每条URL占用64字节，内存限制是4G
，让你找出A,B文件共同的URL。如果是三个乃至n个文件呢？

根据这个问题我们来计算下内存的占用，4G=2^32大概是40亿*8大概是340亿，n=50亿，
如果按出错率0.01算需要的大概是650亿个bit。现在可用的是340亿，相差并不多，这
样可能会使出错率上升些。另外如果这些urlip是一一对应的，就可以转换成ip，则大
大简单了。

2.Hashing

适用范围：快速查找，删除的基本数据结构，通常需要总数据量可以放入内存

基本原理及要点：
hash函数选择，针对字符串，整数，排列，具体相应的hash方法。
碰撞处理，一种是open hashing，也称为拉链法；另一种就是closed hashing，也称开
地址法，opened addressing。

扩展：
d-left hashing中的d是多个的意思，我们先简化这个问题，看一看2-left hashing。2
-left hashing指的是将一个哈希表分成长度相等的两半，分别叫做T1和T2，给T1和T2
分别配备一个哈希函数，h1和h2。在存储一个新的key时，同时用两个哈希函数进行计
算，得出两个地址h1[key]和h2[key]。这时需要检查T1中的h1[key]位置和T2中的h2[
key]位置，哪一个位置已经存储的（有碰撞的）key比较多，然后将新key存储在负载少
的位置。如果两边一样多，比如两个位置都为空或者都存储了一个key，就把新key 存
储在左边的T1子表中，2-left也由此而来。在查找一个key时，必须进行两次hash，同
时查找两个位置。

问题实例：
1).海量日志数据，提取出某日访问百度次数最多的那个IP。

IP的数目还是有限的，最多2^32个，所以可以考虑使用hash将ip直接存入内存，然后进
行统计。

3.bit-map

适用范围：可进行数据的快速查找，判重，删除，一般来说数据范围是int的10倍以下

基本原理及要点：使用bit数组来表示某些元素是否存在，比如8位电话号码

扩展：bloom filter可以看做是对bit-map的扩展

问题实例：

1)已知某个文件内包含一些电话号码，每个号码为8位数字，统计不同号码的个数。

8位最多99 999 999，大概需要99m个bit，大概10几m字节的内存即可。

2)2.5亿个整数中找出不重复的整数的个数，内存空间不足以容纳这2.5亿个整数。

将bit-map扩展一下，用2bit表示一个数即可，0表示未出现，1表示出现一次，2表示出
现2次及以上。或者我们不用2bit来进行表示，我们用两个bit-map即可模拟实现这个
2bit-map。

4.堆

适用范围：海量数据前n大，并且n比较小，堆可以放入内存

基本原理及要点：最大堆求前n小，最小堆求前n大。方法，比如求前n小，我们比较当
前元素与最大堆里的最大元素，如果它小于最大元素，则应该替换那个最大元素。这样
最后得到的n个元素就是最小的n个。适合大数据量，求前n小，n的大小比较小的情况，
这样可以扫描一遍即可得到所有的前n元素，效率很高。

扩展：双堆，一个最大堆与一个最小堆结合，可以用来维护中位数。

问题实例：
1)100w个数中找最大的前100个数。

用一个100个元素大小的最小堆即可。

5.双层桶划分

适用范围：第k大，中位数，不重复或重复的数字

基本原理及要点：因为元素范围很大，不能利用直接寻址表，所以通过多次划分，逐步
确定范围，然后最后在一个可以接受的范围内进行。可以通过多次缩小，双层只是一个
例子。

扩展：

问题实例：
1).2.5亿个整数中找出不重复的整数的个数，内存空间不足以容纳这2.5亿个整数。

有点像鸽巢原理，整数个数为2^32,也就是，我们可以将这2^32个数，划分为2^8个区域
(比如用单个文件代表一个区域)，然后将数据分离到不同的区域，然后不同的区域在利
用bitmap就可以直接解决了。也就是说只要有足够的磁盘空间，就可以很方便的解决。

2).5亿个int找它们的中位数。

这个例子比上面那个更明显。首先我们将int划分为2^16个区域，然后读取数据统计落
到各个区域里的数的个数，之后我们根据统计结果就可以判断中位数落到那个区域，同
时知道这个区域中的第几大数刚好是中位数。然后第二次扫描我们只统计落在这个区域
中的那些数就可以了。

实际上，如果不是int是int64，我们可以经过3次这样的划分即可降低到可以接受的程
度。即可以先将int64分成2^24个区域，然后确定区域的第几大数，在将该区域分成2^
20个子区域，然后确定是子区域的第几大数，然后子区域里的数的个数只有2^20，就可
以直接利用direct addr table进行统计了。

6.数据库索引

适用范围：大数据量的增删改查

基本原理及要点：利用数据的设计实现方法，对海量数据的增删改查进行处理。
扩展：
问题实例：

7.倒排索引(Inverted index)

适用范围：搜索引擎，关键字查询

基本原理及要点：为何叫倒排索引？一种索引方法，被用来存储在全文搜索下某个单词
在一个文档或者一组文档中的存储位置的映射。

以英文为例，下面是要被索引的文本：
T0 = "it is what it is"
T1 = "what is it"
T2 = "it is a banana"
我们就能得到下面的反向文件索引：
"a": {2}
"banana": {2}
"is": {0, 1, 2}
"it": {0, 1, 2}
"what": {0, 1}
检索的条件"what", "is" 和 "it" 将对应集合的交集。

正向索引开发出来用来存储每个文档的单词的列表。正向索引的查询往往满足每个文档
有序频繁的全文查询和每个单词在校验文档中的验证这样的查询。在正向索引中，文档
占据了中心的位置，每个文档指向了一个它所包含的索引项的序列。也就是说文档指向
了它包含的那些单词，而反向索引则是单词指向了包含它的文档，很容易看到这个反向
的关系。

扩展：

问题实例：文档检索系统，查询那些文件包含了某单词，比如常见的学术论文的关键字
搜索。

8.外排序

适用范围：大数据的排序，去重

基本原理及要点：外排序的归并方法，置换选择败者树原理，最优归并树

扩展：

问题实例：
1).有一个1G大小的一个文件，里面每一行是一个词，词的大小不超过16个字节，内存
限制大小是1M。返回频数最高的100个词。

这个数据具有很明显的特点，词的大小为16个字节，但是内存只有1m做hash有些不够，
所以可以用来排序。内存可以当输入缓冲区使用。

9.trie树

适用范围：数据量大，重复多，但是数据种类小可以放入内存

基本原理及要点：实现方式，节点孩子的表示方式

扩展：压缩实现。

问题实例：
1).有10个文件，每个文件1G，每个文件的每一行都存放的是用户的query，每个文件
的query都可能重复。要你按照query的频度排序。

2).1000万字符串，其中有些是相同的(重复),需要把重复的全部去掉，保留没有重复的
字符串。请问怎么设计和实现？

3).寻找热门查询：查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不
超过3百万个，每个不超过255字节。

10.分布式处理 mapreduce

适用范围：数据量大，但是数据种类小可以放入内存

基本原理及要点：将数据交给不同的机器去处理，数据划分，结果归约。

扩展：

问题实例：

1).The canonical example application of MapReduce is a process to count the
appearances of

each different word in a set of documents:
void map(String name, String document):
// name: document name
// document: document contents
for each word w in document:
EmitIntermediate(w, 1);

void reduce(String word, Iterator partialCounts):
// key: a word
// values: a list of aggregated partial counts
int result = 0;
for each v in partialCounts:
result += ParseInt(v);
Emit(result);
Here, each document is split in words, and each word is counted initially
with a "1" value by

the Map function, using the word as the result key. The framework puts
together all the pairs

with the same key and feeds them to the same call to Reduce, thus this
function just needs to

sum all of its input values to find the total appearances of that word.

2).海量数据分布在100台电脑中，想个办法高效统计出这批数据的TOP10。

3).一共有N个机器，每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。如
何找到N^2个数的中数(median)？

经典问题分析

上千万or亿数据（有重复），统计其中出现次数最多的前N个数据,分两种情况：可一次
读入内存，不可一次读入。

可用思路：trie树+堆，数据库索引，划分子集分别统计，hash，分布式计算，近似统
计，外排序

所谓的是否能一次读入内存，实际上应该指去除重复后的数据量。如果去重后数据可以
放入内存，我们可以为数据建立字典，比如通过 map，hashmap，trie，然后直接进行
统计即可。当然在更新每条数据的出现次数的时候，我们可以利用一个堆来维护出现次
数最多的前N个数据，当然这样导致维护次数增加，不如完全统计后在求前N大效率高。

如果数据无法放入内存。一方面我们可以考虑上面的字典方法能否被改进以适应这种情
形，可以做的改变就是将字典存放到硬盘上，而不是内存，这可以参考数据库的存储方
法。

当然还有更好的方法，就是可以采用分布式计算，基本上就是map-reduce过程，首先可
以根据数据值或者把数据hash(md5)后的值，将数据按照范围划分到不同的机子，最好
可以让数据划分后可以一次读入内存，这样不同的机子负责处理各种的数值范围，实际
上就是map。得到结果后，各个机子只需拿出各自的出现次数最多的前N个数据，然后汇
总，选出所有的数据中出现次数最多的前N个数据，这实际上就是reduce过程。

实际上可能想直接将数据均分到不同的机子上进行处理，这样是无法得到正确的解的。
因为一个数据可能被均分到不同的机子上，而另一个则可能完全聚集到一个机子上，同
时还可能存在具有相同数目的数据。比如我们要找出现次数最多的前100个，我们将
1000万的数据分布到10台机器上，找到每台出现次数最多的前 100个，归并之后这样不
能保证找到真正的第100个，因为比如出现次数最多的第100个可能有1万个，但是它被
分到了10台机子，这样在每台上只有1千个，假设这些机子排名在1000个之前的那些都
是单独分布在一台机子上的，比如有1001个，这样本来具有1万个的这个就会被淘汰，
即使我们让每台机子选出出现次数最多的1000个再归并，仍然会出错，因为可能存在大
量个数为1001个的发生聚集。因此不能将数据随便均分到不同机子上，而是要根据hash
后的值将它们映射到不同的机子上处理，让不同的机器处理一个数值范围。

而外排序的方法会消耗大量的IO，效率不会很高。而上面的分布式方法，也可以用于单
机版本，也就是将总的数据根据值的范围，划分成多个不同的子文件，然后逐个处理。
处理完毕之后再对这些单词的及其出现频率进行一个归并。实际上就可以利用一个外排
序的归并过程。

另外还可以考虑近似计算，也就是我们可以通过结合自然语言属性，只将那些真正实际
中出现最多的那些词作为一个字典，使得这个规模可以放入内存。

转载请注明出处：http://bbs.xjtu.edu.cn
作者phylips@bmy

参考文献：
http://blog.csdn.net/jiaomeng/archive/2007/03/08/1523940.aspx d-Left Hashing
http://blog.csdn.net/jiaomeng/archive/2007/01/27/1495500.aspx
http://en.wikipedia.org/wiki/Bloom_filter
http://hi.baidu.com/xdzhang_china/blog/item/2847777e83fb020229388a15.html 应用Bloom Filter的几个小技巧
http://zh.wikipedia.org/wiki/%E5%80%92%E6%8E%92%E7%B4%A2%E5%BC%95

发信人: cshyh (Zakklars), 信区: Algorithm
标题: Re: 大数据量，海量数据处理方法总结
发信站: 兵马俑BBS (Thu Nov 26 20:02:27 2009), 本站(bbs.xjtu.edu.cn)

嗯比较不错啊想了下比较常见的里面没写赫赫有名的二叉排序树

发信人: phylips (星星||一年磨十剑), 信区: Algorithm
标题: Re: 大数据量，海量数据处理方法总结
发信站: 兵马俑BBS (Thu Nov 26 22:36:34 2009), 本站(bbs.xjtu.edu.cn)

恩可以加下
另外i/o 优化方面并没有太多涉及，如果对于这方面谁比较有心得可以补充一下

发信人: appsony (懒羊羊), 信区: Algorithm
标题: Re: 大数据量，海量数据处理方法总结
发信站: 兵马俑BBS (Thu Nov 26 22:38:05 2009), 本站(bbs.xjtu.edu.cn)

很不错啊比较全面。bloom filter确实不错，刚看managing gigabytes这本书，里面
讲索引的一种建法也是这种思想。

发信人: appsony (懒羊羊), 信区: Algorithm
标题: Re: 大数据量，海量数据处理方法总结
发信站: 兵马俑BBS (Thu Nov 26 22:41:11 2009), 本站(bbs.xjtu.edu.cn)

话说应对这类面试题，把编程珠玑研究透彻就差不多了。平常用的话，Managing
gigabytes这本书值得推荐一下。

发信人: phylips (星星||一年磨十剑), 信区: Algorithm
标题: 面试题目-大数据量专题
发信站: 兵马俑BBS (Thu Nov 26 16:30:44 2009), 本站(bbs.xjtu.edu.cn)

1. 给你A,B两个文件，各存放50亿条URL，每条URL占用64字节，内存限制是4G，让你找
出A,B文件共同的URL。

2. 有10个文件，每个文件1G，每个文件的每一行都存放的是用户的query，每个文件
的query都可能重复。要你按照query的频度排序

3. 有一个1G大小的一个文件，里面每一行是一个词，词的大小不超过16个字节，内存
限制大小是1M。返回频数最高的100个词

4.海量日志数据，提取出某日访问百度次数最多的那个IP。

5.2.5亿个整数中找出不重复的整数，内存空间不足以容纳这2.5亿个整数。

6.海量数据分布在100台电脑中，想个办法高效统计出这批数据的TOP10。

7.怎么在海量数据中找出重复次数最多的一个

8.上千万or亿数据（有重复），统计其中出现次数最多的前N个数据。

统计可以用hash,二叉数,trie树。对统计结果用堆求出现的前n大数据。增加点限制可
以提高效率，比如出现次数>数据总数／N的一定是在前N个之内

9.1000万字符串，其中有些是相同的(重复),需要把重复的全部去掉，保留没有重复的
字符串。请问怎么设计和实现？

10.一个文本文件，大约有一万行，每行一个词，要求统计出其中最频繁出现的前十个
词。请给出思想，给时间复杂度分析。

11.一个文本文件，也是找出前十个最经常出现的词，但这次文件比较长，说是上亿行
或者十亿行，总之无法一次读入内存，问最优解。

12.有10个文件，每个文件1G，每个文件的每一行都存放的是用户的query，每个文件
的query都可能重复要按照query的频度排序

13.100w个数中找最大的前100个数

14.寻找热门查询：
搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的
长度为1-255字节。假设目前有一千万个记录，
这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个。
一个查询串的重复度越高，说明查询它的用户越多，
也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。
（1）请描述你解决这个问题的思路；
（2）请给出主要的处理流程，算法，以及算法的复杂度。

15.一共有N个机器，每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。
如何找到N^2个数的中数(median)？

本文由phylips@bmy收集整理，转载请注明出处http://bbs.xjtu.edu.cn
谢谢合作。

有一个1G的数组a,元素是0到2^30-1的自然数.
我想把他打乱成随机的顺序,最简单的实现(代码最简)和时间最优的实现分别是什么?

求算法：从一千万个数字里找出100个最大的数的最快算法。

seabao 于 Wed Oct 21 18:58:06 2009 提到：

堆排序这种解决方案都是堆排序。

都是面试惹得祸...

还有其他点可以忽悠：

1. 多线程去做会更快。
2. 比较fashion的解决方案，MapReduce 我不知道怎么实现，但是大致意思还好。

如果能把MapReduce的问题了解清楚，这样回答的话，估计大部分面试官都能被忽悠住。

duoduolo 于 Thu Oct 22 09:16:47 2009 提到：

第k大元素那个算法么

BlueBore 于 Fri Oct 23 09:18:58 2009 提到：

这个数据量很小，用堆排或快排，平均复杂度都是O(n)，快排常数因子更小些

如果数据量大了选择并行算法，把问题拆开，分配到t个计算节点上，分别堆排，把本
来n*lg100的问题转化为t个(n/t)lg100的问题，最后归并的代价是O(lgt),所以总的代
价就是O(lgt+n/t),最后根据数据的规模选择t的大小。

http://blog.csdn.net/lanphaday/archive/2008/12/18/3547899.aspx

http://space.cnblogs.com/question/4423/

※ 修改:·mudhoof 於 Feb 23 13:14:17 2010 修改本文·[FROM: 129.128.]
※ 来源:·WWW 未名空间站海外: mitbbs.com 中国: mitbbs.cn·[FROM: 129.128.]

你可能感兴趣的:(Google)

python中使用grpc方法示例_Python中使用grpc与consul weixin_39719077
gRPC客户端和服务端可以在多种环境中运行和交互，并且可以用任何gRPC支持的语言来编写。gRPC支持C++JavaPythonGoRubyC#Node.jsPHPDart等语言gRPC默认使用protocolbuffers，这是Google开源的一种轻便高效的结构化数据存储格式，可以用于结构化数据串行化，或者说序列化。它很适合做数据存储或RPC数据交换格式。安装GoogleProtocolBuf
.NET Core 开发中的鉴权技术全解析爱吃香蕉的阿豪 .netcore 鉴权 jwt token
目录鉴权基础概念鉴权与授权的区别鉴权在.NETCore中的核心地位常见鉴权方式Cookie鉴权工作原理实现步骤JWT鉴权工作原理实现步骤OAuth2鉴权工作原理实现步骤（以Google登录为例）实际应用场景与选择策略不同场景下的鉴权技术应用鉴权技术选择策略总结鉴权基础概念鉴权与授权的区别特性鉴权（Authentication）授权（Authorization）目的验证用户身份（“你是谁？”）控制资
Chromium 136 编译指南 Ubuntu篇：环境搭建与源码获取（一）守城小轩浏览器开发指纹浏览器浏览器开发 chrome chrome devtools 超级浏览器
1.引言随着Web技术的飞速发展和应用场景的不断拓展，浏览器引擎的重要性日益凸显。Chromium作为现代浏览器生态系统的核心引擎，不仅驱动着全球超过70%的网络流量，更是众多知名浏览器如GoogleChrome、MicrosoftEdge、Opera以及新兴的Brave等产品的技术基石。其卓越的渲染性能、先进的安全机制和高度模块化的架构设计，使得越来越多的开发者希望基于Chromium进行深度定
学习AI机器学习所需的数学基础 frostmelody 机器学习小知识点人工智能学习机器学习
一、机器学习岗位的数学需求矩阵机器学习岗位研究型职位工业界职位DeepMind/Meta/Google研究部门研究科学家/研究工程师普通科技公司机器学习工程师/数据科学家需硕士/博士数学水平本科数学基础二、数学需求深度解析1.研究型职位（需深度数学）学历要求：数学/物理/计算机/统计/工程本科基础硕士/博士优先（Kaggle调查显示博士占比高）薪资关联：学历与收入呈正相关2.工业界职位（基础数学）
【C/C++】单元测试实战：Stub与Mock框架解析 CodeWithMe C/C++c语言 c++单元测试
C++单元测试中的Stub/Mock框架详解在单元测试中，Stub（打桩）和Mock都是替代真实依赖以简化测试的技术。通常，Stub（或Fake）提供了一个简化实现，用于替代生产代码中的真实对象（例如用内存文件系统替代磁盘文件系统），而Mock则是在运行时预设了期望行为的对象，用来验证代码与依赖之间的交互是否符合预期。下面我们重点介绍几种常见的C++Stub/Mock框架：GoogleMock、F
专注搜索引擎优化的专业模板平台 wodrpress资源分享独立站搜索引擎 moban html
SEO模板seomoban.com定位：致力于提供SEO友好型网站模板，核心目标是帮助用户提升网站在搜索引擎中的排名和在线可见性。核心优势与技术特性：深度SEO优化所有模板均经SEO专家审核，确保代码结构简洁规范，符合搜索引擎爬虫索引标准，从底层提升收录效率。集成元标签编辑器、关键词优化建议等工具，简化SEO操作流程。高性能与响应式设计模板加载速度经过专项优化，符合Google等搜索引擎的页面体验
谷歌地图的3d街景使用的是什么数据格式？奇树谦 experience 3d 三维显示
文章目录一、3D街景（StreetView）1.图像部分2.元数据（Metadata）️二、3D城市模型（GoogleEarth或Maps的倾斜摄影模型）1.模型部分2.瓦片划分（TilingSystem）3.材质贴图注意与标准格式对比（参考）✅一、Google3DMesh使用的格式（Protobuf+Binary）1.**数据结构**2.**典型组成**✅二、glTF（GLTransmissio
k8s基础概念和组件介绍小黑屋说YYDS 笔记 kubernetes 容器云原生
k8s涉及到的概念和组件介绍Kubernetes（简称k8s）是一个开源的容器编排系统，由Google开发并于2014年开源，后捐赠给云原生计算基金会（CNCF）。它用于自动化应用程序的部署、扩展和管理，特别是在容器化环境中，已成为业界容器编排的事实标准。它通过自动化、弹性和自我修复能力，简化了容器化应用的部署和管理。无论是小型创业公司还是大型企业，k8s都能帮助团队更高效地构建、扩展和维护应用程
配置Cuttlefish 虚拟 Android 设备 liuzl_2010 android android
google参考资料：https://source.android.com/docs/setup/start?hl=zh-cnhttps://source.android.com/docs/devices/cuttlefish/get-started?hl=zh-cnCuttlefish开始验证KVM可用性Cuttlefish是一种虚拟设备，依赖于宿主机上可用的虚拟化。在宿主机上的终端中，确保可以
Cuttlefish Android环境搭建 weixin_45670959 android
如何使用Cuttlefish来启动安卓AAOS14Cuttlefish的介绍Cuttlefish是一种可配置的虚拟Android设备，既可以远程运行（使用第三方云产品，如GoogleCloudEngine），又可以在本地运行（在Linuxx86和ARM64计算机上）。Cuttlefish的用途使平台和应用开发者不再依赖于物理硬件来开发和验证代码更改。能够并发执行测试，实现高保真度且入门成本较低。提
高级 Python 测试工程师学习提升计划 code36 python 学习开发语言测试爬虫高级测试
一、测试理论与流程夯实系统梳理：每周安排3-4小时，深入研读软件测试的艺术、Google软件测试之道，重点强化功能、性能、安全性测试流程，整理流程关键节点与执行要点笔记。实践模拟：基于线上开源项目（如GitHub找小型Web应用），每月开展2次全流程测试实践，从需求分析到测试报告输出，巩固理论应用。二、Python及测试工具深化Python进阶：利用Python高级课程资料，主攻面向对象编程、装饰
Ubuntu中常用的网络命令指南心随_风动 Ubuntu系统 ubuntu 网络 linux
Ubuntu中常用的网络命令指南在Ubuntu系统中，网络管理是日常运维和故障排查的核心技能。️基础网络诊断ping-测试网络连通性pinggoogle.com#持续测试ping-c4google.com#发送4个包后停止traceroute/tracepath-追踪数据包路径traceroutegithub.comtracepathgithub.com#无需root权限mtr-实时网络质量分析（
2025年传感器技术与自动化控制国际会议(ICSTAC 2025) 投稿、参会咨询-李老师自动化传感器技术
2025年传感器技术与自动化控制国际会议2025InternationalConferenceonSensorTechnologyandAutomationControl（一）大会信息会议简称：ICSTAC2025大会地点：中国·北京收录检索：提交EiCompendex,CPCI,CNKI,GoogleScholar等（二）会议简介2025年传感器技术与自动化控制国际会议（ICSTAC2025）于
中文工单分类模型选择 SugarPPig 人工智能分类人工智能数据挖掘
采用基于预训练模型的微调（Fine-tuning）方案来做中文工单分类，这是非常明智的选择，因为预训练模型已经在大量中文语料上学习了丰富的语言知识，能大幅提升分类效果。在HuggingFace上，针对中文文本分类，我为你推荐以下最合适的模型：最推荐的模型：BERT-base-chinese模型名称(HuggingFaceID):google-bert/bert-base-chinese为什么推荐它
谷歌开源 AI 编程王炸！Gemini CLI：每日千次请求，硬刚 Claude Code
近日，谷歌正式推出开源AI智能体GeminiCLI，将旗舰模型Gemini2.5Pro的能力直接引入终端命令行界面，能够提供轻量化的Gemini访问通道！免费使用只需使用你的个人Google账号登录，即可免费获得GeminiCodeAssist许可。强大模型免费版直接让你用上Gemini2.5Pro模型，并享受其巨大的100万token上下文窗口。超大用量提供业界最大的免费额度——每分钟60次请求
k8s云原生技术栈(脑图) 晴空06 云原生 kubernetes 容器
Kubernetes(K8s)是一种开源的容器编排引擎，用于自动化应用程序容器的部署、扩展和操作。它由Google设计并捐赠给CloudNativeComputingFoundation（CNCF）进行维护。Kubernetes提供了一个强大的平台，用于构建和管理容器化应用程序的解决方案。K8s基础概念Kubernetes集群架构Master节点组件APIServerKubernetesAPI服务
Perplexity AI：对话式搜索引擎的革新者与未来认知操作系统明似水 AI 人工智能搜索引擎
在信息爆炸的数字时代，传统搜索引擎提供的海量链接列表已无法满足用户对高效、精准知识获取的需求。PerplexityAI作为一款融合人工智能与实时网络检索的对话式搜索引擎，正通过技术创新重新定义人们获取信息的方式。这家成立于2022年的硅谷初创企业，凭借其"答案引擎"(AnswerEngine)的独特定位，在短短几年内迅速崛起，月查询量突破7.8亿次，成为挑战Google传统搜索霸主地位的新锐力量。
借助 Wisdom SSH，使用 Google Authenticator 配置 SSH 连接动态码 qinyia ssh 人工智能运维运维开发 linux 后端服务器
WisdomSSH是一款功能强大的AI助手，能帮你在服务器操作上事半功倍。本文就带你通过WisdomSSH，使用GoogleAuthenticator配置SSH连接动态码。首先打开WisdomSSH软件，在右下角AI对话区输入“配置SSH连接使用GoogleAuthenticator动态码”。WisdomSSH的AI助手会自动规划任务流程。安装GoogleAuthenticator：AI助手会生成
2025年智慧教育、人文与艺术设计国际会议 (SEHAD 2025) 学术-罗老师社科人工智能论文阅读论文笔记
2025InternationalConferenceonSmartEducation,HumanitiesandArtDesign【一】、大会信息会议简称：SEHAD2025大会地点：中国·丽江收录检索：提交EiCompendex,CPCI,CNKI,GoogleScholar等【二】会议简介2025年智慧教育、人文与艺术设计国际会议（SEHAD2025）即将在风景如画的丽江盛大开幕。作为一场汇
2025年公共艺术与社会科学国际会议 (PASS 2025) 学术-罗老师社科论文笔记论文阅读
2025InternationalConferenceonPublicArtandSocialSciences【一】、大会信息会议简称：PASS2025大会地点：中国·苏州收录检索：提交EiCompendex,CPCI,CNKI,GoogleScholar等【二】会议简介2025年公共艺术与社会科学国际会议（PASS2025）即将在苏州这座融合了古典韵味与现代气息的城市盛大开幕。作为全球公共艺术和
Netty4.1 - TCP粘包拆包解决方案及案例代码 wwyh520 IO编程 netty
Netty是目前业界最流行的NIO框架之一，它的健壮性、高性能、可定制和可扩展性在同类框架中都是首屈一指。它已经得到了成百上千的商业项目的验证，例如Hadoop的RPC框架Avro就使用了Netty作为底层通信框架，其他的业界主流RPC框架，例如：Dubbo、Google开源的gRPC、新浪微博开源的Motan、Twitter开源的finagle也使用Netty来构建高性能的异步通信能力。另外，阿
Hadoop 发展过程是怎样的？ AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2003年，美国加州大学洛杉矶分校教授李彦宏博士发明了一种分布式文件系统——GFS（GoogleFileSystem）。由于该文件系统设计得足够简单，可以适应大规模数据集存储需求，在此基础上演化出多种应用，包括MapReduce、BigTable、PageRank等，并成为当时互联网公司的标配技术之一。2004年，Google发布了第一版Hadoop项目，定位是
【Linux】Linux内核代码风格 Jerry&Louis Linux linux
前言最近想提高Linux相关的技能，所以就先从Linux内核代码风格的习惯开始养起吧，成为一名优秀的Linux工程师是我的梦想~希望和大家一起进步。之前有在Ubuntu24.04.2和Windows11上安装neovim，但总是希望依赖Clang-format工具帮我格式化，现在开始我不想依赖这些了，打算开始养成Linux的内核代码风格，当然你也可以选择Google或者Microsoft的风格，个
编译gcc踩坑记录——libtool: error: ‘/usr/local/lib/libgmp.la‘ is not a valid libtool archive feige4242 linux 运维服务器
安装gcc依赖过程中出现错误，解决方法在google找到的。三个依赖如下：libgmplibmpfr依赖libgmplibmpc依赖libgmp、libmpfr直接就无脑（网上很多教程，这里就不赘述了）./configure--prefix=/home/xx/make&&makeinstall然后在libmpc时候就报错了：libtool:error:'/usr/local/lib/libgmp.
使用 Clang-Tidy 进行静态代码分析：完整的配置与 CMake 集成实例橘色的喵静态检测单元测试 c++clang clang-tidy cppcheck 静态检查 cmake 代码质量
文章目录使用Clang-Tidy进行静态代码分析：完整的配置与CMake集成实例0.概要1.安装Clang-Tidy2.配置`.clang-tidy`3.检查项详解3.1静态分析器（StaticAnalyzer）3.2现代化（Modernize）3.3Google代码风格（Google）3.4可读性（Readability）3.5CERT安全编码标准（CERT）3.6Bug检测（Bugprone）
Google Maps×亚矩阵云手机：重构跨境场景的地理服务新范式云云321 矩阵智能手机重构自动化线性代数网络游戏
在全球化与数字化深度融合的当下，地理信息服务与云端虚拟化技术的结合正成为跨境业务的核心竞争力。GoogleMaps作为全球领先的地图服务提供商，凭借其精准定位、路径规划与场景化交互能力，已深度嵌入共享经济、跨境电商、本地化营销等领域。而亚矩阵云手机基于ARM虚拟化集群与边缘计算技术，通过动态IP绑定、虚拟定位与全球节点部署，为GoogleMaps的跨境应用提供了安全、高效、低延迟的底层支撑。本文将
全面掌握ADB-platform-tools：Android开发者必备工具集带你玩遍北海道
本文还有配套的精品资源，点击获取简介：ADB-platform-tools是一套由Google官方提供的工具集，对于Android开发、系统调试和设备管理至关重要，包含ADB、fastboot、sqlite3等核心工具。ADB允许开发者通过命令行工具连接电脑和Android设备，执行数据传输、设备状态查询、安装应用、运行shell命令等任务。fastboot用于引导加载器级别对设备进行固件更新和修
浏览器开发者工具Network面板中复制请求的相关信息（结合PostMan） s甜甜的学习之旅开发工具 postman 测试工具
复制请求相关信息在谷歌浏览器（GoogleChrome）开发者工具的Network面板中，当你右击一条请求并选择"Copy"时，会出现多个选项，这些选项允许你以不同的方式复制请求的相关信息。以下是常见的"Copy"选项及其解释：CopyRequestHeaders：复制HTTP请求头到系统剪贴板。这包括了所有发送给服务器的头部信息，如User-Agent、Accept等。CopyResponseH
Playwright反检测优化与规避方法 PyAIGCMaster 我的学习笔记自动化 python
是的，Playwright可以通过ChromeDevToolsProtocol(CDP)连接已打开的浏览器实例，这种方式能更好地模拟真实用户行为。以下是具体实现方案：方法一：手动接管已打开的浏览器实现步骤：手动启动浏览器（带调试端口）在终端执行以下命令启动Chrome（示例）：#Windows"C:\ProgramFiles\Google\Chrome\Application\chrome.exe
搭建Google WebDriver服务的教程码农资源网 ubuntu
搭建GoogleWebDriver服务是进行Web自动化测试的第一步。以下是一个详细的教程，指导你如何在你的系统上搭建GoogleWebDriver服务。我们将以ChromeDriver为例，它是GoogleChrome浏览器的WebDriver实现。环境准备确保你已经安装了GoogleChrome浏览器：确保你安装了最新版本的GoogleChrome浏览器。你可以通过访问GoogleChrome
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb