seeInfinite

面试海量数据处理题总结

参考：https://blog.csdn.net/v_july_v/article/details/6279498/

top k 问题

1、海量日志数据，提取出某日访问百度次数最多的那个IP。

2.统计最热门的10个查询串

3.有一个1G大小的一个文件，里面每一行是一个词，词的大小不超过16字节，内存限制大小是1M。返回频数最高的100个词。

4.有10个文件，每个文件1G，每个文件的每一行存放的都是用户的query，每个文件的query都可能重复。要求你按照query的频度排序。

5.在海量数据中找出重复次数最多的一个？

6.上千万或上亿数据（有重复），统计其中出现次数最多的前N个数据。

int数字的重复数据查找（bitmap）

在2.5亿个整数中找出不重复的整数（内存不足以容纳这2.5亿个整数）

腾讯面试题：给40亿个不重复的unsigned int的整数，没排过序的，然后再给一个数，如何快速判断这个数是否在那40亿个数当中？

超大文件取数字交集

字符串重复

给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url

字符串统计（trie 树）

一个文本文件，大约有一万行，每行一个词，要求统计出其中最频繁出现的前10个词

海量数据中位数（计数排序）

主要参考：https://blog.csdn.net/v_july_v/article/details/6279498/

技巧总结（必看）：https://blog.csdn.net/guoziqing506/article/details/81365315

MB和G都是在B的基础上

B：字节 = 8位

b：位（一个Int是32位，unsigned int也是）

2的10次 = 10的3次

top k 问题

1、海量日志数据，提取出某日访问百度次数最多的那个IP。

主要问题：

IP地址最多有2^32=4G种取值情况，所以不能完全加载到内存中处理

解决方案：

采用映射的方法，比如模1000，把整个大文件映射为1000个小文件

再找出每个小文中出现频率最大的IP（可以采用hash_map进行频率统计，然后再找出频率最大的几个）及相应的频率。然后再在这1000个最大的IP中，找出那个频率最大的IP

2.统计最热门的10个查询串

搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的长度为1-255字节。
假设目前有一千万个记录（这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个。一个查询串的重复度越高，说明查询它的用户越多，也就是越热门。），请你统计最热门的10个查询串，要求使用的内存不能超过1G。

主要问题：

内存不能超过1G，一千万条记录，每条记录是255Byte，很显然要占据2.375G内存，这个条件就不满足要求了。

解决方案：

第一步：Query统计：

解法一：多路归并排序

外部排序指的是大文件的排序，当待排序的文件很大时，无法将整个文件的所有记录同时调入内存进行排序，只能将文件存放在外存，这种排称为外部排序。外部排序的过程主要是依据数据的内外存交换和“内部归并”两者结合起来实现的。

外部排序最常用的算法是多路归并排序，即将原文件分解成多个能够一次性装入内存的部分分别把每一部分调入内存完成排序。然后，对已经排序的子文件进行归并排序。

我们可以采用归并排序，因为归并排序有一个比较好的时间复杂度O(NlgN)。排完序之后我们再对已经有序的Query文件进行遍历，统计每个Query出现的次数，再次写入文件中。综合分析一下，排序的时间复杂度是O(NlgN)，而遍历的时间复杂度是O(N)

总体时间复杂度：O(N+NlgN)=O（NlgN）。

解法二：哈希表

300万的Query，每个Query255Byte，因此我们可以考虑把他们都放进内存中去，而现在只是需要一个合适的数据结构，在这里，Hash Table绝对是我们优先的选择，因为Hash Table的查询速度非常的快，几乎是O(1)的时间复杂度。

我们的算法：维护一个Key为Query字串，Value为该Query出现次数的HashTable，每次读取一个Query，如果该字串不在Table中，那么加入该字串，并且将Value值设为1；如果该字串在Table中，那么将该字串的计数加一即可。最终我们在O(N)的时间复杂度内完成了对该海量数据的处理。
时间复杂度：O（N）

第二步：找出Top 10

使用堆
借助堆结构，我们可以在log量级的时间内查找和调整/移动。

做法：

维护一个K(该题目中是10)大小的小根堆，然后遍历300万的Query，分别和根元素进行对比。

具体过程：

最先遍历到的k个数存放到最小堆中，并假设它们就是我们要找的最大的k个数，X1>X2...Xmin(堆顶)

而后遍历后续的N-K个数，一一与堆顶元素进行比较，如果遍历到的Xi大于堆顶元素Xmin，则把Xi放入堆中，而后更新整个堆，更新的时间复杂度为logK，如果Xi

时间复杂度： O(K)+O(（N-K）*logK)=O（N*logK）。

3.有一个1G大小的一个文件，里面每一行是一个词，词的大小不超过16字节，内存限制大小是1M。返回频数最高的100个词。

分析：

（1）分文件（在外存中进行）

顺序读文件中，对于每个词x，取hash(x)%5000，然后按照该值存到5000个小文件（记为x0,x1,...x4999）中。这样每个文件大概是200k左右。

如果其中的有的文件超过了1M大小，还可以按照类似的方法继续往下分，直到分解得到的小文件的大小都不超过1M。

（2）文件内排序（内存中）
对每个小文件，统计每个文件中出现的词以及相应的频率（可以采用trie树/hash_map等），并取出出现频率最大的100个词（可以用含100个结点的最小堆），并把100个词及相应的频率存入文件，这样又得到了5000个文件。

（3）归并

下一步就是把这5000个文件进行归并（类似与归并排序）的过程了。

4.有10个文件，每个文件1G，每个文件的每一行存放的都是用户的query，每个文件的query都可能重复。要求你按照query的频度排序。

（1）读取文件，重复的合并到一个文件中

顺序读取10个文件，按照hash(query)%10的结果将query写入到另外10个文件（记为）中。这样新生成的文件每个的大小大约也1G（假设hash函数是随机的）。

（2）排序

找一台内存在2G左右的机器，依次对用hash_map(query, query_count)来统计每个query出现的次数。利用快速/堆/归并排序按照出现次数进行排序。将排序好的query和对应的query_cout输出到文件中。这样得到了10个排好序的文件（记为）。

（3）归并

对这10个文件进行归并排序（内排序与外排序相结合）。

5.在海量数据中找出重复次数最多的一个？

先做hash，然后求模映射为小文件

求出每个小文件中重复次数最多的一个，并记录重复次数。

然后找出上一步求出的数据中重复次数最多的一个就是所求。

6.上千万或上亿数据（有重复），统计其中出现次数最多的前N个数据。

方案1：

上千万或上亿的数据，现在的机器的内存应该能存下。

采用hash_map/搜索二叉树/红黑树等来进行统计次数。

然后就是取出前N个出现次数最多的数据了，可以用堆机制完成。

int数字的重复数据查找（bitmap）

在2.5亿个整数中找出不重复的整数（内存不足以容纳这2.5亿个整数）

BitMap算法详解：https://www.cnblogs.com/senlinyang/p/7885685.html

方案1：

数量计算：

int有4个字节，32位bit，最多可表示 $2^{32}$ 个正整数，即4G个正整数(1G= $2^{30}$ ,1K= $2^{10}$ )
用2Bitmap法，每个正整数用两个bit的标志位，00表示没有出现，01表示出现1次，10表示出现多次。
开辟一个用2Bitmap法标志4G个正整数的桶数组，则总共需要4G*2bit=1G内存。

扫描：

然后扫描这2.5亿个整数，查看Bitmap中相对应位，如果是00变01，01变10，10保持不变。所描完事后，查看bitmap，把对应位是01的整数输出即可。

假设某数据为9。9=8*1+1，即对8的商为1，对8取模为1。应该存在byte[1]，将byte[1]的值改为00000002，即把2的一次方赋予byte[1]。

注意：新开数组的所需大小并不取决于数据量的大小，而是取决于某数据值的大小，新开的数组byte的大小N与所需处理的数据集之中的最大值Max有关，N>=Max/8。那么，先得到最大值，再进行查重可不可行呢，效率相对于直接开大空间有多大的提升呢？有待探究。

具体代码实现：https://blog.csdn.net/brk1985/article/details/18732267

方案2：

也可采用与上1题类似的方法，进行划分小文件的方法。然后在小文件中找出不重复的整数，并排序。然后再进行归并，注意去除重复的元素。

腾讯面试题：给40亿个不重复的unsigned int的整数，没排过序的，然后再给一个数，如何快速判断这个数是否在那40亿个数当中？

快速排序+二分查找过于慢。以下是其它更好的方法：
方案1：

申请512M的内存，一个bit位代表一个unsigned int值。读入40亿个数，设置相应的bit位，读入要查询的数，查看相应bit位是否为1，为1表示存在，为0表示不存在。

超大文件取数字交集

问题：现有两个各有20亿行的文件，每一行都只有一个数字，求这两个文件的交集。

解决：

采用bitset进行问题解决

因为int的最大数是2^32 - 1 == 4G，用一个二进制的下标来表示一个int值，大概需要4G个bit位，即约4G/8 = 552M的内存。这可以解决问题了。

如果都是正数：

用int存的话，4G bit/32b = 2的32次/2的5次 = 2的27次 = 128M个

建立int [128M] 的数组，对于每个数，先 /32，确定在数组哪个位置，然后%32，确定在该int的哪一位

然后对这个数组取并集即可统计

正负都有

1.首先遍历文件，将每个文件按照数字的正数，负数标记到2个BitSet上为：正数BitSetA_positive，负数BitSetA_negative

2.遍历另为一个文件，生成正数：BitSetB_positive ,BitSetB_negative

3.取BitSetA_positive and BitSetB_positive 得到2个文件的正数的交集，同理得到负数的交集。

4.合并，问题解决。

这里一次只能解决全正数，或全负数，所以要分两次。

字符串重复

给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url

问题：

可以估计每个文件安的大小为5G×64=320G（5*10^9*64 = 320 * 10^9 B），远远大于内存限制的4G（4*10^9 B）。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。

解决：

（1）分文件：

遍历文件a，对每个url求取hash(url)%1000，然后根据所取得的值将url分别存储到1000个小文件（记为a0,a1,...,a999）中。这样每个小文件的大约为300M。

遍历文件b，采取和a相同的方式将url分别存储到1000小文件（记为b0,b1,...,b999）。这样处理后，所有可能相同的url都在对应的小文件（a0vsb0,a1vsb1,...,a999vsb999）中，不对应的小文件不可能有相同的url。然后我们只要求出1000对小文件中相同的url即可。

（2）逐个找重复：

求每对小文件中相同的url：把其中一个小文件的url存储到hash_set中，然后遍历另一个小文件的每个url，看其是否在刚才构建的hash_set中，如果是，那么就是共同的url，存到文件里面就可以了。

字符串统计（trie 树）

一个文本文件，大约有一万行，每行一个词，要求统计出其中最频繁出现的前10个词

方案1：

这题是考虑时间效率。

用trie树统计每个词出现的次数，时间复杂度是O(n*le)（le表示单词的平准长度）。

然后是找出出现最频繁的前10个词，可以用堆来实现，前面的题中已经讲到了，时间复杂度是O(n*lg10)。

总的时间复杂度，是O(n*le)与O(n*lg10)中较大的哪一个。

海量数据中位数（计数排序）

只有2G内存的pc机，在一个存有10G个整数的文件，从中找到中位数，写一个算法。

关于中位数：数据排序后，位置在最中间的数值。即将数据分成两部分，一部分大于该数值，一部分小于该数值。中位数的位置：当样本数为奇数时，中位数=(N+1)/2 ; 当样本数为偶数时，中位数为N/2与1+N/2的均值（那么10G个数的中位数，就第5G大的数与第5G+1大的数的均值了）。

分析：

明显是一道工程性很强的题目，和一般的查找中位数的题目有几点不同。
1. 原数据不能读进内存，不然可以用快速选择，如果数的范围合适的话还可以考虑桶排序或者计数排序，但这里假设是32位整数，仍有4G种取值，需要一个16G大小的数组来计数。

2. 若看成从N个数中找出第K大的数，如果K个数可以读进内存，可以利用最小或最大堆，但这里K=N/2,有5G个数，仍然不能读进内存。

解法1：桶排序

首先假设是32位无符号整数。整数范围是0 - 2^32 - 1，一共有4G种取值

故需划分区间，每个区间用来计数，需要计数的下10G（10*2^32 ）这么大的数，因为可能一个数字重复10G次，故每个区间最少需要64位无符号整数来作为计数，即8B

故区间个数共：2G/8B = 256M个

要把4G个数映射到256M个区间，每个区段有16（4G/256M = 16）种值，每16个值算一段， 0～15是第1段，16～31是第2段，……2^32-16 ～2^32-1是第256M段。

操作：

1. 读一遍10G个整数，把整数映射到256M个区段中，用一个64位无符号整数给每个相应区段记数。

2. 从前到后对每一段的计数累加，当累加的和超过5G时停止，找出这个区段（即累加停止时达到的区段，也是中位数所在的区段）的数值范围，设为[a，a+15]，同时记录累加到前一个区段的总数，设为m。然后，释放除这个区段占用的内存。

3. 再读一遍10G个整数，把在[a，a+15]内的每个值计数，即有16个计数。

4. 对新的计数依次累加，每次的和设为n，当m+n的值超过5G时停止，此时的这个计数所对应的数就是中位数。

复杂度：

上面的海量数据寻找中位数，其实就是利用了“分割”思想，每次将问题空间大约分解成原问题空间的一半左右。（划分成两个文件，直接丢弃其中一个文件），故总的复杂度可视为O(logN) N=10亿。

现在有10亿个int型的数字（JAVA中 int 型占4B），以及一台可用内存为1GB的机器，如何找出这10亿个数字的中位数？

解法2：利用二进制分文件 && 快速排序算法中的“分割思想”

2的10次 = 10的3次

10亿个数字，每个数字在内存中占4B，10亿个数字完全加载到内存中需要：10*108*4B ，约为：4GB内存。显然不能把所有的数字都装入内存。

具体如下：

（1）利用二进制分文件

假设10亿个数字保存在一个大文件中，依次读一部分文件到内存(不超过内存的限制：1GB)，将每个数字用二进制表示，比较二进制的最高位(第32位)，如果数字的最高位为0，则将这个数字写入 file_0文件中；如果最高位为 1，则将该数字写入file_1文件中。【这里的最高位类似于快速排序中的枢轴元素】

从而将10亿个数字分成了两个文件（几乎是二分的），假设 file_0文件中有 6亿个数字，file_1文件中有 4亿个数字。那么中位数就在 file_0 文件中，并且是 file_0 文件中所有数字排序之后的第 1亿个数字。

【为什么呢？因为10亿个数字的中位数是10亿个数排序之后的第5亿个数。现在file_0有6亿个数，file_1有4亿个数，file_0中的数都比file_1中的数要大（最高位为符号位，file_1中的数都是负数，file_0中的数都是正数，也即这里一共只有4亿个负数，排序之后的第5亿个数一定是正数，那么排序之后的第5亿个数一定位于file_0中）】。除去4亿个负数，中位数就是6亿个正数从小到大排序之后的第 1 亿个数。

现在，我们只需要处理 file_0 文件了（不需要再考虑file_1文件）。对于 file_0 文件，同样采取上面的措施处理：将file_0文件依次读一部分到内存(不超内存限制：1GB)，将每个数字用二进制表示，比较二进制的 次高位（第31位），如果数字的次高位为0，写入file_0_0文件中；如果次高位为1，写入file_0_1文件中。

现假设 file_0_0文件中有3亿个数字，file_0_1中也有3亿个数字，则中位数就是：file_0_0文件中的数字从小到大排序之后的第1亿个数字。

抛弃file_0_1文件，继续对 file_0_0文件根据次次高位(第30位) 划分，假设此次划分的两个文件为：file_0_0_0中有0.5亿个数字，file_0_0_1中有2.5亿个数字，那么中位数就是 file_0_0_1文件中的所有数字排序之后的第 0.5亿个数。

......

（2）快速排序算法中的“分割思想”

按照上述思路，直到划分的文件可直接加载进内存时（比如划分的文件中只有5KW个数字了），就可以直接对数字进行快速排序，找出中位数了。当然，你也使用“快排的分割算法”来找出中位数(比使用快速排序要快)

写出10万以内的质数

思路：

一个数若可以进行因数分解，那么分解时得到的两个数一定是一个小于等于sqrt(n)，一个大于等于sqrt(n)，据此，上述代码中并不需要遍历到n-1，遍历到sqrt(n)即可，因为若sqrt(n)左侧找不到约数，那么右侧也一定找不到约数。

100000个玩家的战斗力，要排名前500名，而且需要实时更新，怎么处理？

第一、100000名实时遍历系统一定承受不了或者说这样做代价太大，那么可以首先遍历一遍，挑选出战斗力最高的1000名，然后后面只遍历这1000名就可以了，因为前500名大概率都是前一千名产生的，减少系统开销。

第二、为了防止某些玩家充钱了，大幅提升战斗力，那么可以设置一个阈值，如果某个玩家战斗力增加速度超过阈值，那么这个玩家也应该纳入实时排序过程中。

第三、最后100000名玩家的战斗力可以定期在服务器压力不大的时候，比如休服时期或者夜间，做整体排序，以便校验数据的准确性。

一个文件每一行有多个同义词，最后要求分行输出，每一行是合并的同义词集合

（1）建立统计字典，时间O(N)

一个字典：记录每个词出现的行号，最后字典大小为词表大小

（2）获取连通块（这步时间复杂度也是O(N)）

以一个词为起点，通过行号，去扩展连通块，最后能获得一个同义词合集，作为一行输出（被加入的词从字典中删去）

然后继续判断下一个词

你可能感兴趣的:(LeetCode刷题记录)

Leetcode刷题记录分享——数据结构（队列） #200 岛屿数量三年买房不是梦 Leetcode数据结构 leetcode 数据结构队列 bfs
Leetcode刷题记录分享——数据结构（队列）PS：刷题两周了，每周天会专门抽出一段时间来刷Leetcode，这学期在学算法设计与分析，根据课程内容，第一周刷动态规划题目，第二周刷的贪心算法。打算从这周开始刷数据结构。数据结构是大二上学期学的了，过去了一年，当时学的也不扎实，现在通过Leetcode理论+实践重新学习一下。我刷Leetcode会先看一下优质解答，肚里没货硬刚也刚不出来，主要是学习
leetcode刷题记录-两数相加每天都一万遍想吃 leetcode
leetcode小白每日做题记录习题集：hot100（c++）题目：第二题两数相加（难度中等）做题思路小白目前只能想到比较直接的方法：本题是采用不带头结点的单链表进行操作的（这里要注意！不然后续的进位计算会出错！！这是我最开始踩的坑）通过对链表中数据的观察，发现只需要维护一个进位变量，这里我采用的是bool型变量，当需要进位时置进位变量st为true，反之为false。由于链l1,l2链表的长度不
Leetcode刷题记录 - 链表问题石语予木 leetcode刷题 leetcode java 单链表
链表问题总结常出现的几种链表问题文章目录链表问题前言问题一：倒数第k个元素问题二：中间位置的结点`问题三：环形链表问题4：未完待续问题5：未完待续前言无法高效获取长度，无法根据偏移快速访问元素，是链表的两个劣势。然而面试的时候经常碰见诸如获取倒数第k个元素，获取中间位置的元素，判断链表是否存在环，判断环的长度等和长度与位置有关的问题。这些问题都可以通过灵活运用双指针来解决。参考链接：https:/
leetcode刷题记录（三数之和）超时记录顺利毕业（研） leetcode 算法 python
1.题目描述2.解题思路看到这个题目，感觉和之前做的水仙花数的题目差不多，对于一个没有经过训练来说，首先想到的事情就是暴力破解，直接上循环就可以了，但是这样肯定在时间上占不到优势，解决问题肯定能够解决，但是leetcode上通不过。附上我自己写的代码。classSolution:defthreeSum(self,nums:List[int])->List[List[int]]:reesult=[]
LeetCode刷题记录：110. 平衡二叉树「已注销」 c++
110.平衡二叉树解题思路：使用递归遍历二叉树，求出每个二叉树节点的高度并进行判断。递归时若二叉树节点没有子节点，返回0；若二叉树左右节点的高度差的绝对值大于1，说明树已经不满足平衡树的条件，返回-1；否则返回当前节点的最高高度（即左右节点高度中的最大值+1）。通关代码：classSolution{public:intheight(TreeNode*root){if(root==NULL){ret
leetcode刷题记录：暴力搜索算法01 - 回溯小新0077 2024算法工程师求职 leetcode 算法职场和发展
参考：labuladong的算法小抄https://labuladong.online/algo/essential-technique/backtrack-framework/这篇太牛了，一个模板把所有的排列组合子集问题全秒了。1.简介暴力搜索算法：回溯、dfs、bfs。这些都可以看做是从二叉树算法衍生出来的。解决一个回溯问题，实际上是在遍历一颗决策树的过程。树的每个叶子结点上存着一个答案。把整
LeetCode刷题记录（二叉树篇）蓝鲸小镇不临海二叉树算法 leetcode
文章目录前言一、简单题226.翻转二叉树前言保研在即，记录一下我的刷题过程提示：以下是本篇文章正文内容，下面案例可供参考一、简单题226.翻转二叉树基本思路：一个简单的递归前序遍历搞定。代码：publicTreeNodeinvertTree(TreeNoderoot){if(root==null)returnnull;TreeNodetmp=root.right;root.right=root.l
leetcode刷题记录：二叉树04（序列化和反序列化）小新0077 2024算法工程师求职 leetcode linux 算法
参考：https://labuladong.online/algo/data-structure/serialize-and-deserialize-binary-tree/1.前中后序和二叉树的唯一性给定空指针的前提下，只有前序和后序可以唯一确定一颗二叉树；中序不可以。原因是中序遍历无法确定二叉树根节点的位置。不给定空指针的前提下，只靠一种遍历结果是无法还原二叉树的；给定前序和中序，或者中序和后
有不含有重复数字的数组构造二叉树_Leetcode刷题记录：构建最大数二叉树 southbread
题目要求，题目地址给定一个不含重复数字的数组，最大二叉树构建规则如下：1、根是数组中最大的数字2、左边的子树是最大数字左边的内容3、右边的子树是最大数字右边的内容答案classSolution(object):defconstructMaximumBinaryTree(self,nums):""":typenums:List[int]:rtype:TreeNode"""#print(max(num
leetcode刷题记录 1.1 链表小新0077 2024算法工程师求职 leetcode 链表 linux
参考:labuladong的算法小抄，自己按照思路手写了一遍https://labuladong.github.io/algo/di-ling-zh-bfe1b/shuang-zhi-0f7cc/链表Checklist如果要创造一个新表，用dummy指针避免空指针的处理情况，代码更简洁分割链表：记得断开原链表的next，否则结果有环快慢指针应用倒数第k个：fast先跑k步，slow开始跑环形链表：
leetcode刷题记录：二叉树1（纲领篇）小新0077 2024算法工程师求职 leetcode 算法职场和发展
摘自labuladong的算法小抄：https://labuladong.online/algo/essential-technique/binary-tree-summary-2/1.二叉树的遍历框架voidtraverse(TreeNode*root){if(!root){return;}//前序位置traverse(root->left);//中序位置traverse(root->right
leetcode刷题记录：二叉树03（构造二叉树）小新0077 2024算法工程师求职 leetcode 算法职场和发展
参考：https://labuladong.online/algo/data-structure/binary-tree-part2/构造问题一般都是通过分解的思路，构造整棵树=根节点+构造左子树+构造右子树654最大二叉树找到最大值和对应的index先把根节点构造出来，然后递归地构造左子树和右子树需要一个traverse函数，传入nums的索引，返回以nums[lo:hi]构造的最大二叉树。cl
leetcode刷题记录：二叉树02（思路篇）小新0077 2024算法工程师求职 leetcode 数据结构算法
参考labuladong的算法小抄：https://labuladong.online/algo/data-structure/binary-tree-part1/复习二叉树纲领篇，二叉树解题的思维模式分两类：1、是否可以通过遍历一遍二叉树得到答案？如果可以，用一个traverse函数配合外部变量来实现，这叫「遍历」的思维模式。2、是否可以定义一个递归函数，通过子问题（子树）的答案推导出原问题的答
【数据结构】【更新中】【python】leetcode刷题记录：热题100答案 + 每日一题（附文字说明） Hundred billion 算法数据结构 leetcode 哈希算法 python 算法
题目为leetcode的热题100.仅作学习用，且题目为节选，不断更新。如果点赞过100就会制作动画一、Hash(1)给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。示例1：输入：nums=[2,7,11,15]
LC1220线性代数YYDS：多种解法：「状态机DP：一维 OR 二维」&「矩阵快速幂」 Chthollists
前言大家好，我是新人博主：「个人主页」主要分享程序员生活、编程技术、以及每日的LeetCode刷题记录，欢迎大家关注我，一起学习交流，谢谢！正在坚持每日更新LeetCode每日一题，发布的题解有些会参考其他大佬的思路(参考资料的链接会放在最下面)，欢迎大家关注我~~~同时也在进行其他专项类型题目的刷题与题解活动，相关资料也会同步到「GitHub」上面~今天是坚持写题解的21天(haha，从21年圣
C++ 之LeetCode刷题记录（二十六） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。125.验证回文串如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后，短语正着读和反着读都一样。则可以认为该短语是一个回文串。字母和数字都属于字母数字字符。给你一个字符串s，如果它是回文串，返回true；否则，返回false。示例1：输入:s=“Aman,aplan,acanal:Panama”输出：true解释：“a
C++ 之LeetCode刷题记录（二十七） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。136.只出现一次的数字给你一个非空整数数组nums，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。你必须设计并实现线性时间复杂度的算法来解决此问题，且该算法只使用常量额外空间。示例1：输入：nums=[2,2,1]输出：1示例2：输入：nums=[4,1,2,1,2]输出：4示例3：输入：nums
C++ 之LeetCode刷题记录（二十九） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。145.二叉树的后序遍历给你一棵二叉树的根节点root，返回其节点值的后序遍历。示例1：输入：root=[1,null,2,3]输出：[3,2,1]示例2：输入：root=[]输出：[]示例3：输入：root=[1]输出：[1]解题：思路，同昨天解法。classSolution{public:vectorresults;vector
C++ 之LeetCode刷题记录（二十八） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。144.二叉树的前序遍历给你二叉树的根节点root，返回它节点值的前序遍历。示例1：输入：root=[1,null,2,3]输出：[1,2,3]示例2：输入：root=[]输出：[]示例3：输入：root=[1]输出：[1]示例4：输入：root=[1,2]输出：[1,2]示例5：输入：root=[1,null,2]输出：[1,2]
C++ 之LeetCode刷题记录（二十三） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。118.杨辉三角给定一个非负整数numRows，生成「杨辉三角」的前numRows行。在「杨辉三角」中，每个数是它左上方和右上方的数的和。示例1:输入:numRows=5输出:[[1],[1,1],[1,2,1],[1,3,3,1],[1,4,6,4,1]]示例2:输入:numRows=1输出:[[1]]提示:1>generate(
C++ 之LeetCode刷题记录（二十二） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。112.路径总和给你二叉树的根节点root和一个表示目标和的整数targetSum。判断该树中是否存在根节点到叶子节点的路径，这条路径上所有节点值相加等于目标和targetSum。如果存在，返回true；否则，返回false。叶子节点是指没有子节点的节点。示例1：输入：root=[5,4,8,11,null,13,4,7,2,nul
C++ 之LeetCode刷题记录（二十） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。依旧是追求耗时0s的一天。110.平衡二叉树给定一个二叉树，判断它是否是高度平衡的二叉树。本题中，一棵高度平衡二叉树定义为：一个二叉树每个节点的左右两个子树的高度差的绝对值不超过1。示例1：输入：root=[3,9,20,null,null,15,7]输出：true示例2：输入：root=[1,2,2,3,3,null,null,4,4]输出：false示例3：输入：root=
C++ 之LeetCode刷题记录（二十一） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。目标：执行用时击败90%以上使用C++的用户。111.二叉树的最小深度给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明：叶子节点是指没有子节点的节点。示例1：输入：root=[3,9,20,null,null,15,7]输出：2示例2：输入：root=[2,null,3,null,4,null,5,null,6]输出：5解题：二叉树的
C++ 之LeetCode刷题记录（十九） icecream_cheese c++数据结构 c++leetcode 开发语言
开始cpp刷题之旅。依旧是追求耗时0s的一天。108.将有序数组转换为二叉搜索树给你一个整数数组nums，其中元素已经按升序排列，请你将其转换为一棵高度平衡二叉搜索树。高度平衡二叉树是一棵满足「每个节点的左右两个子树的高度差的绝对值不超过1」的二叉树。示例1：输入：nums=[-10,-3,0,5,9]输出：[0,-3,9,-10,null,5]解释：[0,-10,5,null,-3,null,9
LC539最小时间差：两种解法：「字符串排序」&「桶排序思想：哈希计数」 Chthollists
前言大家好，我是新人博主：「个人主页」主要分享程序员生活、编程技术、以及每日的LeetCode刷题记录，欢迎大家关注我，一起学习交流，谢谢！正在坚持每日更新LeetCode每日一题，发布的题解有些会参考其他大佬的思路(参考资料的链接会放在最下面)，欢迎大家关注我~~~同时也在进行其他专项类型题目的刷题与题解活动，相关资料也会同步到「GitHub」上面~今天是坚持写题解的22天(haha，从21年圣
leetcode刷题记录——递归 Saltyjuice leetcode leetcode 链表算法
leetcode刷题记录——递归——转自lyl’sblog的三道题套路解决递归问题（https://lyl0724.github.io/2020/01/25/1/）文章目录递归解题三部曲 Leetcode104.二叉树的最大深度 Leetcode24.两两交换链表中的节点 Leetcode206.反转链表递归解题三部曲只需要关注一级递归的解决过程即可。(图片及内容均来自：https://
[leetcode刷题记录] 1254.统计封闭岛屿数量 Ryougi_
原题链接：1254.统计封闭岛屿的数目-力扣（LeetCode）(leetcode-cn.com)考察知识点：dfs解题思路与源代码：/***@param{number[][]}grid*@return{number}*/varclosedIsland=function(grid){//isBorder为是否超出边界,resCount为封闭岛屿数量letisBorder=0,resCount=0;
C++ 之LeetCode刷题记录（十八） icecream_cheese c++数据结构 c++leetcode 深度优先
开始cpp刷题之旅。依旧是追求耗时0s的一天。104.二叉树的最大深度给定一个二叉树root，返回其最大深度。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。示例1：输入：root=[3,9,20,null,null,15,7]输出：3示例2：输入：root=[1,null,2]输出：2思路：二叉树的这些题目，用递归做永远都是最简单的方法。解法一：DFSclassSolution{
C++ 之LeetCode刷题记录（十七） icecream_cheese 数据结构 c++c++leetcode 深度优先
开始cpp刷题之旅。依旧是追求耗时0s的一天。101.对称二叉树给你一个二叉树的根节点root，检查它是否轴对称。示例1：输入：root=[1,2,2,3,4,4,3]输出：true示例2：输入：root=[1,2,2,null,3,null,3]输出：false这题目感觉还是比较简单的解法:dfsclassSolution{public:boolisSymmetric(TreeNode*root
wy的leetcode刷题记录_Day73 wy-1226 leetcode 算法
wy的leetcode刷题记录_Day73声明本文章的所有题目信息都来源于leetcode如有侵权请联系我删掉!时间：2024-1-11前言目录wy的leetcode刷题记录_Day73声明前言2645.构造有效字符串的最少插入数题目介绍思路代码收获2645.构造有效字符串的最少插入数今天的每日一题是：[2645.构造有效字符串的最少插入数(https://leetcode.cn/problems
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL