程序员编程艺术：第三章、寻找最小的k个数

作者：July，zhouzhenren，yansha。
    致谢：微软100题实现组，狂想曲创作组。
    时间：2011年05月08日
    微博：http://weibo.com/julyweibo 。
    出处：http://blog.csdn.net/v_JULY_v 。
    wiki：http://tctop.wikispaces.com/。
-----------------------------------------------

前奏
在上一篇文章，程序员面试题狂想曲：第三章、寻找最小的k个数中，后来为了论证类似快速排序中partition的方法在最坏情况下，能在O（N）的时间复杂度内找到最小的k个数，而前前后后updated了10余次。所谓功夫不负苦心人，终于得到了一个想要的结果。

    简单总结如下（详情，请参考原文第三章）：
    1、RANDOMIZED-SELECT，以序列中随机选取一个元素作为主元，可达到线性期望时间O（N）的复杂度。
    2、SELECT，快速选择算法，以序列中“五分化中项的中项”，或“中位数的中位数”作为主元（枢纽元），则不容置疑的可保证在最坏情况下亦为O（N）的复杂度。

本章，咱们来阐述寻找最小的k个数的反面，即寻找最大的k个数，但此刻可能就有读者质疑了，寻找最大的k个数和寻找最小的k个数，原理不是一样的么?

是的，的确是一样，但这个寻找最大的k个数的问题的实用范围更广，因为它牵扯到了一个Top K算法问题，以及有关搜索引擎，海量数据处理等广泛的问题，所以本文特意对这个Top K算法问题，进行阐述以及实现（侧重实现，因为那样看起来，会更令人激动人心），算是第三章的续。ok，有任何问题，欢迎随时不吝指正。谢谢。

说明

关于寻找最小K个数能做到最坏情况下为O（N）的算法及证明，请参考原第三章，寻找最小的k个数，本文的代码不保证O（N）的平均时间复杂度，只是根据第三章有办法可以做到而已（如上面总结的，2、SELECT，快速选择算法，以序列中“五分化中项的中项”，或“中位数的中位数”作为主元或枢纽元的方法，原第三章已经严格论证并得到结果）。

第一节、寻找最小的第k个数

在进入寻找最大的k个数的主题之前，先补充下关于寻找最k小的数的三种简单实现。由于堆的完整实现，第三章：第五节，堆结构实现，处理海量数据中已经给出，下面主要给出类似快速排序中partition过程的代码实现：

寻找最小的k个数，实现一（下段代码经本文评论下多位读者指出有问题：当a [ i ]=a [ j ]=pivot时，则会产生一个无限循环，在Mark Allen Weiss的数据结构与算法分析C++描述中文版的P209-P210有描述，读者可参看之。特此说明，因本文代码存在问题的地方还有几处，故请待后续统一修正.2012.08.21）：

//copyright@ mark allen weiss && July && yansha
//July，yansha、updated，2011.05.08.
//本程序，后经飞羽找出错误，已经修正。
//随机选取枢纽元，寻找最小的第k个数
#include <iostream>
#include <stdlib.h>
using namespace std;
int my_rand(int low, int high)
{
int size = high - low + 1;
return low + rand() % size;
}
//q_select places the kth smallest element in a[k]
int q_select(int a[], int k, int left, int right)
{
if(k > right || k < left)
{
// cout<<"---------"<<endl; //为了处理当k大于数组中元素个数的异常情况
return false;
}
//真正的三数中值作为枢纽元方法，关键代码就是下述六行
int midIndex = (left + right) / 2;
if(a[left] < a[midIndex])
swap(a[left], a[midIndex]);
if(a[right] < a[midIndex])
swap(a[right], a[midIndex]);
if(a[right] < a[left])
swap(a[right], a[left]);
swap(a[left], a[right]);
int pivot = a[right]; //之前是int pivot = right，特此，修正。
// 申请两个移动指针并初始化
int i = left;
int j = right-1;
// 根据枢纽元素的值对数组进行一次划分
for (;;)
{
while(a[i] < pivot)
i++;
while(a[j] > pivot)
j--;
//a[i] >= pivot, a[j] <= pivot
if (i < j)
swap(a[i], a[j]); //a[i] <= a[j]
else
break;
}
swap(a[i], a[right]);
/* 对三种情况进行处理
1、如果i=k，即返回的主元即为我们要找的第k小的元素，那么直接返回主元a[i]即可;
2、如果i>k，那么接下来要到低区间A[0....m-1]中寻找，丢掉高区间;
3、如果i<k，那么接下来要到高区间A[m+1...n-1]中寻找，丢掉低区间。
*/
if (i == k)
return true;
else if (i > k)
return q_select(a, k, left, i-1);
else return q_select(a, k, i+1, right);
}
int main()
{
int i;
int a[] = {7, 8, 9, 54, 6, 4, 11, 1, 2, 33};
q_select(a, 4, 0, sizeof(a) / sizeof(int) - 1);
return 0;
}

寻找最小的第k个数，实现二：

//copyright@ July
//yansha、updated，2011.05.08。
// 数组中寻找第k小元素，实现二
#include <iostream>
using namespace std;
const int numOfArray = 10;
// 这里并非真正随机
int my_rand(int low, int high)
{
int size = high - low + 1;
return low + rand() % size;
}
// 以最末元素作为主元对数组进行一次划分
int partition(int array[], int left, int right)
{
int pos = right;
for(int index = right - 1; index >= left; index--)
{
if(array[index] > array[right])
swap(array[--pos], array[index]);
}
swap(array[pos], array[right]);
return pos;
}
// 随机快排的partition过程
int random_partition(int array[], int left, int right)
{
// 随机从范围left到right中取一个值作为主元
int index = my_rand(left, right);
swap(array[right], array[index]);
// 对数组进行划分，并返回主元在数组中的位置
return partition(array, left, right);
}
// 以线性时间返回数组array[left...right]中第k小的元素
int random_select(int array[], int left, int right, int k)
{
// 处理异常情况
if (k < 1 || k > (right - left + 1))
return -1;
// 主元在数组中的位置
int pos = random_partition(array, left, right);
/* 对三种情况进行处理：(m = i - left + 1)
1、如果m=k，即返回的主元即为我们要找的第k小的元素，那么直接返回主元array[i]即可;
2、如果m>k，那么接下来要到低区间array[left....pos-1]中寻找，丢掉高区间;
3、如果m<k，那么接下来要到高区间array[pos+1...right]中寻找，丢掉低区间。
*/
int m = pos - left + 1;
if(m == k)
return array[pos];
else if (m > k)
return random_select(array, left, pos - 1, k);
else
return random_select(array, pos + 1, right, k - m);
}
int main()
{
int array[numOfArray] = {7, 8, 9, 54, 6, 4, 2, 1, 12, 33};
cout << random_select(array, 0, numOfArray - 1, 4) << endl;
return 0;
}

寻找最小的第k个数，实现三：

//求取无序数组中第K个数，本程序枢纽元的选取有问题，不作推荐。
//copyright@ 飞羽
//July、yansha，updated，2011.05.18。
#include <iostream>
#include <time.h>
using namespace std;
int kth_elem(int a[], int low, int high, int k)
{
int pivot = a[low];
//这个程序之所以做不到O（N）的最最重要的原因，就在于这个枢纽元的选取。
//而这个程序直接选取数组中第一个元素作为枢纽元，是做不到平均时间复杂度为 O（N）的。
//要做到，就必须把上面选取枢纽元的代码改掉，要么是随机选择数组中某一元素作为枢纽元，能达到线性期望的时间
//要么是选取数组中中位数的中位数作为枢纽元，保证最坏情况下，依然为线性O（N）的平均时间复杂度。
int low_temp = low;
int high_temp = high;
while(low < high)
{
while(low < high && a[high] >= pivot)
--high;
a[low] = a[high];
while(low < high && a[low] < pivot)
++low;
a[high] = a[low];
}
a[low] = pivot;
//以下就是主要思想中所述的内容
if(low == k - 1)
return a[low];
else if(low > k - 1)
return kth_elem(a, low_temp, low - 1, k);
else
return kth_elem(a, low + 1, high_temp, k);
}
int main() //以后尽量不再用随机产生的数组进行测试，没多大必要。
{
for (int num = 5000; num < 50000001; num *= 10)
{
int *array = new int[num];
int j = num / 10;
int acc = 0;
for (int k = 1; k <= num; k += j)
{
// 随机生成数据
srand(unsigned(time(0)));
for(int i = 0; i < num; i++)
array[i] = rand() * RAND_MAX + rand();
//”如果数组本身就是利用随机化产生的话，那么选择其中任何一个元素作为枢轴都可以看作等价于随机选择枢轴，
//（虽然这不叫随机选择枢纽）”，这句话，是完全不成立的，是错误的。
//“因为你总是选择随机数组中第一个元素作为枢纽元，不是随机选择枢纽元”
//相当于把上面这句话中前面的 “随机” 两字去掉，就是：
//因为你总是选择数组中第一个元素作为枢纽元，不是随机选择枢纽元。
//所以，这个程序，始终做不到平均时间复杂度为O（N）。
//随机数组和给定一个非有序而随机手动输入的数组，是一个道理。稍后，还将就程序的运行结果继续解释这个问题。
//July、updated，2011.05.18。
// 计算一次查找所需的时钟周期数
clock_t start = clock();
int data = kth_elem(array, 0, num - 1, k);
clock_t end = clock();
acc += (end - start);
}
cout << "The average time of searching a date in the array size of " << num << " is " << acc / 10 << endl;
}
return 0;
}

测试：
The average time of searching a date in the array size of 5000 is 0
The average time of searching a date in the array size of 50000 is 1
The average time of searching a date in the array size of 500000 is 12
The average time of searching a date in the array size of 5000000 is 114
The average time of searching a date in the array size of 50000000 is 1159
Press any key to continue

通过测试这个程序，我们竟发现这个程序的运行时间是线性的?
或许，你还没有意识到这个问题，ok，听我慢慢道来。
我们之前说，要保证这个算法是线性的，就一定要在枢纽元的选取上下足功夫：
1、要么是随机选取枢纽元作为划分元素
2、要么是取中位数的中位数作为枢纽元划分元素

现在，这程序直接选取了数组中第一个元素作为枢纽元
竟然，也能做到线性O（N）的复杂度，这不是自相矛盾么?
你觉得这个程序的运行时间是线性O（N），是巧合还是确定会是如此?

哈哈，且看1、@well：根据上面的运行结果不能判断线性，如果人家是O(n^1.1) 也有可能啊，而且部分数据始终是拟合，还是要数学证明才可靠。2、@July：同时，随机数组中选取一个元素作为枢纽元！=> 随机数组中随机选取一个元素作为枢纽元（如果是随机选取随机数组中的一个元素作为主元，那就不同了，跟随机选取数组中一个元素作为枢纽元一样了）。3、@飞羽：正是因为数组本身是随机的，所以选择第一个元素和随机选择其它的数是等价的（由等概率产生保证），这第3点，我与飞羽有分歧，至于谁对谁错，待时间让我考证。

关于上面第3点我和飞羽的分歧，在我们进一步讨论之后，一致认定（不过，相信，你看到了上面程序更新的注释之后，你应该有几分领会了）：

我们说输入一个数组的元素，不按其顺序输入：如，1,2,3,4,5,6,7，而是这样输入：5,7,6,4,3，1,2，这就叫随机输入，而这种情况就相当于上述程序主函数中所产生的随机数组。然而选取随机输入的数组或随机数组中第一个元素作为主元，我们不能称之为说是随机选取枢纽元。

因为，随机数产生器产生的数据是随机的，没错，但你要知道，你总是选取随机数组的第一个元素作为枢纽元，这不叫随机选取枢纽元。

所以，上述程序的主函数中随机产生的数组对这个程序的算法而言，没有任何意义，就是帮忙产生了一个随机数组，帮助我们完成了测试，且方便我们测试大数据量而已，就这么简单。

且一般来说，我们看一个程序的时间复杂度，是不考虑其输入情况的，即不考虑主函数，正如这个 kth number 的程序所见，你每次都是随机选取数组中第一个元素作为枢纽元，而并不是随机选择枢纽元，所以，做不到平均时间复杂度为O（N）。

所以：想要保证此快速选择算法为O（N）的复杂度，只有两种途径，那就是保证划分的枢纽元元素的选取是：
1、随机的（注，此枢纽元随机不等同于数组随机）
2、五分化中项的中项，或中位数的中位数。

所以，虽然咱们对于一切心知肚明，但上面程序的运行结果说明不了任何问题，这也从侧面再次佐证了咱们第三章中观点的正确无误性。

updated：

非常感谢飞羽等人的工作，将上述三个版本综合到了一起（待进一步测试）：

///下面的代码对July博客中的三个版本代码进行重新改写。欢迎指出错误。
///先把它们贴在这里，还要进行随机化数据测试。待发...
//modified by 飞羽 at 2011.5.11
/////Top_K_test
//修改了下命名规范，July、updated，2011.05.12。
#include <iostream>
#include <stdlib.h>
using namespace std;
inline int my_rand(int low, int high)
{
int size = high - low + 1;
return low + rand() % size;
}
int partition(int array[], int left, int right)
{
int pivot = array[right];
int pos = left-1;
for(int index = left; index < right; index++)
{
if(array[index] <= pivot)
swap(array[++pos], array[index]);
}
swap(array[++pos], array[right]);
return pos;//返回pivot所在位置
}
bool median_select(int array[], int left, int right, int k)
{
//第k小元素，实际上应该在数组中下标为k-1
if (k-1 > right || k-1 < left)
return false;
//真正的三数中值作为枢纽元方法，关键代码就是下述六行
int midIndex=(left+right)/2;
if(array[left]<array[midIndex])
swap(array[left],array[midIndex]);
if(array[right]<array[midIndex])
swap(array[right],array[midIndex]);
if(array[right]<array[left])
swap(array[right],array[left]);
swap(array[left], array[right]);
int pos = partition(array, left, right);
if (pos == k-1)
return true;
else if (pos > k-1)
return median_select(array, left, pos-1, k);
else return median_select(array, pos+1, right, k);
}
bool rand_select(int array[], int left, int right, int k)
{
//第k小元素，实际上应该在数组中下标为k-1
if (k-1 > right || k-1 < left)
return false;
//随机从数组中选取枢纽元元素
int Index = my_rand(left, right);
swap(array[Index], array[right]);
int pos = partition(array, left, right);
if (pos == k-1)
return true;
else if (pos > k-1)
return rand_select(array, left, pos-1, k);
else return rand_select(array, pos+1, right, k);
}
bool kth_select(int array[], int left, int right, int k)
{
//直接取最原始的划分操作
if (k-1 > right || k-1 < left)
return false;
int pos = partition(array, left, right);
if(pos == k-1)
return true;
else if(pos > k-1)
return kth_select(array, left, pos-1, k);
else return kth_select(array, pos+1, right, k);
}
int main()
{
int array1[] = {7, 8, 9, 54, 6, 4, 11, 1, 2, 33};
int array2[] = {7, 8, 9, 54, 6, 4, 11, 1, 2, 33};
int array3[] = {7, 8, 9, 54, 6, 4, 11, 1, 2, 33};
int numOfArray = sizeof(array1) / sizeof(int);
for(int i=0; i<numOfArray; i++)
printf("%d/t",array1[i]);
int K = 9;
bool flag1 = median_select(array1, 0, numOfArray-1, K);
bool flag2 = rand_select(array2, 0, numOfArray-1, K);
bool flag3 = kth_select(array3, 0, numOfArray-1, K);
if(!flag1)
return 1;
for(i=0; i<K; i++)
printf("%d/t",array1[i]);
printf("/n");
if(!flag2)
return 1;
for(i=0; i<K; i++)
printf("%d/t",array2[i]);
printf("/n");
if(!flag3)
return 1;
for(i=0; i<K; i++)
printf("%d/t",array3[i]);
printf("/n");
return 0;
}

说明：@飞羽：因为预先设定了K，经过分割算法后，数组肯定被划分为array[0...k-1]和array[k...length-1]，注意到经过Select_K_Version操作后，数组是被不断地分割的，使得比array[k-1]的元素小的全在左边，题目要求的是最小的K个元素，当然也就是array[0...k-1]，所以输出的结果就是前k个最小的数：

7       8       9       54      6       4       11      1       2       33
4       1       2       6       7       8       9       11      33
7       6       4       1       2       8       9       11      33
7       8       9       6       4       11      1       2       33
Press any key to continue

（更多，请参见：此狂想曲系列tctop修订wiki页面：http://tctop.wikispaces.com/）

第二节、寻找最大的k个数
把之前第三章的问题，改几个字，即成为寻找最大的k个数的问题了，如下所述：
查找最大的k个元素
题目描述：输入n个整数，输出其中最大的k个。
例如输入1，2，3，4，5，6，7和8这8个数字，则最大的4个数字为8，7，6和5。

分析：由于寻找最大的k个数的问题与之前的寻找最小的k个数的问题，本质是一样的，所以，这里就简单阐述下思路，ok，考验你举一反三能力的时间到了：

    1、排序，快速排序。我们知道，快速排序平均所费时间为n*logn，从小到大排序这n个数，然后再遍历序列中后k个元素输出，即可，总的时间复杂度为O（n*logn+k）=O（n*logn）。

    2、排序，选择排序。用选择或交换排序，即遍历n个数，先把最先遍历到得k个数存入大小为k的数组之中，对这k个数，利用选择或交换排序，找到k个数中的最小数kmin（kmin设为k个元素的数组中最小元素），用时O（k）（你应该知道，插入或选择排序查找操作需要O（k）的时间），后再继续遍历后n-k个数，x与kmin比较：如果x>kmin，则x代替kmin，并再次重新找出k个元素的数组中最大元素kmin‘（多谢jiyeyuran 提醒修正）；如果x<kmin，则不更新数组。这样，每次更新或不更新数组的所用的时间为O（k）或O（0），整趟下来，总的时间复杂度平均下来为：n*O（k）=O（n*k）。

    3、维护k个元素的最小堆，原理与上述第2个方案一致，即用容量为k的最小堆存储最先遍历到的k个数，并假设它们即是最大的k个数，建堆费时O（k），并调整堆（费时O（logk））后，有k1>k2>...kmin（kmin设为小顶堆中最小元素）。继续遍历数列，每次遍历一个元素x，与堆顶元素比较，若x>kmin，则更新堆（用时logk），否则不更新堆。这样下来，总费时O（k*logk+（n-k）*logk）=O（n*logk）。此方法得益于在堆中，查找等各项操作时间复杂度均为logk（不然，就如上述思路2所述：直接用数组也可以找出最大的k个元素，用时O（n*k））。

    4、按编程之美第141页上解法二的所述，类似快速排序的划分方法，N个数存储在数组S中，再从数组中随机选取一个数X，把数组划分为Sa和Sb俩部分，Sa>=X>=Sb，如果要查找的k个元素小于Sa的元素个数，则返回Sa中较大的k个元素，否则返回Sa中所有的元素+Sb中最大的k-|Sa|个元素。不断递归下去，把问题分解成更小的问题，平均时间复杂度为O（N）（编程之美所述的n*logk的复杂度有误，应为O（N），特此订正。其严格证明，请参考第三章：程序员面试题狂想曲：第三章、寻找最小的k个数、updated 10次）。
   .........

其它的方法，在此不再重复了，同时，寻找最小的k个数借助堆的实现，代码在上一篇文章第三章已有给出，更多，可参考第三章，只要把最大堆改成最小堆，即可。

第三节、Top K 算法问题
3.1、搜索引擎热门查询统计

题目描述：
搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的长度为1-255字节。
假设目前有一千万个记录（这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个。一个查询串的重复度越高，说明查询它的用户越多，也就是越热门。），请你统计最热门的10个查询串，要求使用的内存不能超过1G。

分析：这个问题在之前的这篇文章十一、从头到尾彻底解析Hash表算法里，已经有所解答。方法是:

    第一步、先对这批海量数据预处理，在O（N）的时间内用Hash表完成统计（之前写成了排序，特此订正。July、2011.04.27）；
    第二步、借助堆这个数据结构，找出Top K，时间复杂度为N‘logK。
        即，借助堆结构，我们可以在log量级的时间内查找和调整/移动。因此，维护一个K(该题目中是10)大小的小根堆（K1>K2>....Kmin，Kmin设为堆顶元素），然后遍历300万的Query，分别和根元素Kmin进行对比比较（如上第2节思路3所述，若X>Kmin，则更新并调整堆，否则，不更新），我们最终的时间复杂度是：O（N） + N'*O（logK），（N为1000万，N’为300万）。ok，更多，详情，请参考原文。

或者：采用trie树，关键字域存该查询串出现的次数，没有出现为0。最后用10个元素的最小推来对出现频率进行排序。

ok，本章里，咱们来实现这个问题，为了降低实现上的难度，假设这些记录全部是一些英文单词，即用户在搜索框里敲入一个英文单词，然后查询搜索结果，最后，要你统计输入单词中频率最大的前K个单词。ok，复杂问题简单化了之后，编写代码实现也相对轻松多了，画的简单示意图（绘制者，yansha），如下：

程序员编程艺术：第三章、寻找最小的k个数

完整源码：

//copyright@yansha &&July
//July、updated，2011.05.08
//题目描述：
//搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的
//长度为1-255字节。假设目前有一千万个记录（这些查询串的重复度比较高，虽然总数是1千万，但如果
//除去重复后，不超过3百万个。一个查询串的重复度越高，说明查询它的用户越多，也就是越热门），
//请你统计最热门的10个查询串，要求使用的内存不能超过1G。
#include <iostream>
#include <string>
#include <assert.h>
using namespace std;
#define HASHLEN 2807303
#define WORDLEN 30
// 结点指针
typedef struct node_no_space *ptr_no_space;
typedef struct node_has_space *ptr_has_space;
ptr_no_space head[HASHLEN];
struct node_no_space
{
char *word;
int count;
ptr_no_space next;
};
struct node_has_space
{
char word[WORDLEN];
int count;
ptr_has_space next;
};
// 最简单hash函数
int hash_function(char const *p)
{
int value = 0;
while (*p != '/0')
{
value = value * 31 + *p++;
if (value > HASHLEN)
value = value % HASHLEN;
}
return value;
}
// 添加单词到hash表
void append_word(char const *str)
{
int index = hash_function(str);
ptr_no_space p = head[index];
while (p != NULL)
{
if (strcmp(str, p->word) == 0)
{
(p->count)++;
return;
}
p = p->next;
}
// 新建一个结点
ptr_no_space q = new node_no_space;
q->count = 1;
q->word = new char [strlen(str)+1];
strcpy(q->word, str);
q->next = head[index];
head[index] = q;
}
// 将单词处理结果写入文件
void write_to_file()
{
FILE *fp = fopen("result.txt", "w");
assert(fp);
int i = 0;
while (i < HASHLEN)
{
for (ptr_no_space p = head[i]; p != NULL; p = p->next)
fprintf(fp, "%s %d/n", p->word, p->count);
i++;
}
fclose(fp);
}
// 从上往下筛选，保持小根堆
void sift_down(node_has_space heap[], int i, int len)
{
int min_index = -1;
int left = 2 * i;
int right = 2 * i + 1;
if (left <= len && heap[left].count < heap[i].count)
min_index = left;
else
min_index = i;
if (right <= len && heap[right].count < heap[min_index].count)
min_index = right;
if (min_index != i)
{
// 交换结点元素
swap(heap[i].count, heap[min_index].count);
char buffer[WORDLEN];
strcpy(buffer, heap[i].word);
strcpy(heap[i].word, heap[min_index].word);
strcpy(heap[min_index].word, buffer);
sift_down(heap, min_index, len);
}
}
// 建立小根堆
void build_min_heap(node_has_space heap[], int len)
{
if (heap == NULL)
return;
int index = len / 2;
for (int i = index; i >= 1; i--)
sift_down(heap, i, len);
}
// 去除字符串前后符号
void handle_symbol(char *str, int n)
{
while (str[n] < '0' || (str[n] > '9' && str[n] < 'A') || (str[n] > 'Z' && str[n] < 'a') || str[n] > 'z')
{
str[n] = '/0';
n--;
}
while (str[0] < '0' || (str[0] > '9' && str[0] < 'A') || (str[0] > 'Z' && str[0] < 'a') || str[0] > 'z')
{
int i = 0;
while (i < n)
{
str[i] = str[i+1];
i++;
}
str[i] = '/0';
n--;
}
}
int main()
{
char str[WORDLEN];
for (int i = 0; i < HASHLEN; i++)
head[i] = NULL;
// 将字符串用hash函数转换成一个整数并统计出现频率
FILE *fp_passage = fopen("string.txt", "r");
assert(fp_passage);
while (fscanf(fp_passage, "%s", str) != EOF)
{
int n = strlen(str) - 1;
if (n > 0)
handle_symbol(str, n);
append_word(str);
}
fclose(fp_passage);
// 将统计结果输入文件
write_to_file();
int n = 10;
ptr_has_space heap = new node_has_space [n+1];
int c;
FILE *fp_word = fopen("result.txt", "r");
assert(fp_word);
for (int j = 1; j <= n; j++)
{
fscanf(fp_word, "%s %d", &str, &c);
heap[j].count = c;
strcpy(heap[j].word, str);
}
// 建立小根堆
build_min_heap(heap, n);
// 查找出现频率最大的10个单词
while (fscanf(fp_word, "%s %d", &str, &c) != EOF)
{
if (c > heap[1].count)
{
heap[1].count = c;
strcpy(heap[1].word, str);
sift_down(heap, 1, n);
}
}
fclose(fp_word);
// 输出出现频率最大的单词
for (int k = 1; k <= n; k++)
cout << heap[k].count << " " << heap[k].word << endl;
return 0;
}

程序测试：咱们接下来，来对下面的通过用户输入单词后，搜索引擎记录下来，“大量”单词记录进行统计（同时，令K=10，即要你找出10个最热门查询的单词）：

程序员编程艺术：第三章、寻找最小的k个数

运行结果：根据程序的运行结果，可以看到，搜索引擎记录下来的查询次数最多的10个单词为（注，并未要求这10个数要有序输出）：in（312次），it（384次），a（432），that（456），MPQ（408），of（504），and（624），is（456），the（1008），to（936）。

读者反馈from 杨忠胜：3.1节的代码第38行 hash_function(char const *p)有误吧，这样的话，不能修改p的值（但是函数需要修改指针的值），要想不修改*p指向的内容，应该是const char *p; 此外，您程序中的/t, /n有误，C语言是\t,\n。
感谢这位读者的来信，日后统一订正。谢谢。

3.2、统计出现次数最多的数据

题目描述：
给你上千万或上亿数据（有重复），统计其中出现次数最多的前N个数据。

分析：上千万或上亿的数据，现在的机器的内存应该能存下（也许可以，也许不可以）。所以考虑采用hash_map/搜索二叉树/红黑树等来进行统计次数。然后就是取出前N个出现次数最多的数据了。当然，也可以堆实现。

ok，此题与上题类似，最好的方法是用hash_map统计出现的次数，然后再借用堆找出出现次数最多的N个数据。不过，上一题统计搜索引擎最热门的查询已经采用过hash表统计单词出现的次数，特此，本题咱们改用红黑树取代之前的用hash表，来完成最初的统计，然后用堆更新，找出出现次数最多的前N个数据。

同时，正好个人此前用c && c++ 语言实现过红黑树，那么，代码能借用就借用吧。
完整代码：

//copyright@ zhouzhenren &&July
//July、updated，2011.05.08.
//题目描述：
//上千万或上亿数据（有重复），统计其中出现次数最多的前N个数据
//解决方案：
//1、采用红黑树（本程序中有关红黑树的实现代码来源于@July）来进行统计次数。
//2、然后遍历整棵树，同时采用最小堆更新前N个出现次数最多的数据。
//声明：版权所有，引用必须注明出处。
#define PARENT(i) (i)/2
#define LEFT(i) 2*(i)
#define RIGHT(i) 2*(i)+1
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
typedef enum rb_color{ RED, BLACK }RB_COLOR;
typedef struct rb_node
{
int key;
int data;
RB_COLOR color;
struct rb_node* left;
struct rb_node* right;
struct rb_node* parent;
}RB_NODE;
RB_NODE* RB_CreatNode(int key, int data)
{
RB_NODE* node = (RB_NODE*)malloc(sizeof(RB_NODE));
if (NULL == node)
{
printf("malloc error!");
exit(-1);
}
node->key = key;
node->data = data;
node->color = RED;
node->left = NULL;
node->right = NULL;
node->parent = NULL;
return node;
}
/**
* 左旋
*
* node right
* / / ==> / /
* a right node y
* / / / /
* b y a b
*/
RB_NODE* RB_RotateLeft(RB_NODE* node, RB_NODE* root)
{
RB_NODE* right = node->right; // 指定指针指向 right<--node->right
if ((node->right = right->left))
right->left->parent = node; // 好比上面的注释图，node成为b的父母
right->left = node; // node成为right的左孩子
if ((right->parent = node->parent))
{
if (node == node->parent->right)
node->parent->right = right;
else
node->parent->left = right;
}
else
root = right;
node->parent = right; //right成为node的父母
return root;
}
/**
* 右旋
*
* node left
* / / / /
* left y ==> a node
* / / / /
* a b b y
*/
RB_NODE* RB_RotateRight(RB_NODE* node, RB_NODE* root)
{
RB_NODE* left = node->left;
if ((node->left = left->right))
left->right->parent = node;
left->right = node;
if ((left->parent = node->parent))
{
if (node == node->parent->right)
node->parent->right = left;
else
node->parent->left = left;
}
else
root = left;
node->parent = left;
return root;
}
/**
* 红黑树的3种插入情况
* 用z表示当前结点, p[z]表示父母、p[p[z]]表示祖父, y表示叔叔.
*/
RB_NODE* RB_Insert_Rebalance(RB_NODE* node, RB_NODE* root)
{
RB_NODE *parent, *gparent, *uncle, *tmp; //父母p[z]、祖父p[p[z]]、叔叔y、临时结点*tmp
while ((parent = node->parent) && parent->color == RED)
{ // parent 为node的父母，且当父母的颜色为红时
gparent = parent->parent; // gparent为祖父
if (parent == gparent->left) // 当祖父的左孩子即为父母时,其实上述几行语句，无非就是理顺孩子、父母、祖父的关系。
{
uncle = gparent->right; // 定义叔叔的概念，叔叔y就是父母的右孩子。
if (uncle && uncle->color == RED) // 情况1：z的叔叔y是红色的
{
uncle->color = BLACK; // 将叔叔结点y着为黑色
parent->color = BLACK; // z的父母p[z]也着为黑色。解决z，p[z]都是红色的问题。
gparent->color = RED;
node = gparent; // 将祖父当做新增结点z，指针z上移俩层，且着为红色。
// 上述情况1中，只考虑了z作为父母的右孩子的情况。
}
else // 情况2：z的叔叔y是黑色的，
{
if (parent->right == node) // 且z为右孩子
{
root = RB_RotateLeft(parent, root); // 左旋[结点z，与父母结点]
tmp = parent;
parent = node;
node = tmp; // parent与node 互换角色
}
// 情况3：z的叔叔y是黑色的，此时z成为了左孩子。
// 注意，1：情况3是由上述情况2变化而来的。
// ......2：z的叔叔总是黑色的，否则就是情况1了。
parent->color = BLACK; // z的父母p[z]着为黑色
gparent->color = RED; // 原祖父结点着为红色
root = RB_RotateRight(gparent, root); // 右旋[结点z，与祖父结点]
}
}
else
{
// 这部分是特别为情况1中，z作为左孩子情况，而写的。
uncle = gparent->left; // 祖父的左孩子作为叔叔结点。[原理还是与上部分一样的]
if (uncle && uncle->color == RED) // 情况1：z的叔叔y是红色的
{
uncle->color = BLACK;
parent->color = BLACK;
gparent->color = RED;
node = gparent; // 同上
}
else // 情况2：z的叔叔y是黑色的，
{
if (parent->left == node) // 且z为左孩子
{
root = RB_RotateRight(parent, root); // 以结点parent、root右旋
tmp = parent;
parent = node;
node = tmp; // parent与node 互换角色
}
// 经过情况2的变化，成为了情况3.
parent->color = BLACK;
gparent->color = RED;
root = RB_RotateLeft(gparent, root); // 以结点gparent和root左旋
}
}
}
root->color = BLACK; // 根结点，不论怎样，都得置为黑色。
return root; // 返回根结点。
}
/**
* 红黑树查找结点
* rb_search_auxiliary：查找
* rb_node_t* rb_search：返回找到的结点
*/
RB_NODE* RB_SearchAuxiliary(int key, RB_NODE* root, RB_NODE** save)
{
RB_NODE* node = root;
RB_NODE* parent = NULL;
int ret;
while (node)
{
parent = node;
ret = node->key - key;
if (0 < ret)
node = node->left;
else if (0 > ret)
node = node->right;
else
return node;
}
if (save)
*save = parent;
return NULL;
}
/**
* 返回上述rb_search_auxiliary查找结果
*/
RB_NODE* RB_Search(int key, RB_NODE* root)
{
return RB_SearchAuxiliary(key, root, NULL);
}
/**
* 红黑树的插入
*/
RB_NODE* RB_Insert(int key, int data, RB_NODE* root)
{
RB_NODE* parent = NULL;
RB_NODE* node = NULL;
parent = NULL;
if ((node = RB_SearchAuxiliary(key, root, &parent))) // 调用RB_SearchAuxiliary找到插入结点的地方
{
node->data++; // 节点已经存在data值加1
return root;
}
node = RB_CreatNode(key, data); // 分配结点
node->parent = parent;
if (parent)
{
if (parent->key > key)
parent->left = node;
else
parent->right = node;
}
else
{
root = node;
}
return RB_Insert_Rebalance(node, root); // 插入结点后，调用RB_Insert_Rebalance修复红黑树的性质
}
typedef struct rb_heap
{
int key;
int data;
}RB_HEAP;
const int heapSize = 10;
RB_HEAP heap[heapSize+1];
/**
* MAX_HEAPIFY函数对堆进行更新，使以i为根的子树成最大堆
*/
void MIN_HEAPIFY(RB_HEAP* A, const int& size, int i)
{
int l = LEFT(i);
int r = RIGHT(i);
int smallest = i;
if (l <= size && A[l].data < A[i].data)
smallest = l;
if (r <= size && A[r].data < A[smallest].data)
smallest = r;
if (smallest != i)
{
RB_HEAP tmp = A[i];
A[i] = A[smallest];
A[smallest] = tmp;
MIN_HEAPIFY(A, size, smallest);
}
}
/**
* BUILD_MINHEAP函数对数组A中的数据建立最小堆
*/
void BUILD_MINHEAP(RB_HEAP* A, const int& size)
{
for (int i = size/2; i >= 1; --i)
MIN_HEAPIFY(A, size, i);
}
/*
3、维护k个元素的最小堆，原理与上述第2个方案一致，
即用容量为k的最小堆存储最先在红黑树中遍历到的k个数，并假设它们即是最大的k个数，建堆费时O（k），
然后调整堆（费时O（logk））后，有k1>k2>...kmin（kmin设为小顶堆中最小元素）。
继续中序遍历红黑树，每次遍历一个元素x，与堆顶元素比较，若x>kmin，则更新堆（用时logk），否则不更新堆。
这样下来，总费时O（k*logk+（n-k）*logk）=O（n*logk）。
此方法得益于在堆中，查找等各项操作时间复杂度均为logk）。
*/
//中序遍历RBTree
void InOrderTraverse(RB_NODE* node)
{
if (node == NULL)
{
return;
}
else
{
InOrderTraverse(node->left);
if (node->data > heap[1].data) // 当前节点data大于最小堆的最小元素时，更新堆数据
{
heap[1].data = node->data;
heap[1].key = node->key;
MIN_HEAPIFY(heap, heapSize, 1);
}
InOrderTraverse(node->right);
}
}
void RB_Destroy(RB_NODE* node)
{
if (NULL == node)
{
return;
}
else
{
RB_Destroy(node->left);
RB_Destroy(node->right);
free(node);
node = NULL;
}
}
int main()
{
RB_NODE* root = NULL;
RB_NODE* node = NULL;
// 初始化最小堆
for (int i = 1; i <= 10; ++i)
{
heap[i].key = i;
heap[i].data = -i;
}
BUILD_MINHEAP(heap, heapSize);
FILE* fp = fopen("data.txt", "r");
int num;
while (!feof(fp))
{
fscanf(fp, "%d", &num);
root = RB_Insert(num, 1, root);
}
fclose(fp);
InOrderTraverse(root); //递归遍历红黑树
RB_Destroy(root);
for (i = 1; i <= 10; ++i)
{
printf("%d/t%d/n", heap[i].key, heap[i].data);
}
return 0;
}

程序测试：咱们来对下面这个小文件进行测试：

程序员编程艺术：第三章、寻找最小的k个数

运行结果：如下图所示，

程序员编程艺术：第三章、寻找最小的k个数

问题补遗：

ok，由于在遍历红黑树采用的是递归方式比较耗内存，下面给出一个非递归遍历的程序（下述代码若要运行，需贴到上述程序之后，因为其它的代码未变，只是在遍历红黑树的时候，采取非递归遍历而已，同时，主函数的编写也要稍微修改下）：

//copyright@ zhouzhenren
//July、updated，2011.05.08.
#define STACK_SIZE 1000
typedef struct
{ // 栈的结点定义
RB_NODE** top;
RB_NODE** base;
}*PStack, Stack;
bool InitStack(PStack& st) // 初始化栈
{
st->base = (RB_NODE**)malloc(sizeof(RB_NODE*) * STACK_SIZE);
if (!st->base)
{
printf("InitStack error!");
exit(1);
}
st->top = st->base;
return true;
}
bool Push(PStack& st, RB_NODE*& e) // 入栈
{
if (st->top - st->base >= STACK_SIZE)
return false;
*st->top = e;
st->top++;
return true;
}
bool Pop(PStack& st, RB_NODE*& e) // 出栈
{
if (st->top == st->base)
{
e = NULL;
return false;
}
e = *--st->top;
return true;
}
bool StackEmpty(PStack& st) // 栈是否为空
{
if (st->base == st->top)
return true;
else
return false;
}
bool InOrderTraverse_Stack(RB_NODE*& T) // 中序遍历
{
PStack S = (PStack)malloc(sizeof(Stack));
RB_NODE* P = T;
InitStack(S);
while (P != NULL || !StackEmpty(S))
{
if (P != NULL)
{
Push(S, P);
P = P->left;
}
else
{
Pop(S, P);
if (P->data > heap[1].data) // 当前节点data大于最小堆的最小元素时，更新堆数据
{
heap[1].data = P->data;
heap[1].key = P->key;
MIN_HEAPIFY(heap, heapSize, 1);
}
P = P->right;
}
}
free(S->base);
S->base = NULL;
free(S);
S = NULL;
return true;
}
bool PostOrderTraverse_Stack(RB_NODE*& T) //后序遍历
{
PStack S = (PStack)malloc(sizeof(Stack));
RB_NODE* P = T;
RB_NODE* Pre = NULL;
InitStack(S);
while (P != NULL || !StackEmpty(S))
{
if (P != NULL) // 非空直接入栈
{
Push(S, P);
P = P->left;
}
else
{
Pop(S, P); // 弹出栈顶元素赋值给P
if (P->right == NULL || P->right == Pre) // P的右子树空或是右子树是刚访问过的
{ // 节点，则释放当前节点内存
free(P);
Pre = P;
P = NULL;
}
else // 反之，当前节点重新入栈，接着判断右子树
{
Push(S, P);
P = P->right;
}
}
}
free(S->base);
S->base = NULL;
free(S);
S = NULL;
return true;
}
//主函数稍微修改如下：
int main()
{
RB_NODE* root = NULL;
RB_NODE* node = NULL;
// 初始化最小堆
for (int i = 1; i <= 10; ++i)
{
heap[i].key = i;
heap[i].data = -i;
}
BUILD_MINHEAP(heap, heapSize);
FILE* fp = fopen("data.txt", "r");
int num;
while (!feof(fp))
{
fscanf(fp, "%d", &num);
root = RB_Insert(num, 1, root);
}
fclose(fp);
//若上面的程序后面加上了上述的非递归遍历红黑树的代码，那么以下几行代码，就得修改如下：
//InOrderTraverse(root); //此句去掉（递归遍历树）
InOrderTraverse_Stack(root); // 非递归遍历树
//RB_Destroy(root); //此句去掉（通过递归释放内存）
PostOrderTraverse_Stack(root); // 非递归释放内存
for (i = 1; i <= 10; ++i)
{
printf("%d/t%d/n", heap[i].key, heap[i].data);
}
return 0;
}

updated：

后来，我们狂想曲创作组中的3又用hash+堆实现了上题，很明显比采用上面的红黑树，整个实现简洁了不少，其完整源码如下：

完整源码：

//Author: zhouzhenren
//Description: 上千万或上亿数据（有重复），统计其中出现次数最多的钱N个数据
//Algorithm：采用hash_map来进行统计次数+堆（找出Top K）。
//July，2011.05.12。纪念汶川地震三周年，默哀三秒。
#define PARENT(i) (i)/2
#define LEFT(i) 2*(i)
#define RIGHT(i) 2*(i)+1
#define HASHTABLESIZE 2807303
#define HEAPSIZE 10
#define A 0.6180339887
#define M 16384 //m=2^14
#include <stdio.h>
#include <stdlib.h>
typedef struct hash_node
{
int data;
int count;
struct hash_node* next;
}HASH_NODE;
HASH_NODE* hash_table[HASHTABLESIZE];
HASH_NODE* creat_node(int& data)
{
HASH_NODE* node = (HASH_NODE*)malloc(sizeof(HASH_NODE));
if (NULL == node)
{
printf("malloc node failed!/n");
exit(EXIT_FAILURE);
}
node->data = data;
node->count = 1;
node->next = NULL;
return node;
}
/**
* hash函数采用乘法散列法
* h(k)=int(m*(A*k mod 1))
*/
int hash_function(int& key)
{
double result = A * key;
return (int)(M * (result - (int)result));
}
void insert(int& data)
{
int index = hash_function(data);
HASH_NODE* pnode = hash_table[index];
while (NULL != pnode)
{ // 以存在data，则count++
if (pnode->data == data)
{
pnode->count += 1;
return;
}
pnode = pnode->next;
}
// 建立一个新的节点，在表头插入
pnode = creat_node(data);
pnode->next = hash_table[index];
hash_table[index] = pnode;
}
/**
* destroy_node释放创建节点产生的所有内存
*/
void destroy_node()
{
HASH_NODE* p = NULL;
HASH_NODE* tmp = NULL;
for (int i = 0; i < HASHTABLESIZE; ++i)
{
p = hash_table[i];
while (NULL != p)
{
tmp = p;
p = p->next;
free(tmp);
tmp = NULL;
}
}
}
typedef struct min_heap
{
int count;
int data;
}MIN_HEAP;
MIN_HEAP heap[HEAPSIZE + 1];
/**
* min_heapify函数对堆进行更新，使以i为跟的子树成最大堆
*/
void min_heapify(MIN_HEAP* H, const int& size, int i)
{
int l = LEFT(i);
int r = RIGHT(i);
int smallest = i;
if (l <= size && H[l].count < H[i].count)
smallest = l;
if (r <= size && H[r].count < H[smallest].count)
smallest = r;
if (smallest != i)
{
MIN_HEAP tmp = H[i];
H[i] = H[smallest];
H[smallest] = tmp;
min_heapify(H, size, smallest);
}
}
/**
* build_min_heap函数对数组A中的数据建立最小堆
*/
void build_min_heap(MIN_HEAP* H, const int& size)
{
for (int i = size/2; i >= 1; --i)
min_heapify(H, size, i);
}
/**
* traverse_hashtale函数遍历整个hashtable，更新最小堆
*/
void traverse_hashtale()
{
HASH_NODE* p = NULL;
for (int i = 0; i < HASHTABLESIZE; ++i)
{
p = hash_table[i];
while (NULL != p)
{ // 如果当前节点的数量大于最小堆的最小值，则更新堆
if (p->count > heap[1].count)
{
heap[1].count = p->count;
heap[1].data = p->data;
min_heapify(heap, HEAPSIZE, 1);
}
p = p->next;
}
}
}
int main()
{
// 初始化最小堆
for (int i = 1; i <= 10; ++i)
{
heap[i].count = -i;
heap[i].data = i;
}
build_min_heap(heap, HEAPSIZE);
FILE* fp = fopen("data.txt", "r");
int num;
while (!feof(fp))
{
fscanf(fp, "%d", &num);
insert(num);
}
fclose(fp);
traverse_hashtale();
for (i = 1; i <= 10; ++i)
{
printf("%d/t%d/n", heap[i].data, heap[i].count);
}
return 0;
}

程序测试：对65047kb的数据量文件，进行测试统计（不过，因其数据量实在太大，半天没打开）：

程序员编程艺术：第三章、寻找最小的k个数

运行结果：如下，

程序员编程艺术：第三章、寻找最小的k个数

第四节、海量数据处理问题一般总结

关于海量数据处理的问题，一般有Bloom filter，Hashing，bit-map，堆，trie树等方法来处理。更详细的介绍，请查看此文：十道海量数据处理面试题与十个方法大总结。

余音

反馈：此文发布后，走进搜索引擎的作者&&深入搜索引擎-海量信息的压缩、索引和查询的译者，梁斌老师，对此文提了点意见，如下：1、首先TopK问题，肯定需要有并发的，否则串行搞肯定慢，IO和计算重叠度不高。其次在IO上需要一些技巧，当然可能只是验证算法，在实践中IO的提升会非常明显。最后上文的代码可读性虽好，但机器的感觉可能就会差，这样会影响性能。2、同时，TopK可以看成从地球上选拔k个跑的最快的，参加奥林匹克比赛，各个国家自行选拔，各个大洲选拔，层层选拔，最后找出最快的10个。发挥多机多核的优势。

预告：程序员面试题狂想曲、第四章，本月月底之前发布（尽最大努力）。

修订

程序员面试题狂想曲-tctop（the crazy thingking of programers）的修订wiki（http://tctop.wikispaces.com/）已于今天建立，我们急切的想得到读者的反馈，意见，建议，以及更好的思路，算法，和代码优化的建议。所以，

如果你发现了狂想曲系列中的任何一题，任何一章（http://t.cn/hgVPmH）中的错误，问题，与漏洞，欢迎告知给我们，我们将感激不尽，同时，免费赠送本blog内的全部博文集锦的CHM文件1期；

如果你能对狂想曲系列的创作提供任何建设性意见，或指导，欢迎反馈给我们，并真诚邀请您加入到狂想曲的wiki修订工作中；

如果你是编程高手，对狂想曲的任何一章有自己更好的思路，或算法，欢迎加入狂想曲的创作组，以为千千万万的读者创造更多的价值，更好的服务。

Ps：狂想曲tctop的wiki修订地址为：http://tctop.wikispaces.com/。欢迎围观，更欢迎您加入到狂想曲的创作或wiki修订中。

联系July
•email，[email protected]
•blog，http://blog.csdn.net/v_JULY_v 。
•weibo，http://weibo.com/julyweibo 。

作者按：有任何问题，或建议，欢迎以上述联系方式call me，真诚的谢谢各位。
July、狂想曲创作组，二零一一年五月十日。

你可能感兴趣的:(程序员)

使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
如何自学软件编程？零基础自学编程入门指南 _pangzi
前言零基础自学编程的动力是什么?在开启学习编程之路的时候必须搞清楚自己为什么要学编程?是因为工资高?还是对编程有浓厚的兴趣？还有自己有一定的编程基础想要继续提升自己？其实对于这个问题需要具体分析，如果是单纯看到程序员工资高，而自己本身并没有什么兴趣，那我不建议自学，可以选择参加培训或者不要进入编程领域不然自己学不会没有获得高薪，反而浪费了大把的时间，如果方法不对，反而会打击自信心。下面小编针对学习
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
程序员架构师主要是做什么_程序员架构师：职责、技能与挑战绿色小猪
免费备考资料（2024年11月软考）：历年试题+视频课合集+电子讲义点击领取>>>免费刷题：2024年11月软考备考刷题点此进入>>>程序员架构师的角色定位在软件开发领域，程序员架构师是一个至关重要的角色。他们不仅需要深入理解业务需求，还要将其转化为技术上的解决方案。程序员架构师是项目中的技术领航者，负责制定和维护软件系统的整体架构，确保系统的可扩展性、可维护性和性能。他们的工作涉及从概念化到实现
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
40岁的java程序员，还有出路吗？ cesske java 开发语言
目录前言一、现状与挑战二、出路与机遇三、案例分析与启示四、结语前言40岁Java程序员的出路：挑战与机遇并存在科技日新月异的今天，IT行业始终保持着高速的发展态势，而Java作为其中的重要一员，其地位依然稳固且充满挑战。对于一位40岁的Java程序员而言，面对职业生涯的“中年危机”，是否还有出路？本文将从多个维度探讨这一问题，旨在为这一群体提供思考和启示。一、现状与挑战职场竞争加剧随着技术的不断发
程序员单身单身总动员
如何判断一个男人会不会出轨?容易知足的男人，相对靠谱。他们不会想要通过征服很多异性来证明自己的魅力，他觉得有你一个就够了，多了他也没精力去讨好；他们也特别踏实，只会用行动来向你证明自己。专注于某项兴趣的男人，相对靠谱。比如小编的朋友，是个程序员，世人眼中的闷骚男，他专注于编程，每天24小时除了吃饭睡觉，脑子里想的都是代码，空间、微博也全是代码，最大的业余爱好就是打打游戏，他对老婆就特别专一。综上所
Python开发游戏？也太好用了吧七步编程工具 Github python python 游戏开发语言
程序员宝藏库：https://gitee.com/sharetech_lee/CS-Books-Store当然可以啦！现在日常能够用到和想到的场景，绝大多数都可以用Python实现。效果怎么样暂且不提，但是得益于丰富的第三方工具包，的确让Python能够很容易处理各种各样的场景。对于游戏开发也是这样，如果真的要想商业化，Python在游戏开发方面肯定没办法和C++相提并论，但是如果用于日常学习和自
超级无敌详细的Mysql数据库笔记（基础篇版）当大哥爱上学习 mysql 数据库笔记
注：本篇笔记根据黑马程序员MySQL数据库入门到精通的内容所创建，适合复习和结合该视频学习使用。一.基础1.关系型数据库(RDBMS)概念:建立在关系模型基础上，由多张相互连接的二维表组成的数据库。特点:使用表存储数据，格式统一，便于维护使用SQL语言操作，标准统一，使用方便。2.SQLSQL通用语法SQL语句可以单行或多行书写，以分号结尾.SQL语句可以使用空格/缩进来增强语句的可读性。MySQ
函数可以返回数组吗？有哪3种返回方法呢？如代码种的func2、func3、func4都可以返回数组。func1为什么会报错呢？关于返回数组需要注意哪些呢？神笔馬良 java 算法数据结构
问题描述：根据下列代码回答下列问题。//Createdby黑马程序员.#include"iostream"usingnamespacestd;/**函数返回数组，就是返回指针，要注意：*-不可返回局部数组（在函数内创建的数组），如果要返回需要*-static修饰*-动态内存创建（new[]、delete[]）*-返回全局（在函数外创建的对象）**不推荐函数返回数组，因为要么手动delete、要么s
有个程序员的老公是种什么体验，嫁给程序员，我超级后悔！前端小芳
1：在我还没长开的时候，就常听人说，有两种男人不能嫁：一种是兵哥哥，另一种是程序员。前者见不着，后者死的早。一想到不等头发花白，就要踟蹰独行，我就害怕的厉害。所以，很长一段时间，都对身边的程序员们避而远之。甚至做梦也没有想到，自己会成为程序员的老婆，而且一做就是好多年。2：那天全市停水，为了给部门同事解渴。我气喘吁吁地从超市搬来10瓶矿泉水。“注意性价比啊，一瓶500毫升的水3块，你30块买了5升
Github官方桌面客户端 zwb_jianshu
GitHub是一个面向开源及私有软件项目的托管平台，因为只支持git作为唯一的版本库格式进行托管，故名gitHub。如果你是一名程序员，那么一定会听过或用过现在最流行的版本控制工具GIT！而GitHub.com则是目前全球最热门的公共代码仓库网站，多到数不清的知名开源项目源代码都是托管在它上面。GitHubDesktop免费的Github官方桌面客户端首先，我先对GitHub来一个简单的介绍，Gi
一文搞懂应用架构的3个核心概念公众号-架构师汤师爷后端架构设计 Java SaaS
如果你是一名业务开发，你可能要说，我整天就是做CRUD（增删改查），哪里需要了解什么应用架构设计？经常有人说，程序员35岁之后很容易陷入瓶颈，被行业淘汰，我觉得原因其实就在此。有些朋友在写代码的时候，可能没有太多考虑非功能性的需求、扩展性，只是完成功能，觉得能用就好。做事情的时候，也没有长远的规划，只是把眼前的事情做好就满足了。我面试过很多大龄候选人，他们的简历长达十几页，项目经历有几十个。然而，
oracle数据库安装和配置详细讲解程序员小羊！运维数据库 oracle
大家好，我是程序员小羊！前言：Oracle数据库是全球广泛使用的关系型数据库管理系统(RDBMS)，提供高性能、可靠性、安全性和可扩展性，广泛应用于企业关键任务系统。下面详细介绍如何在CentOS系统上安装和配置Oracle数据库。1.前提条件1.1硬件要求内存：最小1GB，推荐2GB以上。硬盘：至少10GB的可用空间，视具体应用需求而定。1.2软件要求操作系统：CentOS7或CentOS8（确
切换淘宝最新镜像源npm详细讲解程序员小羊！杂文 npm 前端 node.js
大家好，我是程序员小羊！前言：在中国大陆，npm（NodePackageManager）的默认源由于网络限制，速度可能较慢。为了解决这个问题，淘宝提供了一个镜像源，它同步了npm的官方仓库，并显著提升了访问速度。切换到淘宝的镜像源可以加快npm包的下载速度。下面是详细的切换步骤及相关说明。1.查看当前npm源在更改npm源之前，查看当前npm使用的源地址：npmconfiggetregistry默
一文理解 Python 中的环境变量简讯Alfred 和我一起零基础学 Python 简明python教程零基础学python python 环境变量
你好，我是简讯！一枚野生程序员。热爱编程，但目前的工作与编程毫无关系。正在尝试各种副业，目前有做：红包封面商城：如何利用红包封面打造副业购物平台赚取佣金：利用淘宝京东等平台优惠券赚取佣金编辑器使用Neovim多一点，如果你也喜欢使用Nvim，我们可以一起交流。我的Nvim配置：https://github.com/alpha87/nvim。个人公众号经常会分享一些编程相关的文章，还有一些我已经操作
Java中的垃圾回收机制是如何工作的？ Good_tea_h java jvm 算法
Java中的垃圾回收机制（GarbageCollection,GC）是Java虚拟机（JVM）的一个重要组成部分，它负责自动管理内存的分配和释放，以减轻程序员在内存管理方面的负担，并防止内存泄漏和内存溢出等问题。一、垃圾回收机制的核心思想Java的垃圾回收机制主要基于两个核心思想：标记和回收。标记：垃圾收集器会定期自动扫描内存中的对象，根据特定的算法（如可达性分析法）来判断哪些对象已经不再被程序使
Android app后台运行休眠仍然可以运行的方法（确保一直运行) 2401_84102689 2024年程序员学习 android
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Android移动开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
我们都是小小发明家蜻蜓之旅
说到健康码，相信大家都再熟悉不过了。让人惊奇的是，发明它的并不是程序员而是杭州民警钟毅带着他的团队研发出来的。以前只要听到发明家，就觉得特别高大上，好像离我们普通人比较遥远。以前我也这么认为，直到看到了这本《超能编程队4：我是发明家》，才明白原来发明家就在我们身边，就像那位民警一样，他并不是那么遥不可及的。他可以是我们生活中的每一个人，只要你肯创造、肯想象、肯实践，愿意为大家服务、愿意为社会创造价
程序员35岁会失业吗？ Good kid. 经验分享笔记
35岁被认为是程序员职业生涯的分水岭，许多程序员开始担忧自己的职业发展是否会受到年龄的限制。有人担心随着年龄的增长，技术更新换代的速度会使得资深程序员难以跟上；而另一些人则认为，丰富的经验和深厚的技术积累是年轻程序员无法比拟的宝贵财富。那么，让我们来探讨一下这个话题。技术更新与个人适应性确实，技术的快速发展对程序员的职业技能有一定的影响。新的编程语言、框架和工具不断涌现，程序员需要不断学习和适应这
关于Echarts的一些设置总结夏之小星星 echarts 前端 javascript
最近领导让我一个偏后端程序员画各种数据展示echarts页面，遇到好多问题在此记录一下，未完待续。。。ps：不喜欢画页面啊啊啊啊啊，以前公司这些都是ui的活啊啊啊啊，折磨死我啦啊啊啊啊一、柱形图1、echarts如何设置柱形颜色渐变在option加color属性option={color:{type:'linear',//x=0,y=1,柱子的颜色在垂直方向渐变x:0,y:1,colorStops
Python教程：面向对象无敌开心 python 开发语言
模块3：Python高级模块概述本课程旨在介绍Python编程语言中的面向对象编程（OOP）概念和技术。学生将学习如何使用类、对象、继承、多态等OOP的关键要素来构建灵活、可重用和可扩展的代码。通过实际编程练习和项目，学生将提高他们的编程技能，学会设计和实现面向对象的解决方案。面向对象编程是在面向过程编程的基础上发展来的，它比面向过程编程具有更强的灵活性和扩展性。面向对象编程是程序员发展的分水岭，
如果面试官问你CAS，你还这么答，可能就要回去等通知了爱玛士程序员面试 Java java 面试开发语言程序员架构
前言大家好，我是JAVA高级开发之路，一个总在为粉丝解决面试题的程序员。最近有几个粉丝说在面试面试中遇到了CAS的问题，连着几次面试都没有让面试官满意，区区CAS底层源码，怎能难倒咱们这届程序员们呢？都支棱起来，跟我一起来搞定CAS底层源码。什么是CASCAS的全称是Compare-And-Swap，它是CPU并发原语。它的功能是判断内存某个位置的值是否为预期值，如果是则更改为新的值，这个过程是原
程序员被公司开除，隔阵子领导命令回公司讲解代码，网友纷纷支招编程彭于晏
对于很多已经步入社会已经开始上班的人来说，离职是一件很常见的事情。有的是员工自己要求离职，可能是有更好的就业机会，也可能是有私事处理，不能继续工作；有的则是企业开除员工，或者是因为员工工作不努力，划水，或者是公司结构调整，需要裁员。但是不管是哪种原因吧，员工在离职前都需要和后来接任的同事将自己手上负责的工作进行交接，包括财务信息、已完成工作、未完成工作等，一方面是给曾经的公司和同事留下一个好印象，
编程小技巧风的低语
40条真言，希望对进阶中的程序朋友有所帮助。1、重构是程序员的主力技能。2、工作日志能提升脑容量。3、先用profiler调查，才有脸谈优化。4、注释贵精不贵多。杜绝大姨妈般的“例注”。漫山遍野的碎碎念注释，实际就是背景噪音。5、普通程序员+google=超级程序员。6、单元测试总是合算的。7、不要先写框架再写实现。最好反过来，从原型中提炼框架。8、代码结构清晰，其它问题都不算事儿。9、好的项目作
基于nodejs+vue的美妆彩妆网站的设计与实现(源码+LW+调试文档+讲解等) 程序员gelei nodejs毕业设计项目 vue.js 前端 javascript
目录：博主介绍：完整视频演示：系统技术介绍：后端Java介绍前端框架Vue介绍具体功能截图：部分代码参考：Mysql表设计参考：项目测试：项目论文：为什么选择我：源码获取：博主介绍：博主：程序员gelei：全网拥有20W+粉丝、CSDN作者、博客专家、全栈领域优质创作者、平台优质Java创作者、专注于Java、小程序、python、安卓技术领域和毕业项目实战✌Java精品实战案例《1000套》20
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f