无心流泪

百度面试经历

今天去百度大厦面试，职位是测试开发工程师（暑期实习），面试官是一位漂亮、友善的JJ

第一道很简单，问程序在内存有几个数据区，堆和栈区有啥区别

第二道是两个有序数组（可能升序或降序），要求合并到一个大数组中，使其仍然有序，讲了大体思路，并用C简单写了实现代码

第三道是给出int型的x、 y两个数，要求不借助第三个变量交换x和y的值，

啊。从大一开始学C，碰到过用value传参、引用传参、指针传参、宏定义交换x和y，但都要用到辅助变量，这次遇到JJ给的不借助第三变量交换x 和y，还真是第一次，My god。。。第一反应，卡壳了，不过也到觉得很新鲜，特别好奇

JJ似乎也看出了我不会，于是说：你先想一会吧，在纸上写写，尽量写出算法代码。哎我没遇到过，不过第七感马上告诉我：这算法肯定不难，但很有技巧，可能是脑筋急转弯，想出来了就会豁然开朗，可惜此刻只缘我身在庐山中，不会呀

于是乎，我就抛开了指针、引用之类的，想用异或、求反、求交等逻辑运算，还画出了00001，000010之类的来比较，可怜一时半会也倒弄不出来，JJ提示我想想有数学运算试试，于是我把考研那会的三角运算的加减乘除都想了个遍，也凑合了一个（x+y）和（x-y）的四则运算，可怜想不出下一步该如何做，哎，再加上突然遇到这个简单的不能再简单的问题却搞不定，再百度处女面心脏也跳得厉害，急得我坐在中央空调的大厦里，就像掉进了热锅里的蚂蚁 ——急得流汗了，这天好热啊，哈哈，JJ看出来了，于是就跳过了

第四题有1.txt、2.txt。。。。n.txt的n个文件，要求查出含有字符串“love”的文件，并返回文件名。我初看太容易了，直接用shell命令 find + grep搞定，可怜JJ要求我用高级语言写伪代码，我于是小声的问了JJ可以用库函数么，她说行. OK 直接str.substring()或者split()在strcmp()搞定. 结果JJ似乎不太满意，似乎感觉这样做效率太低了，哎，我也想直接一个char的去比较，但感觉太麻烦，效率哟

第五道题就是让我测试一台自动售货机，我想百度应该只测试程序，于是我就没说测试按键、电源、硬币纸币等物理特性，直接跳到了测试程序逻辑部分，要用等价划分法、边界值分析法以及经验评估法，并讲了塞钱又强行拉出、正常购物、购完物继续再塞钱三个区间，再在正常购物两侧的区间进行边界值测试以及凭经验测试经常容易出错的地方，JJ看了看我，没说话，继续。。

第六道题以后就是一些概念题了，如死锁的四个条件、进程通信的方式（我只想到了管道、消息、全局变量、信号量四个）、空机测试（JJ似乎把宕 dang机读成了空kong机，不过当时我没反应过来，我管理实验室两台服务器也没遇到过宕机。可怜我当时不知道她空机的意思可能就是宕机，哎反应的确不够敏捷，于是JJ问我懂不懂，我说没遇到过空机，于是JJ也就没再问了）

我记得就这些题，JJ说话很和气，待人也很好，最后JJ问我有什么问题，x和y交换，我的心结呀心结。于是我第一个问题就是问JJ如何不用变量交换x和y的值，JJ笑而不语，留给我当“家庭作业”，让我回家自己查查哎，现在可是恍然大悟啊，我的思路用异或和数学加减运算，现在网上看了，豁然开朗啊，就简单的三句，汗（当天下午面试后回实验室，我就立即用四种方法补做完家庭作业百度面试及总结2 ，但不知道还有没有去百度补交作业的机会啦）。JJ问我还有什么问题，我对身后的那个闪闪发光的太空舱，很感兴趣，于是问JJ那太空舱是干什么的，JJ说是休息的，赞啊百度睡觉的地儿，居然那么的梦幻、可爱——发光的太空舱，哈哈 ^_^ ，JJ看着我好奇的目光，又笑啦：可能笑我好幼稚的孩子呀就这样，百度初面OVER la ;我看看手机时间，从我13：25提前五分钟预约面试官（原定13：30面试），到14：14面试结束后签到离开，一共仅用了49分钟，其中还包括上楼、下楼、走路、寒暄等时间，看看周围的GGJJ还在面试ing，JJ做事很干练啊，赞

huhu，总体感觉面试题都不是很难，只是当时考虑、描述不是很清楚，x和y那道easyest题，思维一下子就短路啦，把我的自信打击得荡然无存。

罢啦罢啦，继续等吧，不管结果如何，能够去百度面试，遇到这么友善、干练、聪明JJ，这次百度之行，也算值啦哈哈

不为失败找理由，只为成功找方法……

众里寻他千百度

百度面试，深度总结，不找理由，但求努力，为了梦想，继续奋斗！

今天上完课回实验室后，把昨天面试的三道算法题，完完整整的全部自己重做实现了一遍（多种方法）

以下代码原则上，力争全部都是用C语言实现，但考虑到扩展性和兼容性，算法1使用了模板

测试环境：VS2008

测试结果：测试通过

view plaincopy to clipboardprint?

·········10········20········30········40········50········60········70········80········90········100·······110·······120·······130·······140·······150

1. /**** BaiduInterview.cpp : Defines the entry point for the console application. ***/

2. /**** 欢迎访问杨刚的CSDN技术交流博客：http: //blog.csdn.net/Sunboy_2050 ***/

3. /**************************************/

4. /***** 百度面试 - 算法设计 ****/

5. /***** 面试官：漂亮姐姐 **** /

6. /***** 面试人：杨刚 ****/

7. /***** 时间：2010.6.28 **** /

8. /**************************************/

9. #include "stdafx.h"

10. #include

11. #include

12. #include

13. #include

14. #include

15. /**************************************/

16. /***** 面试题1：两数组归并排序 ****/

17. /**************************************/

18. template

19. void PrintArray(T *array, int len)

20. {

21. int i;

22. for(i=0; i

23. {

24. printf("%6d", array[i]); /* printf("%6.2f", array[i]); printf("%6c", array[i]);*/

25. if(9==i%10) /* 每输出5个数据后，就换行 */

26. printf("\n");

27. }

28. printf("\n"); /* 数组全部输出后，换行 */

29. }

30. /******* 算法实现1：升(降)序判定法，时间复杂度为 O(n) *******/

31. template

32. void MergySort(T *array1, int len1, T *array2, int len2, T *array3, int len3)

33. {

34. int i, j, k;

35. int flag1, flag2;

36. /* 记录数组Array1和Array2的升序或降序规则（首尾两个元素相比较） */

37. /* 表示规则：1表示升序，0表示降序 */

38. flag1=(array1[0]

39. flag2=(array2[0]

40. k=0; /* 目标数组Array3的下标初始化 */

41. /* if只比较一次，即进入for循环，因此时间复杂度为O（n） */

42. if(1==flag1 && 1==flag2) /* 升-升: 数组Array1升序，数组Array2升序，则数组Array3仍为升序 */

43. {

44. i=0;

45. j=0;

46. while(i

47. {

48. if(array1[i]

49. array3[k++]=array1[i++];

50. else

51. array3[k++]=array2[j++];

52. }

53. while(i

54. array3[k++]=array1[i++];

55. while (j

56. array3[k++]=array2[j++];

57. }

58. else if(1==flag1 && 0==flag2) /* 升-降: 数组Array1升序，数组Array2降序，则数组Array3仍为升序 */

59. {

60. i=0;

61. j=len2-1; /* 从末尾开始升序向前比较，依次都为升序进行排序 */

62. while (i=0)

63. {

64. if(array1[i]

65. array3[k++]=array1[i++];

66. else

67. array3[k++]=array2[j--];

68. }

69. while(i

70. array3[k++]=array1[i++];

71. while (j>=0)

72. array3[k++]=array2[j--];

73. }

74. else if(0==flag1 && 1==flag2) /* 降-升: 数组Array1降序，数组Array2升序，则数组Array3仍为降序 */

75. {

76. i=0;

77. j=len2-1; /* 从末尾开始倒序向前比较，依次都为降序进行排序 */

78. while (i=0)

79. {

80. if(array1[i]>array2[j])

81. array3[k++]=array1[i++];

82. else

83. array3[k++]=array2[j--];

84. }

85. while(i

86. array3[k++]=array1[i++];

87. while (j>=0)

88. array3[k++]=array2[j--];

89. }

90. else if(0==flag1 && 0==flag2) /* 降-降: 数组Array1降序，数组Array2降序，则数组Array3仍为降序 */

91. {

92. i=0;

93. j=0;

94. while (i

95. {

96. if(array1[i]>array2[j])

97. array3[k++]=array1[i++];

98. else

99. array3[k++]=array2[j++];

100. }

101. while(i

102. array3[k++]=array1[i++];

103. while (j

104. array3[k++]=array2[j++];

105. }

106. }

107. /* 归并两个有序数组（升序或降序）到一个大数组 */

108. void MergeArray()

109. {

110. /*************************************************/

111. /* 测试用例1：等价划分（升升、升降、降升、降降） */

112. /*************************************************/

113. /*int array1[10]={1,2,3,4,5,6,7,8,9,10};

114. int array2[5]={0,3,6,9,12};*/

115. int array1[10]={1,2,3,4,5,6,7,8,9,10};

116. int array2[5]={12,9,6,3,0};

117. /*int array1[10]={10,9,8,7,6,5,4,3,2,1};

118. int array2[5]={0,3,6,9,12};*/

119. /*int array1[10]={10,9,8,7,6,5,4,3,2,1};

120. int array2[5]={12,9,6,3,0};*/

121. int array3[15]={0};

122. /*************************************************/

123. /* 测试用例2：边界值分析（左边界、包含、右边界） */

124. /*************************************************/

125. /*int array1[10]={1,2,3,4,5,6,7,8,9,10};

126. int array2[5]={1,3,6,9,12};*/

127. /*int array1[10]={1,2,3,4,5,6,7,8,9,10};

128. int array2[5]={2,3,6,8,9};*/

129. /*int array1[10]={1,2,3,4,5,6,7,8,9,10};

130. int array2[5]={1,3,6,9,10};*/

131. /*int array1[10]={1,2,3,4,5,6,7,8,9,10};

132. int array2[5]={0,3,6,9,10};*/

133. /*int array1[10]={1,2,3,4,5,6,7,8,9,10};

134. int array2[5]={1,1,1,1,1};*/

135. /*int array1[10]={10,10,10,10,10,10,10,10,10,10};

136. int array2[5]={1,1,1,1,1};*/

137. /*int array1[10]={10,10,10,10,10,10,10,10,10,10};

138. int array2[5]={10,10,10,10,10};*/

139.

140. //int array3[15]={0};

141. /*************************************************************/

142. /* 测试用例3：经验评估测试（浮点型、字符型等非整型异常数据） */

143. /*************************************************************/

144. /*float array1[10]={1.1, 2.2, 3.3, 4.4, 5.5, 6.6, 7.7, 8.8, 9.9, 10.0};

145. float array2[5]={1.2, 3.4, 6.7, 9.8, 12.0};

146. float array3[15]={0.0};*/

147. /*char array1[10]={'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'};

148. char array2[5]={'0', 'A', 'J', 'a', 'z'};

149. char array3[15]={0.0};*/

150.

151. printf("\n有序数组Array1：\n");

152. PrintArray(array1, 10);

153.

154. printf("\n有序数组Array2：\n");

155. PrintArray(array2, 5);

156. MergySort(array1, 10, array2, 5, array3, 15);

157. printf("\n归并Array1和Array2后的有序数组：\n");

158. PrintArray(array3, 15);

159. }

160.

161. /****************************************************************/

162. /***** 面试题2：不借助第三方变量，交换两个整型数x和y的值 ****/

163. /****************************************************************/

164. void swap()

165. {

166. int x, y;

167. x=5;

168. y=10;

169. /*函数声明,引用传地址但未用第三方变量*/

170. void swap1(int &x, int &y); /* 方法1 */

171. void swap2(int &x, int &y); /* 方法2 */

172. void swap3(int &x, int &y); /* 方法3 */

173. printf("\n原始值：x=%d, y=%d\n", x, y);

174. swap3(x, y);

175. printf("\n交换后：x=%d, y=%d\n", x, y);

176. }

177.

178. /****************************************/

179. /******* 方法1：算术运算(加减) *******/

180. /****************************************/

181. void swap1(int &x, int &y)

182. {

183. x=x+y; /* x存储x与y的和值（核心思想：x同时先把x和y两者的信息都存储下来） */

184. y=x-y; /* 保持x内存和值不变，y先赋值，即减去y的原始值使其等于x原始的值 */

185. x=x-y; /* 保持x内存和值不变，x再赋值，即减去y现在存储的原始x值，更新x值为原始y的值 */

186. }

187. /**************************************************************/

188. /******* 方法2：算术运算(乘除、指数运算、三角运算等) *******/

189. /**************************************************************/

190. void swap2(int &x, int &y)

191. {

192. x=x*y; /* x存储x与y的积值，核心思想同方法1，x同时先把x和y两者的信息都存储下来，本方法以乘除为例 */

193. y=x/y; /* 保持x内存积值不变，y先赋值，即除去y的原始值使其等于x原始的值 */

194. x=x/y; /* 保持x内存积值不变，x再赋值，即除去y现在存储的原始x值，更新x值为原始y的值 */

195. }

196. /****************************************/

197. /******* 方法3：逻辑运算(异或) *******/

198. /****************************************/

199. void swap3(int &x, int &y)

200. {

201. x^=y; /* x存储x与y的异或值（核心思想同上，即x先存储x和y两者信息（异或表示）） */

202. y^=x; /* 保持x内存和值不变，y先赋值，即利用x异或反转y的原始值使其等于x原始的值 */

203. x^=y; /* 保持x内存和值不变，x再赋值，即利用x异或反转y的原始值使其等于y原始的值 */

204. }

205. /*********************************************************/

206. /******* 方法4：Linux系统下，利用Python语言实现 *******/

207. /*********************************************************/

208. /********** 源代码 **********/

209. /*

210. # !/bin/sh/python

211. # FileName: swap.py

212. # Function: swap x and y not by other variable

213. x=5

214. y=10

215. print("swap before...")

216. print("x=%d, y=%d") % (x,y)

217. x,y=y,x # swap x and y

218. print("swap after...")

219. print("x=%d, y=%d") % (x,y)

220. */

221. /********** 编译方法 **********/

222. /*

223. 说明：

224. 编译环境：Redhat Linux Server 5.2

225. 代码工具：vim文本编辑器

226. 因为绝大部分Linux系统在安装时都会默认自带安装python

227. 在python语言中，#表示注释

228. 第一行 # !/bin/sh/python 告诉系统：编译此py文件的解释器路径，来编译此py源文件

229. 第二行 Filename 注释表示此程序的文件名称为 swap.py，文件执行时不执行

230. 第三行 Filename 注释表示此程序实现的功能，即不利用其它变量交换x和y的值

231. 具体编译运行方法

232. 1、登陆进入Linux系统的终端 Shell 命令界面

233. 2、python swap.py

234. */

235. /********** 运行结果 **********/

236. /*

237. [root@localhost python]# python swap.py

238. swap before...

239. x=5, y=10

240. swap after...

241. x=10, y=5

242. */

243.

244. /****************************************************************/

245. /***** 面试题3：统计单词出现过的文件，并给出其文件名 ****/

246. /****************************************************************/

247. /* 查找匹配文件中是否包含word单词，如果第一次查找匹配成功，则立即返回文件名 */

248. const char *Find_Word(const char *filePath, const char *word)

249. {

250. FILE *pf=NULL;

251. const char *pword=word;

252. char ch;

253. int i, len, flag;

254. if (NULL==(pf=fopen(filePath, "r"))) /* 判断是否成功以只读方式打开文件 */

255. {

256. printf("Sorry! Cannot open file...\n");

257. return NULL;

258. }

259. i=0;

260. while (pword[i++]!='\0')

261. ;

262. len=i-1;

263. i=0;

264. flag=1;

265. ch=fgetc(pf);

266. while(ch!=EOF) /* 循环单个字符读取文件 */

267. {

268. if(ch==' ') /* 英文单词以空格分隔，每当遇到空格，则flag=1表示开始匹配新单词 */

269. {

270. flag=1;

271. ch=fgetc(pf);

272. continue;

273. }

274. if(ch==pword[i] && i依次匹配单个字符，成功 */

275. i++;

276. else /* 匹配失败，则重置i=0 */

277. {

278. i=0;

279. flag=0;

280. }

281.

282. if(i>=len && flag) /* 如果全部匹配成功，则i>=len 返回文件名 */

283. {

284. fclose(pf); /* 关闭打开文件 */

285. pf=NULL; /* 防止野指针 */

286. return filePath;

287. }

288. ch=fgetc(pf);

289. }

290. fclose(pf);

291. pf=NULL;

292. return NULL;

293. }

294. /* 遍历文件夹下的所有*.txt格式文件 */

295. void Search_TxtFiles(const char *dirPath, const char *word)

296. {

297. char *filePath=NULL;

298. const char *findFileName=NULL;

299. struct _finddata_t c_file;

300. long hFile;

301. if((hFile=_findfirst("*.txt", &c_file))==-1)

302. {

303. printf( "There is no *.txt files in current directory!\n" );

304. return;

305. }

306. else

307. {

308. printf( "\nListing of files\n" );

309. printf( "\n%-12s %9ld\n", c_file.name, c_file.size );

310. findFileName=Find_Word(c_file.name, word); /* 读取第一个文件 */

311. if(NULL!=findFileName)

312. printf("\n\n%s is found in file: %s\n\n", word, findFileName);

313. while( _findnext( hFile, &c_file ) == 0 ) /* 循环读取其它剩余文件 */

314. {

315. printf( "\n%-12s %9ld\n", c_file.name, c_file.size );

316. findFileName=Find_Word(c_file.name, word);

317. if(NULL!=findFileName)

318. printf("\n\n%s is found in file: %s\n\n", word, findFileName);

319. }

320.

321. _findclose( hFile );

322. }

323. printf("\n");

324. }

325. /* 显示目录文件夹下（相对路径）所有包含单词word的文件名（*.txt） */

326. void Display_FileName()

327. {

328. char *dirPath="..\\..\\data\\txt\\*.txt";

329. char *word="baidu"; /* 匹配文件中是否含有baidu的单词 */

330. Search_TxtFiles(dirPath, word);

331. }

332. /* 主函数，实现面试三道C语言算法题 */

333. int _tmain(int argc, _TCHAR* argv[])

334. {

335. MergeArray(); /* 算法题1：归并两个有序数组（升序或降序） */

336.

337. swap(); /* 算法题2：不借助第三方变量，交换两个整型数x和y的值 */

338. Display_FileName(); /* 算法题3：统计单词出现过的文件，并给出其文件名 */

339. return 0;

340. }

百度面试及总结3

在经历了半个多月的漫长等待、翘首以盼的期待以后，今天终于有幸再次去百度大厦总部二面。此乃谓真应了百度的那句名言：众里寻他千百度，蓦然回首，那人却在灯火阑珊处——为了信念，执著追求、永不言弃！

这次面试官是一位GG，很帅气，干练，自信中散发着内在的睿智——三张纸、两个人、一支笔，没带笔记本——这便是今天面试的主题。

在深刻分析和总结了一面失利的教训后，为了防止一面因听不清题目而要求面试官JJ重述题目的失误，再因这次面试官是一位GG，因此可以和GG坐得尽量靠近些，这样一来便于一次性清晰、准确、完整的理解题目的确切信息，另一方面也方便和面试官进行面对面充分的交流，避免在同一个地方跌倒两次——重蹈一面的覆辙。不过这次面试，我的这些担心看来似乎都是多余的：GG说话声音适量，很有底气，题意、需求、提问也都很清晰、简洁、明了，而且GG在提问的时候还特意重点强调了题意的重要信息，因此这次面试没有因听不清题目而要求面试官重述问题的情况，而且我在理解了GG表述的意思后也尽量迅捷作出反馈。总体上，这次面试感觉比较轻松，交流也很充分，GG待人很好，气氛也很Happy

OK 介绍了这些面试的“前传”以后，下面就让我们直入今天面试的主题

第一道，给出两个集合A和B，其中集合A={name}，集合B={age、sex、scholarship、address、...}，要求：问题1、根据集合A中的name查询出集合B中对应的属性信息；问题2、根据集合B中的属性信息（单个属性，如age<20等），查询出集合A中对应的name

第二道，给出一个文件，里面包含两个字段{url、size}，即url为网址，size为对应网址访问的次数，要求：问题1、利用Linux Shell命令或自己设计算法，查询出url字符串中包含“baidu”子字符串对应的size字段值；问题2、根据问题1的查询结果，对其按照size 由大到小的排列。（说明：url数据量很大，100亿级以上）

第三道，测试一部手机（手机是普通手机，除了系统软件外，可能已经安装了某些应用软件）

第四道，根据我简历上的项目经历，选出了其中的一个“Gloss搜索推荐系统”项目，让我介绍其架构以及我负责的工作

第五道，询问了是否比较熟悉的编程语言（C/C++/C#）、VS2008以及对Linux Shell、Python认识等，主要是聊天交流方式，感觉很轻松

最后，是自由提问环节啦，问我有些什么问题，我主要提问了三个问题：框计算与云计算有哪些区别以及框计算目前的进展如何、百度面对团购网和移动互联网等新兴市场将有哪些战略方面的调整以及质量测试部门的工作和后期面试将要准备或学习些什么（这三个问题依次涉及到：1、框计算，关注百度的发展战略和核心技术创新；2、百度在面对不断变革和创新的互联网市场，将如何定位和战略调整；3、涉及到个人如果有幸三面或最终被录用，我将可能需要提前学习和准备哪些方面的知识储备）

对于第一道的问题1：因为最近我一直都负责处理实验室的海量文本数据（500G以上的log文本数据）进行数据挖掘分析，因此我直接给出了我正在用到的文本处理方法。

方法1、直接利用HashTable的{key、value}来做映射，即利用key记录集合A中的name属性，利用value记录集合B中的属性向量，然后直接key来查询value值

方法2、使用C++的容器类map进行一对多的映射（其实应该是multimap，当时忘了一对一与一对多的关系，在此更正一下）

方法3、自定义映射关系，大体思路是index+vector模式，vector可以利用struct结构体做，index主要对name建立索引，提高查询效率这题的的核心解决思想，其实就是如何建立起一对多的映射关系，以及如何高效的进行查询匹配

对于第一道的问题2：一时我没有非常完整、高效的解决方案，但是我给面试官GG讲了我思考的大体思路：

第一种方案，集合A和集合B，逐行读取并按属性字段判断，如age<20则打印出name，否则直接读取下一行。但GG指出这样做的缺点是需要遍历整个文件，效率较低

第二种方案，于是提高效率，我借鉴了倒排索引的思想，提出把关键字段建立索引，进行“全文”搜索（其实就是集合A中的name），但是GG提出建立索引会占用额外存储空间，不是最优的方案

第三种方案，为了不占用额外存储空间，我再想借鉴数据库的Group+Order方法，对集合B关键字段先分组然后排序，这样既不占用额外存储空间，也比方案一提高了效率，但GG说这不是最优方案，并给我提示说其实很简单，没我想的这么复杂，让我继续想想。。。

于是我继续想了一小会儿，在头脑中快速搜索我曾经还遇到过哪些能够既不占额外存储空间，又能提高效率的方法或借鉴思想。火花一冒，对呀，最近炒得很热的框计算、云计算，它们的设计思想或许可以一用，于是我接着想分布存储计算，对，利用分布式的思想来提高效率。可GG说似乎不行，这仍然不是解决问题2 的最佳解决方案。不过还好的是，GG没有在这个问题上继续损杀我的脑细胞和自信心，而是循于转入下一道题目（GG不死抠面试者最薄弱的环节，而是适时直接转入下一环节，GG提问的技巧和哲学，给了面试者足够的自信和勇气，赞）

好啦，出于对我所崇拜的技术型创新公司——百度面试题目知识产权的保护以及对面试官GG（超牛级人物）劳动成果的尊重，我不再详细介绍本次面试的具体细节 O(∩_∩)O哈哈~，谨以上述第一道题的大体思考过程和分析解决问题的方法，以飨各位支持我、鼓励我的博友们 ^_^

不过做事为了有始有终，不半途而废，下面我还是简单描述一下第2-5题我能想到的解决方法和细节，也希望大家能帮我提出更好更优化的方法

第二道，利用Linux Shell查询文件中的子字符串，需要用grep命令进行内容查询；分离显示文件的url和size两字段，似乎需要用到awk命令（没用过，不太熟悉），二者通过管道|传值。不过当时我没用Shell命令（不敢在GG高手面前Show，否则出了问题可不太好ban滴呵呵面试回来后，我在man sort查看详细参数后，利用Shell的解法请见：百度面试及总结4 ）于是我采用了自己设计算法解决的，分解成三步（1、字符匹配：字节流逐行读取，进行子字符串匹配KMP算法，查出所有包含“baidu”的url；2、打印满足1对应的size结果；3、根据2的结果，先把字段size字段值的字符型转换成整型，然后再用排序算法进行排序）当时说了三种排序算法：二分法、快排、堆排序

这里面还有一个小插曲， GG让我简单写写排序算法的代码，我开始选择采用二分法，复杂度O(nlog2n) 不过这次我在下笔写代码之前，先吸取了一面时JJ说我代码不规范的建议，于是我便从void QuickSort（int sizeArray[], int low, int high）、int i, j, tmp; ... 最基本格式写起，虽然感觉比较麻烦，耗费了宝贵的面试时间，但毕竟吃一堑、长一智嘛——从细节做起，严格要求自己。好吧，就这样写着写着，当写到一半时，突然发现不对头，我原先写过二分法，但忘记了边界值最后到底取上限high还是取下限low 于是我小声请示GG：我想换一种排序算法写，不用二分法，改用快排写，可以么。GG没有马上简单地回复我是或否，而是笑着问我怎么写到一半突然想换算法啦呵呵。面试提问的哲学或许就体现在这里，GG问得非常精妙，颇有提问的艺术。因为他问出了我在写算法的过程中，我头脑中预见、思考、判断、选择等一系列的无法看到的思考过程（GG洞察问题的能力、提问的技巧艺术这些优点也非常值得我学习学习的）于是我也直接告诉GG我的弱点和担心，我怕二分插入排序移动位置后，忘了到底取上标还是下标插入新值的细节所以我想改用我比较熟悉的快排算法，这样一来不用担心上下限选择的问题，二来快排利用递归，代码简洁、清晰、易懂。 GG笑了笑，同意了我的请求，哈哈，于是我改用快排写出了代码，并详细给GG讲了算法遍历的细节和递归过程。（具体快排、二分法（此处代表折半插入排序）、堆排序的实现代码，请详见我原先写的博文各种基本算法实现小结（五）—— 排序算法）

第三道，测试题，在一面时也问过的。不过一面JJ问的是如何测试一台露天售货机，当时我心里想到了需要测试硬件部分，但却没说出来，直接跳到了测试软件部分。这次我也吸取了一面叙述不完整、表达不充分的缺点，而是明确给出需要测试硬件部分等物理特性的。其实测试，只要把握三条最基本的原则：1、等价划分；2、边界值测试；3、经验评估查错（当然啦，经理还需要考虑效益、进度等经济因素）然后遵照这些原则进行分析、思考测试用例、总结。例如本次测试一部手机，先划分为硬件与软件测试两部分。硬件测试如温度、按键、开机、抗摔、抗震、抗摸等等物理特性；软件部分需要细划分为系统软件与应用软件两部分，因为系统软件和应用软件的功能和使用频度不一样，因此需要考虑测试的轻重缓急，由重点软件（如电话薄）到次重点软件（如电子书）再到非重点软件（如游戏），由使用频繁到较频繁再到较少使用等频度划分，如此依次划分进行计划、安排、进行测试。当时我举了硬件、软件；系统软件、应用软件；百度软件和其它应用软件；以及在Android手机上详细测试百度手机输入法等测试过程。核心思路：等价划分——》边界值测试——》凭经验重点测试经常或较易出bug的地方（如果大家想深入学习软件测试的核心思想和方法，推荐一本经典——大师级的Myers编写的《The Art of Software Testing》（软件测试的艺术）

第四道，主要是按照提供的简历，详细询问负责项目的设计思想、实现过程、部分功能实现细节以及采用的技术方法。GG询问了我简历上的一个搜索推荐相关的项目（现导师已让我转交给了一研三师兄，作为他毕业论文开题项目）我详细讲了利用solr做全文搜索的基本原理以及我负责实现的一些功能模块。收集数据源（中科院学生毕业论文、IEEE国际会议、各种学术期刊等等）、Solr建立索引和数据库存储（Solr是在Lucene全文搜索开源系统上封装后的改良系统）、ASP.NET(C#)制作客户端前台页面、用户Search过程等。对这些功能模块我依次做了比较详细的介绍。GG似乎对Search和 sort很感兴趣，于是接着深入询问了solr建立、排序等细节问题，于是我把我曾经负责的工作，如Analyzer分词、语义分析；document全文通过field字段建立索引及存储；用户Search parser的string分词抽取、排序等都做了较为深入的讲解和介绍。这道系统设计题，主要考察的是面试者进行系统设计的整体思想，以及分析问题、解决问题的实战能力、对功能模块技术细节的掌握应用水平。GG问的这些问题，一针见血，切中要害，对系统整体、核心、细节等都关注了，而且还提出了我们设计之初采用MySQL数据库进行存储数据的弊端（GG提出的这个问题，也的确是我们导师最近想改用文本进行海量数据存储）——很有预见能力，值得我在以后的系统设计中，好好学习。。

第五道，就是以聊天为主啦，很轻松愉快，谈了一些比较熟悉的语言编程（C/C++/C#以及Python）、熟悉的编译环境（VS2008和 Linux GCC）、以及对C#是否做过界面（客户端和网页开发）、数据库设计（熟悉MySQL、SQL Server数据库设计，并独立设计过逻辑较为复杂的数据库系统）

最后，自由提问环节，这次我没像一面那样，问“太空舱”睡觉等幼稚的问题啦，而是关注百度的产品战略和技术创新（上面已说过，在此不再赘述）

好啦终于写完了这次面试总体感觉比一面要轻松、愉快，交流很顺畅，沟通也很友好，不过给我印象最深的还是GG的面试风格——三张纸（其中两张还是我的简历）、二个人（GG和我）、一支笔（共同交流的语言）、不带笔记本（他将如何记录我面试的过程呢）——简单、率直、干练，体现出的是GG自信背后的智慧与才华，我终于看到了我心目中大牛级的技术高手啦，以后还得多多向他请教、学习 ^_^ 同时，从GG面试风格上，反映出了百度的核心价值观——Simple and Reliable（简单可依赖）

百度面试及总结4

今天周末，导师让我来实验室，帮他一起把数据从服务器上拷贝下来，然后做预处理，周一上午给出结果。现在干得都差不多了，放在服务器让自个跑着，我闲来没事就随便看看新闻，逛逛论坛，写写博客，回顾总结一下前天面试的经验教训和心得体会

先说说前天百度面试的经历吧，那天下课后匆匆在教学楼打印代码后，便直接骑车飞奔五道口13号地铁站，进站、刷卡、等车、呼呼……、下车、刷卡、出站、然后从西二旗以100米冲刺的速度狂奔百度大厦，跨进B座门后，手机显示16：48分，还好，总算没迟到！

和一面一样，提前5分钟预约面试官，17：00面试正式开始 balabala... 18：00面试over。刚好面试完后，哥哥就给我打电话问我面试的情况如何（可能哥哥就站在4楼看着我面试呢 ^_^），并让我在一楼大厅等一会，他下楼带我去百度一楼吃饭（这个点回学校肯定也都没饭啦）于是我和哥哥一块下楼到百度食堂，也随便感受一下百度的食堂文化——哇，人好多啊！需要排队、需要刷卡、也有免费的绿豆汤。。。有点像中科院的食堂，颇具学校食堂的气氛——于是点了一份喜欢吃的鱼和一小盘海带丝，要了一大份米饭，端了一大碗绿豆汤，哥哥替我打卡，好好蹭饭呗哈哈

面试的序幕和片尾都讲完了，下面再回放一段精彩的剧情吧——回顾一下面试GG让我用Linux Shell命令进行字符串匹配的那道题吧（第二道）

题目大意：给出一个文件，里面包含两个字段{url、size}，url即为网址，size为网址对应访问的次数，要求：问题1、利用Linux Shell命令或自己设计算法，查询出url字符串中包含“baidu”子字符串对应的size字段值；问题2、根据问题1的查询结果，对其按照size 由大到小的排列

面试时我采用的是自己设计算法，面试回来后我man sort查了排序命令的参数使用手册，下面我就详细讲一下用Shell命令的做法

分析题意：baidu.txt{url, size}，baidu.txt是文件，{url, size}是文件中的两个字段，并且url和size都是字符串型，字段之间用tab（\t）隔开

第一步，查询匹配url字符串中的字串"baidu"，直接用grep命令，具体格式 grep "baidu" baidu.txt（每行仅url可能含有baidu子字符串）

第二步，显示含有字串"baidu"的url及其对应的size，可以直接用ls命令，具体格式 ls -l | grep "baidu" baidu.txt（管道传值）

第三步，将步骤2的结果，通过重定向命令>>保存在baidu2.txt文件中，即 grep "baidu" baidu.txt >> baidu2.txt 保存匹配结果

第四步，排序，直接利用sort命令，即格式ls -l | sort -rnk 2 baidu.txt （sort反向r、以第二个字段k 2、数值型n进行排序）

第五步，将步骤4的结果，通过重定向命令>>保存在baidu3.txt文件中，即 sort -rnk 2 baidu2.txt >> baidu3.txt 保存排序结果

按照上面五步，我们先看结果，用数据说话，然后我将在下面依次详细介绍上面五步中用到的Shell命令及其参数的确切含义：

首先，新建baidu.txt文件，即用Vim编辑器输入创建的测试用例（我用过的主流搜索引擎及百度的部分产品），然后利用cat命令查看文件

其次，我们查询url字符串中包含子串"baidu"的项，并打印出url及其size

然后，我们新建baidu2.txt文件，用于保存问题1的结果（即匹配字符串url中包含子串"baidu"的结果项url和size）

接着，我们对上述问题1的结果，利用sort命令按照size由大到小进行排序

最后，我们新建baidu3.txt文件，用于保存sort排序结果

附图说明：

以上截图，均截自我电脑Linux RedHat 5.2（安装在VMWare 7.0虚拟机上）

其中的Shell命令都在Redhat Linux OS环境已测试通过

====================================================================================

好啦，今晚在man sort 查看了sort详细参数使用方法后，似乎可以不用awk命令就可以搞定此题，看来并没有我面试时想得那么复杂。现在就让我们具体看看sort的参数以及 grep、重定向等Shell命令的详细使用方法吧

sort命令

格式：sort 【参数】【文件】

举例：sort -rnk 2 baidu.txt

参数：r 逆序； n字符串按数值处理； k 2 表示第二个字段（列）

说明：在文件baidu.txt中，按照第二个字段的数值型由大到小进行排序

首先，在 Linux Shell命令行界面输入 man sort 查看 sort 的帮助手册

然后，查看本题中，我们需要用到的三个参数 r n k 的详细使用方法

由sort帮助文档显示：

1、参数n是把string字符串转换成numberical的值value进行比较（即把字符串转换成数值型，再进行比较）

2、参数r是反向，即逆序。由于sort默认排序是由小到大，而题意需要从大到小排序，因此此处需要逆序（注意：v在某些命令中也可表示反向，如正则表达式中）

3、参数k是字段分隔，即从哪个字段开始直到哪个字段结束，按其进行排序（注意：Linux Redhat 第一列从1开始，而不是0，本题格式中size为第二列，因此我们k定为2，而不是1。区别于通常用的Array数组下限和Python语言中分组的下限，即从0开始）

grep命令

格式：grep 【参数】【查询字符串】【文件】

举例：grep "baidu" baidu.txt

参数：此处无参数（省略了参数）

说明：查询匹配文件baidu.txt中，判断是否包含"baidu"子字符串

在Linux Shell命令行输入：man grep

管道| 命令

格式：【命令1】（目标） |【命令2】（源数据）

参数：为进程通信，无参数

举例：ls -l | grep "baidu" baidu.txt

说明：把文件baidu.txt中，包含"baidu"子字符串的结果，通过管道|命令，传给ls -l 作为目标内容，进行显示

重定向>或>> 命令

格式：【命令1】（源数据）> 【命令2】（目标）或者【命令1】（源数据）>> 【命令2】（目标）

参数：为信道传值，无参数

举例：sort -rnk 2 baidu.txt > baidu2.txt

说明：把文件baidu.txt中，对第二个字段按照数值型进行由大到小的排序，并将结果保存到文件baidu2.txt（清空后重写）

附图举例说明：先清空文件baidu2.txt中原有内容，然后再将sort结果重定向保存到 baidu2.txt文件中

附图举例说明：先并未清空文件baidu2.txt中原有内容，而是直接追加sort结果，重定向保存到 baidu2.txt文件中（保留baidu2.txt原有内容）

ls touch cat等其它基本命令，请详见我先前的博客 Linux Shell 常用命令与目录分区的学习总结

====================================================================================

第二步，查询匹配url字符串中是否含有字串"baidu"的另一种做法（在网友showmsg 的提示下，改用 awk 命令代替 grep 命令进行正则匹配）

当然，我们还是先看结果，然后我再介绍awk命令的使用方法

首先，我们查询并打印出含有"baidu"字串的url及其size

其次，我们对查询含有"baidu"的结果，对size进行有大到小的排序

最后，保存查询匹配"baidu"并对size由大到小排序后的结果到baidu2.txt文件中（重定向）

附加1，如果只想按照size由大到小打印出url（即不打印size，也就是分离字段），则如下

附加2，如果只想按照size由大到小打印出size（即不打印url，也就是分离字段），则如下

这就是我面试时想用的awk命令解法，不过我当时只知道此命令功能但没具体用过，在网友showmsg 高手指点下，总算明白一二，对此表示谢意 ^_^

====================================================================================

awk 命令

格式：awk commands file 或者 awk script-file file

参数：print 打印；$1 第一个字段； $2 第二个字段； ' ' 单引号需加上，并可写入正则表达式，如查询baidu字串

举例：awk '/baidu/ && $2<800' baidu.txt

说明：查询文件baidu.txt中满足第一字段含有"baidu"字串并且第二个字段数字size<800的所有记录，并显示出结果

附图1：查询文件baidu.txt中满足第一字段含有"baidu"字串并且第二个字段数字 size<800的所有记录，并显示出结果

附图2：查询文件baidu.txt中满足第一字段含有"baidu"字串并且第二个字段数字 size<800的所有记录，并打印出结果的第一个字段（url）

你可能感兴趣的:(面试题,面试)

Spring boot定义LocalDateTime序列化梦幻D开始工作记录技术杂记 spring boot 后端 java
刚刚开通了一个公众号，会分享一些技术博客和自己觉得比较好的项目，同时会更新一些自己使用的工具和图书资料，后面会整理一些面试资料进行分享，觉得有兴趣的可以关注一下。文章目录前言解决打完收工！前言在开发需求过程中，定义字段为LocalDateTime,返回的序列化字段是按照LocalDateTime.toString返回的，返回的字符串带一个’T’，在application.properties里面统
SpringBoot学习路线总结（附思维导图） m0_67402026 面试学习路线阿里巴巴 spring boot java 学习 python 开发语言
??作者简介：CSDN2021博客之星亚军??、新星计划导师、博客专家????哪吒多年工作总结：Java学习路线总结，搬砖工逆袭Java架构师??关注公众号【哪吒编程】，回复1024，获取Java学习路线思维导图、大厂面试真题、加入万粉计划交流群、一起学习进步目录立志存高远，笃行践初心?一、SpringBoot学习路线思维导图?二、什么是SpringBoot三、使用SpringBoot有什么好处四
【Java基础】深入剖析Java中构造器、实例变量、静态变量、代码块的执行顺序！原理+实战，一文搞定！工一木子 Java基础知识系列 Java java 开发语言
深入剖析Java中构造器、实例变量、静态变量、代码块的执行顺序！原理+实战，一文搞定！在Java编程中，构造器、实例变量、静态变量、实例代码块和静态代码块的执行顺序是一个经典且重要的知识点。无论是日常开发还是面试，理解这些内容的执行顺序都至关重要。今天，我们将通过原理分析和实战代码，彻底搞懂这些内容的执行顺序，并附上详细的代码示例，帮助你轻松掌握！1.核心概念回顾在深入分析之前，我们先回顾一下这些
【java面试题】2017.11.17 还没入门的大菜狗每日一问 java 面试题
来源：https://github.com/tangyouhua/program-resource/blob/master/program-interview/java-baidu-200.md操作系统中heap和stack的区别emmm。。。操作系统里面没讲过这玩意啊？？？于是。。。参考大佬http://blog.csdn.net/u014306011/article/details/51044
Kotlin协程之flow工作原理，2024最新Android大厂面试题来袭 m0面试大全 Android程序员 android kotlin 开发语言
Kotlin协程之协程取消与异常处理首先看一下Flow接口的源码，内部只有一个collect方法：publicinterfaceFlow{//是一个suspend方法，意味着会挂起当前协程@InternalCoroutinesApipublicsuspendfuncollect(collector:FlowCollector)}publicinterfaceFlowCollector{//数据的发
深度学习-【完整代码+数据集】逻辑回归预测乳腺癌检测案例编程千纸鹤人工智能学习专栏深度学习逻辑回归人工智能癌症预测
作者主页：编程千纸鹤作者简介：Java、前端、Python开发多年，做过高程，项目经理，架构师主要内容：Java项目开发、Python项目开发、大学数据和AI项目开发、单片机项目设计、面试技术整理、最新技术分享收藏点赞不迷路关注作者有好处文末获得源码机器学习分为：有监督学习：数据带有标签无监督学习：数据没有标签，根据属性聚类在机器学习有监督学习中大致可以分为两大任务，一种是回归任务，一种是分类任务
为什么面试狂问Redis，阿里面试官把我问到哑口无言… 2501_90433130 面试 redis 职场和发展
Redis我们在工作中经常会用到，但是为什么要用、redis的一些场景和实战问题，90%以上的人都不是很懂。曾经自己去面试阿里，就被Redis问题问到哑口无言…事后我专门去恶补了Redis，现在算是比较精通了。作为目前主流的NoSQL技术，redis在Java互联网中得到了非常广泛的使用，个时代码代码的秃头人员，对Redis肯定是不陌生的，如果连Redis都没用过，还真不好意思出去面试，指不定被面
2022最新软件测试面试题常问的30道【持续更新~】可可爱爱的程序员软件测试测试理论功能测试测试用例功能测试压力测试单元测试面试
软件基础1.测试人员在测试中的任务是什么？1.尽可能早的找出系统中的bug；2.避免软件开发过程中缺陷的出现；3.衡量软件的品质，保证系统的质量；4.关注用户的需求，并保证系统符合用户需求。总的目标是：确保软件的质量2.测试用例评审的流程是什么1.测试用例是否按照公司定义的模板进行编写的；2.测试用例的本身的描述是否清晰，是否存在二义性；3.测试用例内容是否正确，是否与需求目标相一致；4.测试用例
面试之《前端开发者如何优化页面的加载时间？》只会写Bug的程序员面试面试前端
前端开发者可以从多个方面入手优化页面的加载时间，以下是一些常见且有效的方法：优化资源加载压缩资源文件：对HTML、CSS、JavaScript文件进行压缩，去除不必要的空格、注释等，减小文件体积，加快下载速度。例如使用uglify-js压缩JavaScript文件，cssnano压缩CSS文件。优化图片：对图片进行压缩处理，降低图片的分辨率、色彩深度或采用更高效的图片格式（如WebP）。同时，根据
Android App开发之Jetpack架构，Android大厂高频面试题解析 m0_66144992 程序员架构移动开发 android
因此，Jetpack来了！Jetpack是什么？===========Jetpack是Google推出的一套系列组件集。Jetpack的出现以及Google标准化开发模式的确立，代表了Android原生开发的未来方向，意味着Android发展已经逐渐成熟。为什么要学？======在开发世界，永远是技术至上，一门新技术的盛行总是有原因的，要么比老框架性能提升不少，要不更加易用等等。作为开发者，更是要
计算机复试面试题总结 m0_67400972 面试学习路线阿里巴巴 android 前端后端
时隔两年，重新完善一下以前写的东西：更新！！！！1.c++，408，设计模式，编程技巧，开源框架（适合cpp后端开发）2.数据结构与算法面试题3.c++与STL面试题4.计算机网络面试题面试问题之编程语言1。C++的特点是什么？封装，继承，多态。支持面向对象和面向过程的开发。2.C++的异常处理机制？抛出异常和捕捉异常进行处理。（实际开发）3.c和c++，java的区别c是纯过程，c++是对象加过
基于Spring Boot的驾校预约管理系统超级无敌暴龙战士塔塔开 Java课设与毕设资源 spring boot java mybatis
文章目录项目介绍主要功能截图：登录首页学员管理教练管理车辆管理关系管理车辆维修模块个人中心部分代码展示设计总结项目获取方式作者主页：Java韩立简介：Java领域优质创作者、简历模板、学习资料、面试题库【关注我，都给你】文末获取源码联系项目介绍基于SpringBoot的驾校预约管理系统（可帮忙远程调试），java项目。eclipse和idea都能打开运行。推荐环境配置：eclipse/ideajd
爬虫和逆向教程-专栏介绍和目录数据知道 2025年爬虫和逆向教程爬虫 python 数据采集网络爬虫逆向
文章目录一、爬虫基础和进阶二、App数据采集三、爬虫项目四、爬虫面试本专栏为爬虫初学者和进阶开发者量身定制的爬虫和逆向学习园地。为你提供全面而深入的爬虫和逆向技术指导，从入门到精通，从基础理论到高级实战，助你在数据的海洋中畅游，挖掘出有价值的信息。通过本专栏的学习，你将具备独立开发和优化爬虫程序的能力，及逆向分析能力和项目开发能力，成为爬虫领域的佼佼者。《本专栏持续更新中…（早订阅优惠仅需9.9元
java集合框架List常见基础面试题步归猿某人 java list 数据结构面试
简介：java集合框架List常见基础面试题考点：list的基础知识掌握情况，对应实现的区别、线程安全、使用场景。问：Vector和ArrayList、LinkedList联系和区别？分别的使用场景？答：（1）线程安全：ArrayList:底层是数组实现，线程不安全，查询和修改快，但是增加和删除慢。LinkedList:底层是双向链表，线程不安全，查询和修改慢，新增和删除快。Vector:底层是数
Elasticsearch 数据量大时如何优化查询性能？忍者算法 elasticsearch 大数据搜索引擎
Elasticsearch数据量大时如何优化查询性能？在面试中，如果你被问到：“Elasticsearch（ES）在数据量很大的情况下（数十亿级别）如何提高查询效率？”那么面试官其实是在测试你是否有实际使用ES的经验。为什么这么说？因为很多人以为ES性能非常强大，但实际上，在数据量达到几亿甚至数十亿条时，你可能会惊讶地发现，搜索一次需要5~10秒。而且，第一次查询特别慢，之后才变快，变成几百毫秒。
Linklist Merge Sort(微软等面试一百题-链表排序）代码文西算法 C++merge 面试微软 null 算法
因为自己写程序栽在这个问题上了，所以就手写+机试的敲了一下，虽然很小心，但是机试的时候依然写出了bug，所以发这篇帖子算是让自己长长记性吧。问题如下：1.编写实现链表排序的一种算法。说明为什么你会选择用这样的方法代码如下：#include#includestructLinkNode{intdata;LinkNode*pNext;LinkNode(int_data){data=_data;pNext
【操作系统】面试重点 sofaraway13 面试速记 AI专业课+408 面试职场和发展 linux
考研面试自用1.操作系统的特点与功能特点：并发性：支持多任务同时进行。共享性：系统资源可被多个进程共享使用。异步性：进程在不同时刻按自己的速度独立执行。虚拟性：通过虚拟化技术，使用户觉得独占资源。功能：管理软硬件资源：合理分配内存、CPU、I/O设备等资源。组织工作流程：协调各个进程的运行。提供用户接口：为用户提供交互界面（如命令行、GUI）。2.中断与系统调用的区别中断：硬中断：由硬件设备触发（
老东家新增7000个岗位 go_to_hacker web安全测试工具安全
《网安面试指南》https://mp.weixin.qq.com/s/RIVYDmxI9g_TgGrpbdDKtA?token=1860256701&lang=zh_CN5000篇网安资料库https://mp.weixin.qq.com/s?__biz=MzkwNjY1Mzc0Nw==&mid=2247486065&idx=2&sn=b30ade8200e842743339d428f414475
3万字长文：SQL Server面试题和参考答案（持续更新）大模型大数据攻城狮 oracle 数据库大数据面试求职
目录解释关系数据库中的主键、外键、超键和候选键的区别。描述SQLServer中聚集索引和非聚集索引的不同。什么是事务？SQLServer中如何保证事务的ACID属性？什么是视图？在SQLServer中视图有什么用途？解释SQLServer中的锁机制以及死锁是如何产生的。如何优化SQL查询以提高性能？写出SQL语句：取出表A中第31到第40记录。解释SQLServer中的临时表和表变量的区别。什么是
【计算机网络】面试重点 sofaraway13 面试速记 AI专业课+408 网络计算机网络
自用复试，有重复的，介意勿看OSI层次协议功能描述应用层（第七层）超文本传输协议HTTP/HTTPS用于万维网的数据传输，HTTPS通过TLS/SSL加密。文件传输协议FTP用于在客户端和服务器之间传输文件。动态主机配置协议DHCP自动分配IP地址和其他网络配置参数。简单邮件发送协议SMTP用于发送电子邮件。邮件接收协议POP3用于从邮件服务器接收电子邮件。远程登陆协议Telnet远程登录协议，允
常见后端开发面试问题（持续更新）零戚面试职场和发展
mysql为什么采用B+树作为索引？首先，B+树相比于B树来说非叶子节点上只有索引没有数据，数据都在叶子节点，就使其非常适合进行范围查询。因为对于Mysql这种数量级非常大的数据来说可以减少磁盘的I/O次数，同时其在叶子节点添加的有指针，可以更加快速的进行查找。平均查找时间为log(n)为什么B树不可以呢？因为B树的非叶子节点上面既有指针也有数据，从而导致一次搜索时装入到内存的值并不多，而海量的数
16：00面试，16：06就出来了，问的问题有点变态。。。程序员笑笑软件测试面试职场和发展功能测试软件测试自动化测试程序人生
从小厂出来，没想到在另一家公司又寄了。到这家公司开始上班，加班是每天必不可少的，看在钱给的比较多的份上，就不太计较了。没想到8月一纸通知，所有人不准加班，加班费不仅没有了，薪资还要降40%,这下搞的饭都吃不起了。还在有个朋友内推我去了一家互联网公司，兴冲冲见面试官，没想到一道题把我给问死了：如果模块请求http改为了https,测试方案应该如何制定，修改?感觉好简单的题，硬是没有答出来，早知道好好
JAVA面试常见题_基础部分_mybatis面试题茂茂在长安 JAVA mysql java 面试 mybatis
1、什么是MyBatis？答：MyBatis是一个可以自定义SQL、存储过程和高级映射的持久层框架。2、讲下MyBatis的缓存答：MyBatis的缓存分为一级缓存和二级缓存,一级缓存放在session里面,默认就有,二级缓存放在它的命名空间里,默认是不打开的,使用二级缓存属性类需要实现Serializable序列化接口(可用来保存对象的状态),可在它的映射文件中配置3、Mybatis是如何进行分
消息队列概要讲解（下） Good Note 消息队列 golang 服务器数据库开发语言 MQ 消息队列面试
大家好，这里是编程Cookbook，关注公众号「编程Cookbook」，获取更多面试资料。本文概要介绍消息队列的核心原理和实现，以及常见问题及其解决方案等。本文不会过多的扩展详细的消息队列系统，如RocketMQ、RabbitMQ、Kafka等，这些会在后续系列文章中详细介绍。文章目录消息队列的传递模式概念介绍1.推模式（Push）2.拉模式（Pull）3.推拉模式对比4.实际应用中的选择5.混合
消息队列（RocketMQ+Kafka）八千里路云和月laiker 算法 rocketmq kafka 分布式
基础什么是消息队列：具备生产者，消费者，消息队列的场景应用场景：异步（电商订单的创建、支付、发货流程）解耦削峰填谷（淘宝的双十一）需解决的问题：消息重复（唯一ID，幂等）消息丢失（ack确认机制，死信队列）消息堆积（增加消费者，增加消费能力，增加集群分担）高可用（集群，主从，多副本）高性能（集群，分区，多机部署，负载均衡）RocketMQ整体架构视频：小白debug的视频面试题：CSDN上找的一篇
java常见面试题：什么是NIO（New IO）？NIO和IO有什么区别？广寒舞雪 java java nio 开发语言
NIO（NewIO）是一种同步非阻塞的I/O模型，是I/O多路复用的基础，已经被越来越多地应用到大型应用服务器，成为解决高并发与大量连接、I/O处理问题的有效方式。NIO适用于处理大量并发连接和高性能的网络服务器开发，如聊天服务器、即时通讯服务器、游戏服务器等。这是因为NIO提供了非阻塞的网络I/O操作，可以在一个线程中同时处理多个连接，提高了服务器的并发性能。此外，NIO还适用于文件I/O和数据
JAVA面试_进阶部分_23种设计模式总结茂茂在长安 JAVA java 面试设计模式
1.单例模式：确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。（1）懒汉式public class Singleton { /* 持有私有静态实例，防止被引用，此处赋值为null，目的是实现延迟加载 */ private static Singleton instance = null; /* 私有构造方法，防止被实例化 */ private
HIVE 面试题总结小余真旺财 Hive hive
Hive依赖于HDFS存储数据，Hive将HQL转换成MapReduce执行，所以说Hive是基于Hadoop的一个数据仓库工具，实质就是一款基于HDFS的MapReduce计算框架，对存储在HDFS中的数据进行分析和管理。一、Hive架构用户接口：CLI（hiveshell）、JDBC/ODBC(java访问hive)、WEBUI（浏览器访问hive）元数据：元数据包括：表名、表所属的数据库（默
Hive 面试题昨夜为你摘星
什么是Hive?Hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的意义（最初研发的原因）?降低程序员使用Hadoop的难度，降低学习成本Hive的内部组成模块，作用
Python面向对象面试题及参考答案大模型大数据攻城狮 python 面试继承封装接口隔离弱引用元类
目录什么是面向对象编程？Python中的类和对象是什么？什么是继承？Python如何实现继承？什么是多态？Python如何实现多态？Python中的类属性和实例属性有什么区别？类属性和实例属性的访问优先级规则是什么？Python中的实例方法、类方法和静态方法有什么区别？静态方法、类方法、实例方法的参数传递差异是什么？什么是构造函数（init）？解释__init__方法与__new__方法的区别Py
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found