BAT面试中的大数据相关问题笔记

大数据

Map-Reduce 和Hadoop 逐渐成为面试热门
1. 介绍哈希函数

哈希函数又叫散列函数
1.1  典型的哈希函数都有无限的输入值域。
1.2 输入值相同时，返回值一样。
1.3 输入值不同时，返回值可能一样，也可能不一样
1.4 不同输入值得到的哈希值，整体均分的分布在输出域S上（重要）

1~3 点性质是哈希函数的基础，第4点是评价一个哈希函数优劣的关键。
aaa1 aaa2 aaa3 虽然相似，但哈希值差异巨大。

2.介绍Map-Rdeduce

2.1  Map阶段  把大任务分成子任务
2.2 Reduce阶段  子任务并发处理，然后合并结果。

难点：工程上的处理

注意点：

1. 备份的考虑，分布式存储的设计细节，以及容灾策略。
2. 任务分配策略与任务进度跟踪的细节设计，节点状态的呈现
3. 多用户权限的控制

map-reduce 方法统计文章的单词

文章-> 预处理

1.去掉标点符号  
2.连字符
3.对于缩写的处理
4.大小写的处理

对每个单词生成词频为1

哈希函数

子任务进行处理

海量数量处理技巧

分而自治，通过哈希函数将大任务分流到机器或分流秤小文件
常用hashMap 或bitamp

难点：通讯、时间和空间的估算。

请对10亿个IPV4的ip地址进行排序，每个ip只会出现一次。
普通做法：
ip-转换为无符号整数 10亿个整数 4G
推荐做法：
bitmap 2^32 bit类型的数组。

每个位置上是一个bit，只能表示0和1两种状态。
长度为2^32的bit数组，空间约为128m.

请对10亿人的年龄进行排序

0~200
计数排序
20亿全是32位数整数的文件，空间限制大小2G

hashmap记录所有出现的次数

key->具体某一种数
value-> 这种数出现的次数

内存可能超出

文件分流

在40亿个无符号整数的文件，所以在整个范围中必然没有出现过的数，可以使用最多10M的内存，只用找到一个没有出现过的数即可，该如何找？

hash 表 40亿条每一条4个字节 16G

bitmap 500M

64个区间
500M/64 8M
1、根据内存限制决定区间大小，根据区间大小，得到有多少个变量，来记录每个区间的数出现的次数。
2、统计区间上的数的出现次数，找到不足的区间。
3、利用bitmap对不满足的区间，进行这个区间上的数的词频统计。

百亿数据中，找到100个热词

分流确定机器数

对每一个机器，进行文件分流，小根堆确定top100

工程师使用服务器集群来设计和是吸纳数据缓存，以下是常见的侧脸。

无论是添加、查询还是删除数据，都先将数据的id通过哈希函数转换成一个哈希值，记为key.

2.如果目前机器有N台，则计算key%N的值，这个值就是该数据所属的机器编号，无论是添加、删除还是查询操作，都只在这台机器上进行。请分析这种缓存策略可能带来的问题。并提出改进的方案。

如果增加或删除机器，数据迁移的代价很大。

一致性哈希算法

数据id—> 0~ 2 ^32
key 和data 相邻存储
顺时针进行

动态规划

给定数组arr，arr中所有的值杜伟整数且不重复。每个值代表一种面值的货币，每种面值的货币可以使用任意张，再给定一个整数aim代表要找的钱数，求换钱有多少种方法.

暴力搜索方法

记忆搜索方法

动态规划方法

状态继续优化

arr={5,10,25,1} aim={1000}

暴力搜索解决：

public int coins1(int[] arr,int aim){
    if(arr==null||arr.length==0||aim<0)
    {
        return 0;
    }

    return process1(arr,0,aim);
}

public int process1(int [] arr,int index,int aim){
    int res=0;
    if(index==arr.length){
        res=aim==0?1:0;
    }else{
         for(int i=0;arr[index]*i<=aim;i++){
            res+=process1(arr,index+1,aim-arr[index]*i);    
             }
         }
}

如果已经使用0张5元和1张10元的情况下
后续将求：p1(arr,2,990)
这里2表示arr剩下的钱为arr[2,3] 即为[25,1]
990：表示要找的剩余钱数。

2张5元0张10元p1(arr,2,990)

记忆搜索方法：

arr={5,10,24,1}, aim=1000
p(index,aim) 结果表map
1. 每计算完一个p(index,aim),都将结果放入map中，index和aim组成共同的key，
  返回结果为Value.
2. 要进入一个递归过程p(index,aim)
  先以index和aim注册的key在map中查询是否已经在value中，如果存在，则直接取值，如果不存在，才进行递归计算。

public int coins2(int[] arr,int aim){
    if(arr==null||arr.length==0||aim<0){
    return 0;
    }
    int[][] map=new int[arr.length+1][aim+1];
        return process2(arr,0,aim,map);
}

public int process2(int[] arr,int index,int aim,int[][] map){
    int res=0;
    if(index==arr.length){
        res=aim==0?1:0;
    }else{
        int mapValue=0;
        for(int i=0;arr[index]*i<=aim;i++){
            mapValue=mapValue==-1?0:mapValue;
            }else{
                res+=process2(arr,index+1,aim-arr[index]*i,map);
            }
        }
    }
    map[index][aim]=res==0?-1:res;
    return res;
}

动态规划方法

如果arr长度为N，生成行数为N，列数为aim+1的矩阵dp
dp[i][j] 的含义是在使用arr[0..i]货币的情况下，有多少种方法。

什么是动态规划方法

其本质是利用空间来记录每一个暴力搜索的计算结果的时候直接使用，从而不再是用重复计算。
动态规划由于规定了每一种递归的计算顺序，依次进行计算。

面试中遇到暴力递归题目可以优化成动态规划方法的大体过程：

实现暴力递归方法。
在暴力搜索方法的函数中看看那些参数可以代表递归过程。
找到代表递归过程的参数之后，记忆话搜索方法非常容易实现。
通过分析记忆话搜索的依赖路径，进而实现动态规划。
根据记忆化搜索方法改出动态规划，减少时间复杂度。

动态规划的关键点：

最优化原理，也就是最优子结构性质。这指的是一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的的状态而言，余下的诸多决策必须构成最优决策，简单来说就是一个最优化的策略的子策略总是最优的，如果一个问题满足最优化原理，就称其具有最优子结构性质。
无后效性。指的是某状态下决策的收益，只与状态和决策相关，与到达该状态的方式无关。
子问题的重叠性，动态规划将原来具有指数级时间复杂度的暴力搜索算法改进成了具有多项式时间复杂度的算法。其中的关键在于解决冗余，这是动态规划算法的根本目的。

经典动态规划的问题

有n级台阶，一个每次上一级或者两级，问有多少种走完n级的方法？

f(1)=1
f(2)=2
f(i)= f(i-1)+f(i-2)

public int s1(int n){
    if(n<1)
    return 0;

}
    if(n==1||n==2){
    return n;
    }
    return s1(n-1)+s1(n-2);
}

求矩阵中最小的路径和

dp[i][j]=m[i][j]+dp[i-1][j]
dp[i][j-1]
返回arr的最长递增子序列长度

2 1 5 3 6 4 8 9 7
返回 1 3 4 8 9 长度为5

arr 2 1 5 3 6 4 8 9 7
dp: 1 1 2 2 3 3 4 5 4 长度为5
假设str1的长度为M，str2的长度为N，生成大小为M*N的矩阵dp.dp[i][j]的含义是str1[0..i] 与str2[0..j]的最长公共序列的长度。

待补：

一个背包有一定的承重W,有N件物品，每件都有自己的价值，记录在数组V中，也都有自己的重量，记录在数组W中，没见物品只能选择要装入背包还是不装入背包，要求在不超过背包承重的前提下，选出物品的总价值最大。

假设物品编号1~n,一件一件物品考虑是否加入背包

假设dp[x][y]表示前X件物品，不超过重量y的时候的最大价值。枚举一下第X件物品的情况。

情况一：如果选择第X件物品，则前X-1件物品得到的重量不能超过y-w[x].
情况二：如果不选第X件物品，则前X-1件物品得到的重量不能超过
```
所以dp[x][y]可能等于dp[x-1][y],也就是是不取第x件物品的时候，价值和之前一样。

也可能是dp[x-1][y-w[x]]+v[x], 也就是决定拿第x件物品的情况，当然会获得x物品的价值。

两种可能性中，应该选择价值最大的那个。dp[x][y]=max{dp[x-1][y],dp[x-1][y-w[x]]+v[x]}.


对于dp矩阵来说，行数是物品的数量n，行数是背包的重量W。从左到右，再从上到下依次计算所有dp值即可。
```

C# 上位机开发进阶：利用 WinForms 与 WPF 创建智能化工业控制系统威哥说编程 c#wpf 开发语言
随着工业自动化和智能制造的不断发展，上位机系统作为人与机器之间的重要桥梁，已成为工业控制系统中不可或缺的一部分。在上位机系统开发中，C#提供了强大的开发框架，尤其是WinForms和WPF，两者在创建高效、智能化的工业控制系统中扮演着重要角色。本文将深入探讨如何利用C#中的WinForms和WPF构建智能化的工业控制系统，从界面设计、实时数据处理、设备通信协议到性能优化的全面技术方案，助力开发者提
2x2矩阵教程
2x2矩阵教程1.简介2x2矩阵是线性代数中的基本概念，用于表示二维线性变换。本教程将介绍如何使用C++实现2x2矩阵的基本运算，包括矩阵加减、乘法、行列式、逆矩阵等操作。2.代码实现2.1头文件(matrix2x2.h)#ifndefMATRIX2X2_H#defineMATRIX2X2_H#include#include#includenamespacemath{namespacelinear
JetBrains IntelliJ IDEA插件推荐 Someone_sky intellij-idea java ide
在IntelliJIDEA可以安装一些插件，让工作更有效率，好的插件可以满足从新手到资深开发者的各种需求。ApifoxHelper:ApifoxHelper是一个免费的、专为Java和Kotlin开发者设计的高效API调试插件。它能够自动分析项目中的接口，并允许你直接在IDEA中发送请求，无需在IDE和其他工具之间来回切换。这个插件还能自动填充请求参数，解析各种响应体，并记录请求历史，方便你实时编
微服务链路雪崩防护深度解析：Hystrix与Sentinel熔断降级策略对比梦玄海微服务 hystrix sentinel
一、微服务雪崩效应与熔断机制核心原理1.1雪崩效应形成机制微服务架构中的雪崩效应本质上是服务调用链路的级联故障扩散过程，其形成机制可分为以下阶段：异常传播阶段：当某个下游服务节点因高负载、网络波动或代码缺陷出现响应延迟或异常时，调用方服务会持续积累待处理请求资源耗尽阶段：调用方线程池被持续占满，数据库连接池耗尽，TCP连接数达到上限，导致正常业务请求无法获取计算资源服务瘫痪阶段：故障通过服务依赖关
什么情况下需要心理咨询？——中原焦点团队，坚持分享776天，2022-03-13 归鸿_66
心理咨询对象恰恰是正常人，而不是心理有疾病的人（这要去医院就诊，需要药物治疗的。）当正常人有了情绪困扰，工作、学业压力、家庭矛盾，或者其它内心烦恼的话，在咨询室里可以得到释放，能够对自己、对事情认识的更深刻。这样你能心理状态更好更轻松的去应对外边的挑战，面对当下的生活学习。尤其正在成长中的青少年。可以这么说，心理咨询室就是你的解压的驿站，情绪的安放地。走出咨询室，你会变得轻松、自信、有力量。当然，
孤注一掷十豆口_cf24
在互联网无比发达的今天，网络活动包括移动支付便捷了我们的生活，同样也让电子zhaP无孔不入。刷单、博彩、Du球等信息充斥在我们的身边，《孤注一掷》正是以这些容易被我们忽视的阴暗地带为切入口，为我们呈现了一个肮脏的、xue淋淋的“地下世界”。网络zhaP无关年龄、无关性别、无关学历，它其实激发了每个人心中的暗面。正如电影中所说的那样：“人有两颗心，一颗是贪心，一颗是不甘心。”总的说来，《孤注一掷》是
欣诚幼儿园小六班：冬日相伴，温暖如初欣诚幼儿园郑雅文
太阳当空照花儿对我笑小鸟说早早早你为什么背上小书包我去上学校天天不迟到爱学习爱劳动长大要为人民立功劳集体活动：周一：《哈巴狗》1.学习歌曲《哈巴狗》，能够边唱边跟随歌曲内容变换动作。2.愿意表演歌曲，体验表演的乐趣。周二：《小鱼游游》1.愿意和同伴一起玩“捉迷藏”游戏，感受游戏的乐趣。2.会使用水彩笔或者油画棒画曲线。周三：《咪咪猫》1.喜欢并尝试模仿儿歌中的语言，体会其中的乐趣。2.理解儿歌内容
58、JavaScript中的类定义与对象创建 pepper JavaScript 类定义对象创建
JavaScript中的类定义与对象创建1.引言在现代Web开发中，JavaScript已经成为不可或缺的一部分。随着JavaScript的发展，面向对象编程（OOP）的概念也逐渐融入其中。通过定义类和创建对象，可以使代码更加模块化、易于维护和复用。本文将详细介绍如何在JavaScript中定义新类，并创建自定义对象，包括属性和方法的添加。2.构造函数的基础构造函数是一种特殊的函数，主要用于创建和
vue 组件中如何引用外部js文件中的变量或者方法一叶孤舟1990
相信很多新手小伙伴都会遇到这样一个问题，就是我如何引用一个外部文件中的变量，下面我为大家分享一下解决办法：（如果解决小伙伴的问题，请帮忙给我点个赞吧，谢谢！！！）1，首先自己创建一个js文件放到assets中：map.js2，map.js中代码如下：（data是数组，geoCoordMap是对象，这个因为太长了所以就不展开了）重点：export{//导出多个对象geoCoordMap,data}3
C语言中的正则表达式使用示例详解-转载边躺平边学习笔记正则表达式 c语言开发语言
C语言中的正则表达式使用示例详解正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。本文通过示例代码给大家介绍了C语言中的正则表达式使用，感兴趣的朋友跟随小编一起看看吧正则表达式，又称正规表示法、常规表示法（英语：RegularExpression，在代码中常简写为regex、regexp或RE）。正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在c语言中，
备考中心面试海陵燕飞
2018.10.21古北启德备考中心面试V的主要问题是害羞，有的时候没有自信。我突然觉得这几年她的幼儿园生活太动荡，我有一丝丝愧疚，因为我的确有点折腾，外加选择困难症。好在V没有过早进入补习鸡血的大军，她还是个快乐的小朋友，这点我很自豪。期待接下去的两个半月，V我会和你一起努力。图片发自App
第3季：《一个青年摄影师和四个文化名人》备课思考（二）谈西_
图片发自App今天感冒很难受，头昏脑涨的，不过终于还是把思考整理了一遍，今天又看了忠玉姐的《愚公移山》的设计和艳平姐的《钢铁是怎样炼成》课堂实录，很受启发。这个教学设计有很多待完善的地方，经过上课之后再来反思吧！一、导入：今天我们要认识五个人，一个是摄影师，邓伟，著名摄影家，清华大学原教授，博士生导师。出版有《中国文化人影录》《邓伟眼中的世界名人》等著作。还有四个他的拍摄对象，都是鼎鼎有名的人物：
历史的真相是被人为的掩盖了吗？--我们眼中的历史是加工过的历史那点理儿
历史上有很多脍炙人口的故事，读起来让人沸腾不已，后来的艺术家加以加工就成了艺术作品，反倒让历史的真相湮没了。我们读的三国演义，说岳全传、隋唐演义等等，这些经过大量艺术加工的作品，深深地影响了我们对历史真相的判断，对历史人物脸谱化、片面化、孤立化、妖魔化。举几个例子：三国演义就妖魔化了诸葛亮，鲁迅先生就批判状诸葛多智而近妖，奸邪化了曹操，杀戮霸道而草菅人命；说岳全传就过于全面化岳飞而孤立化宋高宗，一
赵丽颖新剧，甩了《创业时代》整整一条街文化咖
【原文链接：赵丽颖新剧，甩了《创业时代》整整一条街】“你喜欢什么样的女生？”“像九五式自动步枪那样，小巧，杀伤力大。”听惯了土味情话，是不是觉得这样的告白让人虎躯一震？说这话的人，是热播剧《你和我的倾城时光》（以下简称《倾城》）里的男主角厉致诚。虽然算不上是标准的高富帅，但剧中的厉老板，靠一箩筐的“怪力情话”收割了一票观众的少女心。特种兵退伍归来的厉致诚（金瀚饰）临危受命，接下因哥哥事故离世留下的
url中关于编解码加号和空格的问题
今天遇到一个问题，URL中的加号传到后台之后变成了空格BNn+Y6xKvmejeJmu9sS2OnRJwYhHtYXScG2ol17EUhg1oeSFE5btrT4Eh04QiwIf变成了BNnY6xKvmejeJmu9sS2OnRJwYhHtYXScG2ol17EUhg1oeSFE5btrT4Eh04QiwIf原因：URL中的+号，通过GET方式传值的时候，+号会被浏览器处理为空，需要转换为%2
mac的m芯片上跑cuda程序 xinxuann macos
config里parser.add_argument('--device',type=str,default='mps')main里device=torch.device(cfg['device'])train里x_batch=x_batch.astype('float32')y_batch=y_batch.astype('float32')aux_batch=aux_batch.astype('
韩灵儿江平安《我是赘婿，有个老祖宗娘子很合理吧》全章节在线阅读_韩灵儿江平安全文免费阅读下载_韩灵儿江平安《我是赘婿，有个老祖宗娘子很合理吧》完整版在线阅读蚂蚁推书
小说名：我是赘婿，有个老祖宗娘子很合理吧主角：韩灵儿江平安小说作者：纯良小白状态：连载中字数：12.02万字最新章节：第98章小说简介：穿越异界，我意外成了赘婿，但没想到的是我的春梦居然成了真，我春梦中的各色女子，全部都在现实里出现了。高冷御姐，可爱萝莉，月宫仙子全出现在我面前，追着我喊夫君！更让人大吃一惊的是，我梦中最常出现的女人，居然是我入赘家族里的老祖宗，我嘞个豆，她都管我叫相公，那我的身份
python请求有关ja3指纹问题王太歌 python 爬虫开发语言
遇见一个网站采集，无论怎样都返回空数据(实际上是有数据的)，但是抓包下来又确实是那样的，请教了一些人推测是指纹验证，拜读了网上其他大佬的博客文章后实验了一下，发现确实是这个问题！第一次知道tcp还有这个东西，让我大受震撼，值此搬运一下。参考链接及来源：Python爬虫进阶必备|JA3指纹在爬虫中的应用与定向突破python爬虫requests、httpx、aiohttp、scrapy突破ja3指纹
2022-03-15 《思辨力》872 我来自金星
最不济最不济，我觉得这个偷换概念的范围可以宽泛到，如果在某一个场合有一些约定俗成的应该使用的概念，而我却直接不加解释、不加论证地使用了另外一个概念，这也可以说是偷换概念。比如说一群哲学家讨论伦理，约定俗成地应该用哲学的概念去理解、去讨论，但是有一个人却直接把生活语境中的概念拿来进行他的论证，这个可以算是偷换概念。网上还有很多说法，比如说把转移讨论的重点，或者说转移注意力的redherring，也叫
东游记——秦晋文化之旅（五）五三追梦人美玲
雨中朝台历史过于厚重，时光总是匆匆!拿起拙笔，实在不敢随意揣测山山水水的心思!更何况是充满浓郁历史文化气息的山西了，告别课本中的晋祠，去往下一站著名的五台山。七夕夜，宿五台山脚下，在他乡，别样旅行作礼，静听梵音，遇见皆是有缘人，愿大家有情人终成眷属!图片发自App晨起，梵音袅袅，细雨蒙蒙，云雾缭绕，恍若仙境，有缘朝圣文殊菩萨道场，1080阶小朝台，一步一步登临黛螺顶，真可谓千年五台佛圣境，叩问自省
技术演进中的开发沉思-35 MFC系列：消息映射与命令 chilavert318 熬之滴水穿石 c++mfc windows
个人认为windows编程里最为重要的就是通讯机制了，而这里消息映射与命令传递，正是MFC世界里的“通讯协议”。当用户移动鼠标、点击菜单，甚至窗口被风吹得晃动了一下，程序都能接收到对应的“消息”，并按部就班地做出反应。这背后的逻辑，既是技术的精妙，也藏着当年的我对“人机交互”最朴素的理解。一、消息分类在MFC程序的世界里，消息就像穿梭于城市各个角落的通讯信号，有着不同的种类和特性。如果把程序比作一
敏捷开发中的自然语言处理集成项目管理实战手册项目管理最佳实践敏捷流程自然语言处理 easyui ai
敏捷开发中的自然语言处理集成：让代码与需求“说人话”关键词：敏捷开发、自然语言处理（NLP）、用户故事分析、需求自动化、持续集成优化摘要：在敏捷开发中，“快速响应变化”的核心目标常被繁琐的文本处理拖慢——需求文档像“天书”、用户故事靠“脑补”、缺陷报告整理耗时……自然语言处理（NLP）就像一位“智能翻译官”，能让开发团队与需求文档“流畅对话”。本文将用“搭积木”“翻译机”等生活化比喻，带您理解如何
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
软件测试面试？太简单了 2025测试面经（答案+思路+史上最全）软件测试雪儿软件测试自动化测试面试面试职场和发展
从年后开始投简历面试的，在boss和拉钩上投了有几十份简历，其中70%未读状态，30%已读，已读的一半回复要求发送附件简历，然后这周接到面试的有七、八家公司，所以，当前这个大环境真的难这半个月来，每天安排三到四场面试，平均每个公司至少都是两轮面试打底，经此一役，截止今天下午，算是拿到四个offer，两个已经发了，两个口头约定好了。个人比较心仪其中的一家外企，毕竟不太卷，真的国内的互联网公司真的卷怕
全网最全，软件测试-性能测试面试题汇总（附答案）软件测试雪儿软件测试面试软件测试面试
前言面试题：性能测试指标有哪些？分别是什么含义？tps：每秒事务量，代表了系统的处理能力，tps越高，性能越好响应时间：从发出请求到接受到系统响应数据所花费的时间，响应时间越短，性能越好吞吐量：网络上行和下行流量的总和，吞吐量是网络瓶颈定位的重要指标错误率：在压测过程中系统出现错误的比例面试题：什么是集合点，什么场景下需要用集合点？集合点是测试脚本中的一个标记，当每个虚拟用户执行到标记处时，会停留
雪韵纯情，绕指千念羽彤于飞现代诗创作乐园
文/羽彤1（耶殊陀尼看图文作诗）许一场雪乡梦妍染几分香息，几分柔软以素心供养的纯洁写一纸不被世俗沾染的情书雪为平仄，绕指千念想你，轻轻地来在我的一厢雪韵诗意里深情幽居。落款是我的陪伴，我的暖…………剪一眸雪日画面以轻盈细碎，和煦明艳模仿白雪公主般的女孩在漫天冰菱中炫舞蹁跹晶莹剔透，乖巧灵动深信，心中的人儿如若落入这美妙的画卷驻足凝眸间，定是无尽的欣然，无尽的恋…………还原一次纯情的爱恋问心听雪，含
展麟文化随笔第39期：循环三六系统，缔造百万流量展麟文化
（一）第一个月我就开始赚钱了。我是一个相对简单，没太多的想法的人，我是迷恋谁，就全身心地听谁的话，无论对错，我都听他的，我觉得世上所有的人都比我聪明。我只要听他们的话，老老实实干，就能赚大钱！（二）我每个阶段都有疯狂迷恋的人，他们就是我的衣食父母，他们就是我心目中的神！生活中，我是极其孤独的，只是当我把心放在项目上，也就不孤单了。我最喜欢的歌手是张国荣。每次我看他的电影《东邪西毒》，我都感觉到很孤
2023-07-28 仁德上人
为什么不能心甘情愿地认账呢？文/仁德上人既然要认帐，心甘情愿地认帐要比被迫无奈地认账好得多。可为什么自己不能心甘情愿地认帐，而非要无奈被迫地烦恼认账呢？这其中的原因就是因为自己不明白因果的真实性，总想按照自己的意思来决定自己的思想行为，不明白有很多事情并不是按照自己的意思。每一位菩萨都能够亲自体会，很多事情的到来是违背自己的意思，无奈被迫地认账，还不如心甘情愿地认账好。因为被迫无奈地认账是痛苦烦恼
Sigmoid 函数在模式匹配中的应用及偏置项的作用
：1.问题背景：笔画多少导致的“不公平”比如识别数字时：数字1的笔画少（简单），匹配结果net数值小；数字8的笔画多（复杂），匹配结果net数值大。直接比较net会不公平（因为8天生更容易得分高）。2.Sigmoid的核心作用：把结果“归一化”到0~1Sigmoid函数的公式是：\sigma(net)=\frac{1}{1+e^{-net}}它能把任意大小的net（比如-100到+100）压缩到0
认真对待每一天 Naziya
每天看几个小时的视频节目，再刷几个小时的公众号和微博，不用担心，你会离梦想中的生活越来越远。一天一共24小时，去掉你睡觉的10个小时，一天还有14个小时。如果是上班族、学生党肯定有剩下二分之一的时间是上班或者上课。如果你是无业游民或者不用上班不用学习的咸鱼，呢你有整整14个小时，840分钟，50400秒。按统计学的角度来算，顶级的英语老师和普通的英语老师按每节课算的费用相差大概10倍左右。这样一来
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

BAT面试中的大数据相关问题笔记

大数据

动态规划

什么是动态规划方法

你可能感兴趣的:(BAT面试中的大数据相关问题笔记)