scxyz_

【算法】理解哈希算法 hash 和常见应用

概念

将任意长度的二进制值串映射为固定长度的二进制值串，这个映射的规则就是 哈希算法。
通过原始数据映射之后得到的二进制值串就是 哈希值。

要求

从哈希值不能反向推导出原始数据
对输入数据非常敏感，一个 Bit 修改得到的哈希值也大不相同
散列冲突的概率要很小
执行效率高效

常见应用

安全加密、唯一标识、数据校验、散列函数、负载均衡、数据分片、分布式存储。

后三个应用均与分布式系统有关。

下面逐个进行解释。

1 安全加密

常用：

MD5 (MD5 Message-Digest Algorithm , MD5 消息摘要算法)
SHA (Secure HashAlgorithm ,安全散列算法)

其他：

DES ( Data Encryption Standard ,数据加密标准)
AES ( Advanced Encryption Standard ,高级加密标准)

哈希算法在安全加密方面有两点特别重要：

很难反向推到
散列冲突概率小

以MD5为例，哈希值是固定的128 位二进制串，最多能表示 2^128 个数据。当我们对2^128+1个数据求哈希值时，必然会存在至少两个哈希值是相同的。

尽管如此，想要破解的难度依然非常高。

2 唯一标识

对大数据做信息摘要，通过一个较短的二进制编码来表示很大的数据。

查找图库中是否存在某张图片为例。

从图片开头、中间、末尾各取 100 个字节，将这 300 个字节放到一块，通过哈希算法（比如 MD5 ），得到一个哈希字符串，用它作为图片的唯一标识。

通过唯一标识来判定图片是否在图库中，这样就可以减少很多工作量。

还可以把图片路径信息，存储在散列表中。
如果存在，通过散列表中存储的文件路径，获取到这个已经存在的图片。
跟现在要插入的图片做全量的比对，看是否完全一样。
如果一样，就说明已经存在；
如果不一样，说明两张图片尽管唯一标识相同，但是并不是相同的图片。

3 数据校验

校验数据的完整性和正确性。

BT下载时，文件可能分成很多文件块，并行的下载完成后需要将文件块组装。
组装时需要校验文件块是否完整或是否正确，避免下载出错或被恶意篡改。

一种校验思路：
对所有文件块取哈希值，保存在种子中。
下载完成后，逐一对文件块的哈希值进行比对。
如果不同，则需要重新从其他宿主机器上下载这个文件块。

4 散列函数

散列函数其实也是哈希算法的一种应用。
散列函数是设计一个散列表的关键。
散列函数中用到的散列算法，更加关注散列后的值是否能平均分布，以及执行效率。

插个问题：如何防止数据库中的用户信息被脱库

对用户密码进行加密之后再存储，比如 SHA 等（因为 MD5 已经号称被破解了）。

但由于很多人使用简单密码，为了更加安全，需要维护一个常用密码的字典表。
把字典中的每个密码用哈希算法计算哈希值，然后拿哈希值跟脱库后的密文比对。
如果相同，基本上就可以认为，这个加密之后的密码对应的明文就是字典中的这个密码。
（但由于散列冲突，也有可能出现，尽管密文一样，但是明文并不一样的情况。）

引入一个盐（ salt ），跟用户的密码组合在一起，增加密码的复杂度。

5 负载均衡

在同一个客户端上，在一次会话中的所有请求都路由到同一个服务器上。

对客户端IP 地址或者会话 ID 计算哈希值，将取得的哈希值与服务器列表的大小进行取模运算，最终得到的值就是应该被路由到的服务器编号。

这样，我们就可以把同一个 IP 过来的所有请求，都路由到同一个后端服务器上。

6 数据分片

两个例子来说明。

统计 “ 搜索关键词 ” 出现的次数

假如有 1T 日志文件，记录了用户的搜索关键词，想要快速统计出每个关键词被搜索的次数。

可以先对数据进行分片，然后采用多台机器处理来提高速度。

依次读出每个关键词，通过哈希函数计算哈希值，然后跟 n取模，得到的值就是应该被分配到的机器编号。

哈希值相同的搜索关键词就被分配到了同一个机器上。每个机器会分别计算关键词出现的次数，最后合并起来就是最终的结果。

这里的处理过程也是 MapReduce 的基本设计思想。

快速判断图片是否在图库中

上面唯一标识中讲过，给每个图片取唯一标识(或者信息摘要)，然后构建散列表。

但图库中的图片数量非常大（上亿）时，内存有限，单台机器构建散列表行不通。

可以对数据进行分片，然后采用多机处理。每台机器只维护部分图片对应的散列表。
每次从图库中读取一个图片，计算唯一标识，与机器个数 n 求余取模，得到的值就对应要分配的机器编号，然后将这个图片的唯一标识和图片路径发往对应的机器构建散列表。

判断一个图片是否在图库中时，通过相同哈希算法，计算这个图片的唯一标识，然后与机器个数 n 求余取模。得到的值对应机器编号，将这个图片的唯一标识和图片路径发往对应的机器构建散列表。

下面估算一亿张图片构建散列表所需大概的机器数。

假设通过 MD5 来计算哈希值，长度128比特，也就是 16 字节。
文件路径长度上限是 256 字节，假设平均长度是 128 字节。
如果用链表法来解决冲突，还需要存储指针，指针占用 8 字节。
所以散列表中每个数据单元就占用 152 字节(估算)。
假设每台机器的内存2GB ，散列表的装载因子为 0.75 ，那一台机器可以给大约 1000万( 2GB*0.75/152 )张图片构建散列表。
所以对 1 亿张图片构建索引，需要大约十几台机器。

合理的估算能更好地评估解决方案的可行性。

7 分布式存储

面对海量数据，为了提高数据的读取、写入能力，一般都采用分布式的方式来存储数据，比如分布式缓存。

借用前面数据分片的思想，即通过哈希算法对数据取哈希值，然后对机器个数取模，这个最终值就是应该存储的缓存机器编号。

但是这样存在一个问题，假如后期需要新增或下线机器，个数发生改变，会造成缓存数据全部失效。

这时，需要一致性哈希算法，具体可以查看聊聊一致性哈希、漫画算法：什么是一致性哈希？

大概含义是：

实际k台机器，但划分时使用m作为个数（m远大于k），取模时，使用m。
当被分配到不存在的机器上时，自动划分到下一个存在的机器中。
当新增机器时，只需调整新增机器与新增机器下一个存在的机器之间的缓存数据即可。
下线机器时，只需调整该机器与下一台机器之间的数据即可，实际中为了避免突然机器下线，往往会在每台机器中同步上一台机器数据。
为了解决最后一台机器的数据问题，往往还会把哈希空间做成环状结构。

参考：

极客时间 - 数据结构与算法之美；
聊聊一致性哈希；

你可能感兴趣的:(数据结构与算法)

C#推箱子游戏源代码解析与实践指南 Boa波雅
本文还有配套的精品资源，点击获取简介：C#推箱子游戏是一个经典的益智游戏，适合编程初学者学习C#语言和游戏开发的基础知识。本篇文章将深入探讨使用C#语言开发推箱子游戏的源代码，涉及面向对象编程、图形用户界面(GUI)、事件驱动编程、数据结构与算法、状态管理、错误检查与边界条件、游戏逻辑以及调试技巧。通过学习本课程，初学者将能够掌握C#编程的基础和游戏逻辑的实现，并能够创建用户友好的界面。1.面向对
数据结构与算法--Python栈栈实现综合计算器和逆波兰计算器前缀表达式中缀表达式后缀表达式逆波兰表达式 storyfull 数据结构与算法算法 python 栈逆波兰表达式逆波兰计算器
阅读目录栈实现综合计算器思路及Python实现思路Python实现模拟逆波兰计算器思路及Python实现思路Python实现正则表达式实现计算器栈实现综合计算器思路及Python实现思路先建立一个“数栈”用来压入数字，还有一个“符号栈”用来压入运算符，规定：减法从栈底向栈顶方法运算，乘除法优先级高于加减法具体操作过程：以“3+26-2”为例（1）数栈和符号栈皆为空，指针从左向右扫描表达式，数栈入栈
c++面试八股文（大公司通用）挨踢小明 IT生涯开发语言 c++
在C++面试中，常见的问题通常会围绕C++的基础知识、数据结构与算法、系统设计、编程技巧、以及实际应用中的场景。以下是华为C++面试中常见的“八股文”问题及其简要回答思路。1.C++语言基础C++中const的用法有哪些？回答：常量变量：constinta=10;指针常量：constint*p;（指向常量的指针），int*constp;（指针本身是常量）成员函数常量：voidfunc()const
零基础数据结构与算法——第二章：基本数据结构-队列&总结
2.1数组（Array）2.2链表（LinkedList）2.3栈（Stack）2.4队列（Queue）2.4.1队列的定义与特点想象一下排队买票的场景，先到的人先买票，后到的人排在队伍末尾，这就是队列的基本概念。队列是一种遵循先进先出（FIFO,First-In-First-Out）原则的线性数据结构。队列的主要特点包括：两端操作：在一端（队尾）添加元素，在另一端（队头）移除元素，就像人们在队伍
《解锁Vcpkg国内镜像源：C++开发者的速度秘籍》空云风语 QT 人工智能 c++开发语言
一、Vcpkg初相识在C++开发的广袤世界里，Vcpkg犹如一把神奇的钥匙，为开发者们打开了便捷之门，尤其是在依赖管理方面，发挥着举足轻重的作用。包管理工具对于C++开发而言，是至关重要的存在。C++作为一门强大且广泛应用的编程语言，在开发过程中常常需要依赖众多的第三方库。这些库涵盖了各种功能领域，比如网络通信、图形处理、数据结构与算法等。以网络通信为例，开发网络应用程序时，可能会用到像Boost
【LeetCode刷题指南】--消失的数字，轮转数组，移除元素草莓熊Lotso Leetcode刷题指南 c语言刷题经验分享其他
个人主页：@草莓熊Lotso作者简介：C++研发方向学习者个人专栏：《C语言》《数据结构与算法》《C语言刷题集》⭐️人生格言：生活是默默的坚持，毅力是永久的享受。前言：在之前的C语言刷题集中我们刷了很多IO类型的基础编程题，但是随着数据结构往后的学习以及企业面试的要求，我们还需要对接口型的题目进行练习，博主在这里准备了新的《LeetCode刷题指南》专栏给大家分享一些我自己在力扣上面写过的题目，提
【LeetCode】力扣题——轮转数组、消失的数字、数组串联艾莉丝努力练剑 LeetCode代码强化刷题 leetcode 算法职场和发展开发语言 c语言学习
个人主页：艾莉丝努力练剑❄专栏传送门：《C语言》、《数据结构与算法》、C语言刷题12天IO强训学习方向：C/C++方向⭐️人生格言：为天地立心，为生民立命，为往圣继绝学，为万世开太平前言：牛客网和LeetCode的刷题都不可或缺，我们都做一做，力扣的题目对提升代码能力很有帮助，需要有一点基础，几乎都是接口型的题目，在C语言刷题专栏我好像还没有介绍过这两者的区别，那么我们来了解一下——IO型和接口型
【数据结构与算法】直接插入排序例题愿做无知一猿算法与数据结构算法排序算法插入排序
原题：假设一组成绩的关键字序列如下（24.15.32.28.19.10.40）采用直接插入排序时，当插入记录19到有序表时，为找插入位置的需要比较次数为：答案4次分析直接插入排序的过程：原来：24.15.32.28.19.10.401）首先从第一个元素开始：24.15.32.28.19.40不变的，下面才是正题2）检查15：15和前面的24比较，24>15。结论：比较一次，交换位置（方便查看后面的
数据结构与算法领域贪心算法的深度剖析 AI天才研究院 ChatGPT 实战计算 Agentic AI 实战贪心算法算法 ai
数据结构与算法领域贪心算法的深度剖析关键词：贪心算法、最优子结构、贪心选择性质、动态规划、贪心策略、时间复杂度、算法设计摘要：本文从贪心算法的核心概念出发，系统剖析其数学原理、算法设计模式及工程实践方法。通过对比贪心算法与动态规划的差异，揭示贪心选择性质和最优子结构的本质联系。结合活动选择、最小生成树、最短路径等经典案例，详细阐述贪心策略的构建过程与正确性证明方法。最后通过工业级项目实战，展示贪心
深度优先在数据结构与算法中的独特作用 AI天才研究院 AI大模型企业级应用开发实战 Agent 实战 AI人工智能与大数据深度优先算法 ai
深度优先在数据结构与算法中的独特作用关键词：深度优先搜索、数据结构、算法设计、图遍历、递归、迭代、问题求解摘要：深度优先搜索（DFS）是计算机科学中最重要的图遍历算法之一，其通过"尽可能深"的探索路径的策略，在树与图的结构分析、问题求解中展现出独特价值。本文从DFS的核心原理出发，系统解析其在数据结构中的实现方式、算法设计中的问题建模方法，结合数学模型分析时间空间复杂度，通过迷宫求解、强连通分量检
数据结构与算法-练习打卡day5（每日温度）潇洒亦如我算法练习 java
数据结构与算法-练习打卡day5问题：解题：性能：问题：题目地址，点我解题：分析：至少需要两层，最简单就是两层for循环，也可以引入单调栈，可以去掉一些不是单调的中间值，节省遍历个数classSolution{/***publicint[]dailyTemperatures(int[]temperatureArray){*int[]diffArray=newint[temperatureArray
「C/C++」C/C++STL篇之 forward_list单向链表容器何曾参静谧 c语言 c++list
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
Github 2024-07-22 开源项目周报Top15
根据GithubTrendings的统计，本周(2024-07-22统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7TypeScript项目4非开发语言项目2Rust项目2JupyterNotebook项目1C#项目1JavaScript项目1C++项目1《Hello算法》：动画图解、一键运行的数据结构与算法教程创建周期：476天协议类型：Oth
数据结构与算法：贪心（一） WBluuue 算法 c++leetcode 贪心算法
前言有一说一贪心的题目真的ex，想不到就是想不到……一、贪心贪心就是通过在过程中每次达到局部最优，从而在最后实现整体最优。贪心的题目经常要用到排序和堆。越打cf越能感受到贪心的奇妙，很吃状态和灵感。解题的过程中往往依赖举大量例子，然后进行总结和归纳，然后才能发现规律。当然不排除怎么举都想不到的情况，此处点名上次edu的b题斐波那契叠正方形。二、题目1.最大数classSolution{public
春招Java上岸指南：从0到1的备战全攻略
个人主页:java之路-CSDN博客(期待您的关注)目录春招前的自我评估与目标设定核心知识巩固与提升Java基础知识数据结构与算法多线程与并发编程数据库知识框架学习项目经验积累与优化回顾现有项目参与开源项目打造个人项目面试准备与技巧提升简历撰写常见面试题解析模拟面试面试技巧与注意事项春招实战与心态调整春招信息收集投递策略面试实战应对心态调整春招前的自我评估与目标设定在开始春招备战之前，首先要对自己
Python数据结构与算法——数据结构(栈、队列) 依彡 python数据结构与算法 python 算法数据结构
目录数据结构介绍列表栈栈的基本操作：栈的实现（使用一般列表结构即可实现）：栈的应用——括号匹配问题队列队列的实现方式——环形队列队列的实现方式——双向队列队列内置模块栈和队列应用——迷宫问题栈——深度优先搜索队列——广度优先搜索数据结构介绍介绍：数据结构是值相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。简单说：数据结构就是设计数据以何种方式组织并存储在计算机中。比如
数据结构与算法-线性表-线性表的应用晴空闲雲数据结构与算法实践数据结构
1线性表1.5线性表的应用1.5.1线性表的合并【算法步骤】分别获取LA表长m和LB表长n。从LB中第1个数据元素开始，循环n次执行以下操作：从LB中查找第i个数据元素赋给e；在LA中查找元素e，如果不存在，则将e插在表LA的最后。【代码实现】顺序表实现：//合并两个线性表：顺序表实现。//将所有在线性表LB中但不在LA中的数据元素插入到LA中。voidMergeList_Sq(SqList*LA
DAY 24冲击蓝桥杯——Python数据结构与算法06 栈(Stack)
6.1特点回顾下队列：先进先出。栈则是先进后出，类比于浏览器的后退功能。6.2时间复杂度访问:O(N)栈顶元素搜索：O(N)插入:O(1)删除：O(1)栈顶元素6.3栈的常用操作6.3.1创建栈#创建stackstack=[]6.3.2添加元素#向末尾添加stack.append(1)6.3.3获取即将出stack的元素#获取即将stack的元素O(1)temp1
Go的数据结构与算法-----实现可变长数组 Go达人开发语言 golang go
切片在Golang中，数组长度是不可变的，那么我们可以自己实现简单的可变长数组。在Golang里面切片slice里就运用了可变长数组，slice是对底层数组的抽象和控制。那么我们先看看slice的结构体typeslicestruct{arrayunsafe.Pointer//表示任何类型的指针lenint//长度capint//容量}unsafe.Pointer是Go语言中的一个特殊类型，用于表示
【保姆级教程】2025年AI产品经理终极学习指南：从零基础到精通，收藏我这一篇就够了！ AGI大模型老王人工智能产品经理 Agent Qwen 大模型大模型教程大模型学习
成为一名优秀的AI产品经理不仅需要掌握相关的技术知识，还需要具备良好的产品思维、市场洞察力以及跨部门沟通协调能力。下面是一个详细的AI产品经理学习路线，旨在帮助有志于从事该职业的人士快速成长。AI产品经理的学习路线第一阶段：基础知识积累了解AI基本概念学习人工智能的基本定义和发展历程；掌握常见AI技术如机器学习、深度学习、自然语言处理、计算机视觉等的基础原理。2.计算机科学基础熟悉数据结构与算法；
Github 2024-06-07 Java开源项目日报Top10 老孙正经胡说 github java 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Java项目9非开发语言项目1TypeScript项目1Python项目1《Hello算法》：动画图解、一键运行的数据结构与算法教程创建周期：476天协议类型：OtherStar数量：63556个Fork数量：7731次关注人数：63556人贡献人数
IT专业高考假期预习指南 ak2111 程序人生高考程序人生
目录1.概述1.1.基础知识铺垫1.2.编程技能学习1.3.实际动手操作1.4.小结2.基础课程预习指南2.1.计算机组成原理2.2.C语言程序设计2.3.C++程序设计2.4.数据库原理2.5.计算机网络原理2.6.软件工程2.7.数据结构与算法2.8.编译原理3.技术学习路线图3.1.前端开发3.2.后端开发3.3.全栈开发3.4.数据科学3.5.人工智能1.概述对于有兴趣进入IT领域的新生，
阿里的极限压测：手撕红黑树卡壳时，技术主管抛出分布式锁失效危机搞Java的小码农 Java面试场景题 Java 面试高并发分布式锁红黑树技术挑战
标题：阿里的极限压测：手撕红黑树卡壳时，技术主管抛出分布式锁失效危机场景设定时间：阿里总部，终面环节，技术主管正在考核即将加入某高并发项目组的应届生小兰。小兰即将面对一场极限压测场景模拟，这是她能否通过终面的关键一战。第一轮提问：基础数据结构与算法面试官（技术主管）：小兰，首先我们来聊点基础的。你能否手撕红黑树，讲讲它的基本性质和实现原理？小兰：嗯……红黑树是一种自平衡二叉搜索树，它的节点有红黑两
蓝桥杯刷题指南 love_c++ 蓝桥杯职场和发展
蓝桥杯是中国普及性最好的计算机程序设计竞赛之一，参加者包括大学生、高中生和草根程序员等各个群体。通过刷题来提升自己的编程能力是参加蓝桥杯比赛的常见做法。下面是一些蓝桥杯常见的题型和刷题技巧，希望对大家有所帮助。基础入门题目：输出“HelloWorld！”计算两个整数的和判断一个数是不是素数这些题目是蓝桥杯入门级别的常见题目，通过这些简单的题目可以熟悉比赛的题目风格和解题思路。数据结构与算法：深度优
数据结构字符串（二）统计字符数胡乱huluan 数据结构与算法字符串数据结构算法 c++c语言
数据结构（八）学习数据结构与算法过程中的心得体会以及知识点的整理，方便我自己查找，也希望可以和大家一起交流。——统计字符数——1.题目描述判断一个由a-z这26个字符组成的字符串中哪个字符出现的次数最多1.1输入第1行是测试数据的组数n，每组测试数据占1行，是一个由a-z这26个字符组成的字符串每组测试数据之间有一个空行，每行数据不超过1000个字符且非空1.2输出n行，每行输出对应一个输入。一行
数据结构与算法中二叉树的高效应用技巧数据结构与算法学习 ai
数据结构与算法中二叉树的高效应用技巧关键词：二叉树、数据结构、算法、遍历、平衡二叉树、应用场景、性能优化摘要：本文将深入探讨二叉树在数据结构与算法中的高效应用技巧。我们将从基础概念出发，逐步深入到实际应用场景和性能优化策略，帮助读者掌握二叉树的核心原理和实用技巧。文章包含丰富的代码示例、性能分析图表和实际应用案例，适合从初学者到进阶开发者的各个层次读者。背景介绍目的和范围本文旨在全面介绍二叉树数据
【C/C++】面试基础题目收集 CodeWithMe C/C++c语言 c++面试
C++软件开发面试中常见的刷题题目通常可分为以下几大类：数据结构与算法、系统编程、面向对象设计、C++语言特性、并发编程等。一、数据结构与算法（力扣/牛客经典题）掌握STL和底层结构实现能力：数组&字符串两数之和（LeetCode1）三数之和（LeetCode15）盛水最多的容器（LeetCode11）最长不重复子串长度（LeetCode3）字符串转整数（LeetCode8）链表反转链表（Leet
【原神 × 插入排序】刷圣遗物也讲算法：圣遗物评分系统背后的排序逻辑你真的懂吗？星之尘1021 游戏视角下的算法通识课算法排序算法数据结构
改编自：王争《数据结构与算法之美》游戏演绎：米哈游《原神》核心关键词：插入排序、排序算法、评分系统、属性评价、强化圣遗物、冒泡排序对比引言：原神刷本=刷排序？玩《原神》的玩家每天日常是啥？体力用来刷圣遗物、精通头、暴击头、攻充沙……一堆副本爆一堆装备，怎么判断哪个最好？我们通常会：看主属性和副属性结合角色使用场景打分排个分先用“过渡毕业”的这个过程，其实背后用的就是排序算法！尤其是插入排序（Ins
数据结构与算法学习笔记----Kruskal算法明月清了个风数据结构与算法笔记（基础课）算法学习笔记
数据结构与算法学习笔记----Kruskal算法@@author:明月清了个风@@firstpublishtime:2024.12.21ps⭐️这也是一个思想比较简单的算法，只写了基本思想，具体的可以看代码理解一下Kruskal算法Kruskal算法同样是一种基于贪心策略的最小生成树求解算法，另一种是上一篇中的Prim算法。基本思想将所有的边按边长从小到大排序。遍历所有边，判断每条边所连接的两个节
数据结构与算法学习笔记----字符串哈希明月清了个风数据结构与算法笔记（基础课）哈希算法学习笔记
数据结构与算法学习笔记----字符串哈希@@author:明月清了个风@@firstpublish:2024.12.4字符串哈希（stringhash）字符串哈希和上一篇的整数哈希一样，通过将字符串映射到一个数字来表示该字符串，只是对于字符串来说，这个哈希函数映射的方法会更特殊。实现原理（多项式哈希）基本的思想是通过将字符串中的每个字符映射到一个数字，通常使用ASCII码值，通过加权求和的方式计算
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他