E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
BloomFilter
布隆过滤器 布隆算法
BloomFilter
package com.spider; import java.util.BitSet; public class
BloomFilter
{ private int defaultSize
woshizn
·
2009-11-28 23:00
算法
对大量转载贴识别算法的研究
至于产生信息指纹的方式,最简单的是用MD5或者SHA等单向Hash函数,如果为了减少存储以及提高性能,同时可以容许一定误差,可以再利用
BloomFilter
。
chl033
·
2009-11-17 11:00
算法
存储
扩展
Google黑板报
今天发现Google黑板报真是个不错的东东~~http://googlechinablog.com/数学之美系列五--简单之美:布尔代数和搜索引擎的索引数学之美系列二十--布隆过滤器(
BloomFilter
hjhnju
·
2009-11-15 22:02
生活
职场
休闲
Google黑板报
今天发现Google黑板报真是个不错的东东~~http://googlechinablog.com/数学之美系列五--简单之美:布尔代数和搜索引擎的索引数学之美系列二十--布隆过滤器(
BloomFilter
hjhnju
·
2009-11-15 22:02
生活
职场
休闲
提升hbase性能的几个地方
1、使用
bloomfilter
和mapfile_index_interval
Bloomfilter
(开启/未开启=1/0)mapfile_index_intervalExists(0-10000)/msGet
cangyingzhijia
·
2009-10-21 16:00
虚拟机
数据库
hbase
存储
byte
程序开发
提升hbase性能的几个地方
阅读更多1、使用
bloomfilter
和mapfile_index_interval
Bloomfilter
(开启/未开启=1/0)mapfile_index_intervalExists(0-10000
cangyingzhijia
·
2009-10-21 16:00
HBase
Hadoop
虚拟机
Apache
多线程
提升hbase性能的几个地方
阅读更多1、使用
bloomfilter
和mapfile_index_interval
Bloomfilter
(开启/未开启=1/0)mapfile_index_intervalExists(0-10000
cangyingzhijia
·
2009-10-21 16:00
HBase
Hadoop
虚拟机
Apache
多线程
提升hbase性能的几个地方
1、使用
bloomfilter
和mapfile_index_interval
Bloomfilter
(开启/未开启=1/0) mapfile_index_interval Exists
cangyingzhijia
·
2009-10-21 16:00
apache
多线程
hadoop
虚拟机
hbase
BloomFilter
算法的C#简化版,主要应用于URL消重
System.Collections; using System.Text; using NUnit.Framework; namespace OurAlgorithmCollections { public class
BloomFilter
yy8354
·
2009-04-09 09:00
C++
c
算法
C#
BloomFilter
研究了一个周的问题,终于得到释然与证实,之前一直在研究大数据集的处理问题,以个人的理解和总结写出了这个记录,以后对自己、或者更多的人有所帮助,算是小成了。 领域涉及通信、项目面对的是大数据集处理,海量数据的诸多操作,优化当然是首当其冲了,经验出自项目成员组的资深码农,也算是从他们的方案中学习到的吧,自己经验暂所浅出。功能很简单,但是做到优化和用户体验就显得比较棘手了,”缓存中存在1W以上的电话号
哑鸟
·
2009-04-08 00:00
大数据处理
bloomfilter
数学之美系列二十一 - 布隆过滤器(Bloom Filter)
数学之美系列二十一-布隆过滤器(
BloomFilter
)2007年7月3日上午09:35:00发表者:Google(谷歌)研究员吴军在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中
justin12zhu
·
2009-01-13 23:00
Bloom filters in Python
Python语言:临时自用代码@代码发芽网#coding:utf-8#
Bloomfilter
sinPython#AdamLangley#给CountedBloom加了一个max_count张沈鹏#Bloom-Filter
zuroc
·
2008-12-10 11:00
C++
c
算法
python
C#
Bloom Filter概念和原理
阅读更多焦萌2007年1月27日
BloomFilter
是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。
helloyesyes
·
2008-08-21 09:00
F#
EXT
网络应用
领域模型
数据结构
Bloom Filter概念和原理
焦萌2007年1月27日
BloomFilter
是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。
helloyesyes
·
2008-08-21 09:00
数据结构
F#
网络应用
ext
领域模型
Bloom Filter概念和原理
BloomFilter
是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。
threewells_14
·
2008-06-12 10:00
数据结构
function
网络
filter
网络应用
存储
数学之美系列二十一 - 布隆过滤器(Bloom Filter)
数学之美系列二十一-布隆过滤器(
BloomFilter
)2007年7月3日上午09:35:00uT("time4444440318463911176");发表者:Google(谷歌)研究员吴军在日常生活中
damon_king
·
2008-04-29 10:00
filter
email
存储
网络爬虫
服务器
yahoo
Google黑板报
大数据量的过滤 (用于爬虫,蜘蛛) Bloom Filter 布隆过滤器
大数据量的过滤(用于爬虫,蜘蛛)
BloomFilter
布隆过滤器原文:
BloomFilter
sinC#http://www.devsource.com/article2/0,1895,2113495,00
rcyl2003
·
2007-10-18 16:00
数据结构
String
filter
null
url
Class
大数据量的过滤 (用于爬虫,蜘蛛) Bloom Filter 布隆过滤器
大数据量的过滤(用于爬虫,蜘蛛)
BloomFilter
布隆过滤器原文:
BloomFilter
sinC#http://www.devsource.com/article2/0,1895,2113495,00
rcyl2003
·
2007-10-18 16:00
数据结构
算法
.net
asp.net
asp
url排重
http://blog.csdn.net/oyd/archive/2007/07/19/1699237.aspx---原网址我这里介绍一个极适合大量URL快速排重的方法 ,这个算法被称为
Bloomfilter
lovecpp
·
2007-07-20 18:00
mysql
.net
算法
socket
perl
快速URL排重的方法(一)
我这里介绍一个极适合大量URL快速排重的方法,这个算法被称为
Bloomfilter
,基本上,它也只适合这样的场合。这里的大量是指有5000万至1亿的URL,更大的数据量可能也不合适了。
javatgo
·
2007-07-19 18:00
算法
mysql
socket
perl
Bloom Filter, Counting Bloom Filter和Dynamic Count Filter源码下载
下面是我做实验时实现的
bloomfilter
,counting
bloomfilter
和dynamiccountfilter的源码,只经过很简单的测试,有兴趣的可以下载玩一玩,如果发现bug请发邮件给我,
jiaomeng
·
2007-05-21 14:00
filter
测试
Bloom Filter应用之LOAF
通讯录(邮件地址的集合)用
bloomfilter
来表示,不但大大减少了网络通信量,而且保护了你的隐私。
jiaomeng
·
2007-04-18 20:00
数据库
网络
filter
Social
通讯
networking
Dynamic Count Filter
Spectral
bloomfilter
(SBF)在counting
bloomfilter
(CBF)的基础上提出了元素出现频率查询的概念,将CBF的应用扩展到了multi-set的领域。
jiaomeng
·
2007-03-28 11:00
c
工作
vector
filter
存储
扩展
Spectral Bloom Filter (4)
在membershipquery上,由于SBF和CBF都沿用
bloomfilter
的基本结构,因此很难在membershipquery上提高查询效率。
jiaomeng
·
2007-03-25 07:00
算法
优化
filter
存储
query
Spectral Bloom Filter (2)
假设SBF要表示M个元素的集合(可能包含重复元素),counter数组的长度为m(对应着
bloomfilter
的位数组),显然所有counter需要的最少位数N为 其中Ci表示counter数组中第i个
jiaomeng
·
2007-03-23 12:00
c
vector
filter
存储
Spectral Bloom Filter (1)
Bloomfilter
将集合中的元素映射到位数组中,用k(k为哈希函数个数)个映射位是否全1表示元素在不在这个集合中。
jiaomeng
·
2007-03-19 22:00
Stream
filter
存储
query
扩展
Bloom Filter应用之Web Cache Sharing
从这篇文章开始,我会陆续介绍一些
bloomfilter
的应用。
jiaomeng
·
2007-03-16 16:00
Web
cache
网络
filter
扩展
分布式应用
评价d-Left Counting Bloom Filter
BloomFilter
是一个简洁精致的数据结构,要对它进行本质上的提高并不容易。
jiaomeng
·
2007-03-14 16:00
数据结构
工作
cache
网络
filter
d-Left Counting Bloom Filter (5)
最后,我们将d-leftcounting
bloomfilter
与标准的counting
bloomfilter
作一比较。
jiaomeng
·
2007-03-13 12:00
c
filter
construction
d-Left Counting Bloom Filter (4)
根据前面的描述,d-leftcounting
bloomfilter
构造过程中的缺陷有三个条件:1.x和y的fingerprint相同;2.位置选择有重合;3.x不选择重合位置,y选择重合位置。
jiaomeng
·
2007-03-11 09:00
工作
filter
Random
存储
permutation
d-Left Counting Bloom Filter (3)
通过以上的介绍,d-leftcounting
bloomfilter
的主要思路已经呈现出来了,那就是利用d-lefthashing的方法存储fingerprint。
jiaomeng
·
2007-03-10 17:00
filter
存储
Perfect Hashing VS. Bloom Filter
PerfectHashingVS.
BloomFilter
在NetworkApplicationsof
BloomFilter
s:ASurvey一文中,作者提到了一种基于Perfecthashing的方法,
jiaomeng
·
2007-03-02 16:00
function
filter
存储
语言
NetWork
需要整理研究的搜索引擎技术点(目录,无实际价值)
,分词算法设计5.1,数字英文分词算法设计5.2,中文分词算法设计分词应用部分1,标签抽取2,文本相关性与文本分类2.1,SVM算法WebSpider开发1,网页编码自动识别2,Url去重算法2.1,
Bloomfilter
kwklover
·
2007-03-01 20:00
需要整理研究的搜索引擎技术点(目录,无实际价值)
分词算法设计 5.1,数字英文分词算法设计 5.2,中文分词算法设计分词应用部分1,标签抽取2,文本相关性与文本分类 2.1,SVM算法WebSpider开发1,网页编码自动识别2,Url去重算法 2.1,
Bloomfilter
kwklover
·
2007-03-01 20:00
Compressed Bloom Filter
Compressed
BloomFilter
焦萌2007年2月8日 在前面的讨论中,我们都只将
BloomFilter
作为一种表示集合的数据结构。
jiaomeng
·
2007-02-08 14:00
数据结构
算法
网络
filter
网络应用
Partial Bloom Filter
Partial
BloomFilter
焦萌2007年2月5日 在标准的
BloomFilter
中,我们用k个相互独立的哈希函数将一个集合映射到长度为m的位数组中,其中每个哈希函数的映射范围都为{0,…,m-
jiaomeng
·
2007-02-05 22:00
filter
存储
Counting Bloom Filter
Counting
BloomFilter
焦萌2007年1月30日 从前面几篇对
BloomFilter
的介绍可以看出,标准的
BloomFilter
是一种很简单的数据结构,它只支持插入和查找两种操作。
jiaomeng
·
2007-01-30 22:00
数据结构
工作
cache
filter
存储
扩展
应用Bloom Filter的几个小技巧
应用
BloomFilter
的几个小技巧焦萌2007年1月29日 下面列举几个基于标准
BloomFilter
的小技巧: 1. 求两个集合的并。
jiaomeng
·
2007-01-29 19:00
filter
从哈希存储到Bloom Filter
从哈希存储到
BloomFilter
焦萌2007年1月28日 先解释一下什么是哈希函数。哈希函数简单来说就是一种映射,它可取值的范围(定义域)通常很大,但值域相对较小。
jiaomeng
·
2007-01-28 17:00
加密
工作
function
filter
存储
扩展
Bloom Filter概念和原理
BloomFilter
概念和原理焦萌2007年1月27日
BloomFilter
是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。
jiaomeng
·
2007-01-27 12:00
数据结构
网络应用
filter
internet
networking
transactions
Url排重Bloom Filter 算法、误差及其他
Url排重
BloomFilter
算法、误差及其他flywithme,intheperfectworld---题记最近看了一些书,公式和算法,用一个词把他们窜起来的话,这就是:误差。
accesine960
·
2007-01-23 18:00
C++
算法
filter
Google
url
Ruby
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他