E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
972信息检索
C# 直接执行、调用本机代码、汇编代码 shell Native Code
C# 直接执行、调用本机代码、汇编代码 shell Native Code Posted on 2008-05-11 16:58 曲滨*銘龘鶽 阅读(
972
) 评论(13) 编辑
·
2015-11-11 11:11
native
欢迎报考中国科学院信息工程研究所第二研究室
信息检索
课题组
研究方向:主要就是
信息检索
(Information Retrieval)以及相关的领域。神马机器学习啦,数据挖掘啦,推荐系统啦,知识图谱啦,自然语言处理啦
·
2015-11-11 10:42
关于
信息检索
-倒排文件系统架构解析
信息检索
信息检索
我们常见的模型包括: bool model static langulage model vector space model 这里面主要涉及到的问题就是
·
2015-11-11 09:02
系统架构
新手学
信息检索
3:词频-逆文档频
上一篇介绍了倒排表这种数据结构,接下来将介绍一下词频-逆文档频(tf-idf)这个概念。 首先,什么是词频?词频就是一篇文档包含一个词的次数。 举个例子,如果一篇文档d中“cat”这个词出现了5词,那么我们就说“cat”的词频为5,记做tf(cat)=5。 那么,什么是文档频?这个概念也是对于一个词来说的。通俗来说文档频就是包含一个词的文档数目。 举个例子,如果有100篇文档都有“cat”
·
2015-11-11 08:22
文档
新手学
信息检索
2:倒排表与存储
这篇就说一个
信息检索
里面理解最简单的一个东西吧,它就叫做倒排表或者倒排索引。但是这只是个名字,我想大家都知道它是什么就行了,不必纠结于名称。先说说倒排表张什么样子吧!
·
2015-11-11 08:21
存储
新手学
信息检索
1:浅谈
信息检索
没做过
信息检索
,所以别人怎么做的也不知道。很想知道Google,百度这样的大公司怎么做搜索引擎的,但是没机会也不会知道。凭着自己的理解就写了这么几篇随笔,这样能督促自己思考,也希望得到大神们的指点。
·
2015-11-11 08:20
新手
AUC(Area Under roc Curve )计算及其与ROC的关系
这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在
信息检索
(IR)领域中常用的recall和precision,等等。
·
2015-11-11 08:55
计算
多媒体
信息检索
技术简介 (基于内容的视频检索)
http://www.istis.sh.cn/list/list.asp?id=1532 多媒体技术和Internet的发展给人们带来巨大的多媒体信息海洋,并进一步导致了超大型多媒体信息库的产生,光凭关键词是很难做到对多媒体信息的描述和检索的,这就需要有一种针对多媒体的有效的检索方式。如何有效的帮助人们快速、准确地找到所需要的多媒体信息,成了多媒体信息库所要解决的核心问题。
·
2015-11-11 08:27
多媒体
Discovering Word Senses from Text
Discovering Word Senses from Text 第一章 简介 使用词形的词义在很多应用中具有重要的作用,这些应用包含
信息检索
、机器翻译
·
2015-11-11 07:26
word
SDUT OJ 周赛 找有毒的那杯水(思维逻辑 + 分治思想 )
点这里^_^ 题目描述 最近看了一个非常好玩的题,如果有
972
杯水,其中有971个没有毒的,1个有毒的, 其中有毒的水的毒性需要一周才会发作,那么,我们最少需要多少只小白鼠才能够在一周的时间内确定那一杯水是有毒的
·
2015-11-11 06:34
du
以求医为例谈搜索引擎排序算法的基础原理
这个看似简单的问题,却是
信息检索
专家们研究的核心难题之一。 怎样的医生呢?假设我只有三种选择: A医生,既治眼病,又治胃病; B医生,既治牙病,又治胃病,还治眼病;
·
2015-11-11 06:46
搜索引擎
高效稳定的大型网站系统架构分析
随着中国大型IT企业信息化速度的加快,大部分应用的数据量和访问量都急剧增加,大型企业网站正面临性能和高数据访问量的压力,而且对存储、安全以及
信息检索
等等方面都提出了更高的要求。
·
2015-11-11 05:22
系统架构
大地__向量空间的本质
由于早期的搜索沿用的借助倒排表,使用布尔模型是0和1的二元逻辑,使用逻辑符号and or not来组织关键词的表达式,所以造成
信息检索
的结果查全率高,查准率底。
·
2015-11-11 04:41
《Lucene In Action》 01 初识Lucene
基于Lucene 3.0.1 1、Lucene简单定义 Lucene是高性能、可扩展的
信息检索
(IR)工具库。
·
2015-11-11 03:49
Lucene
计算机程序员+研一生活总结
这一学年总共选了十几门课程,其中机器学习、自然语言处理、
信息检索
、复杂网络建模这几门课还是挺有用的。其余的课程就比较坑爹了。 研一下学期,就一直在
·
2015-11-11 03:37
程序员
新手学
信息检索
6:谈谈二值独立模型
介绍一个概率检索模型-二值独立模型。这个模型我自认为比较扯淡,如有大神在可以指点一下。这个模型用了N多个假设。 假设1:词项之间的出现是相互独立的。 这样文档和查询都可以向量化,如下: 当词项t出现在文档或查询中,则xt或qt的值为1,否则为0。由于我们假设词项出现是相互独立的,并且向量取值只取0,1两个值,故这个模型就叫做二值独立模型。那么这个模型是如何进行文档检索以及排序的呢,接下来
·
2015-11-11 02:36
新手
新手学
信息检索
5:正确率-召回率与搜索引擎的评价
这篇就简单介绍一下搜索引擎的评价方法。从用户的角度去评价一个搜索引擎的检索效果最好的方法就是计算用户在查到自己满意文档时已经浏览的文档数。但是实际中,查询千变万化,文档也千变万化,所以这种方法不可行。人们便提出了下面的概念,并建立了一个评价标准。 这里面有三个常用的概念:正确率,精确率,召回率。 正确率(Precision,简称为P)定义为:P=返回结果中相关文档个数/返回结果的数目。 精确
·
2015-11-11 02:35
搜索引擎
新手学
信息检索
4:向量空间模型与相似度计算
在
信息检索
中,相似度表示的是两个文档之间的相似程度或者查询与文档的相似程度。 首先回想一下检索过程: 1:首先用户输入查询词。 2:搜索引擎根据查询词查找相应的文档。
·
2015-11-11 02:34
相似度计算
计算音乐学简介
ppt下载链接 http://pan.baidu.com/s/1hqjJdUc 声音与音乐的信号处理 声音与音乐的内容分析、理解和建模 音乐
信息检索
机器学习在音乐计算中的应用
·
2015-11-11 00:34
音乐
大型网站的架构设计问题—-大型高并发高负载网站的系
archive/2010/11/24/1886301.html 随着中国大型IT企业信息化速度的加快,大部分应用的数据量和访问量都急剧增加,大型企业网站正面临性能和高数据访问量的压力,而且对存储、安全以及
信息检索
等等方面都提出了更高的要求
·
2015-11-11 00:18
架构设计
AUC(Area Under roc Curve )计算及其与ROC的关系
这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在
信息检索
(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对
·
2015-11-11 00:53
计算
HDU Tickets(简单的dp递推)
(Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s):
972
&
·
2015-11-10 23:23
HDU
lucene
源代码下载 What’s LuceneLucene是一个
信息检索
的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能. Lu
·
2015-11-10 23:46
Lucene
删除表中的所有行,但表结构及其列、约束、索引等保持不变Truncate Table [Table Name]
原帖地址:http://hi.baidu.com/liyanlin84/blog/item/eb306616cdb51e1c
972
b4389.html 删除表中所有数据,且希望自动自动增长列从
·
2015-11-09 14:57
truncate
Lucene 搜索引擎( ing..)
在
信息检索
工具中,全文检索是最具通用性和实
·
2015-11-09 13:56
Lucene
析取范式
本身我已经将算法导论上基本的数据结构和算法都掌握了,再加上平常练习acm,感觉自己具备了投身搜索的一些前提条件,本身我也是好联系黄页搜索的主要负责人,现在搜索做成那个样子跟我自己的搜索水平有脱不开的关系,所以《
信息检索
导论
·
2015-11-09 13:36
范式
信息检索
1 背景知识
1 定义 本文
信息检索
属于广义上的
信息检索
。即把信息按一定方式组织起来,并根据信息用户的需求找出有关的信息的过程和技术。
·
2015-11-08 16:55
背景
面向对象设计-图书管理系统
nbsp; 图书馆管理系统是图书馆管理工作中不可缺少的部分,对于图书馆的管理者和使用者来说都非常重要了,故相对于传统的手工方式或性能较低的图书馆管理系统管理图书馆的日常事务相比,设计一个能提供快速的图书
信息检索
功能
·
2015-11-08 16:23
面向对象
SRS文档
系统总体功能需求 图书馆管理系统是图书馆管理工作中不可缺少的部分,对于图书馆的管理者和使用者来说都非常重要了,故相对于传统的手工方式或性能较低的图书馆管理系统管理图书馆的日常事务相比,设计一个能提供快速的图书
信息检索
功能
·
2015-11-08 16:21
文档
搜索引擎--范例:django之初试牛刀
这学期学了一门课《
信息检索
》,也就是传说中的搜索引擎 大作业自然而然的让我们自己做一个小型的搜索引擎。
·
2015-11-08 14:04
django
Lucene
源代码下载 What’s LuceneLucene是一个
信息检索
的函数库(Library),利
·
2015-11-08 11:50
Lucene
A simple test
博士生课程报告 视觉
信息检索
技术
·
2015-11-08 09:46
simple
字符串精确匹配算法改进的探讨
关键词:精确匹配;KMP算法;模糊匹配 一、引言 字符串精确匹配在计算机领域有着广泛的应用, 它可用于数据处理、数据压缩、文本编辑、
信息检索
等多方面。
·
2015-11-08 09:33
字符串
信息检索
3 检索模型
检索模型分为两种,一种是boolean model 一种是ranked retrieval 一 boolean查找: 1 binary decision:is document relevant or not? 文档只有相关和不相关两种,并没有排行 2 presence of term is necessary and sufficient for match
·
2015-11-07 15:29
模型
信息检索
2 索引文档
索引文档的目标就是去找能代表文档的短语。 通常,索引方式有两种,手动索引和自动索引 一 手动索引 人工来索引整理文档(通常用固定的词汇) 需要去训练人力 例子:图书馆书籍 优缺点: 优点: 1 可以达到很精确的索引
·
2015-11-07 15:28
索引
微博集体照UI重构草图
微博集体照应用(哈工大社会计算与
信息检索
研究所开发),通过一定的算法对微博用户的粉丝进行分组计算,将用户的粉丝自动分为几个小组,用户还可以手工修改分组结果,调整错误的分组,然后对小组成员进行合照留念分享到微博
·
2015-11-07 11:48
UI
现代
信息检索
(原书第2版)
《现代
信息检索
(原书第2版)》基本信息原书名:Modern Information Retrieval:The Concepts and Technology behind Search,Second
·
2015-11-07 11:10
书
聚类效果评测-Fmeasure和Accuracy及其Matlab实现
F-Measue是
信息检索
中常用的评价标准。
·
2015-11-07 10:20
matlab
TF-IDF与余弦相似性的应用(一):自动提取关键词
这个问题涉及到数据挖掘、文本处理、
信息检索
等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通人只用10分
·
2015-11-07 10:28
关键词
中文全文
信息检索
系统中索引项技术及分词系统的实现
关键词:
信息检索
中文信息处理 分词 The indexing term technology of Chinese information retrieval and implement
·
2015-11-05 08:29
索引
信息检索
中索引的本质
信息检索
问题 首先我们来看问题域。每一种技术产物都是为解决某类问题。不从问题域出发,我们就很难理解为什么它是这样的。就像那些没学过“程序语言”设计的人,只能被程序语言牵着走。
信息检索
背
·
2015-11-03 22:33
索引
[
信息检索
]搜索引擎大作业
[现代
信息检索
]搜索引擎大作业 一、题目要求: 新闻搜索:定向采集3-4个体育新闻网站,实现这些网站信息的抽取、索引和检索。网页数目不少于10万条。
·
2015-11-03 21:07
搜索引擎
爬虫项目功能规格说明书
对爬虫软件有所需要的各类用户1.3项目背景互联网信息繁杂冗余,虽然有搜索引擎如百度、谷歌给一般用户提供内容检索分类呈现的服务,这些引擎的表层功能虽然满足了一般互联网用户的需求,但是比较广泛不具体,为了让网络
信息检索
获取功能更加的具体专一
爱码室
·
2015-11-02 21:00
C 语言中 typeof keyword简单介绍
原文:http://hi.baidu.com/leowang715/blog/item/b0b96d6f
972
e7dd080cb4a06.html typeofkeyword是C语言中的一个新扩展
·
2015-11-02 19:48
typeof
信息检索
导论学习笔记(4)
索引构建 回顾倒排索引的构建,首先,我们扫描一遍文档集合得到所有的词项—文档 ID 对。然后,我们以词项为主键、文档 ID 为次键进行排序。最后,将每个词项的文档 ID组织成倒排记录表, 并计算诸如词项频率或者文档频率的统计量。对于小规模文档集来说,上述过程均可在内存中完成。对于大规模文档集,由于内存不足,我们必须使用基于磁盘的外部排序算法(external sorting algorit
·
2015-11-02 16:10
学习笔记
信息检索
导论学习笔记(2)
词项词典及倒排记录表 回顾倒排索引的构建 收集待建索引的原文档(Document) 将原文档传给词条化工具(Tokenizer)进行文本词条化 将第二步得到的词条(Token)传给语言分析工具(Linguistic modules)进行语言学预处理,得到词项(Term) 将得到的词项(Term)传给索引组件(Indexer),建立倒排索引 文档 文档分析以及编码转
·
2015-11-02 16:09
学习笔记
信息检索
导论学习笔记(3)
词典及容错式检索 如上图,倒排索引记录表构建好后。对于查询请求“solr”,我们的首要任务是确定查询词项solr是否在词典的词项词汇表中,如果在,则返回该词项对应的倒排记录表的指针。如何在数据结构(即词典)中快速定位词项? 词典(即存储词项词汇表的数据结构) 快速定位词项主要有两大类解决方案 哈希表方式 每个词项通过哈希函数映射成一个整数,映射函数的目标空
·
2015-11-02 16:09
学习笔记
信息检索
导论学习笔记(1)
布尔检索
信息检索
概述
信息检索
:是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。
·
2015-11-02 16:08
学习笔记
全文
信息检索
介绍及算法分析
一、摘要 本文主要介绍了全文
信息检索
的概念、应用领域、算法分类、技术难点和算法比较。及一款实现全文检索的数据结构和算法。
·
2015-11-02 15:05
算法
主题模型
它克服了传统
信息检索
中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。 关
·
2015-11-02 13:16
主题
上一页
54
55
56
57
58
59
60
61
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他