E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
972信息检索
数据竞赛-“达观杯”文本智能处理-Day2:TF-IDF实践
达观杯”文本智能处理-Day2:TF-IDF实践1.原理2.tf-idf的理论依据及不足3.实践tf-idf(英语:termfrequency–inversedocumentfrequency)是一种用于
信息检索
与文本挖掘的常用加权技术
Mr._Hou
·
2020-07-07 09:48
数据分析
TF-IDF
数据分析
nlp
99%学生都不知道的Paper写作神器,Google从此是路人
__biz=MzA3MDM3MDYwMg==&mid=402714970&idx=2&sn=27be29a3a5e990a
972
ac221d5b3d19d2#wechat_redirectS神网站算不上
han____shuai
·
2020-07-07 09:48
Elasticsearch(七)
信息检索
与结果过滤
Elasticsearch:6.4.2聚合分类:Bucketing聚合:类似SQL中的GROUPBY;基于检索构成了逻辑文档组,满足特定规则的文档放置到一个桶里,每一个桶关联一个key;分桶聚合可以嵌套分桶聚合。Metric聚合:基于一组文档进行聚合。所有的文档在一个检索集合里,文档被分成逻辑的分组;对一个数据集求最大、最小、和、平均值等指标的聚合。Matrix聚合:此功能是实验性的,可在将来的版
morven936
·
2020-07-07 09:38
Elasticsearch
准确率、召回率和F值的关系
在
信息检索
、统计分类、识别、预测、翻译等领域,两个最基本指标是准确率和召回率,用来评价结果的质量。
feng_zhiyu
·
2020-07-07 07:08
自然语言处理
推荐几个机器学习算法及应用领域相关的中国大牛
>>李航:http://research.microsoft.com/en-us/people/hangli/,是MSRAWebSearchandMiningGroup高级研究员和主管,主要研究领域是
信息检索
chongshangyunxiao321
·
2020-07-07 05:14
见贤思齐
机器学习(Machine Learning)与深度学习(Deep Learning)资料 之 相关书目
master/dl2.mdhttps://github.com/ty4z2008/Qix/blob/master/dl.md·《IntroductiontoInformationRetrieval》介绍:此书在
信息检索
领域家喻户晓
我还听说过石壁岭的小河湾
·
2020-07-07 04:48
机器学习
深度学习
大数据
学习笔记CB008:词义消歧、有监督、无监督、语义角色标注、
信息检索
、TF-IDF、隐含语义索引模型...
词义消歧,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义消歧,可通过机器学习方法解决。词义消歧有监督机器学习分类算法,判断词义所属分类。词义消歧无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。有监督词义消歧方法。基于互信息词义消歧方法,两种语言对照,基于大量中英文对照语料库训练模型可词义消歧。来源信息论,一个随机变量中包含另一个随机变量信息量(英文信息中包含中文信息信息量
ahua2886
·
2020-07-07 02:24
信息检索
之布尔检索
1、倒排索引的两部分图1-32、构建倒排索引的过程①收集需要建立索引的文档;②将每篇文档转换成一个个词条的列表,这个过程成为词条化;(第二章)③进行语言学处理,产生归一化的词条来作为词项;(第三章)④对所有文档按照其中出现的词项来建立倒排索引,索引中包括一部词典(存于内存)和一个全体倒排索引表(存于磁盘)。(第四章)图1-43、倒排索引的词典和倒排索引都有存储开销,可以通过存储优化的策略来提高访问
nearvoid
·
2020-07-07 01:06
搜索引擎
信息检索
| | 检索装逼神技大全
文章目录1减除无关资料2并行搜索3相关检索4把搜索范围限定在网页标题中一intitle5把搜索范围限定在特定站点中一site6把搜索范围限定在url链接中一inurl7精确匹配一双引号和书名号8查找网页/文档filetype:9"开始连接"、"正在连接"用于搜索免费电影信息1减除无关资料 有时候,排除含有某些词语的资料有利于缩小查询范围。 百度支持“-”功能,用于有目的地删除某些无关网页,但减
是希望
·
2020-07-07 01:24
信息检索那点事
CiteSpace实践——英文Web of Science数据分析
1数据库简介ISIWebofKnowledge是ThomsonReuters公司开发的
信息检索
平台,通过这个平台用户可以检索关于
Blessy_Zhu
·
2020-07-06 19:49
citespace学习笔记
【信息管理学基础】总论-复习提纲
文章目录1)信息与信息管理2)信息交流3)信息分布4)信息获取5)信息组织6)
信息检索
7)信息服务8)信息系统9)信息机构管理10)信息政策与信息法律1)信息与信息管理详情信息、信息管理的基本概念信息特征
lambor20000216
·
2020-07-06 17:43
信息管理学基础
信息资源管理
【
信息检索
教程】【01
信息检索
基础】【理解】
文章目录信息信息的功能(信息的功效和作用)信息的类型(信息的分类)网络环境下的信息变化网络环境下信息的新特点
信息检索
信息检索
的原理
信息检索
的类型
信息检索
的意义/作用
信息检索
的历程
信息检索
系统
信息检索
系统的含义及工作原理
信息检索
系统的构成
信息检索
系统的分类
lambor20000216
·
2020-07-06 17:43
信息检索教程
Java使用哈夫曼树实现文件压缩的原理及实现
构造这种树的算法最早是由哈夫曼(Huffman)1952年提出,这种树在
信息检索
中很有用。结点之间的路径长度:从一个结点到另一个结点之间的分支数目。
陈九龙的博客
·
2020-07-06 16:41
JavaSE
实现模糊查询时对特殊字符进行处理和对查询结果进行处理
在这次的课程设计中老师布置了一个完成
信息检索
的作业,我是用网页实现的。功能比较简单写了将近半天的时间就完成功能,但是我还有点意犹未尽的感觉所以自己又完善了一下细节。
diaocaohui5613
·
2020-07-06 16:22
阿里巴巴年度技术总结:人工智能在搜索的应用和实践
以深度学习为代表的人工智能在图像、语音和NLP领域带来了突破性的进展,在
信息检索
和个性化领域近几年也有不少公开文献,比如wide&deep实现了深度模型和浅层模型的结合,dssm用于计算语义相关性,deepfm
人工智能学家
·
2020-07-06 16:05
【620】【信息管理学基础】【真题背诵】
联机
信息检索
的特点?
lambor20000216
·
2020-07-06 15:46
信息资源管理
档案数据挖掘技术的特点和应用
在日常的
信息检索
和整合处理的时候,管理档案的技术工作人员会采用一些较为特殊的技术手段进行处理,这种特殊的数据处理方式就是我们所说的档案数据挖掘技术。
人工智能爱好者
·
2020-07-06 12:38
大数据
计算语言学学习总结
内容来自中科院刘群研究员计算语言学PPT的整理笔;一、概述;1.应用;机器翻译(MT);
信息检索
(IR);自动问答(QA);自动文摘(AU,automaticsummary;信息抽取(IE);信息过滤(
zzzzzzzzzzzzzzzzzxs
·
2020-07-06 12:22
自然语言处理
(三)基于TensorFlow的聊天机器人—NLP基础
自然语言处理的主要范畴:文本分析、
信息检索
、词性标注、问答系统等二、NLP技术词法分析语法分析语义分析1、词法分析分词技术:如在文章中切分词语词性标注:即确定一段话中每个词是副词、名词、形容词或者其他词性的过程
雙安
·
2020-07-06 09:03
机器学习
准确率、精准率、召回率和F1值详解
专业术语的中英文对照表英文名准确率Accuracy精准率Precise召回率RecallF1值F1measurePrecise和Recall是广泛应用在
信息检索
和统计学分类领域的两个度量值,用来评价结果的质量
mannuandeyangguang
·
2020-07-06 07:59
机器学习
机器学习实战学习笔记(十三)利用SVD简化数据
1.1隐形语义索引 最早的SVD应用之一就是
信息检索
。
Hold_My_Own
·
2020-07-06 07:08
机器学习
svd
机器学习
算法与模型评估:准确率(Accuracy),精确率(Precision),召回率(Recall)和综合评价指标(F1-Measure)
本文首发于个人博客,点击访问原文序言自然语言处理(ML)、机器学习(NLP)、
信息检索
(IR)等AI领域,评估(evaluation)是一项非常重要的工作,其模型或算法的评价指标往往有如下几点:准确率(
阿拉灯神丁Vicky
·
2020-07-06 01:14
产品经理
自然语言处理
AI产品思维
【TOAN HOANG 专题(6)】布丁图
18394717-
972
ccbb3c283e3ca.jpg本文由Tableau交流问答群Tableau爱好者—Charles对原文进行翻译,若有问题,欢迎讨论我喜欢在
Tableau交流问答群
·
2020-07-06 00:03
【收藏】2018年不容错过的20大人工智能/机器学习/计算机视觉等顶会时间表
目录人工智能/机器学习计算机视觉/模式识别自然语言处理/计算语言学体系结构数据挖掘/
信息检索
计算机图形学人工智能/机器学习1.AAAI2018会议时间:2月2日~7日会议地点:新奥尔良市,美国AAAI是人工智能领域的主要学术会议
weixin_33813128
·
2020-07-05 23:20
《信心抽取研究概述》读书摘要
信息抽取与
信息检索
的差异:①功能不同。
信息检索
系统主要是从大量的文档集合中找到与用户需求相关的文档列表;而信息抽取系统则旨在从文本中直接获得用户感兴趣的事实信息。②处理技术不同。
wasd6081058
·
2020-07-05 19:17
Machine
Learning
&
Data
Mining
读书
自然语言处理
wrapper
文档
domain
金融
python数据分析-文本相似度分析
它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,
信息检索
等一些常用任务的API接口。
诺坎普奇迹
·
2020-07-05 19:41
数据分析
学习方法-北大学霸(02)初级技能
系列文章解读&说明:学习方法-北大学霸主要分为以下部分:(01)学习方法基础(自检&布鲁姆分类法)(02)初级技能(
信息检索
&神奇笔记&记忆秘密)(03)中级技能(整体提升:知识诅咒知识迁移元认知&读书知觉
AGS-wangdsh
·
2020-07-05 19:01
知识图谱(八)——知识存储和检索
背景知识图谱是一种有向图结构,描述了现实世界存在的实体、事件或者概念以及它们之间的关系,为自动问答、
信息检索
等应用提供支撑。
__盛夏光年__
·
2020-07-05 17:58
知识图谱
知识图谱
一个评测指标就是MAP(Mean Average Precision)平均精度均值。
在
信息检索
领域用的比较多,和正确率一块出现的是找回率Recall。对于一个查询,返回了一系列的文档,正
鹊踏枝-码农
·
2020-07-05 16:49
深度学习
深度学习
信管专业毕业生的尴尬
信息管理专业是一个管理学与计算机科学交叉的专业,是所学的课程一般包括管理学相关课程,
信息检索
相关课程和计算机相关课程。很多同学认为,本专业毕业后会出现既不如管理专业学生的管理技能,也
全脂老猫
·
2020-07-05 15:22
【NUC
972
】LINUX移植笔记:(1)移植笔记
【NUC
972
】LINUX移植笔记:(1)移植笔记宿主机:虚拟机Ubuntu16.04LTS/X86开发板:NUC
972
LINUX内核:3.10.x交叉编译器:arm-linux-uclibcgnueabi-gcc4.3.4
大水猫
·
2020-07-05 12:32
NUC972
LINUX
事件抽取
事件抽取是把含有事件信息的非结构化文本以结构化的形式呈现出来,在自动文摘、自动问答、
信息检索
等领域有着广泛的应用。近些年来,事件抽取一直吸引着许多研究机构和研究者的注意力。
林子要加油
·
2020-07-05 10:17
NLP
第四范式先荐|推荐系统简论
【什么是推荐】推荐是一种古老的
信息检索
方式,我国历史记载最早的推荐在西汉,汉武帝元光元年初令郡国举孝廉各一人,即举孝举廉各一人。
第四范式天枢
·
2020-07-05 09:03
SEO优化的意义是什么?
SEO,顾名思义是通过百度搜索引擎规则,让自己想marketing的东西有很好的排名,在别人进行
信息检索
的时候第一时间点击访问。而SEO优化的最高境界是什么?就我理解,如果能霸屏了,算不算最高境界。
春城往事
·
2020-07-05 08:51
新手探索NLP(八)——序列标注
中的序列标注问题(隐马尔可夫HMM与条件随机场CRF)Introduction序列标注问题(sequencelabeling,alsonamedastagging)可以看作许多自然语言处理问题的前驱,如情感分析,
信息检索
野营者007
·
2020-07-05 07:19
Neural
Network
说一下数据库有哪些索引类型,有什么优缺点?
使用索引的优点:提高数据的搜索速度加快表与表之间的连接速度在
信息检索
过程中,若使用分组及排序子句进行时,通过建立索引能有效的减少检索过程中所需的分组及排序时间,提高检索效率。
奥修诺斯
·
2020-07-05 07:18
面试题
计算语言学之拼写纠错
多用在
信息检索
、输入法等,其实也可以扩展到寻找同义词等相关领域。这里我们主要针对英文、中文中的拼写检查的方法,进行一个简要的概述,因为这方面是一个很热门的研究方向,所以材料很多,我们只是进行入门介绍。
刘炫320
·
2020-07-05 05:01
计算语言学
#
自然语言处理(计算语言学)概论
KMP算法模式匹配
各种
信息检索
系统,文字处理系统都少不了。本文介绍一个非常著名的KMP模式匹配算法用于子串查找。先抛开KMP,正常情况一下我们会如何设计这个逻辑。
犀牛饲养员
·
2020-07-05 02:49
编程算法
那些年一起追过的算法
机器学习与人工智能学习资源导引
groups.google.com/group/pongba/)我经常在TopLanguage讨论组上推荐一些书籍,也经常问里面的牛人们搜罗一些有关的资料,人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、
信息检索
这些无疑是
pongba
·
2020-07-05 02:48
片面思考
信息检索
系统——VSM算法实现
匹配文档样例查询样例匹配结果样例python–源码如下importmathfromtqdmimporttqdmdf_dict={}globaldocs_num#一个全局变量,保留全部文档数docs_num=0defdoc_pl(doc):#求出文档中的词频数,及总词数,用于tf-idf的计算word_list=doc.split()num=0word_pl={}forwordinword_list
_Rikka_
·
2020-07-05 00:32
算法
“我投降,关于你的都退让????”
今天的歌曲由@someday分享希望大家喜欢这是大叔为你写的
972
篇日记图片:网络从今天起下单购书的读者收货后在朋友圈晒图并@我我将每天选出一位读者大叔日记的插曲由你决定。
末那大叔
·
2020-07-05 00:00
信息检索
领域相关资料
zzfromhttp://net.pku.edu.cn/~webg/IR-Guide.txt
信息检索
领域相关资料(AGuidetoInformationRetrieval)OrganizedbyHongfeiYanLastupdatedonApril19,2006
tattarrattat
·
2020-07-04 23:30
自然语言处理
fw_printenv 工具编译使用心得
平台环境是NUC
972
。中间过程不是很顺利,走了些弯路,在此记录,分享出来。关于编译方法,网上也很多了。但在
972
平台上还是有点区别。
justgg
·
2020-07-04 20:55
linux开发
自然语言处理之准确率、召回率、F1理解
在
信息检索
、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要。
小亮 Play NLP
·
2020-07-04 19:50
NLP
图挖掘:社会网络分析和多关系数据挖掘
2、许多图搜索算法已经被开发出来了,并且广泛用在
信息检索
、计算机视觉等领域;3、需要进一步开发高效的图挖掘算法,以便从更加复杂的结构化数据中挖掘出有效的知识。
iteye_9214
·
2020-07-04 19:21
20 Newsgroups数据集介绍
20newsgroups数据集是用于文本分类、文本挖据和
信息检索
研究的国际标准数据集之一。数据集收集了大约20,000左右的新闻组文档,均匀分为20个不同主题的新闻组集合。
imstudying
·
2020-07-04 18:17
C 语言中 typeof 关键字简介
原文:http://hi.baidu.com/leowang715/blog/item/b0b96d6f
972
e7dd080cb4a06.htmltypeof关键字是C语言中的一个新扩展。
ganggexiongqi
·
2020-07-04 16:38
杂项
Linux
内核
Linux
驱动
移植
Linux
基础学习
实时操作系统
语言
c
pointers
arrays
编译器
character
信息检索
导论读书笔记(六):文档评分、词项权重计算及向量空间模型
在文档集规模很大的情况下,满足布尔查询的结果文档数量可能非常多,往往会大大超过用户能够浏览的文档数目。因此对搜索引擎来说,对文档进行评分和排序非常重要。参数化索引及域索引大多数文档具有额外的结构信息,与文档相关的特定形式的数据(比如作者、标题、出版日期等)我们称为元数据。数字文档通常会把与之相关的元数据以机读的方式一起编码。元数据通常会包括字段信息,对每个字段(比如文档创建时间)建立与之对应的参数
时间很奇妙!
·
2020-07-04 14:45
信息检索导论读书笔记
信息检索
导论读书笔记(五):索引压缩
在先前的章节中介绍了
信息检索
系统中两个主要数据结构:词典、倒排记录表。接下来将介绍对这两个数据结构的各种压缩技术。这些技术对于构建高效的IR系统非常关键。
时间很奇妙!
·
2020-07-04 14:44
信息检索导论读书笔记
信息检索
导论读书笔记(三):词典及容错式检索(通配符查询、拼写校正)
假设给定倒排索引及查询,首先应确定查询词项是否在词汇表中,如果在应该返回词项对应的倒排记录表的指针。查找操作通常采用词典的经典数据结构。实现这种数据结构有两种方式:哈希表及搜索树。关于两者的定义在此不再赘述。哈希表除了需要解决哈希冲突的问题,在查询词存在轻微变形时也无法进行查询,并且由于词汇表往往是不断增长的,为当前需求设计的哈希函数可能过一段时间就不再适用。因此通常使用搜索树的查询方式。搜索树也
时间很奇妙!
·
2020-07-04 14:44
信息检索导论读书笔记
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他