E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
☆搜索引擎技术☆
利用Lucene.net搭建站内搜索(2)---分词技术
在
搜索引擎技术
中,分词对于影响搜索引擎结果排序有着至关重要的作用。
·
2015-10-30 20:31
Lucene
转:Lucene与
搜索引擎技术
--Analysis包分析
作者:TjuAILab windshow 2005.11.11 原URl:http://blog.donews.com/windshow/archive/2005/11/11/622845.aspx Analysis包分析 算法和数据结构分析: 由于Analysis包比较简单,不详述了! 算法:基于机械分词 1-gram,2-gram,HMM(如果使用ICTCLAS
·
2015-10-30 14:21
Lucene
继续我的代码,分享我的快乐 - WEBUS2.0 资源汇总
WEBUS就是这样的代码,自从两年前开始研究
搜索引擎技术
,它就开始伴我度过无数个闲暇时光,而今已经开发到2.0版本了。
·
2015-10-30 12:43
Web
中文
搜索引擎技术
之网页排序
随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。 随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之
·
2015-10-30 11:36
搜索引擎
中文
搜索引擎技术
之系统架构
互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到想要的各类信息,这在互联网没有被普及之前,还都仅是一个梦而已,但如今这一切已成为了可能
·
2015-10-30 11:35
搜索引擎
中文
搜索引擎技术
之网络爬虫
随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为学者,会把有代表性的搜索引擎作为研究对象…… 而作为一个网站的经营者,其更关心的或许是如何通过网络载体让更多的网民知道自己的网站,进而获得更高的流量和知名度。这其中,搜索引擎已经
·
2015-10-30 11:35
搜索引擎
搜索引擎学习资源收集
一、
搜索引擎技术
/动态资源<一>、综合类1、卢亮的搜索引擎研究 http://www.wespoke.com/卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"
·
2015-10-30 11:34
搜索引擎
搜索引擎技术
学习
更多内容: http://www.stlchina.org/twiki/bin/view.pl/Main/SearchEngine 网络蜘蛛基本原理 网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从 网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地
·
2015-10-30 10:38
搜索引擎
基于
搜索引擎技术
的协同互联网
1.我们身边的互联网 2.基于
搜索引擎技术
的协同互联网 3.基于社交网络技术的协同互联网 本文主要我自己根据多年使用Google技术总结,同时和国内一些互联网公司做了一下简单的对比而得来。
·
2015-10-28 09:50
搜索引擎
PHP开发
搜索引擎技术
全解析
谈到网页搜索引擎时,很多人都会想到雅虎。的确,雅虎开创了一个互联网络的搜索时代。然而,雅虎目前用于搜索网页的技术却并非该公司原先自己开发的。2000年8月,雅虎采用了Google这家由斯坦福大学学生创建的公司的技术。理由非常简单,Google的搜索引擎比雅虎先前使用的技术能更快、更准确搜索到所需要的信息。 让我们自己来设计、开发一个强劲、高效的搜索引擎和数据库恐怕短时间内在技术、资金等方面
·
2015-10-23 09:10
搜索引擎
第四章 索引 Full Text Indexing
第四章 索引 Full Text Indexing 在学习
搜索引擎技术
之前最好有一定的知识储备, Modern Information Retrieval 是本经典IR的教材,本文默认读者已经具有相应的基础
·
2015-10-23 08:19
index
第四次作业—关于微软必应词典客户端的案例分析
前言:微软必应词典基于微软强大的技术实力和创新能力,近义词比较,词性百搭,拼音搜索,搭配建议等功能,结合了互联网“在线词典”及“桌面词典”的优势,依托必应
搜索引擎技术
,及时发现并收录网络新兴词汇。
S-shao
·
2015-10-22 21:00
中文
搜索引擎技术
之中文分词
随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,
搜索引擎技术
也成为技术人员关注的热点。
·
2015-10-21 11:34
搜索引擎
搜索引擎技术
核心揭密
编者按:这是一篇精彩的编程教学文章,不但详细地剖析了搜索引擎的原理,也提供了笔者自己对使用PHP编制搜索引擎的一些思路。整篇文章深入浅出,相信无论是高手还是菜鸟,都能从中得到不少的启发。 谈到网页搜索引擎时,大多数人都会想到雅虎。的确,雅虎开创了一个互联网络的搜索时代。然而,雅虎目前用于搜索网页的技术却并非该公司原先自己开发的。2000年8月,雅虎采用了Google(www.google
·
2015-10-21 11:45
搜索引擎
第三代
搜索引擎技术
与P2P
第三代
搜索引擎技术
与P2P 第二代搜索引擎虽然比第一代在搜索速度、针对多种语言信息的扩展等方面有所改进,在以自然语言为查询语言方面也做了一些探索。
·
2015-10-21 11:44
搜索引擎
第1章 搜索引擎及其技术架构
1,
搜索引擎技术
的发展史 第一代:文本检索的一代 采用经典的信息检索模型,比如布尔模型、向量空间模型或概率模型,来计算用户查询关键词和网页文本内容的相关程度。
·
2015-10-21 10:10
搜索引擎
阿里
搜索引擎技术
介绍
iSearch4性能优化之路.pptxiSearch5商品搜索特色功能.pptxiSearch5实现原理之实时搜索.pptxisearch5性能优化.pptxiSearch5调度系统.pptxiSearch演变历程.pptxOpenSearch.pptxSP-技术报告.pptx广告实时引擎.pptx搜索离线生产集群中的流计算.ppt淘宝搜索业务架构优化.pptx淘宝搜索离线系统介绍-技术报告.pp
yangshangchuan
·
2015-10-11 02:00
搜索引擎
阿里
iSearch
OpenSearch
阿里
搜索引擎技术
介绍
iSearch4性能优化之路.pptxiSearch5商品搜索特色功能.pptxiSearch5实现原理之实时搜索.pptxisearch5性能优化.pptxiSearch5调度系统.pptxiSearch演变历程.pptxOpenSearch.pptxSP-技术报告.pptx广告实时引擎.pptx搜索离线生产集群中的流计算.ppt淘宝搜索业务架构优化.pptx淘宝搜索离线系统介绍-技术报告.pp
杨尚川
·
2015-10-11 02:00
搜索引擎
阿里
iSearch
OpenSearch
[Search Engine]
搜索引擎技术
之查询处理
这就是
搜索引擎技术
中相对顶层的技术——查询处理。转载自:http://blog.csdn.net/hguisu/article/details/79784511.查询处理的流程用
Poll的笔记
·
2015-10-07 10:00
个人博客作业3 ----- 微软必应词典客户端简测
微软必应词典基于微软强大的技术实力和创新能力,有近义词比较,词性百搭,拼音搜索,搭配建议等功能,结合了互联网“在线词典”及“桌面词典”的优势,依托必应
搜索引擎技术
,及时发现并收录网络新兴词汇。
潘礼鹏
·
2015-10-06 21:00
[Search Engine]
搜索引擎技术
之倒排索引
倒排索引是搜索引擎中最为核心的一项技术之一,可以说是搜索引擎的基石。可以说正是有了倒排索引技术,搜索引擎才能有效率的进行数据库查找、删除等操作。1.倒排索引的思想倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(invertedindex)。在搜索引擎中,查
Poll的笔记
·
2015-09-08 14:00
[Search Engine]
搜索引擎技术
之网络爬虫
随着互联网的大力发展,互联网称为信息的主要载体,而如何在互联网中搜集信息是互联网领域面临的一大挑战。网络爬虫技术是什么?其实网络爬虫技术就是指的网络数据的抓取,因为在网络中抓取数据是具有关联性的抓取,它就像是一只蜘蛛一样在互联网中爬来爬去,所以我们很形象地将其称为是网络爬虫技术。其中网络爬虫也被称为是网络机器人或者是网络追逐者。网络爬虫技术是搜索引擎架构中最为根本的数据技术,通过网络爬虫技术,我们
Poll的笔记
·
2015-09-04 00:00
完整的搜索引擎营销必须包括网站优化
搜索引擎营销是指“直接”或“间接”利用
搜索引擎技术
来进行的营销。
我爱西红柿
·
2015-08-31 14:00
公平价,等待你的加入
同步在北京、上海、苏州设立办事处;成都建立研发中心;公平价技术团队独创的产品
搜索引擎技术
,每天可以爬行上万亿个产品页面,实时检索并跟踪每一个卖家的报价,建立了中国最大的电子商务产品报价数据库。
公平价123
·
2015-07-09 14:00
三种技术的融合
搜索引擎技术
,分析数据库技术,分布式计算引擎技术这三股力量正在快速地彼此融合。举例证如下HiveHive一开始只是用sql的方式描述map/reduce的逻辑,是一个典型的分布式计算引擎。
taowen
·
2015-07-07 07:00
数据库
大数据
爬虫书籍
——原理、技术与系统,北大天网为案例,很好很强大,有点学术味道 4,Web数据挖掘 Bing Liu,刘兵的书,强烈推荐 5,搜索引擎:信息检索实践,很好的书,强烈推荐 6.解密
搜索引擎技术
实战
m635674608
·
2015-06-17 00:00
爬虫
Seoer大师具有的八大优秀习惯
我们处于搜索引擎优化
搜索引擎技术
革新的期间,笔者发明很多SEOer都在说SEO是一门苦逼的事情,SEO越来越不好做了,但营销师为大企业SEO靠的是企业文化、团队办理末了才是技术的实行,好的文化与管理可以大概让
leowebmaster
·
2015-06-01 13:00
【Tips篇】爬虫
爬虫应该是随着
搜索引擎技术
出现的。爬虫技术主要是用来抓取万维网网页内容的主要技术,被爬到的网页会被收录进入搜索引擎。
menke007
·
2015-04-16 16:12
互联网
搜索引擎
机器人
【Tips篇】爬虫
爬虫应该是随着
搜索引擎技术
出现的。爬虫技术主要是用来抓取万维网网页内容的主要技术,被爬到的网页会被收录进入搜索引擎。
menke007
·
2015-04-16 16:12
搜索引擎
互联网
机器人
工具
【Tips篇】爬虫
爬虫应该是随着
搜索引擎技术
出现的。爬虫技术主要是用来抓取万维网网页内容的主要技术,被爬到的网页会被收录进入搜索引擎。
menke007
·
2015-04-16 16:12
搜索引擎
互联网
机器人
搜索引擎——全文检索Compass(一)
在java中,开源
搜索引擎技术
有很多,大名鼎鼎的Lucene;后来者居上的Compass等。本篇博客主要分享Compass。
kanglix1an
·
2015-01-19 23:00
网络爬虫技术浅析
在万维网飞速发展的网络背景下,搜索引擎在人们的生活工作中无疑扮演着重要的角色,而网络爬虫则是
搜索引擎技术
的最基础部分。
u010539352
·
2015-01-04 22:00
搜索引擎
互联网
网络爬虫
几种实用的推广方法.
1、搜索引擎加注 互联网的普及可以说与
搜索引擎技术
的发展是密不可分的,是众家搜索引擎把世界上亿万个网站进行分类、索引,使其变得有序从而便于查找。
weixindashi6
·
2014-12-16 17:21
搜索引擎
电子商务
网络营销
邮件营销
网络技术
几种实用的推广方法.
1、搜索引擎加注 互联网的普及可以说与
搜索引擎技术
的发展是密不可分的,是众家搜索引擎把世界上亿万个网站进行分类、索引,使其变得有序从而便于查找。
weixindashi6
·
2014-12-16 17:21
搜索引擎
电子商务
网络营销
邮件营销
网络技术
【转载】从百度、360、搜狗对新站态度看国内
搜索引擎技术
现状
原文链接:http://blog.lmlphp.com/archives/3 来自LMLPHP后院 我从事互联网行业这么多年,一直没能真正当过站长。10年的时候有自己的博客,但当时用的二级域名,最后没有买域名继续做下去,而现在终于有了自己的网站。在互联网被各大巨头统治下的今天,要提高自己网站的流量,少不了要跟搜索引擎打交道。关于百度百度是国内搜索引擎市场份额最大的一个
hosser
·
2014-10-19 22:00
国外程序员整理的机器学习资源大全
机器学习资源大全分类: IT业界观察 推荐引擎系统
搜索引擎技术
图像处理技术 文本分析技术 自然语言处理2014-08-2518:57 116人阅读 评论(0) 收藏 举报目录(?)[+]推荐!
shizenglin
·
2014-10-15 16:00
自然语言处理
神经网络
deep
learning
深度学习
搜索引擎技术
图像处理技术
IT业界观察
推荐引擎系统
文本分析技术
搜索学习内容
1、Lucene(1)书籍:LuceneinAction(基于3.0版本,有点旧)、解密
搜索引擎技术
(Lucene&Java精华版)(2)官方材料:http://lucene.apache.org/core
茶葉麵包
·
2014-09-09 16:00
读《
搜索引擎技术
基础》
为了更深入的了解与应用爬虫,花了一些时间读了清华大学和百度联合出版的《
搜索引擎技术
基础》。一直没有整理过这种专业性或技术类别的书,是因为涉及到的内容太多,不懂得也太多,根本整理不出来不如直接看书。
u012150179
·
2014-07-10 21:00
搜索引擎
系统架构
搜索引擎技术
内幕之索引
搜索引擎中索引的好坏直接影响着搜索引擎的性能,最终影响到用户的体验,可见索引的重要性。 今天我们就来谈谈索引技术。谈到索引大家第一想到的是倒排索引,的确倒排在全文检索中的优势,在搜索引擎中的大量使用令它声名鹊起。所以在此就以倒 排进行分析。但是除了倒排索引外还有很多的索引方式,如静态索引方式有:位图、签名文件、倒排等;动态索引有:B树、B+树等等。 搜索引擎之所以大量使用倒排作为它内部的索引结
wbj0110
·
2014-05-03 12:00
搜索引擎
索引
搜索引擎技术
内幕之索引
搜索引擎中索引的好坏直接影响着搜索引擎的性能,最终影响到用户的体验,可见索引的重要性。 今天我们就来谈谈索引技术。谈到索引大家第一想到的是倒排索引,的确倒排在全文检索中的优势,在搜索引擎中的大量使用令它声名鹊起。所以在此就以倒 排进行分析。但是除了倒排索引外还有很多的索引方式,如静态索引方式有:位图、签名文件、倒排等;动态索引有:B树、B+树等等。 搜索引擎之所以大量使用倒排作为它内部的索引结
wbj0110
·
2014-05-03 12:00
搜索引擎
索引
搜索引擎技术
内幕之索引
搜索引擎中索引的好坏直接影响着搜索引擎的性能,最终影响到用户的体验,可见索引的重要性。 今天我们就来谈谈索引技术。谈到索引大家第一想到的是倒排索引,的确倒排在全文检索中的优势,在搜索引擎中的大量使用令它声名鹊起。所以在此就以倒 排进行分析。但是除了倒排索引外还有很多的索引方式,如静态索引方式有:位图、签名文件、倒排等;动态索引有:B树、B+树等等。 搜索引擎之所以大量使用倒排作为它内部的索引结
wbj0110
·
2014-05-03 12:00
索引
搜索引擎
搜索引擎技术
之概要预览
前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅精彩的架构图,特此,便有记录下来的冲动,以作备忘。 本文从最基本的搜索引擎的概念谈起,到全文检索的概念,由网络蜘蛛,分词技术,系统架构,排序的讲解(结合google搜索引擎的技术原理),
wbj0110
·
2014-05-01 13:00
搜索引擎
搜索引擎技术
之概要预览
前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅精彩的架构图,特此,便有记录下来的冲动,以作备忘。 本文从最基本的搜索引擎的概念谈起,到全文检索的概念,由网络蜘蛛,分词技术,系统架构,排序的讲解(结合google搜索引擎的技术原理),
wbj0110
·
2014-05-01 13:00
搜索引擎
搜索引擎技术
之概要预览
前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅精彩的架构图,特此,便有记录下来的冲动,以作备忘。 本文从最基本的搜索引擎的概念谈起,到全文检索的概念,由网络蜘蛛,分词技术,系统架构,排序的讲解(结合google搜索引擎的技术原理),
wbj0110
·
2014-05-01 13:00
搜索引擎
一个tomcat服务添加多个solr索引应用
《解密
搜索引擎技术
实战》中推荐使用部署在同一个web服务器中的多个solr应用这种方式。书上只是抛砖引玉,在此做个详细记录 1、tomcat安装sorl成功后。
karo_lee
·
2014-04-24 13:00
tomcat solr 多应用
专利检索为什么那么慢?
专利往往涉及全文检索,最好的方式就是使用
搜索引擎技术
,这一技术在以前还不是被大范围使用的,所以很多系统使用数据库来做这件事。使用数据库之后,为了实现这些数据的全文检索,
skytree
·
2014-04-03 16:00
数据库
搜索引擎
全文检索
专利
搜索引擎学习资源收集
搜索引擎学习资源收集一、
搜索引擎技术
/动态资源、综合类1、卢亮的搜索引擎研究 http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://
Challenge_C_PlusPlus
·
2014-03-21 18:00
搜索引擎
学习
资料
[Python] 实现网络爬虫
1、什么是网络爬虫网络爬虫是现代
搜索引擎技术
的一种非常核心、基础的技术,网络就好比是一张蜘蛛网,网络爬虫就像是一只蜘蛛,在网络间‘爬来爬去’,搜索有用的信息。
u010454729
·
2014-03-18 10:00
搜索引擎技术
搜索引擎技术
之概要预览前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引
fengshizty
·
2014-01-17 16:00
解密
搜索引擎技术
实战:Lucene &Java精华版(第2版)
解密
搜索引擎技术
实战:Lucene&Java精华版(第2版)《解密
搜索引擎技术
实战:lucene&java精华版》总结搜索引擎相关理论与实际解决方案,并给出了java实现,其中利用了流行的开源项目lucene
李航421
·
2013-11-28 09:00
搜索引擎
解密
Lucene
精华
&Java
技术实战
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他