- Solr之——Solr4.4主从模式配置
冰 河
Tomcat搜索Solr分词Lucene爬虫J2EE搜索优化
转载请注明出处:http://blog.csdn.net/l1028386804/article/details/50251927废话不多说,直接进入主题,我们一起来搭建solr主从配置框架。一、主从模式介绍Solr(这里指Solr4.4)的主从模式实现是这样一个思路。首先至少有两个solr服务器,一个称为master(主服务),其余的一个或多个solr服务器被称为slave(附属服务)。每个sl
- SolrCloud之Sharding路由介绍
qindongliang1922
solrluceneelasticsearch
阅读更多在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是:(1)大数据量下更高的性能(2)更好扩展性(3)更高的可靠性(4)更简单易用什么时候应该使用SolrCloud(Shard)呢?(1)更大的数据量(2)更大的索引体积(3)想并行索引和查询(4)想自定义数据分区SolrCloud路由的分类A:显式路由(Composite)=>创建时明确指定shard
- SolrCloud之Sharding路由介绍
qindongliang1922
solrluceneelasticsearch
阅读更多在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是:(1)大数据量下更高的性能(2)更好扩展性(3)更高的可靠性(4)更简单易用什么时候应该使用SolrCloud(Shard)呢?(1)更大的数据量(2)更大的索引体积(3)想并行索引和查询(4)想自定义数据分区SolrCloud路由的分类A:显式路由(Composite)=>创建时明确指定shard
- SolrCloud之Sharding路由介绍
qindongliang1922
solrluceneelasticsearch
阅读更多在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是:(1)大数据量下更高的性能(2)更好扩展性(3)更高的可靠性(4)更简单易用什么时候应该使用SolrCloud(Shard)呢?(1)更大的数据量(2)更大的索引体积(3)想并行索引和查询(4)想自定义数据分区SolrCloud路由的分类A:显式路由(Composite)=>创建时明确指定shard
- Solr4.4的安装与配置
Solr
最近准备用Solr搭建项目,所以对其作了一些了解,我采用的是Solr4.4版本;这个版本的Solr相对于以前的版本改变很大,这里记一下自己安装与配置的过程。
网上很多关于Solr的教程都很老了,很多教程居然还是基于Solr1.3或者1.4版本在讲解,有些资料的内容看了再对比当前版本会不知所云。
尽量多看官方提供的wiki文档:http://wiki.apache.org/solr/
Solr
- [置顶] SOLR 4.4 部署
Solr
SOLR 4.4 部署
前言:近期研究下solr4.4的部署,一下是部署步骤,与大家分享下。
下载solr4.4.0.zip
地址 http://mirror.esocc.com/apache/lucene/solr/4.4.0/solr-4.4.0.zip
apache-solr
- Solr的中英文分词实现
wb284551926
Solr
对于Solr应该不需要过多介绍了,强大的功能也是都体验过了,但是solr一个较大的问题就是分词问题,特别是中英文的混合分词,处理起来非常棘手。 虽然solr自带了支持中文分词的cjk,但是其效果实在不好,所以solr要解决的一个问题就是中文分词问题,这里推荐的方案是利用ik进行分词。
ik是较早作中文分词的工具,其效果也是得到多数用户认同。但是现在作者似乎更新缓慢,对于最新的solr4.4支持不
- solrcloud 配置与搭建过程
quentinXXZ
javaSolrOpenSource
本文的配置示例采用单台zookeeper与两台solr实例(即两个tomcat启动),collection分为两个shard(分片),每个shard两个replia(复本),本例使用版本为solr4.4,zookeeper3.4.6。实际生产不会采用单台zookeeper,读者可自行扩展。 本文链接地址:http://quentinXXZ.iteye.com/blog/2118447 1、
- 利用solr的 DataImportHandler从mysql数据库建立索引
quentinXXZ
javaSolrsearchOpenSource
文章地址:http://quentinxxz.iteye.com/blog/2100619 本文所有实验在solr4.4上进行 quickStart参考 http://wiki.apache.org/solr/DIHQuickStart步骤1:首先修改solrconfig.xml加往上DataImportHandler的配置
data-config.xml
步骤2:配置solr服务器
- 利用solr的 DataImportHandler从mysql数据库建立索引
quentinXXZ
solrsearchopensourcejava
阅读更多文章地址:http://quentinxxz.iteye.com/blog/2100619本文所有实验在solr4.4上进行quickStart参考http://wiki.apache.org/solr/DIHQuickStart步骤1:首先修改solrconfig.xml加往上DataImportHandler的配置data-config.xml步骤2:配置solr服务器时一般报这个错o
- 利用solr的 DataImportHandler从mysql数据库建立索引
quentinXXZ
solrsearchopensourcejava
阅读更多文章地址:http://quentinxxz.iteye.com/blog/2100619本文所有实验在solr4.4上进行quickStart参考http://wiki.apache.org/solr/DIHQuickStart步骤1:首先修改solrconfig.xml加往上DataImportHandler的配置data-config.xml步骤2:配置solr服务器时一般报这个错o
- solr4.4 + mmseg4j-1.9.1中文分词
tiankong6622
Lucenesolr 4.4
1、solr配置请参考solr4.4.0配置笔记.txt
2、mmseg4j-1.9.1下载地址 http://mmseg4j.googlecode.com/files/mmseg4j-1.9.1.zip
mmseg4j 1.8.3 只支持 lucene 2.9/3.0 接口 和 solr1.4。其它没改动
mmseg4j 1.8.5
- solr4.4在tomcat6底下署
huyumin
tomcat6
Solr最新版本是4.4,这两天一直在折腾其在tomcat6下的部署,参考了官方文档:
http://wiki.apache.org/solr/SolrTomcat
由于E文不继,根据官方文档部署的demo运行起来无法访问,报404,tomcat报错如下:
error filterstart
context [/solr] startup failed due to previous
- solr4.4 索引mysql数据库数据(DataImport DIH QuickStart)
huang798807481
solr.home是/home/leroy/solrhome/solr官方文档:http://wiki.apache.org/solr/DataImportHandler#Overview http://wiki.apache.org/solr/DIHQuickStart(easydemo)第一部分是对《db-data-config.xml》query是获取全部数据的SQLdel
- Ubuntu Tomcat7 Solr4.4 运行
huang798807481
下载好资源:1.http://lucene.apache.org/solr/下载了solr-4.4.02.下载tomcat7tar.gz由于Solr基于java开发,因此Solr在windows及Linux都能较好部署使用,但由于Solr提供了一些用于测试及管理、维护较为方便的shell脚本,因此在生产部署时候建议安装在Linux上,测试时候可以在windows使用。这里tomcat不做详解:配置
- Solr4.4的安装与配置
jingdian_leo
Solr
http://blog.csdn.net/zhyh1986/article/details/9856115 Solr简介 这里贴一段关于solr的简介:Solr是一个基于Lucene的Java搜索引擎服务器。Solr提供了层面搜索、命中醒目显示并且支持多种输出格式(包括XML/XSLT和JSON格式)。它易于安装和配置,而且附带了一个基于HTTP的管理界面。Solr已经在众多大型的网站中使用,
- Solr的中英文分词实现
tidezyc
SolrLucene
对于Solr应该不需要过多介绍了,强大的功能也是都体验过了,但是solr一个较大的问题就是分词问题,特别是中英文的混合分词,处理起来非常棘手。虽然solr自带了支持中文分词的cjk,但是其效果实在不好,所以solr要解决的一个问题就是中文分词问题,这里推荐的方案是利用ik进行分词。ik是较早作中文分词的工具,其效果也是得到多数用户认同。但是现在作者似乎更新缓慢,对于最新的solr4.4支持不好,最
- solr4.4 优化笔记
高军威
Solrsolr优化
其中一步:
indexed fields
The number of indexed fields greatly increases the following:
1.Memory usage during indexing
2.Segment merge time
3.Optimization times
4.Index size
These effects can
- solr4.4 索引mysql数据库数据
u011310328
1、修改solrconfig.xml
data-config.xml
2、添加data-config.xml或者复制E:\solr-4.4.0\example\example-DIH\solr\db\conf\db-data-config.xml到solr.home目录下,并修改为data-config.xml修改里面代码
3、复制E:\solr-4.4.0\dist\sol
- solrcloud集群启动管理过程基于源码的分析
yangbutao
集群Solr
基于Solr4.4先看一下ZK的目录结构 /collections----solrcore的节点,集群的leader节点的选举在该节点下 --collection1 --leader_elect ---shard1 --electi
- solr4.4+hadoop2.1.0beta整合
hzyu
hadoopSolr
solr4.4支持索引存储到hdfs中下载hadoop2.1.0-beta下载解压solr4.4,hadoop2.1.0-beta我的solr是运行在tomcatweb容器中solr4.4用的是hadoop2.0.5alpha版本,如果不改成hadoop2.1.0-beta会报很多奇怪的错误。删除solrwebapp/WEB-INF/lib中的jar包,用我已经整合好的lib替换整合好的tomca
- Ubuntu下安装Solr4.4
greatwqs
tomcat安装ubuntuSolrsolr4.4
操作环境:Win8/Ubuntu64(最下面),Tomcat7,Solr4.4,Jdk7EnMore: http://wiki.apache.org/solr/SolrTomcat 1)在apache官网下载solr4.4的包,解压到本地目录,如E:\apache\solr-4.4.02)找一个目录作为solr的home目录,如D:/WebContainer/apache-solr-home3)解
- Ubuntu下安装Solr4.4
greatwqs
ubuntuTomcatSolrSolr4.4安装
阅读更多操作环境:Win8/Ubuntu64(最下面),Tomcat7,Solr4.4,Jdk7EnMore:http://wiki.apache.org/solr/SolrTomcat1)在apache官网下载solr4.4的包,解压到本地目录,如E:\apache\solr-4.4.02)找一个目录作为solr的home目录,如D:/WebContainer/apache-solr-home3
- solr分布式搜索源码分析
yangbutao
分布式Solr源码分析
基于solr4.4 分布式搜索的主控逻辑是在SearchHandler.handleRequestBody方法中实现的,参见distributedrequest分支分布式搜索过程是分阶段stage的,stage的控制在每个componnet的distributedProcess方法中,每个stage的请求输出都会封装在outgoing.add(sreq)中。component针对每个st
- solr学习 one
高军威
Solr
1.下载 solr.jar包
http://apache.fayea.com/apache-mirror/lucene/solr/4.4.0/
2.把\solr\dist\solr-4.4.0.war放到E:\tomcat\webapps目录下改名为solr.war。
3.解压solr4.4.zip solr4.4\example\re
- win7下resin4上安装solrcloud4.4
july_2
1概述: windows和linux安装方式相同。2.准备: 1)下载solr4.4resinik 2)更改ik与solr兼容部分打包ik.jar 3)解压solr4.4到D盘将D:\solr-4.4.0\example\solr目录复制到D:\resin盘,改名solr_home,并将D:\solr-4.4.0\example\solr-webapp\solr.war复制到 D:\r
- solr4.4在tomcat6下部署
Buddha2008
javaapachetomcatwindowsSolr
Solr最新版本是4.4,这两天一直在折腾其在tomcat6下的部署,参考了官方文档:
http://wiki.apache.org/solr/SolrTomcat
由于E文不继,根据官方文档部署的demo运行起来无法访问,报404,tomcat报错如下:
error filterstart
context [/solr] startup failed due to previou
- win7下tomcat7上安装solrcloud4.4
july_2
1概述: windows和linux安装方式相同。2.准备: 1)下载solr4.4tomcat7ik 2)更改ik与solr兼容部分打包ik.jar 3)解压solr4.4到D盘将D:\solr-4.4.0\example\solr目录复制到D盘,并将D:\solr-4.4.0\example\solr-webapp\solr.war复制到 D:\solr-4.4.0\example
- Solr4.4的安装与配置
zhangyihui1986
javaSolr
最近准备用Solr搭建项目,所以对其作了一些了解,我采用的是Solr4.4版本;这个版本的Solr相对于以前的版本改变很大,这里记一下自己安装与配置的过程。网上很多关于Solr的教程都很老了,很多教程居然还是基于Solr1.3或者1.4版本在讲解,有些资料的内容看了再对比当前版本会不知所云。尽量多看官方提供的wiki文档:http://wiki.apache.org/solr/Solr简介这里贴一
- solr4.4升级
rock_soft
在使用solr4.3的过程中,发现致命bug,在使用create core创建成功core后,config 、schema配置属性没有保存到solr。xml 中,导致重启后,core无法引用正确的solrconfig.xml 和 schema.xml.
solr升级到4.4版本后,此问题修改,solr4.4在每个collection/core的目录下添加了一个 core.pr
- mongodb3.03开启认证
21jhf
mongodb
下载了最新mongodb3.03版本,当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题,现总结如下:
(百度上搜到的基本都是老版本的,看到db.addUser的就是,请忽略)
Windows下我做了一个bat文件,用来启动mongodb,命令行如下:
mongod --dbpath db\data --port 27017 --directoryperdb --logp
- 【Spark103】Task not serializable
bit1129
Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一,这里记录下出现这个问题的两个实例,一个是自己遇到的,另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在,至少目前阶段碰到此类问题,没有什么章法
1.
package spark.exampl
- 你所熟知的 LRU(最近最少使用)
dalan_123
java
关于LRU这个名词在很多地方或听说,或使用,接下来看下lru缓存回收的实现
1、大体的想法
a、查询出最近最晚使用的项
b、给最近的使用的项做标记
通过使用链表就可以完成这两个操作,关于最近最少使用的项只需要返回链表的尾部;标记最近使用的项,只需要将该项移除并放置到头部,那么难点就出现 你如何能够快速在链表定位对应的该项?
这时候多
- Javascript 跨域
周凡杨
JavaScriptjsonp跨域cross-domain
 
- linux下安装apache服务器
g21121
apache
安装apache
下载windows版本apache,下载地址:http://httpd.apache.org/download.cgi
1.windows下安装apache
Windows下安装apache比较简单,注意选择路径和端口即可,这里就不再赘述了。 2.linux下安装apache:
下载之后上传到linux的相关目录,这里指定为/home/apach
- FineReport的JS编辑框和URL地址栏语法简介
老A不折腾
finereportweb报表报表软件语法总结
JS编辑框:
1.FineReport的js。
作为一款BS产品,browser端的JavaScript是必不可少的。
FineReport中的js是已经调用了finereport.js的。
大家知道,预览报表时,报表servlet会将cpt模板转为html,在这个html的head头部中会引入FineReport的js,这个finereport.js中包含了许多内置的fun
- 根据STATUS信息对MySQL进行优化
墙头上一根草
status
mysql 查看当前正在执行的操作,即正在执行的sql语句的方法为:
show processlist 命令
mysql> show global status;可以列出MySQL服务器运行各种状态值,我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
- 我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名
aijuans
Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名?
原始的
<bean id="business" class="onlyfun.caterpillar.device.Business">
<property name="writer">
<ref b
- 高性能mysql 之 性能剖析
annan211
性能mysqlmysql 性能剖析剖析
1 定义性能优化
mysql服务器性能,此处定义为 响应时间。
在解释性能优化之前,先来消除一个误解,很多人认为,性能优化就是降低cpu的利用率或者减少对资源的使用。
这是一个陷阱。
资源时用来消耗并用来工作的,所以有时候消耗更多的资源能够加快查询速度,保持cpu忙绿,这是必要的。很多时候发现
编译进了新版本的InnoDB之后,cpu利用率上升的很厉害,这并不
- 主外键和索引唯一性约束
百合不是茶
索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表 用户表和文章表
第二步;发表文章
1,建表;
---用户表 BlogUsers
--userID唯一的
--userName
--pwd
--sex
create
- 线程的调度
bijian1013
java多线程thread线程的调度java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。
2. 多数线程的调度是抢占式的(即我想中断程序运行就中断,不需要和将被中断的程序协商)
a) 
- 查看日志常用命令
bijian1013
linux命令unix
一.日志查找方法,可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log
二.查看日志常用命令1.grep '关键字' error.log:在error.log中搜索'关键字'2.grep -C10 '关键字' error.log:显示关键字前后10行记录3.grep '关键字' error.l
- 【持久化框架MyBatis3一】MyBatis版HelloWorld
bit1129
helloworld
MyBatis这个系列的文章,主要参考《Java Persistence with MyBatis 3》。
样例数据
本文以MySQL数据库为例,建立一个STUDENTS表,插入两条数据,然后进行单表的增删改查
CREATE TABLE STUDENTS
(
stud_id int(11) NOT NULL AUTO_INCREMENT,
- 【Hadoop十五】Hadoop Counter
bit1129
hadoop
1. 只有Map任务的Map Reduce Job
File System Counters
FILE: Number of bytes read=3629530
FILE: Number of bytes written=98312
FILE: Number of read operations=0
FILE: Number of lar
- 解决Tomcat数据连接池无法释放
ronin47
tomcat 连接池 优化
近段时间,公司的检测中心报表系统(SMC)的开发人员时不时找到我,说用户老是出现无法登录的情况。前些日子因为手头上 有Jboss集群的测试工作,发现用户不能登录时,都是在Tomcat中将这个项目Reload一下就好了,不过只是治标而已,因为大概几个小时之后又会 再次出现无法登录的情况。
今天上午,开发人员小毛又找到我,要我协助将这个问题根治一下,拖太久用户难保不投诉。
简单分析了一
- java-75-二叉树两结点的最低共同父结点
bylijinnan
java
import java.util.LinkedList;
import java.util.List;
import ljn.help.*;
public class BTreeLowestParentOfTwoNodes {
public static void main(String[] args) {
/*
* node data is stored in
- 行业垂直搜索引擎网页抓取项目
carlwu
LuceneNutchHeritrixSolr
公司有一个搜索引擎项目,希望各路高人有空来帮忙指导,谢谢!
这是详细需求:
(1) 通过提供的网站地址(大概100-200个网站),网页抓取程序能不断抓取网页和其它类型的文件(如Excel、PDF、Word、ppt及zip类型),并且程序能够根据事先提供的规则,过滤掉不相干的下载内容。
(2) 程序能够搜索这些抓取的内容,并能对这些抓取文件按照油田名进行分类,然后放到服务器不同的目录中。
- [通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费
comsci
资源
降低通讯服务资费,就意味着有更多的用户进入,就意味着通讯服务提供商要接待和服务更多的用户,在总体运维成本没有由于技术升级而大幅下降的情况下,这种降低资费的行为将导致每个用户的平均带宽不断下降,而享受到的服务质量也在下降,这对用户和服务商都是不利的。。。。。。。。
&nbs
- Java时区转换及时间格式
Cwind
java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用,以及不同时区时间相互转化的方法和原理。
问题描述:
向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如,服务器位于东八区(北京时间,GMT+8:00),而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
- readonly,只读,不可用
dashuaifu
jsjspdisablereadOnlyreadOnly
readOnly 和 readonly 不同,在做js开发时一定要注意函数大小写和jsp黄线的警告!!!我就经历过这么一件事:
使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能,有的就不行,而且函数readOnly有黄线警告!!!就这样被折磨了不短时间!!!(期间使用过disable函数,但是发现disable函数之后后台接收不到前台的的数据!!!)
- LABjs、RequireJS、SeaJS 介绍
dcj3sjt126com
jsWeb
LABjs 的核心是 LAB(Loading and Blocking):Loading 指异步并行加载,Blocking 是指同步等待执行。LABjs 通过优雅的语法(script 和 wait)实现了这两大特性,核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器,倡导的是一种模块化开发理念,核心价值是让 JavaScript 的模块化开发变得更
- [应用结构]入口脚本
dcj3sjt126com
PHPyii2
入口脚本
入口脚本是应用启动流程中的第一环,一个应用(不管是网页应用还是控制台应用)只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。
Web 应用的入口脚本必须放在终端用户能够访问的目录下,通常命名为 index.php,也可以使用 Web 服务器能定位到的其他名称。
控制台应用的入口脚本一般在应用根目录下命名为 yii(后缀为.php),该文
- haoop shell命令
eksliang
hadoophadoop shell
cat
chgrp
chmod
chown
copyFromLocal
copyToLocal
cp
du
dus
expunge
get
getmerge
ls
lsr
mkdir
movefromLocal
mv
put
rm
rmr
setrep
stat
tail
test
text
- MultiStateView不同的状态下显示不同的界面
gundumw100
android
只要将指定的view放在该控件里面,可以该view在不同的状态下显示不同的界面,这对ListView很有用,比如加载界面,空白界面,错误界面。而且这些见面由你指定布局,非常灵活。
PS:ListView虽然可以设置一个EmptyView,但使用起来不方便,不灵活,有点累赘。
<com.kennyc.view.MultiStateView xmlns:android=&qu
- jQuery实现页面内锚点平滑跳转
ini
JavaScripthtmljqueryhtml5css
平时我们做导航滚动到内容都是通过锚点来做,刷的一下就直接跳到内容了,没有一丝的滚动效果,而且 url 链接最后会有“小尾巴”,就像#keleyi,今天我就介绍一款 jquery 做的滚动的特效,既可以设置滚动速度,又可以在 url 链接上没有“小尾巴”。
效果体验:http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码:
&
- kafka offset迁移
kane_xie
kafka
在早前的kafka版本中(0.8.0),offset是被存储在zookeeper中的。
到当前版本(0.8.2)为止,kafka同时支持offset存储在zookeeper和offset manager(broker)中。
从官方的说明来看,未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话,可以考虑在合适
- android > 搭建 cordova 环境
mft8899
android
1 , 安装 node.js
http://nodejs.org
node -v 查看版本
2, 安装 npm
可以先从 https://github.com/isaacs/npm/tags 下载 源码 解压到
- java封装的比较器,比较是否全相同,获取不同字段名字
qifeifei
非常实用的java比较器,贴上代码:
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import net.sf.json.JSONArray;
import net.sf.json.JSONObject;
import net.sf.json.JsonConfig;
i
- 记录一些函数用法
.Aky.
位运算PHP数据库函数IP
高手们照旧忽略。
想弄个全天朝IP段数据库,找了个今天最新更新的国内所有运营商IP段,copy到文件,用文件函数,字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件,直接用phpmyadmin导入.csv文件的形式导入。(生命在于折腾,也许你们觉得我傻X,直接下载人家弄好的导入不就可以,做自己的菜鸟,让别人去说吧)
当然用到了ip2long()函数把字符串转为整型数
- sublime text 3 rust
wudixiaotie
Sublime Text
1.sublime text 3 => install package => Rust
2.cd ~/.config/sublime-text-3/Packages
3.mkdir rust
4.git clone https://github.com/sp0/rust-style
5.cd rust-style
6.cargo build --release
7.ctrl