前面发现的问题
之前的使用的版本信息为
solrj 7.3.0
spring-data-solr 3.0.6 RELEASE
在进行输入插入时
@Test
public void save(){
Music music = new Music();
music.setResId(12345555L);
music.setSongId(1234555L);
musicRepository.save(music);
}
会抛出异常
java.lang.NoSuchMethodError: org.apache.solr.common.SolrInputField.setValue(Ljava/lang/Object;F)V
原因是spring-data-solr是基于底层封装solrj来进行的架构,但是当前版本的spring-data-solr并不支持solrj 7.0.0以上的版本,会导致找不到方法,因此需要将solrj进行降版本处理,降至6.6.3后问题得到解决,能成功进行数据插入。
org.apache.solr
solr-solrj
6.6.3
中文分词
在spring-data-solr中并未找到分词的功能,因此需要使用solrj来实现分词功能。
在MusicRepositoryImpl中加入以下方法:
/**
/**
* @Author Alistair.Chow
* @Description 中文分词
* @Date 11:11 2018/6/29
* @Param [sentence]
* @return java.lang.String
**/
public String getAnalysis(String sentence) throws IOException, SolrServerException {
FieldAnalysisRequest request = new FieldAnalysisRequest("/analysis/field");
// 字段名,随便指定一个支持中文分词的字段
request.addFieldName(Music.FIELD_KEYWORDS);
// 字段值,可以为空字符串,但是需要显式指定此参数
request.setFieldValue("");
request.setQuery(sentence);
FieldAnalysisResponse response = null;
response = request.process(solrTemplate.getSolrClient(), Music.CORE_NAME);
String results = "";
Iterator it = response.getFieldNameAnalysis(Music.FIELD_KEYWORDS)
.getQueryPhases().iterator();
while(it.hasNext()) {
AnalysisResponseBase.AnalysisPhase pharse = (AnalysisResponseBase.AnalysisPhase)it.next();
List list = pharse.getTokens();
for (AnalysisResponseBase.TokenInfo info : list) {
results += " " + (info.getText());
}
}
注意:其指定的字段必须要支持中文分词,在solr中的配置不能为string或其他类型。
如以上keywords在music中的定义为:
public static final String FIELD_KEYWORDS = "keywords";
@Indexed(name = FIELD_KEYWORDS, type="text_ik")
private String keywords;
在solr中的配置为:
添加测试代码:
@Test
public void analysis() throws IOException, SolrServerException {
System.out.println(musicRepository.getAnalysis("我要听刘德华的歌"));
}
执行结果为:
要听 刘德华 歌
由于使用了ik中文分词,所以分词后去除了一些定冠词。
分词搜索
分完词,搜索就简单了。因为之前的代码,就使用了按空格拆分词语(空格可以适用于英文),因此只需要简单封装一下,调用前面的方法就行了。
增加一个关键字搜索和分词搜索的接口
在CustomRepository接口中加入:
public ScoredPage searchByKeyword(String searchTerm, long pageIndex, int pageSize);
public ScoredPage searchBySentence(String sentence, long pageIndex, int pageSize)
throws IOException, SolrServerException;
在MusicRepositoryImpl中实现:
/**
* @Author Alistair.Chow
* @Description 关键字搜索
* @Date 10:07 2018/6/28
* @Param [searchTerm, pageIndex, pageSize]
* @return org.springframework.data.solr.core.query.result.ScoredPage
**/
@Override
public ScoredPage searchByKeyword(String searchTerm, long pageIndex, int pageSize) {
String[] words = searchTerm.toUpperCase().split(" ");
String[] contidionFields = new String[]{Music.FIELD_KEYWORDS};
Criteria conditions = createSearchConditions(contidionFields, words);
SimpleQuery search = new SimpleQuery(conditions);
search.setOffset(pageIndex);
search.setRows(pageSize);
ScoredPage page = solrTemplate.queryForPage(Music.CORE_NAME, search, Music.class);
return page;
}
/**
* @Author Alistair.Chow
* @Description 语句搜索
* @Date 10:13 2018/6/28
* @Param [sentence, pageIndex, pageSize]
* @return org.springframework.data.solr.core.query.result.ScoredPage
**/
@Override
public ScoredPage searchBySentence(String sentence, long pageIndex, int pageSize) throws IOException, SolrServerException {
String words = getAnalysis(sentence.toUpperCase());
return searchByKeyword(words, pageIndex, pageSize);
}
测试一下:
@Test
public void searchByKeywords(){
ScoredPage musicList = musicRepository.searchByKeyword("赵传", 0, 10);
for (Music music : musicList.getContent()) {
System.out.println(music);
}
}
@Test
public void searchBySentence() throws IOException, SolrServerException {
ScoredPage musicList = musicRepository.searchBySentence("我要听刘德华的歌", 0, 10);
for (Music music : musicList.getContent()) {
System.out.println(music);
}
}