Django中Elasticsearch(全文搜索引擎)的使用
一、Elasticsearch
1、使用Docker安装Elasticsearch
docker image pull delron/elasticsearch-ik:2.4.6-1.0
2、修改配置文件
修改elasticsearch的配置文件 elasticsearc-2.4.6/config/elasticsearch.yml第54行,更改ip地址为本机ip地址;
network.host: 10.211.55.5
3、创建Docker容器运行
docker run -dti --network=host --name=elasticsearch -v /home/python/elasticsearch-2.4.6/config:/usr/share/elasticsearch/config delron/elasticsearch-ik:2.4.6-1.0
备注:Elasticsearch搜索引擎的作用是维护索引数据。
二、使用haystack(全文检索框架)对接Elasticsearch
1、安装haystack:
# 安装全文检索框架
pip install drf-haystack
# elasticsearch==2.4.1为python中操控es的包
pip install elasticsearch==2.4.1
2、注册应用:
INSTALLED_APPS = [
...
'haystack',
...
]
3、配置搜索引擎:
# Haystack
HAYSTACK_CONNECTIONS = {
'default': {
'ENGINE': 'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine',
'URL': 'http://10.211.55.5:9200/', # 此处为elasticsearch运行的服务器ip地址,端口号固定为9200
'INDEX_NAME': 'meiduo', # 指定elasticsearch建立的索引库的名称
},
}
# 当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
4、创建索引类:
在应用目录下新建文件search_indexes.py,此文件名为固定,不可更改
from haystack import indexes
# 引入模型类
from .models import 模型类名
class 模型类名Index(indexes.SearchIndex, indexes.Indexable):
"""
SKU索引数据模型类
"""
# 建立索引字段(可以是单一的也可以是复合的)
# document=True说明这个字段是一个索引字段,use_template=True说明会在一个文件中标明索引字段
text = indexes.CharField(document=True, use_template=True)
def get_model(self):
"""返回建立索引的模型类"""
return 模型类名 # 说明了索引类对应的模型类
def index_queryset(self, using=None):
"""返回要建立索引的数据查询集"""
return self.get_model().objects.filter(is_launched=True)
5、在templates目录中新建text字段使用的模板文件:
目录为templates/search/indexes/goods/sku_text.txt
格式为
{{ object.字段名字}}
6、手动生成索引:
python manage.py rebuild_index
7、创建类视图:
# HaystackViewSet封装了用于搜索的函数
from drf_haystack.viewsets import HaystackViewSet
class 模型类SearchViewSet(HaystackViewSet):
"""
指定模型类搜索
"""
index_models = [模型类]
serializer_class = SKUIndexSerializer
8、序列化器类:
from drf_haystack.serializers import HaystackSerializer
class 模型类Serializer(serializers.ModelSerializer):
"""
指定模型类序列化器
"""
class Meta:
model = 模型类
fields = (。。。)
class 模型类IndexSerializer(HaystackSerializer):
"""
指定模型类结果数据序列化器
"""
object = 模型类Serializer(read_only=True)
class Meta:
# text对应索引类的text字段,object为检索成功后返回结果的序列化
index_classes = [模型类Index]
fields = ('text', 'object')
备注:haystack支持多种搜索引擎,例如es,solor等,它的作用主要有两点:1)让搜索引擎建立索引数据;2)利用搜索引擎查询索引数据并搜索出数据表的对应消息。
在Django中其搜索流程为,前端将关键词传递到haystack框架,haystack把检索关键交给es,es根据检索关键词检索索引记录,将检索到的索引记录提交给haystack,haystack到数据库查询指定数据。