网络编程
位置:首页>> 网络编程>> Python编程>> Django对接elasticsearch实现全文检索的示例代码

Django对接elasticsearch实现全文检索的示例代码

作者:劲风君  发布时间:2023-07-02 01:31:29 

标签:Django,elasticsearch,全文检索
目录
  • 前言

  • 第一步:首先安装相关的依赖包

  • 第二步:在django项目配置文件settings.py中注册应用

  • 第三步:在django项目配置文件settings.py中指定搜索的后端

  • 第四步:创建索引类

  • 第五步:在templates目录中创建text字段使用的模板文件

  • 第六步:手动更新索引

  • 第七步:创建haystack序列化器

  • 第八步:创建视图类

  • 第九步:添加路由

  • 第十步:结果

前言

说到搜索,第一时间想到的是mysql数据库的like语句

但是,假如你的数据库有几千万条数据,name字段没有索引,可能查询需要十几分钟,用户可能会等你?那为什么不给name字段增加索引?数据表不仅仅是用来查询,也会经常修改数据,新增删除数据等。建立索引后,做增删改操作时也会大大占用数据库资源。所以应该怎么解决呢?

Elasticsearch!

一个强大的基于Lucene的全文搜索服务器! * 、Stack Overflow、Github都在用。

如果想详细了解其原理的话,可以参考:https://www.elastic.co/guide/index.html

第一步:首先安装相关的依赖包


pip install drf-haystack
pip install elasticsearch
pip install djangorestframework

第二步:在django项目配置文件settings.py中注册应用


INSTALLED_APPS =
[
'app.apps.AppConfig',
'haystack',
'rest_framework'
]

第三步:在django项目配置文件settings.py中指定搜索的后端


HAYSTACK_CONNECTIONS = {
'default':    {
           'ENGINE':'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine',
           'URL': 'http://127.0.0.1:9200/', # 此处为elasticsearch运行的服务器ip地址,端口号固定为9200
           'INDEX_NAME': 'test', # 指定elasticsearch建立的索引库的名称
           },
           }
# 当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
# 指定搜索结果每页的条数
# HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

第四步:创建索引类

在此之前要先创建model类,并插入数据


from django.db import models
class Es(models.Model):
   name=models.CharField(max_length=32)
   desc=models.CharField(max_length=32)

在需要进行索引的应用的目录下创建文件search_indexes.py, 在该文件内创建该索引类
我在app应用下创建:search_indexes.py


# 索引模型类的名称必须是 模型类名称 + Index
from haystack import indexes
from .models import Es
class EsIndex(indexes.SearchIndex, indexes.Indexable):
   text = indexes.CharField(document=True, use_template=True)
   def get_model(self):
   """返回建立索引的模型类"""
       return Es
   def index_queryset(self, using=None):
   """返回要建立索引的数据查询集"""
       return self.get_model().objects.all()

第五步:在templates目录中创建text字段使用的模板文件

创建文件templates/search/indexes/app/es_text.txt文件中定义


{{ object.name }}
{{ object.desc }}

第六步:手动更新索引


python manage.py rebuild_index   #数据库有多少条数据,全部会被同步到es中

第七步:创建haystack序列化器


from drf_haystack.serializers
import HaystackSerializer
from rest_framework.serializers
import ModelSerializer from app
import models
from app.search_indexes import EsIndex
class EsSerializer(ModelSerializer):
   class Meta:
       model=models.Es
       fields='__all__'
class EsIndexSerializer(HaystackSerializer):
    object = EsSerializer(read_only=True) # 只读,不可以进行反序列化
    class Meta:
       index_classes = [EsIndex]# 索引类的名称
       fields = ('text', 'object')# text 由索引类进行返回, object 由序列化类进行返回,第一个参数必须是text

第八步:创建视图类


from drf_haystack.viewsets
import HaystackViewSet
from app.models import Book
from app.serializers import EsIndexSerializer
class EsSearchView(HaystackViewSet):
   index_models = [Es]
   serializer_class = EsIndexSerializer

第九步:添加路由


from django.conf.urls
import url from django.contrib
import admin
from rest_framework import routers
from app.views import EsSearchView
   router = routers.DefaultRouter()
   router.register("book/search", EsSearchView, base_name="book-search")
   urlpatterns = [ url(r'^admin/', admin.site.urls), ]
   urlpatterns += router.urls

第十步:结果

http://127.0.0.1:8000/?text=测试

来源:https://juejin.cn/post/6991354297728368648

0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com