Django_haystack全文搜索

本文主要是介绍Django_haystack全文搜索，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

haystack是全文搜索的框架，支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎，点击查看官方网站。

whoosh是用纯Python编写的全文搜索引擎，虽然性能比不上sphinx、xapian、Elasticsearc等，但是无二进制包，程序不会莫名其妙的崩溃，对于小型的站点，whoosh已经足够使用，点击查看whoosh文档。

jieba是一款免费的中文分词包，如果觉得不好用可以使用一些收费产品。

一、全文搜索配置

1）在环境中安装依赖包

pip install django-haystack
pip install whoosh
pip install jieba

2）在项目配置文件settings.py中注册应用

INSTALLED_APPS = (
    ...
    'haystack',
)

3）在项目配置文件settings.py中指定搜索引擎

# haystack全文搜索配置
HAYSTACK_CONNECTIONS = {
    'default': {
        # 使用whoosh引擎
        'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine',
        # 索引文件存储路径
        'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
    }
}

# 当添加、修改、删除数据时，自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'
# 修改haystack 默认返回数据量。默认20
HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

4）在项目的urls.py中添加路由

path('search/', include('haystack.urls'))

5）在haystack中使用jieba分词包

修改haystack源码包目录下的 ./backends/whoosh_backend.py文件

from jieba.analyse import ChineseAnalyzer
#将StemmingAnalyzer()替换为 ChineseAnalyzer()
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer()), field_boost=field_class.boost, sortable=True)

二、生成索引文件

1）在需要进行全文搜索的模型类同目录下，新建一个search_indexes.py文件（注：文件名称不能自定义），在其中定义

from haystack import indexes

# 导入需要创建索引的模型类
from apps.goods.models import GoodsSKU


class GoodsSKUIndex(indexes.SearchIndex, indexes.Indexable):
    # 索引字段 use_template=True指定根据表中的哪些字段建立索引文件的说明放在一个文件中
    text = indexes.CharField(document=True, use_template=True)

    def get_model(self):
        # 返回创建索引模型类
        return GoodsSKU

    # 建立索引的数据
    def index_queryset(self, using=None):
        return self.get_model().objects.all()

2）在templates下面新建目录search/indexes/goods，其中search/indexes/为固定名称，goods为创建索引模型类对应的应用名称。

并在目录下新建一个文件goodssku_text.txt，goodssku为模型类小写，后面部分为固定名称。

3）在goodssku_text.txt文件中指定索引字段

# 指定索引的字段
{{ object.name }}   # object为固定值，可以看成是模型类的实例
{{ object.desc }}
{{ object.goods.detail }}

4）使用命令生成索引文件

python manage.py rebuild_index

索引文件存储在settings中配置的目录下，即whoosh_index

三、使用全文搜索

这篇关于Django_haystack全文搜索的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

Go教程

Django_haystack全文搜索

一、全文搜索配置

二、生成索引文件

三、使用全文搜索

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯