haystack是全文搜索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎,点击查看官方网站。
whoosh是用纯Python编写的全文搜索引擎,虽然性能比不上sphinx、xapian、Elasticsearc等,但是无二进制包,程序不会莫名其妙的崩溃,对于小型的站点,whoosh已经足够使用,点击查看whoosh文档。
jieba是一款免费的中文分词包,如果觉得不好用可以使用一些收费产品。
1)在环境中安装依赖包
pip install django-haystack pip install whoosh pip install jieba
2)在项目配置文件settings.py中注册应用
INSTALLED_APPS = ( ... 'haystack', )
3)在项目配置文件settings.py中指定搜索引擎
# haystack全文搜索配置 HAYSTACK_CONNECTIONS = { 'default': { # 使用whoosh引擎 'ENGINE': 'haystack.backends.whoosh_backend.WhooshEngine', # 索引文件存储路径 'PATH': os.path.join(BASE_DIR, 'whoosh_index'), } } # 当添加、修改、删除数据时,自动生成索引 HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 修改haystack 默认返回数据量。默认20 HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1
4)在项目的urls.py中添加路由
path('search/', include('haystack.urls'))
5)在haystack中使用jieba分词包
修改haystack源码包目录下的 ./backends/whoosh_backend.py文件
from jieba.analyse import ChineseAnalyzer #将StemmingAnalyzer()替换为 ChineseAnalyzer() schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer()), field_boost=field_class.boost, sortable=True)
1)在需要进行全文搜索的模型类同目录下,新建一个search_indexes.py文件(注:文件名称不能自定义),在其中定义
from haystack import indexes # 导入需要创建索引的模型类 from apps.goods.models import GoodsSKU class GoodsSKUIndex(indexes.SearchIndex, indexes.Indexable): # 索引字段 use_template=True指定根据表中的哪些字段建立索引文件的说明放在一个文件中 text = indexes.CharField(document=True, use_template=True) def get_model(self): # 返回创建索引模型类 return GoodsSKU # 建立索引的数据 def index_queryset(self, using=None): return self.get_model().objects.all()
2)在templates下面新建目录search/indexes/goods,其中search/indexes/为固定名称,goods为创建索引模型类对应的应用名称。
并在目录下新建一个文件goodssku_text.txt,goodssku为模型类小写,后面部分为固定名称。
3)在goodssku_text.txt文件中指定索引字段
# 指定索引的字段 {{ object.name }} # object为固定值,可以看成是模型类的实例 {{ object.desc }} {{ object.goods.detail }}
4)使用命令生成索引文件
python manage.py rebuild_index
索引文件存储在settings中配置的目录下,即whoosh_index