本文首发于公众号:Hunter后端
原文链接:Python连接es笔记二之查询方式汇总
上一节除了介绍使用 Python 连接 es,还有最简单的 query() 方法,这一节介绍一下几种其他的查询方式。
以下是本篇笔记目录:
在上一节中介绍了 query() 的一个简单示例,如下:
s = Search(using="default").index("exam") s = s.query("match", name="张三丰")
query() 中接受两个参数,第一个是字段查询的方式,比如这里是 match,也可以是 term,这个依照查询的目的来替换。
第二个则是查询的字段与值,比如这里是查询的 name 字段为 "张三丰" 的数据。
如果是有多个条件,比如 name="张三丰",address="中国" 的数据,这里的 = ,并非是完全等于的意思,而是会依照前面的查询方式,比如 match 或 term 进行类似的分词或者模糊搜索。
如果是上面多个条件的查询,可以直接在后面加上类似的 query():
s = s.query("match", name="张三丰").query("match", address="中国")
这两个 query() 通过链式操作连在一起转换成 es 语句就是使用 must 将多条件连接在一起,我们可以使用 to_dict() 方式来查看:
s.to_dict() # {'query': {'bool': {'must': [{'match': {'name': '张三丰'}}, {'match': {'address': '中国'}}]}}}
如果看过之前我写过的 Django 系列笔记,应该记得在 Django 里也有个 Q() 方法的查询,和这里的一样,也是用于条件的联合,与或非条件都可以实现。
引入方式如下:
from elasticsearch_dsl import Q
但是如果是在 Django 中使用 es 的连接,也是同样使用 Q() 方法,我们可以使用 as 来区分,这里我们对于 es 的 Q() 方法可以使用 ES_Q() 来区分:
from elasticsearch_dsl import Q as ES_Q
单个条件的使用 Q() 如下:
s = s.query(ES_Q("match", name="张三丰"))
如下使用 dict 形式的操作也是等效的:
s = s.query(ES_Q({"match": {"name": "张三丰"}}))
对于这两个条件,如果想要实现它们的与操作:
q1 = ES_Q("match", name="张三丰") q2 = ES_Q("match", address="中国")
可以如下实现:
s = s.query(q1 & q2)
如果是想实现上面的或操作,可以如下:
s = s.query(q1 | q2)
如果是想取反,直接在条件前加一个 ~
即可:
q1 = ~ES_Q("match", name="张三丰") s = s.query(q1)
如果是搜索多字段,可以如下操作:
q = ES_Q("multi_match", query="中国 张三丰", fields=["name", "address"]) s = s.query(q)
对于 es 中 text 字段,前面我们介绍过 .keyword
的查询方式,是将 text 字段作为一个整体进行查询,在 ES_Q() 中,以下两种操作是等效的:
q = ES_Q({"term": {"address.keyword": "中国湖北省"}}) q = ES_Q("term", address__keyword="中国湖北省")
在 es 中的 filter 操作,在 Python 中是一个 filter() 函数,可以直接使用:
q = ES_Q("term", name="张三丰") s = s.filter(q)
实现大小于的操作示例如下:
q = ES_Q({"range": {"age": {"gte": 21}}}) s = s.query(q)
如果是想取反,除了使用 ~Q(),还可以直接使用 exclude() 函数,这个和 Django 里的操作也是一样的:
q = ES_Q("term", name="张三丰") s = s.exclude(q)
如果是想对返回的结果进行排序操作,直接使用 .sort() 方法。
比如想对 age 字段排序,正序返回数据,可如下操作:
s = s.sort("age")
如果是想倒序返回,可以如下操作:
s = s.sort("-age")
多字段排序直接在后面跟上就行:
s = s.sort("-age", "name")
Python 连接 es 进行分页,可以直接使用 Python 里的切片操作,比如:
s = s[5:10]
我们可以通过 source() 方法指定返回的字段:
s = s.source(["name", "address"])
source() 方法还可以接受 includes 和 excludes 参数来指定返回的字段或者不返回的字段,这个和 es 的原生处理方式是一致的:
s = s.source( includes=["address"], excludes=["name"] )
extra() 函数接受一些查询的额外属性,比如 size 参数决定返回条数,比如 from 参数可以决定从第几条数据开始返回,sort 参数决定排序方式,以及 _source 参数决定返回的字段。
比如我们想要返回的数据从第 2 条数据开始,返回两条,按照 name 字段进行排序,只返回 name 和 _id 字段,可以如下操作:
s = Search(using="default").index("exam") s = s.extra( sort="name", _source=["name"], **{ "from": 1, "size": 2 } ) response = s.execute()
前面介绍过获取符合条件的总数,可以通过 response.hits.total.value 的方式获得,其实对于 Search(),可以直接使用 count() 函数:
count = s.count()
如果我们想直接运行 kibana 里执行的命令,可以使用 from_dict() 函数,比如:
s = s.from_dict( { "query": { "term": { "name": { "value": "张三丰" } } } } )
如果想获取更多后端相关文章,可扫码关注阅读: