本文主要介绍 Elasticsearch REST API 的使用,相关的环境及软件信息如下:CentOS 7.6.1810、Elasticsearch 8.2.2。
curl -X <VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' ‐d '<BODY>'
说明:
参数 | 说明 |
<VERB> | 请求方法,如:GET,POST,PUT,HEAD 或 DELETE |
<PROTOCOL> | 协议,http 或 https |
<HOST> | 主机 |
<PORT> | Elasticsearch 服务端口,默认为9200 |
<PATH> | API 端点 |
<QUERY_STRING> | 请求参数 |
<BODY> | JSON 格式的请求体 |
cat API 是提供给人在 Kibana 控制台或命令行中使用的,不适合应用程序调用。
curl -X GET "http://10.49.196.11:9200/_cat/health?v=true"
curl -X GET "http://10.49.196.11:9200/_cat/nodes?v=true"
同时设置了 setting 和 mapping 信息;setting 里面包含分片和副本信息,mapping 里包含字段设置的详细信息。
curl -X PUT -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index' -d ' { "settings": { "index": { "number_of_shards": 2, "number_of_replicas": 1 } }, "mappings": { "properties": { "age": { "type": "integer" }, "name": { "type": "keyword" }, "poems": { "type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word" }, "about": { "type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word" }, "success": { "type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word" } } } }'
字段可以新增,已有的字段只能修改字段的 search_analyze r属性。
curl -X PUT -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index' -d ' { "properties": { "name": { "type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word" }, "age": { "type": "integer" }, "desc": { "type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_smart" } } }'
curl -X DELETE 'http://10.49.196.11:9200/poet-index'
curl -X GET "http://10.49.196.11:9200/*"
或
curl -X GET "http://10.49.196.11:9200/_all"
curl -X GET 'http://10.49.196.11:9200/poet-index'
A、设置 id 为 1
curl -X POST -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_create/1' -d ' { "age": 30, "name": "李白", "poems": "静夜思", "about": "字太白", "success": "创造了古代浪漫主义文学高峰、歌行体和七绝达到后人难及的高度" }'
B、不设置 id,将自动生成
curl -X POST -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_doc' -d ' { "age": 31, "name": "杜甫", "poems": "登高", "about": "字子美", "success": "唐代伟大的现实主义文学作家,唐诗思想艺术的集大成者" }'
C、批量新增文档
curl -X POST -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_bulk' -d ' {"index":{"_id":"11"}} {"age": 30,"name": "杜甫11","poems": "登高","about": "字子美","success": "唐代伟大的现实主义文学作家,唐诗思想艺术的集大成者"} {"index":{"_id":"12"}} {"age": 30,"name": "杜甫12","poems": "登高","about": "字子美","success": "唐代伟大的现实主义文学作家,唐诗思想艺术的集大成者"} '
注:最后的空行是需要的,否则会报错。
curl -X DELETE 'http://10.49.196.11:9200/poet-index/_doc/1'
只更新参数设置的字段。
curl -X POST -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_update/1' -d ' { "doc": { "age": 32, "poems": "望庐山瀑布" } }'
没有对应 id 的文档就创建,有就覆盖更新所有的字段(相当于先删除再新增)。
curl -X PUT -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_doc/1' -d ' { "age": 31, "name": "李白", "poems": "静夜思", "about": "字太白" }'
curl -X GET 'http://10.49.196.11:9200/poet-index/_search'
curl -X GET 'http://10.49.196.11:9200/poet-index/_doc/1'
term 查询不会对输入的内容进行分词处理,而是作为一个整体来查询。
A、查询单个词
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "term": { "name": { "value": "李白" } } } }'
B、查询多个词
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "terms": { "name": ["李白", "杜甫"] } } }'
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "range": { "age": { "gte": 20, "lte": 35 } } } }'
对输入的内容进行分词处理,再根据分词查询。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "match": { "success": "理想主义" } }, "from": 0, "size": 10, "sort": [{ "name": { "order": "asc" } }] }'
多字段匹配。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "multi_match": { "query": "太白", "fields": ["about", "success"] } } }'
匹配整个查询字符串。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "match_phrase": { "success": "文学作家" } } }'
查询所有数据。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "match_all": { } } }'
query_string 可以同时实现前面几种查询方法。
A、类似 match
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "query_string": { "default_field": "success", "query": "古典文学" } } }'
B、类似 mulit_match
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "query_string": { "query": "古典文学", "fields": ["about", "success"] } } }'
C、类似 match_phrase
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "query_string": { "default_field": "success", "query": "\"古典文学\"" } } }'
D、带运算符查询,运算符两边的词不再分词
1、查询同时包含 ”文学“ 和 ”伟大“ 的文档
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "query_string": { "default_field": "success", "query": "文学 AND 伟大" } } }'
或
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "query_string": { "fields": ["success"], "query": "文学 伟大", "default_operator": "AND" } } }'
2、查询 name 或 success 字段包含"文学"和"伟大"这两个单词,或者包含"李白"这个单词的文档。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "query_string": { "query": "(文学 AND 伟大) OR 李白", "fields": ["name", "success"] } } }'
类似 query_string,主要区别如下:
1、不支持AND OR NOT ,会当做字符处理;使用 + 代替 AND,| 代替OR,- 代替 NOT
2、会忽略错误的语法
查询同时包含 ”文学“ 和 ”伟大“ 的文档:
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "simple_query_string": { "fields": ["success"], "query": "文学 + 伟大" } } }'
模糊查询时使用的参数:
fuzziness |
允许的最大编辑距离,默认不开启模糊查询,相当于 fuzziness=0。支持的格式 1、可以是数字(0、1、2)代表固定的最大编辑距离 2、自动模式,AUTO:[low],[high] 查询词长度在 [0-low)范围内编辑距离为 0(即强匹配) 查询词长度在 [low, high) 范围内允许编辑 1 次 查询词长度 >high 允许编辑 2 次 |
prefix_length |
控制两个字符串匹配的最小相同的前缀大小,也就是前 n 个字符不允许编辑,必须与查询词相同,默认是 0,大于 0 时可以显著提升查询性能 |
max_expansions |
产生的最大模糊选项 |
transpositions |
相邻位置字符互换是否算作 1 次编辑距离,全文查询不支持该参数 |
A、全文查询时使用模糊参数
先分词再计算模糊选项。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "match": { "success": { "query": "古典文化", "fuzziness": 1, "prefix_length": 0, "max_expansions": 5 } } } }'
B、使用 fuzzy query
对输入不分词,直接计算模糊选项。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "fuzzy": { "success": { "value": "理想", "fuzziness": 1, "prefix_length": 0, "transpositions": true } } } }'
组合查询使用 bool 来组合多个查询条件。
条件 | 说明 |
must | 同时满足 |
should | 满足其中任意一个 |
must_not | 同时不满足 |
filter | 过滤搜索,不计算得分 |
A、查询 success 包含 “思想” 且 age 在 [20-40] 之间的文档:
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "bool": { "must": [{ "simple_query_string": { "query": "思想", "fields": ["success"] } }, { "range": { "age": { "gte": 20, "lte": 40 } } }] } } }'
B、过滤出 success 包含 “思想” 且 age 在 [20-40] 之间的文档,不计算得分:
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "bool": { "filter": [{ "simple_query_string": { "query": "思想", "fields": ["success"] } }, { "range": { "age": { "gte": 20, "lte": 40 } } }] } } }'
A、求和
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "aggs": { "age_sum": { "sum": { "field": "age" } } } }'
B、类似 select count distinct(age) from poet-index
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/test-index/_search' -d ' { "aggs": { "age_count": { "cardinality": { "field": "age" } } } }'
C、数量、最大、最小、平均、求和
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "aggs": { "age_stats": { "stats": { "field": "age" } } }, "size": 0 }'
D、类似 select name,count(*) from poet-index group by name
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "aggs": { "name_terms": { "terms": { "field": "name" } } }, "size": 0 }'
E、类似 select name,age, count(*) from poet-index group by name,age
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "aggs": { "name_terms": { "terms": { "field": "name" }, "aggs": { "age_terms": { "terms": { "field": "age" } } } } }, "size": 0 }'
F、类似 select avg(age) from poet-indexwhere name='李白'
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "bool": { "filter": { "term": { "name": "李白" } } } }, "aggs": { "age_avg": { "avg": { "field": "age" } } }, "size": 0 }'
如果希望 Elasticsearch 能够根据我们的搜索内容给一些推荐的搜索选项,可以使用推荐搜索。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "suggest": { "success_suggest": { "text": "思考", "term": { "field": "success", "analyzer": "ik_max_word", "suggest_mode": "always", "min_word_length":2 } } } }'
推荐模式 suggest_mode:
推荐模式 | 说明 |
popular | 推荐词频更高的一些搜索 |
missing | 当没有要搜索的结果的时候才推荐 |
always | 无论什么情况下都进行推荐 |
对搜索结果中的关键字高亮显示。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/poet-index/_search' -d ' { "query": { "match": { "success": "思想" } }, "highlight": { "pre_tags": "<span color='red'>", "post_tags": "</span>", "fields": { "success": {} } } }'
Elasticsearch 支持通过 SQL 查询数据。
curl -X GET -H 'Content-Type:application/json' 'http://10.49.196.11:9200/_sql' -d ' { "query": "SELECT * FROM \"poet-index\" limit 3" }'
详细的 Elasticsearch REST API 使用说明,请参考官网文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/rest-apis.html。