Elasticsearch查询及聚合类DSL语句宝典示例详解
作者:京东云开发者 发布时间:2023-01-10 18:51:46
前言
随着使用es场景的增多,工作当中避免不了去使用es进行数据的存储,在数据存储到es当中以后就需要使用DSL语句进行数据的查询、聚合等操作,DSL对SE的意义就像SQL对MySQL一样,学会如何编写查询语句决定了后期是否能完全驾驭ES,所以至关重要,本专题主要是分享常用的DSL语句,拿来即用。
一、match
如果match 查询数字,日期,布尔值或者not_analyzed 的字符串时,会精确匹配搜索值,不做分词解析;如果match 查询全文本,会对查询词做分词解析,然后搜索。
比如对keyword 类型的tag 查询,"京东总部"不会分词,必须完全相等的词才会被搜索出来
{
"query": {
"match": {
"content" : {
"tag" : "京东总部"
}
}
}
}
比如"宝马多少马力"会被分词为"宝马 多少 马力", 所有有关"宝马 多少 马力", 那么所有包含这三个词中的一个或多个的文档就会被搜索出来。并且根据lucene的评分机制(TF/IDF)来进行评分
{
"query": {
"match": {
"content" : {
"query" : "宝马多少马力"
}
}
}
}
二、match_phrase
如果想要精确匹配所有同时包含"宝马 多少 马力"的文档,就要使用 match_phrase 了
{
"query": {
"match_phrase": {
"content" : {
"query" : "宝马多少马力"
}
}
}
}
三、mult_match
如果我们希望两个字段进行匹配,其中一个字段有这个文档就满足的话,使用multi_match
{
"query": {
"multi_match": {
"query" : "我的宝马多少马力",
"fields" : ["title", "content"]
}
}
}
四、term
关键字精确匹配,不分词解析。注意 term 包含(contains) 操作,而非 等值(equals)判断。如果文档包含full_text 及其他词,也会命中返回。
使用term要确定的是这个字段是否“被分析”(analyzed),默认的字符串是被分析的。
比如下面的例子,其中的full_text是被分析过的,所以full_text的索引中存的就是[quick, foxes],而extra_value中存的是[Quick Foxes!]
PUT my_index
{
"mappings": {
"my_type": {
"properties": {
"full_text": {
"type": "string"
},
"exact_value": {
"type": "string",
"index": "not_analyzed"
}
}
}
}
}
PUT my_index/my_type/1
{
"full_text": "Quick Foxes!",
"exact_value": "Quick Foxes!"
}
请求不出数据的,因为full_text分词后的结果中没有[Quick Foxes!]这个分词
GET my_index/my_type/_search
{
"query": {
"term": {
"full_text": "Quick Foxes!"
}
}
}
五、terms
指定多值精确匹配,如果字段包含了指定值中的任何一个值,那么文档满足条件。类似sql中的in
{
"terms": {
"tag": [
"search",
"full_text",
"nosql"
]
}
}
六、range
数字/时间的区间查询,操作符:
•gt > greater than
•gte >=
•lt < litter than
•lte <=
{
"query":{
"range": {
"age": {
"gte": 20,
"lt": 30
}
}
}
}
七、wildcard
通配符索引。* 表示全匹配,? 表示单一匹配。扫描所有倒排索引,性能较差
{
"query": {
"wildcard": {
"companyName": "*京东*"
}
}
}
八、regexp
正则索引。扫描所有倒排索引,性能较差
{
"query": {
"regexp": {
"postcode": "W[0-9].+"
}
}
}
九、组合多查询(bool查询)
bool 查询后面可以跟这四种匹配模式
•must 必须匹配
•must_not 必须不匹配
•should 匹配任意,等价or
•filter 必须匹配:过滤模式
比如我们想要请求"content 中带宝马,但是tag 中不带宝马"这样类似的需求,就需要用到bool 联合查询。
{
"query":{
"bool":{
"must":{
"term":{
"content":"宝马"
}
},
"must_not":{
"term":{
"tags":"宝马"
}
}
}
}
}
十、聚合
聚合包含一下两种:
1、 指标聚合(Metric Aggregation):一些数学运算,可以对文档字段进行统计分析
•输出一个值
▪min
▪max
▪sum
▪avg
▪ value_count 统计某字段有值的文档数
▪ cardinality 某字段值去重计数
•输出多个值
▪stats
▪percentiles
▪percentile_ranks
2、桶聚合(Bucket Aggregation) :一些列满足特定条件的文档的集合,相当于sql 的groupby
•terms 对某个字段统计每个不同的内容,以及出现文档的个数
•range 某个范围内文档的个数
默认聚合范围是全文,但是如果有query查询,那么聚合的范围就是query查询的结果。
value_count 统计某字段有值的文档数
{
"size": 0,
"aggs": {
"count": {
"value_count": {
"field": "companyName"
}
}
}
}
指定查询语句进行统计
{
"query": {
"term": {
"companyName": "安徽科达智慧能源科技有限公司"
}
},
"aggs": {
"count": { //自定义名称
"terms": {
"field": "companyName"
}
}
}
}
来源:https://juejin.cn/post/7181645045211070519
猜你喜欢
- 如执行:"2|33|4".split("|")出来的结果是:""2334奇怪吧,
- 一、递归的思路一个方法在执行时,调用自身被称为“递归”。递归相当于数学归纳法,有一个起始条件,有一个递推公式。递归可以分为:单路递归和多路递
- 前言惰性计算(尽可能延迟表达式求值)是许多函数式编程语言的特性。惰性集合在需要时提供其元素,无需预先计算它们,这带来了一些好处。首先,您可以
- 前言Mybatis真正强大的地方在于SQL映射语句,这也是它的魅力所在。相对于它强大的功能,SQL映射文件的配置却非常简单,我上篇文章语句讲
- 1.获取签名与模板进入阿里云平台,进入短信服务模块,在以下位置添加签名和模板(格式一定按照要求填写 审批的比较严格)2.编写模板与签名的枚举
- 背景在接口请求过程中,传递json对象,springboot转换为实体VO对象后,所有属性都为null。post请求:后台接收请求:当时就懵
- 最近一直在对接接口,上游返回的都是 JSON 数据,我们需要将这些数据进行保存,我们可以解析成 Map 通过 key 的方式进行获取,然后
- 先看Demo运行效果SharedPreferences详解SharedPreferences是Android平台上一个轻量级的存储类,用来保
- 缓存淘汰算法在高并发、高性能的质量要求不断提高时,我们首先会想到的就是利用缓存予以应对。第一次请求时把计算好的结果存放在缓存中,下次遇到同样
- 前言前段时间一直使用到word文档转pdf或者pdf转word,寻思着用Java应该是可以实现的,于是花了点时间写了个文件转换工具源码wel
- C语言/C++怎样产生随机数:这里要用到的是rand()函数, srand()函数,和time()函数。需要说明的是,iostream头文件
- 本文主要关注如何使用mybatis/mybatis plus连接SQL Server数据库,因此将省略其他项目配置、代码。框架选择应用框架:
- 前言你一定会好奇:“老周,你去哪开飞机了?这么久没写博客了。”老周:“我买不起飞机,开了个铁矿,挖了一年半的石头。谁知铁矿垮了,压死了几条蜈
- 本文实例为大家分享了java简单实现斗地主发牌的具体代码,供大家参考,具体内容如下问题:参考斗地主的游戏规则,完成一个发牌的功能(54张牌,
- 前言前段时间因为工作的需要用到Spring事件,翻翻文档将功能实现了,但是存在少许理解不畅的地方,今天有空来梳理梳理。需求背景叶子同学在新入
- 一、Mybatis1、mybatis-config.xml<?xml version="1.0" encoding
- 本文介绍了Java设计模式之享元模式,供大家参考,具体内容如下1、关于享元模式享元模式有点类似于单例模式,都是只生成一个对象被共享使用。享元
- cookies的创建:在客户端创建一个username的cookies,其值为oneday,有效期为1天.方法1:Response.Cook
- 本文实例讲述了java GUI编程之布局控制器(Layout)。分享给大家供大家参考,具体如下:布局控制器,是用来系统自动分配各个compo
- 使用unity制作瞄准镜,供大家参考,具体内容如下一、创建场景在Hierarchy窗口中使用Plane和Cube创建场景,并调整摄像机位置二