北方轻巡舰的博客


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

Aggregations 聚合总结

发表于 2021-05-15 | 分类于 学习打卡

聚合分类

聚合,可以简单的理解为数据库操作中的 Distinct、 Group By ,count、sum、Having 等操作,当然,实际的功能还是有差别的。目前 Elasticsearch 中的聚合操作包含以下几种分类:

  • Bucket ,分桶
  • Metric ,⼀些系列的统计⽅法,包括 sum、max、min、avg 、stats 等
  • Matrix(弃用)
  • Pipeline,针对 “聚合” 的聚合。基于其他聚合的结果集

之前一直觉得聚合好难,然而真的读完,敲了两遍之后发现也就那样。。。

阅读全文 »

Week04总结

发表于 2021-05-01 | 分类于 学习打卡

1. 文档学习

本周阅读了 Analyzer API、ingest API、Modules 三个章节,以及 xpack 的配置 https 访问部分,重点内容如下:

  • 内置分词器,以及自定义分词器;
  • ingest 数据处理;
  • shard allocation 与 cluster allocaiton ;
  • 跨集群检索 cross-cluster search;
  • xpack 角色配置、https 配置
阅读全文 »

Week03总结

发表于 2021-04-24 | 分类于 学习打卡

1. 文档学习

本周阅读内容为 cat API、cluster API、query API 部分, 以及 script 和 mapping 的小章节内容。 Aggregatins 暂时跳过了(这一章我一直觉得很难 orz… 最后再来慢慢啃吧),这周总结的重点内容如下:

  • cluster reroute、cluster update settings
  • Compound query
  • full text query
  • scripting
  • mapping
阅读全文 »

倒排索引---联合查询加速

发表于 2021-04-24 | 分类于 学习打卡

1. 位图与布隆过滤器

位图通常用于状态检索,通过与或操作来判断,检索效率为 O(1)。相比数组而言,虽然检索效率相同,但可以减小内存占用,一个 2^32=40亿 的位图占用为 512M,同样的情况下数组在使用 boolean 类型时内存占用为位图的 8 倍,而使用 int32 时占用为 4 字节,内存占用是位图的 32 倍;

阅读全文 »

Week02总结

发表于 2021-04-18 | 分类于 学习打卡

1. 文档学习

本周文档阅读内容大模块为 Search API 和 Indices API,重点内容包含以下模块

  • doc_value、explain、collaspace 及 index boost;

  • 特殊查询rescore query、script_fields、inner_hits 以及 post_filter ;

  • 分页查询 from+size、scroll、search_after ;

  • search_type 之 query_then_fetch 、dfs_query_then_fetch;

  • sort、source_filter 过滤;

  • search_template、explain 与 profile_API。

    阅读全文 »
1234…7
北方轻巡舰

北方轻巡舰

35 日志
8 分类
16 标签
GitHub
© 2022 北方轻巡舰
0%