ElasticSearch使用索引生命周期管理 作者: admin 时间: 2020-07-10 分类: elasticsearch 评论 # ElasticSearch使用索引生命周期管理 ILM( Index Lifecycle Management 索引生命周期管理)是 Elasticsearch6.7 正式推出的功能,使用 ILM 可以在索引中设置策略,自动根据索引的存在时间、文档数、大小做滚动、删除、移动等操作。 - 阅读剩余部分 -
ElasticSearch 数据同步在项目中的实践经验 作者: admin 时间: 2020-06-17 分类: 默认分类,elasticsearch 评论 #ElasticSearch 数据同步在项目中的实践经验 接触ES也有两年的时间了,在两家公司、不同的项目上接触到了不同的ES使用方法,走了不少岔路,也积累了不少的经验,接下来分析一下我接触过的项目中使用ES的方法。 ## 离线数据同步--Logstash 使用 Logstash 可以 通过简单的配置文件实现秒级的数据增量同步,但是缺点也很明显,在 MySQL->ES 千万数据量级同步时,Logstash 宿主机很容易因内存不足而杀死 Logstash 进程。 - 阅读剩余部分 -
ElasticSearch跨集群跨版本迁移(5.5到7.2) 作者: admin 时间: 2020-04-07 分类: 默认分类 1 条评论 ##5.5与7.2的差异 1. 7.x版本不可再自定义type ,默认的type为`_doc` 如搜索 `index/_doc/_search` 不加也可`index/_search`,type会在8.X版本彻底移除。 2. 时间格式严格匹配 2020-4-3 11:36:21 => 2020-04-03 11:36:23 正确的 ```json "range":{ "created_at":{ "gte":"2020-04-03 00:00:00" } } ``` 错误的 ```json "range":{ "created_at":{ "gte":"2020-4-3 00:00:00" } } ``` - 阅读剩余部分 -
相关词推荐 作者: admin 时间: 2020-03-19 分类: 默认分类 评论 ### 需求 根据用户输入的搜索词进行搜索词推荐,增加用户的选择。 ### 实现方法 这里我们使用word2vec进行词向量模型训练,找到与搜索词最近的几个词作为推荐项。 - 阅读剩余部分 -
elasticsearch suggest实现搜索词自动补全 作者: admin 时间: 2020-03-11 分类: elasticsearch 评论 ###如何实现 利用ES的suggest completion提示器进行关键词补全,completion提示器是由前缀树实现的,数据全部装载在内存中,速度极快。 ###现有的数据 每天每个关键词的 PV UV 搜索次数 无结果次数 ###自动补全实现 > pv/uv 每个用户有几张有效数据 (系数 2) pv/search_cnt 每次搜索有几个有效数据 (系数1) search_cnt/uv 每个用户搜几次 (系数0.05) no_results_pv/search_cnt 每次搜索有几个无效图 (系数-0.5 负反馈) · 对七天内数据(PV UV search_cnt)进行加权融合 算出权重 · 存入ES · 清洗敏感词,补全拼音 - 阅读剩余部分 -