【ES三周年】高效搜索引擎ElasticSearch介绍|环球今亮点
ElasticSearch
简介
官网:https://www.elastic.co/cn/products/elasticsearch
(资料图)
特点:
高速、扩展性、最相关的搜索结果。分布式 - 节点对外表现对等,每个节点都可以作为入门,加入节点自动负载均衡。JSON - 输入输出格式是 JSON。Restful 风格,一切 API 都遵循 Rest 原则,容易上手。近实时搜索,数据更新在 Elasticsearch 中几乎是完全同步的,数据检索近乎实时。安装方便 - 没有其它依赖,下载后安装很方便,简单修改几个参数就可以搭建集群。支持超大数据:可以扩展到 PB 级别的结构化和非结构化数据。■Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。
■Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
■Elasticsearch 还是高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性,能使数据在生产环境变得更有价值。
ElasticSearch信息概览
什么是index,type,doc
■index:索引是文档(Document)的容器,是一类文档的集合,可以理解成我们常用的mysql中的数据库。
■Type 可以理解成mysql中的表。
■Document Index 里面单条的记录称为Document(文档)。等同于mysql中的一行数据。
建库,建表,建字段
■建库脚本
PUT http://127.0.0.1:9200/cunw-share-es-index
就这么一个请求就可以建成一个以cunw-share-es-index为库名的ES数据库索引库;
■建表脚本,建字段
PUT http://127.0.0.1:9200/cunw-share-es-index/sanbu/1
PUT http://127.0.0.1:9200/cunw-share-es-index/sanbu/1{ "name":"大哥", "sex": "男", "hight":"180", "date":"2022-01-01", "info":"Hello World"}
索引基本创建完成。
什么是mapping
■mapping 是用来定义文档及其字段的存储方式、索引方式的手段,例如利用mapping 来定义以下内容:哪些字段需要被定义为全文检索类型;哪些字段包含number、date类型等格式化时间格式;自定义规则,用于控制动态添加字段的映射。
■mapping是一种简单的数据类型,例如text、keyword、integer、double、boolean、long、date、ip类型。也可以是一种分层的json对象(支持属性嵌套)。也可以是一些不常用的特殊类型,例如geo_point、geo_shape、completion。
■针对同一字段支持多种字段类型可以更好地满足我们的搜索需求,例如一个string类型的字段可以设置为text来支持全文检索,与此同时也可以让这个字段拥有keyword类型来做排序和聚合,另外我们也可以为字段单独配置分词方式,例如"analyzer": "ik_max_word"。从某种意义上来讲,就是表字段类型,int,varchar,date...
为什么要用mapping
提出疑问,修改一个字段的类型:
{ "sanbu": { "properties": { "hight": { "type": "integer" } } }}
为什么不能修改一个字段的type?原因是一个字段的类型修改以后,那么该字段的所有数据都需要重新索引。Elasticsearch底层使用的是lucene库,字段类型修改以后索引和搜索要涉及分词方式等操作。
ElasticSearch 分片,副本
■数据分片:
简单来讲就是咱们在ES中所有数据的文件块,也是数据的最小单元块,整个ES集群的核心就是对所有分片的分布、索引、负载、路由等达到惊人的速度。
实列场景:
假设 IndexA 有2个分片,我们向 IndexA 中插入10条数据 (10个文档),那么这10条数据会尽可能平均的分为5条存储在第一个分片,剩下的5条会存储在另一个分片中。说白了:数据分片其实类似主流关系型数据库的表分区(分表)的概念有点类似。这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。构成分布式搜索要注意的是分片的数量只能在索引创建前指定,并且索引创建后不能更改。
分片数量设置计算公式:
分片个数是越多越好,还是越少越好了?根据整个索引的数据量来判断。SN(分片数) = IS(索引大小) / 30,当然也要根据能够给ES分配资源的实际情况而定夺。
■数据副本
副本是主分片的拷贝,es可以设置多个索引的副本,副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡。副本分片数,可以动态的修改。增加副本数,还可以在一定程度上提高服务的可用性(读取的吞吐)。
■设置分配,副本脚本代码
PUT /index { "settings":{ "number_of_shards" : 3, //指 这个index主分片分布在3个节点上 "number_of_replicas":1 //指 每一个主分片都有一个副本 } }
■查询写法
es中的查询请求有两种方式,一种是简易版的查询,另外一种是使用JSON完整的请求体,叫做结构化查询(DSL)。由于DSL查询更为直观也更为简易,所以大都使用这种方式。DSL查询是POST过去一个json,由于post的请求是json格式的,所以存在很多灵活性,也有很多形式。
最基本的查询语句,查询所有数据值得注意的是,在请求之前一定确保它是正确的Json。
{ "query": { "match_all": {} }}
查询过滤条件关键字
■查询关键字的用法match,term,wildcard,range....
1.match 通过单词字面意思理解是匹配的意思,顾名思义如果匹配到其中的任意字词就会命中,其实就是通过ES默认的ik分词器去做分词查询。
{ "query": { "match": { "name":软" } }}
2.term 如果匹配到其中所有字词才会命中。
{ "query": { "match": { "name":"软" } }}
3.wildcard 用法类似mysql的like,注意这里的通配符是*
{ "query": { "match": { "name":"*软*" } }}
4.range 看到这个词就会想到区间,它的用法类似于mysql的between ..and ..
{ "query": { "range": { "height":{ "gt": "150", "lt": "170" } } }}
update,delete语句
■ 根据ID进行单个更新
POST /index/type/_id/_update{ "doc" : { "publish_date" :"2021-11-10", }}
■ 根据ID进行单个删除
DELETE /index/type/_id
Elastic 有一条完整的产品线 ELK - Elasticsearch、Logstash、Kibana,前面说的三个就是常说的 ELK 技术栈(开源实时日志分析平台)。Logstash 的作用就是一个数据收集器,将各种格式各种渠道的数据通过它收集解析之后格式化输出到 Elastic Search ,最后再由 Kibana 提供的比较友好的 Web 界面进行汇总、分析、搜索。ELK 内部实际就是个管道结构,数据从Logstash 到 Elastic Search 再到 Kibana 做可视化展示。这三个组件各自也可以单独使用,比如 Logstash 不仅可以将数据输出到 Elastic Search ,也可以到数据库、缓存等。
关于ES的内容还有很多东西等着我们,搭建、分词器、集群、节点角色分配、冷热分离、读写分离等等,后续我们再输出相关详细内容。
Kibana
简介
Kibana 是 Elastic Stack 成员之一,它是一个基于 Node.js 的 Elasticsearch 索引库数据统计工具,可以利用 Elasticsearch 的聚合功能,生成各种图表,如柱形图,线状图,饼;而且还提供了操作 Elasticsearch 索引数据的控制台,并且提供了一定的 API 提示。您可以使用 Kibana 对 Elasticsearch 索引中的数据进行搜索、查看、交互操作。您可以很方便地利用图表、表格及地图对数据进行多元化的分析和呈现。
Kibana 可以使大数据通俗易懂。它很简单,基于浏览器的界面便于您快速创建和分享动态数据仪表板来追踪 Elasticsearch 的实时数据变化。
搭建
搭建 Kibana 非常简单。可以分分钟完成 Kibana 的安装并开始探索 Elasticsearch 的索引数据 ——— 没有代码、不需要额外的基础设施。当前我们公司使用的版本是 5.5.1。
常用模块
■ Discover
Discover 主要是做索引查询,功能非常强大。从发现页可以交互地探索ES的数据。可以访问与所选索引模式相匹配的每一个索引中的每一个文档。可以提交搜索查询、筛选搜索结果和查看文档数据。还可以看到匹配搜索查询和获取字段值统计的文档的数量。如果一个时间字段被配置为所选择的索引模式,则文档的分布随着时间的推移显示在页面顶部的直方图中。
■ Visualize
视图展示,支持许多风格。可视化能使你创造你的 Elasticsearch 指标数据的可视化。然后你可以建立仪表板显示相关的可视化。Kibana 的可视化是基于 Elasticsearch 查询。通过一系列的 Elasticsearch聚合提取和处理您的数据,您可以创建图表显示你需要知道的关于趋势,峰值和骤降。您可以从搜索保存的搜索中创建可视化或从一个新的搜索查询开始。
■ Dashboard
图表展示,一个仪表板显示Kibana保存的一系列可视化。你可以 根据需要安排和调整可视化,并保存仪表盘,可以被加载和共享。
■ Timelion
Timelion 是一个时间序列数据的可视化功能,可以结合在一个单一的可视化完全独立的数据源。它是由一个简单的表达式语言驱动的,你用来检索时间序列数据,进行计算,找出复杂的问题的答案,并可视化的结果。这个功能由一系列的功能函数组成,同样的查询的结果,也可以通过 Dashboard 显示查看。
■ Dev Tools
其实就是一个控制台,可以直接使用 DSL语法来直接操作es中的数据,使用户方便地通过浏览器直接与 Elasticsearch 进行交互。
使用
■ 搜索、查看并可视化 Elasticsearch 中所索引的数据,并通过创建柱状图、饼状图、表格、直方图和地图对数据进行分析。仪表板视图能将这些可视化元素集中到一起,然后通过浏览器加以分享,以提供有关海量数据的实时分析视图,为下列用例提供支持:
a:日志处理和分析
b:基础设施指标和容器监测
c:应用程序性能监测 (APM)
d:地理空间数据分析和可视化
e:安全分析
f:业务分析
■ 借助网络界面来监测和管理 Elastic Stack 实例并确保实例的安全。
■ 针对基于 Elastic Stack 开发的内置解决方案(面向可观测性、安全和企业搜索应用程序),将其访问权限集中到一起
如何使用
使用 Discover 搜索栏进行搜索。使用 Dev Tools 的 Console 直接与 Elastcsearch 进行交互 。DSL语法
■ 查询所有
■ 查询特定的字段,按照指定字段排序
■ 查询指定字段的日志
■ 分页查询所有的日志
本人就职于公司大数据组,正好近期我在公司分享了关于ES、Kiban和机器学习的一些知识,总结出本文献给大家。
-
2022-09-15 14:23:06
杨莉娜租借加盟巴黎圣日耳曼 与姆巴佩梅西拉莫斯一起共事<
北京时间9月13日下午,法甲女足俱乐部巴黎圣日耳曼正式官宣中国女足国脚杨莉娜完成租借加盟,合同期至2023年6月。杨莉娜成为目前国家队中第
-
2022-02-07 14:57:45
奇迹!绝杀!女足亚洲杯逆转夺冠!<
刚刚,中国女足上演逆转绝杀奇迹!她们在亚洲杯决赛中3:2力克韩国队,时隔16年再夺亚洲杯冠军!
-
2022-02-07 14:57:45
中国政府与阿根廷共和国政府签署共建“一带一路”谅解备忘录<
新华社北京2月6日电(记者安蓓)国家发展改革委6日称,国家发展改革委主任何立峰与阿根廷外交、国际贸易和宗教事
-
2022-02-07 14:57:43
中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明(全文)<
新华社北京2月6日电中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明一、应中方邀请,阿根廷
-
2022-02-07 14:57:40
春节假期国内旅游出游2.51亿人次<
春节遇冬奥,旅游年味浓。根据文化和旅游部数据中心测算,2022年春节假期7天,全国国内旅游出游2 51亿人次,同比
-
2023-02-22 19:20:37
【ES三周年】高效搜索引擎ElasticSearch介绍|环球今亮点
官网:https: www elastic co cn products elasticsearch
-
2023-02-22 17:08:13
cad怎么测量不规则图形面积_cad怎么测量面积
1、方法如下:采用多义线进行封闭绘制,完成后利用查询命令即可得出面积和周长。2、多义线编辑步骤:pl——回车——输入画弧
-
2023-02-22 13:09:53
缓刑流程怎么执行_世界微资讯
一、缓刑流程怎么执行缓刑流程的执行如下:1 缓刑判决从依法确定之日起,人民法院就应当立即交付罪犯所在地公安机关执行
-
2023-02-22 11:06:25
天天报道:广西荔浦市总工会:走访看望工匠 礼遇先进送奖上门
中工网讯据广西工人报消息,荔浦市总工会日前组成慰问组对工匠开展慰问,并将他们所获的证书、奖牌及奖金送到他们手中。此次慰问,慰问组到访
-
2023-02-22 09:13:48
收购碘化铂---苏州鑫聚宝贵金属有限公司 天天观察
收购碘化铂---苏州鑫聚宝贵金属有限公司,离子,碘化物,化合物,络合物,碘化铂,贵金属,中和反应
-
2023-02-22 07:05:06
扶同绥县
1、扶同绥县。2、1951年7月由扶南、同正、绥渌三县合并而成。本文到此分享完毕,希望对大家有所帮助。
-
2023-02-22 02:15:11
世界信息:目标3500亩!小榄把“工改”动员会开到村小组
2月20日下午,小榄镇召开2023年村镇低效工业园改造升级工作动员大会。受访者供图2月20日下午,小榄镇召开2023年村镇低效工业园改造升级工作动
-
2023-02-21 21:58:41
塌鼻子图片_塌字组词_世界动态
1、塌字组词有:倒塌,塌方,塌台,塌架,塌陷,塌秧,崩塌,坍塌,塌房,塌落,塌掉,垮塌,一塌糊涂等。2、1 因凹陷而倒
-
2023-02-21 19:05:15
供需博弈下,油价大概率上涨为主金十期货2月21日讯,申银万国期货前瞻原油后市-环球通讯
供需博弈下,油价大概率上涨为主金十期货2月21日讯,申银万国期货前瞻原油后市:当前原油的需求主要受到中国需求复苏以及欧美加息带来的需求下
-
2023-02-21 17:44:25
全球关注:火车站寄存行李的柜子是什么时候开始的_火车站寄存行李
你们好,最近小活发现有诸多的小伙伴们对于火车站寄存行李的柜子是什么时候开始的,火车站寄存行李这个问题都颇为感兴趣的,今天
-
2023-02-21 14:13:16
武汉东湖梅园进入盛花期 世界聚看点
武汉东湖梅园进入盛花期
-
2023-02-21 12:02:09
优质赛道淘尖货 华夏基金匠心打造产业龙头系列产品-环球焦点
优质赛道淘尖货华夏基金匠心打造产业龙头系列产品
-
2023-02-21 09:57:44
第二轮中央生态环保督察移交问题已追责问责近2900人 热点聚焦
新华社北京2月20日电(记者高敬)20日,6省份和2家央企公开了中央生
-
2023-02-21 08:36:29
世界微速讯:田洪良:2月21日主要货币短线操作指南
从技术上来看,美指周一上涨在104 10之下遇阻,下跌在103 75之上受到支持,意味着美元上涨后有可能保持下跌的走势。如果美指今天上涨在104 05
-
2023-02-21 04:58:24
杜德克:也许梅西更适合巴萨,但C罗能在所有联赛、所有球队踢球
直播吧2月20日讯曾效力利物浦、皇马等球队的门将杜德克近日接受了阿斯报的采访,在采访中他谈到了西班牙国家德比,梅西与C罗的对比。杜德克:
-
2023-02-21 00:38:09
百世物流科技 中国有限公司北京分公司 天天快讯
1、百世物流科技(中国)有限公司北京分公司于2009年09月15日成立。2、法定代表人吴波,公司经营范围包括:技术开
-
2023-02-20 21:04:15
热头条丨1月中国实际使用外资金额同比增14.5%
(记者李晓喻)中国商务部20日发布的最新数据显示,1月全国实际使用外资金额1276 9亿元(人民币,下同),同比增长14 5%。分行业看,1月中国制造业
-
2023-02-20 18:22:20
面包中吃出上锈刀片?知名品牌:已报警
面包中吃出上锈刀片?知名品牌:已报警
-
2023-02-20 16:28:02
手机哪些功能最费电?想不到耗电大户竟是相机 没电千万别用 全球今日报
手机哪些功能最费电?想不到耗电大户竟是相机没电千万别用
-
2023-02-20 14:48:22
EBC外汇:利差交易是什么意思?如何运用利差套利?
在炒汇过程中,我们经常会听到“利差交易”一词,对炒汇新手来讲它是一个陌生的存在,更别说运用利差套利了。为帮助广大炒汇者获得投资收益...
-
2023-02-20 11:53:08
新款奥迪Q7就长这样?!
重磅新车奥迪Q7即将再次改款目前在售的这代奥迪Q7自2015年发布以来,在销量和关注度上始终没有收获太好的成效,由于车辆的外形设计不及前代霸
-
2023-02-20 10:16:13
世界热推荐:999感冒灵胶囊好用吗_999感冒灵胶囊
1、“18号全天吃了十颗”这已经药物过量了,本身感冒灵的负作用是嗜睡和虚弱感。2、一天3次,一次2粒,你多吃了4粒。3、
-
2023-02-20 08:39:04
开展路面养护维修 改善群众出行环境(创建全国文明城市)
市市政维护发展中心开展路面养护维修改善群众出行环境(创建全国文明城市)本报讯(记者黄亚楠)今年年初以来,市市政维护发展中心以“严”...
-
2023-02-20 05:51:07
扇贝肉如何保存新鲜 扇贝肉的保存方法-当前热门
1、最好的保存扇贝的方式就是采用冰冻的方法,冰冻的方法可以维持我们活扇贝的新鲜程度,同时用盐水泡一泡活扇贝同样可以达到一个非常不错的保
-
2023-02-20 00:53:51
南京鸡鸣寺_说一说南京鸡鸣寺的简介 全球视点
夏弥来为大家解答以下的问题,南京鸡鸣寺,说一说南京鸡鸣寺的简介,现在让我们一起来看看吧!1、鸡鸣寺位于南京市玄武区鸡笼山
-
2023-02-19 20:44:27
每日速讯:开完长安CS75Plus,换到博越Pro上,车友:对比后差别一清二楚
谈到国产SUV,很多消费者会给出较为正面的评价,因为国产车的发展国人看在眼中,在各方面的积极进取之心,让国产车的步伐迈得大而稳健。其中紧
-
2023-02-19 17:05:02
世界消息!福建这些集体和个人拟获先进表彰
国家通用语言文字推广普及工作表彰领导小组办公室最新公示福建3个先进集体和8位先进个人拟获表彰↓根据《教育部国家语委关于
-
2023-02-19 14:12:44
全国家庭医生岗位练兵暨风采展示,上海代表队获第一
上海市代表队来自奉贤西渡的全科医生柳理娜带领的“美少女”家医团队在激烈的全国赛中一路过关斩将,取得一等奖的佳绩。
-
2023-02-19 11:23:03
小米13 Ultra外观基本确定,最新渲染图曝光,据称可信度达90%
小米13Ultra外观基本确定,最新渲染图曝光,据称可信度达90%
-
2023-02-19 09:03:51
抓住机遇,与中国市场共成长|今日热讯
抓住机遇,与中国市场共成长---随着中国成为全球第二大商品消费市场,进口规模持续扩大、结构不断优化,外国不少中小企业通过进博会、消博会等
-
【ES三周年】高效搜索引擎ElasticSearch介绍|环球今亮点
2023-02-22 19:20:37 -
cad怎么测量不规则图形面积_cad怎么测量面积
2023-02-22 17:08:13 -
缓刑流程怎么执行_世界微资讯
2023-02-22 13:09:53 -
天天报道:广西荔浦市总工会:走访看望工匠 礼遇先进送奖上门
2023-02-22 11:06:25 -
收购碘化铂---苏州鑫聚宝贵金属有限公司 天天观察
2023-02-22 09:13:48 -
扶同绥县
2023-02-22 07:05:06 -
世界信息:目标3500亩!小榄把“工改”动员会开到村小组
2023-02-22 02:15:11