您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > ElasticSearch技术分享
ElasticSearch延时符目录ContentsAnalyzer内部机制存储模型节点分类Write实现原理Read实现原理02延时符Analyzer内部机制0401字符过滤器(characterfilter)他们的任务实在分词前整理字符串,可以用来去掉HTML标签,或者将&转化成“and”02分词器(tokenization)一个简单的分词器遇到空格和标点的时候,会将文本拆成词条03Token过滤器(Tokenfiltering)最后,词条按顺序通过每个Token过滤器,这个过程可能会改变词条(例如小写化,删除无用词或增加同义词)延时符Analyzer内部机制04延时符0501标准分析器(StandardAnalyzer)02简单分析器(SimpleAnalyzer)03空白分析器(WhitespaceAnalyzer)04停止分析器(StopAnalyzer)05语言分析器(LanguageAnalyzers)06关键词分析器(KeywordAnalyzer)延时符0708模式分析器(PatternAnalyzer)指纹分析器(FingerprintAnalyzer)内置分析器存储模型0401设有两篇文章1和2文章1的内容为:TomlivesinGuangzhou,IliveinGuangzhoutoo文章2的内容为:HeoncelivedinShanghai.02经过处理后(分词,过滤无用词,小写化):文章1的所有关键词为:[tom][live][guangzhou][i][live][guangzhou]文章2的所有关键词为:[he][live][shanghai]03建立倒排索引关键词文章号[出现频率]出现位置guangzhou1[2]3,6he2[1]1i1[1]4live1[2]2,52[1]2shanghai2[1]3tom1[1]1延时符节点分类0401默认节点(node.master:trueANDnode.data:true)默认值,既有成为主节点的资格,又可以存储数据,还可以处理客户端的请求02Master节点(node.master:trueANDnode.data:false)有成为主节点的资格,可以参与选举,master节点负责维护整个集群状态并保证数据一致性03Data节点(node.master:falseANDnode.data:true)存储数据节点,提供建立索引和查询索引的服务延时符03Client节点(node.master:falseANDnode.data:false)又称coordinate节点和ingest节点,这些节点只负责处理用户请求,实现请求转发,负载均衡等功能write(写)/create(创建)操作实现原理07延时符协调节点(coordinatingnode)使用文档ID(默认)将文档路由到对应的分片。Elasticsearch将文档ID以murmur3作为散列函数进行散列,并通过索引中的主分片数量进行取模运算,以确定文档应被索引到哪个分片。shard=hash(document_id)%(num_of_primary_shards)Read的实现原理08延时符获取阶段(FetchPhase)查询阶段(QueryPhase)39结束语conclusion概述:ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。摘要:我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的。我们希望搜索解决方案要运行速度快,我们希望能有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP来索引数据,我们希望我们的搜索服务器始终可用,我们希望能够从一台开始并扩展到数百台,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。因此我们利用Elasticsearch来解决所有这些问题及可能出现的更多其它问题。延时符感谢各位同僚的观看!延时符
本文标题:ElasticSearch技术分享
链接地址:https://www.777doc.com/doc-3364465 .html