JVM 一月 05, 2025

arthas 异常排查(一) 一次内存泄露

文章字数 3.6k 阅读约需 3 mins.

图中的5638进程java程序内存已经来到了52%,即8G.肯定是不正常的.

curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar ...
查看全文

ES 八月 13, 2024

分布式原理

文章字数 23k 阅读约需 21 mins.

  • 服务性能受节点主机性能限制
  • 可用性差,主机或服务挂了就无法使用
  • 节点服务变更困难,若碰到需要重启服务才能生效的配置
  • 高可用性:集群可容忍部分节点宕机而保持服务的可用性和数据的完整性
  • 易扩展:当集群的性能不满足业务要求时,可以方便快速的扩容集群,而无需停止服务。
  • 高性能:集群通过负载均衡器分摊并发请求压力,可以大大提高集群的吞吐能力和并发能力。

但相应的,由于节点的增加,维护难度相应提升.

配置

elasticsearch.yml中可配置项

关键配置

  • cluster.name: 集群名称,唯...
查看全文

ES 八月 10, 2024

es常用命令

文章字数 3.3k 阅读约需 3 mins.

插入语句


POST dynamic_table_data_prod/_doc/20220913182809274319000002
{
  "id" : "20220913182809274319000002",
          "data" : {
            "姓名" : "横一",
            "公海" : "",
            "最后跟进时间" : "2022...
查看全文

ES 八月 08, 2024

java客户端

文章字数 37k 阅读约需 34 mins.

生命周期(生卒年:ES 0.9 - ES 7.x)

Java API在7.x之前使用的客户端名称叫TransportClient,从7.0.0开始,官方已经不建议使用TransportClient作为ES的Java客户端了,并且从8.0开始被彻底删除。

注意事项

  • TransportClient 使用transport模块(9300端口)远程连接到 Elasticsearch 集群,客户端并不加入集群,而是通过获取单个或者多个transport地址来以轮询的方式与他们通信。
  • TransportClient...
查看全文

ES 八月 06, 2024

推荐搜索

文章字数 9.5k 阅读约需 9 mins.

在用户输入时候,进行自动补正或错误纠正,提高搜索的精准度来提升用户的搜索体验.

term suggester

只基于tokenizer之后的单个term去匹配建议词,并不会考虑多个term之间的关系.

结构

POST <index>/_search
{ 
  "suggest": {
    "<suggest_name>": {
      "text": "<search_content>...
查看全文

ES 八月 06, 2024

Untitled

文章字数 9.4k 阅读约需 9 mins.

Elasticsearch没有内部对象的概念,因此,ES在存储复杂类型的时候会把对象的复杂层次结果扁平化为一个键值对列表。

例子

插入记录

POST nested_test/_doc
{
  "camera":{
    "type":"canon",
    "photo":[
        {
          "image":"yyy1",
          "score":6
        }...
查看全文

ES 十二月 21, 2023

脚本查询 scripting

文章字数 34k 阅读约需 31 mins.

​ Scripting是ES支持的一种专门用于复杂场景下支持自定义编程的强大的脚本功能,ES支持多种脚本语言,如painless,其语法类似于Java,也有注释、关键字、类型、变量、函数等,其就要相对于其他脚本高出几倍的性能,并且安全可靠,可以用于内联和存储脚本。

groovy: 即es 1.4.x - 5.0 的默认脚本语言.

painless: es5.0之后的默认脚本语言.

expression: 每个文档的开销较低,表达式的作用更多,可以非常快速地执行.但只能访问数值,布尔值,日期与geo_point...

查看全文

ES 十二月 10, 2023

es概念

文章字数 9.1k 阅读约需 8 mins.

​ Elasticsearch 是一种分布式文档存储。Elasticsearch 存储的是序列化为 JSON 文档的复杂数据结构,而不是以列数据行的形式存储信息。当集群中有多个 Elasticsearch 节点时,存储的文档会分布在整个集群中,可以从任意节点立即访问。

​ 文档存储后,会在 1 秒钟内编制索引并进行完全实时搜索。Elasticsearch 使用一种称为倒排索引的数据结构,支持非常快速的全文检索。倒排索引列出了任何文档中出现的每一个单词,并能识别每个单词出现的所有文档。

​ 索引可...

查看全文

KAFKA 五月 25, 2023

kafka安装

文章字数 87 阅读约需 1 mins.

文章 五月 25, 2023

kafka(一) 概述

文章字数 3.4k 阅读约需 3 mins.

​ Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以收集并处理用户在网站中的所有动作流数据以及物联网设备的采样信息。

broker

集群的基本单位,一台kafka服务器即为一个broker.多个broker组成一个kafka集群,broker之间没有主从之分,地位都是平等的.

topic 主题

主题,每条消息发布到kafka的一个类别,用于区分消费.物理上不同的topic的消息分开存储,逻辑...

查看全文
加载更多
0%