Меня зовут Игорь Сидоренко, я техлид в команде админов, поддерживающих в рабочем состоянии всю инфраструктуру Домклик.

Хочу поделиться своим опытом в настройке распределённого хранения данных в Elasticsearch. Мы рассмотрим, какие настройки на нодах отвечают за распределение шардов, как устроен и работает ILM.

Те, кто работают с логами, так или иначе сталкиваются с проблемой долгосрочного хранение для последующего анализа. В Elasticsearch это особенно актуально, потому что с функциональностью куратора всё было прискорбно. В версии 6.6 появился функционал ILM. Он состоит из 4 фаз:

Hot индекс активно обновляется и запрашивается.
Warm индекс больше не обновляется, но всё ещё запрашивается.
Cold индекс больше не обновляется и редко запрашивается. Информация всё ещё должна быть доступна для поиска, но запросы могут выполняться медленнее.
Delete индекс больше не нужен и может быть безопасно удален.

Дано

Elasticsearch Data Hot: 24 процессора, 128 Гб памяти, 1,8 Тб SSD RAID 10 (8 нод).
Elasticsearch Data Warm: 24 процессора, 64 Гб памяти, 8 Тб NetApp SSD Policy (4 ноды).
Elasticsearch Data Cold: 8 процессоров, 32 Гб памяти, 128 Тб HDD RAID 10 (4 ноды).

Цель

Эти настройки индивидуальны, всё зависит от места на нодах, количества индексов, логов и т.д. У нас это 2-3 Тб данных за сутки.

5 дней фаза Hot (8 основных / 1 реплика).
20 дней фаза Warm (shrink-индекс 4 основных / 1 реплика).
90 дней фаза Cold (freeze-индекс 4 основных / 1 реплика).
120 дней фаза Delete.

Настройка Elasticsearch

Для распределения шард по нодам нужен всего один параметр:

Hot-ноды:

~]# cat /etc/elasticsearch/elasticsearch.yml | grep attr# Add custom attributes to the node:node.attr.box_type: hot

Warm-ноды:

~]# cat /etc/elasticsearch/elasticsearch.yml | grep attr# Add custom attributes to the node:node.attr.box_type: warm

Cold-ноды:

~]# cat /etc/elasticsearch/elasticsearch.yml | grep attr# Add custom attributes to the node:node.attr.box_type: cold

Настройка Logstash

Как это всё работает и как мы реализовали эту функцию? Давайте начнем с попадания логов в Elasticsearch. Есть два способа:

Logstash забирает логи из Kafka. Может забрать чистыми или преобразовать на своей стороне.
Что-то само пишет в Elasticsearch, например, APM-сервер.

Рассмотрим пример управления индексами через Logstash. Он создает индекс и применяет к нему шаблон индекса и соответствующий ILM.

k8s-ingress.conf

input {    kafka {        bootstrap_servers => "node01, node02, node03"        topics => ["ingress-k8s"]        decorate_events => false        codec => "json"    }}filter {    ruby {        path => "/etc/logstash/conf.d/k8s-normalize.rb"    }    if [log] =~ "\[warn\]" or [log] =~ "\[error\]" or [log] =~ "\[notice\]" or [log] =~ "\[alert\]" {        grok {            match => { "log" => "%{DATA:[nginx][error][time]} \[%{DATA:[nginx][error][level]}\] %{NUMBER:[nginx][error][pid]}#%{NUMBER:[nginx][error][tid]}: \*%{NUMBER:[nginx][error][connection_id]} %{DATA:[nginx][error][message]}, client: %{IPORHOST:[nginx][error][remote_ip]}, server: %{DATA:[nginx][error][server]}, request: \"%{WORD:[nginx][error][method]} %{DATA:[nginx][error][url]} HTTP/%{NUMBER:[nginx][error][http_version]}\", (?:upstream: \"%{DATA:[nginx][error][upstream][proto]}://%{DATA:[nginx][error][upstream][host]}:%{DATA:[nginx][error][upstream][port]}/%{DATA:[nginx][error][upstream][url]}\", )?host: \"%{DATA:[nginx][error][host]}\"(?:, referrer: \"%{DATA:[nginx][error][referrer]}\")?" }            remove_field => "log"        }    }    else {        grok {            match => { "log" => "%{IPORHOST:[nginx][access][host]} - \[%{IPORHOST:[nginx][access][remote_ip]}\] - %{DATA:[nginx][access][remote_user]} \[%{HTTPDATE:[nginx][access][time]}\] \"%{WORD:[nginx][access][method]} %{DATA:[nginx][access][url]} HTTP/%{NUMBER:[nginx][access][http_version]}\" %{NUMBER:[nginx][access][response_code]} %{NUMBER:[nginx][access][bytes_sent]} \"%{DATA:[nginx][access][referrer]}\" \"%{DATA:[nginx][access][agent]}\" %{NUMBER:[nginx][access][request_lenght]} %{NUMBER:[nginx][access][request_time]} \[%{DATA:[nginx][access][upstream][name]}\] (?:-|%{IPORHOST:[nginx][access][upstream][addr]}:%{NUMBER:[nginx][access][upstream][port]}) (?:-|%{NUMBER:[nginx][access][upstream][response_lenght]}) %{DATA:[nginx][access][upstream][response_time]} %{DATA:[nginx][access][upstream][status]} %{DATA:[nginx][access][request_id]}" }            remove_field => "log"        }    }}output {    elasticsearch {        id => "k8s-ingress"        hosts => ["node01", "node02", "node03", "node04", "node05", "node06", "node07", "node08"]        manage_template => true # включаем управление шаблонами        template_name => "k8s-ingress" # имя применяемого шаблона        ilm_enabled => true # включаем управление ILM        ilm_rollover_alias => "k8s-ingress" # alias для записи в индексы, должен быть уникальным        ilm_pattern => "{now/d}-000001" # шаблон для создания индексов, может быть как "{now/d}-000001" так и "000001"        ilm_policy => "k8s-ingress" # политика прикрепляемая к индексу        index => "k8s-ingress-%{+YYYY.MM.dd}" # название создаваемого индекса, может содержать %{+YYYY.MM.dd}, зависит от ilm_pattern    }}

Настройка Kibana

Есть базовый шаблон, который применяется ко всем новым индексам. Он задаёт распределение горячих индексов, количество шардов, реплик и т.д. Вес шаблона определяется опцией order. Шаблоны с более высоким весом переопределяют уже существующие параметры шаблона или добавляют новые.

GET _template/default

{  "default" : {    "order" : -1, # вес шаблона    "version" : 1,    "index_patterns" : [      "*" # применяем ко всем индексам    ],    "settings" : {      "index" : {        "codec" : "best_compression", # уровень сжатия        "routing" : {          "allocation" : {            "require" : {              "box_type" : "hot" # распределяем только по горячим нодам            },            "total_shards_per_node" : "8" # максимальное количество шардов на ноду от одного индекса          }        },        "refresh_interval" : "5s", # интервал обновления индекса        "number_of_shards" : "8", # количество шардов        "auto_expand_replicas" : "0-1", # количество реплик на ноду от одного индекса        "number_of_replicas" : "1" # количество реплик      }    },    "mappings" : {      "_meta" : { },      "_source" : { },      "properties" : { }    },    "aliases" : { }  }}

Затем применим маппинг к индексам k8s-ingress-* с помощью шаблона с более высоким весом.

GET _template/k8s-ingress

{  "k8s-ingress" : {    "order" : 100,    "index_patterns" : [      "k8s-ingress-*"    ],    "settings" : {      "index" : {        "lifecycle" : {          "name" : "k8s-ingress",          "rollover_alias" : "k8s-ingress"        },        "codec" : "best_compression",        "routing" : {          "allocation" : {            "require" : {              "box_type" : "hot"            }          }        },        "number_of_shards" : "8",        "number_of_replicas" : "1"      }    },    "mappings" : {      "numeric_detection" : false,      "_meta" : { },      "_source" : { },      "dynamic_templates" : [        {          "all_fields" : {            "mapping" : {              "index" : false,              "type" : "text"            },            "match" : "*"          }        }      ],      "date_detection" : false,      "properties" : {        "kubernetes" : {          "type" : "object",          "properties" : {            "container_name" : {              "type" : "keyword"            },            "container_hash" : {              "index" : false,              "type" : "keyword"            },            "host" : {              "type" : "keyword"            },            "annotations" : {              "type" : "object",              "properties" : {                "value" : {                  "index" : false,                  "type" : "text"                },                "key" : {                  "index" : false,                  "type" : "keyword"                }              }            },            "docker_id" : {              "index" : false,              "type" : "keyword"            },            "pod_id" : {              "type" : "keyword"            },            "labels" : {              "type" : "object",              "properties" : {                "value" : {                  "type" : "keyword"                },                "key" : {                  "type" : "keyword"                }              }            },            "namespace_name" : {              "type" : "keyword"            },            "pod_name" : {              "type" : "keyword"            }          }        },        "@timestamp" : {          "type" : "date"        },        "nginx" : {          "type" : "object",          "properties" : {            "access" : {              "type" : "object",              "properties" : {                "agent" : {                  "type" : "text"                },                "response_code" : {                  "type" : "integer"                },                "upstream" : {                  "type" : "object",                  "properties" : {                    "port" : {                      "type" : "keyword"                    },                    "name" : {                      "type" : "keyword"                    },                    "response_lenght" : {                      "type" : "integer"                    },                    "response_time" : {                      "index" : false,                      "type" : "text"                    },                    "addr" : {                      "type" : "keyword"                    },                    "status" : {                      "index" : false,                      "type" : "text"                    }                  }                },                "method" : {                  "type" : "keyword"                },                "http_version" : {                  "type" : "keyword"                },                "bytes_sent" : {                  "type" : "integer"                },                "request_lenght" : {                  "type" : "integer"                },                "url" : {                  "type" : "text",                  "fields" : {                    "keyword" : {                      "type" : "keyword"                    }                  }                },                "remote_user" : {                  "type" : "text"                },                "referrer" : {                  "type" : "text"                },                "remote_ip" : {                  "type" : "ip"                },                "request_time" : {                  "format" : "yyyy/MM/dd HH:mm:ss||yyyy/MM/dd||epoch_millis||dd/MMM/YYYY:H:m:s Z",                  "type" : "date"                },                "host" : {                  "type" : "keyword"                },                "time" : {                  "format" : "yyyy/MM/dd HH:mm:ss||yyyy/MM/dd||epoch_millis||dd/MMM/YYYY:H:m:s Z",                  "type" : "date"                }              }            },            "error" : {              "type" : "object",              "properties" : {                "server" : {                  "type" : "keyword"                },                "upstream" : {                  "type" : "object",                  "properties" : {                    "port" : {                      "type" : "keyword"                    },                    "proto" : {                      "type" : "keyword"                    },                    "host" : {                      "type" : "keyword"                    },                    "url" : {                      "type" : "text",                      "fields" : {                        "keyword" : {                          "type" : "keyword"                        }                      }                    }                  }                },                "method" : {                  "type" : "keyword"                },                "level" : {                  "type" : "keyword"                },                "http_version" : {                  "type" : "keyword"                },                "pid" : {                  "index" : false,                  "type" : "integer"                },                "message" : {                  "type" : "text"                },                "tid" : {                  "index" : false,                  "type" : "keyword"                },                "url" : {                  "type" : "text",                  "fields" : {                    "keyword" : {                      "type" : "keyword"                    }                  }                },                "referrer" : {                  "type" : "text"                },                "remote_ip" : {                  "type" : "ip"                },                "connection_id" : {                  "index" : false,                  "type" : "keyword"                },                "host" : {                  "type" : "keyword"                },                "time" : {                  "format" : "yyyy/MM/dd HH:mm:ss||yyyy/MM/dd||epoch_millis||dd/MMM/YYYY:H:m:s Z",                  "type" : "date"                }              }            }          }        },        "log" : {          "type" : "text"        },        "@version" : {          "type" : "text",          "fields" : {            "keyword" : {              "ignore_above" : 256,              "type" : "keyword"            }          }        },        "eventtime" : {          "type" : "float"        }      }    },    "aliases" : { }  }}

После применения всех шаблонов мы применяем ILM-политику и начинаем следить за жизнью индексов.

GET _ilm/policy/k8s-ingress

{  "k8s-ingress" : {    "version" : 14,    "modified_date" : "2020-06-11T10:27:01.448Z",    "policy" : {      "phases" : {        "warm" : { # теплая фаза          "min_age" : "5d", # срок жизни индекса после ротации до наступления теплой фазы          "actions" : {            "allocate" : {              "include" : { },              "exclude" : { },              "require" : {                "box_type" : "warm" # куда перемещаем индекс              }            },            "shrink" : {              "number_of_shards" : 4 # обрезание индексов, т.к. у нас 4 ноды            }          }        },        "cold" : { # холодная фаза          "min_age" : "25d", # срок жизни индекса после ротации до наступления холодной фазы          "actions" : {            "allocate" : {              "include" : { },              "exclude" : { },              "require" : {                "box_type" : "cold" # куда перемещаем индекс              }            },            "freeze" : { } # замораживаем для оптимизации          }        },        "hot" : { # горячая фаза          "min_age" : "0ms",          "actions" : {            "rollover" : {              "max_size" : "50gb", # максимальный размер индекса до ротации (будет х2, т.к. есть 1 реплика)              "max_age" : "1d" # максимальный срок жизни индекса до ротации            },            "set_priority" : {              "priority" : 100            }          }        },        "delete" : { # фаза удаления          "min_age" : "120d", # максимальный срок жизни после ротации перед удалением          "actions" : {            "delete" : { }          }        }      }    }  }}

Проблемы

Были проблемы на этапе настройки и отладки.

Hot-фаза

Для корректной ротации индексов критично присутствие в конце index_name-date-000026 чисел формата 000001. В коде есть строчки, которые проверяют индексы с помощью регулярного выражения на наличие чисел в конце. Иначе будет ошибка, к индексу не применятся политики и он всегда будет в hot-фазе.

Warm-фаза

Shrink (обрезание) уменьшение количества шардов, потому что нод в теплой и холодной фазах у нас по 4. В документации есть такие строчки:

The index must be read-only.

A copy of every shard in the index must reside on the same node.

The cluster health status must be green.

Чтобы урезать индекс, Elasticsearch перемещает все основные (primary) шарды на одну ноду, дублирует урезанный индекс с необходимыми параметрами, а потом удаляет старый. Параметр total_shards_per_node должен быть равен или больше количества основных шардов, чтобы уместить их на одной ноде. В противном случае будут уведомления и шарды не переедут на нужные ноды.

GET /shrink-k8s-ingress-2020.06.06-000025/_settings

{  "shrink-k8s-ingress-2020.06.06-000025" : {    "settings" : {      "index" : {        "refresh_interval" : "5s",        "auto_expand_replicas" : "0-1",        "blocks" : {          "write" : "true"        },        "provided_name" : "shrink-k8s-ingress-2020.06.06-000025",        "creation_date" : "1592225525569",        "priority" : "100",        "number_of_replicas" : "1",        "uuid" : "psF4MiFGQRmi8EstYUQS4w",        "version" : {          "created" : "7060299",          "upgraded" : "7060299"        },        "lifecycle" : {          "name" : "k8s-ingress",          "rollover_alias" : "k8s-ingress",          "indexing_complete" : "true"        },        "codec" : "best_compression",        "routing" : {          "allocation" : {            "initial_recovery" : {              "_id" : "_Le0Ww96RZ-o76bEPAWWag"            },            "require" : {              "_id" : null,              "box_type" : "cold"            },            "total_shards_per_node" : "8"          }        },        "number_of_shards" : "4",        "routing_partition_size" : "1",        "resize" : {          "source" : {            "name" : "k8s-ingress-2020.06.06-000025",            "uuid" : "gNhYixO6Skqi54lBjg5bpQ"          }        }      }    }  }}

Cold-фаза

Freeze (заморозка) мы замораживаем индекс для оптимизации запросов по историческим данным.

Searches performed on frozen indices use the small, dedicated, search_throttled threadpool to control the number of concurrent searches that hit frozen shards on each node. This limits the amount of extra memory required for the transient data structures corresponding to frozen shards, which consequently protects nodes against excessive memory consumption.
Frozen indices are read-only: you cannot index into them.
Searches on frozen indices are expected to execute slowly. Frozen indices are not intended for high search load. It is possible that a search of a frozen index may take seconds or minutes to complete, even if the same searches completed in milliseconds when the indices were not frozen.

Итоги

Мы научились подготавливать ноды для работы с ILM, настроили шаблон для распределения шардов по горячим нодам и настроили ILM на индекс со всеми фазами жизни.

Полезные ссылки

https://www.elastic.co/guide/en/elasticsearch/reference/master/index-lifecycle-management-api.html
https://www.elastic.co/guide/en/elasticsearch/reference/master/recovery-prioritization.html
https://www.elastic.co/guide/en/elasticsearch/reference/master/indices-shrink-index.html#indices-shrink-index
https://www.elastic.co/guide/en/elasticsearch/reference/master/frozen-indices.html
https://www.elastic.co/guide/en/elasticsearch/reference/master/modules-cluster.html#shard-allocation-awareness

Всем привет, меня зовут Семён и я руковожу разработкой витрины объектов недвижимости в ДомКлик. В прошлой части этой серии статей мы поговорили про самую трудоёмкую область работы тимлида работу с людьми. Сегодня я расскажу про не менее важную тему для любого тимлида технологии. Насколько крут должен быть тимлид технически? Должен ли он писать код? Отвечает ли тимлид за техническое состояние своего хозяйства

Инструкция по диагностике проблем в работе баз данных в случае аварии.

Привет. У каждого на работе иногда случаются чёрные дни. Для меня такими днями являются аварии в работе сервисов, приводящие к недоступности систем для конечных пользователей. По счастью, т

В конце прошлого года на сайте State of JS 2020 было опубликовано исследование о состоянии экосистемы JavaScript в 2020 году с ретроспективой на предыдущие годы развития. Исследование основывалось на многочисленных опросах, в которых суммарно приняли участие более 23 тысяч человек из 137 стран мира.

Всем привет. Сегодня я бы хотел поделиться рецептом установки утилиты PGHero с подключением нескольких баз данных. PGHero это простенькая утилита, написанная на Ruby, с минималистичным дашбордом для мониторинга производительности БД PostgreSQL.

Что может показа

Сложность эксплуатации ИТ-систем растёт. Приходится управлять данными в локальных системах и облачных дата-центрах, передавать зависимости между разрозненными платформами, интегрировать и настраивать новые инструменты и технологии. Потребность в быстрых изменениях и получении

PostgreSQL хранит данные на каких-то носителях. И между PostgreSQL и, например, магнитной поверхностью диска находится несколько кешей: кеш самого винчестера, кеш RAID-контроллера или винчестерной полки, кеш файловой системы на уровне операционной системы и кеш самого PostgreSQL. Если первыми перечисленными кешами мы практический не можем управлять, то последними, находящимися в ОЗУ сервера, управлять можем: наприм

Мало того, что многие не доверяют общедоступным облакам, так они еще и предлагают непозволительно малые объемы дискового пространства.

Однажды мне понадобилось 1Tb облачного хранилища и выбор пал на Nextcloud, который и было решено развернуть на собственном домашнем сервере

В данной статье я опишу как быстро и безболезненно установить и настроить облако Nextcloud и облачный редактор Onlyoffice

Статья предполага

7го июня компания Apple провела свою ежегодную конференцию для разработчиков - WWDC (Worldwide Developers Conference), на которой, помимо всего, была представлена новая версия macOS - Monterey. Спустя некоторое время стала доступна бета-версия, про которую, сегодня, и пойдет

Технический прогресс не стоит на месте, появляются новые компьютерные архитектуры, компиляторы становятся умнее и генерируют более быстрый машинный код. Современные задачи требуют все более креативного и эффективного решения. В данной статье пойдет речь, на мой взгляд, про

Всем привет!

Продолжаем дайджесты новостей и других материалов о свободном и открытом ПО и немного о железе. Всё самое главное про пингвинов и не только, в России и мире.

Главные темы нового выпуска:

Facebook открыл доступ к самой большой языковой базе для разработч

Да, понимаю, что это игра про учёных, но это не игра про немого учёного с монтировкой с цифрой 3, которую все ждут. Что вышло за 4 года разработки.

Официальное описание: Научная станция в глубоком космосе перестала отвечать на запросы. Что там произошло? Вы агент, прибывший выяснить, что случилось и Ваша задача спасти важное открытие, сделанное на станции.

Ученые находятся в комнатах с колбами. Система по очереди откр

Очень много людей с самым разным бэкграундом, и не всегда даже техническим, в последнее время пытаются перейти в data science. И такой ажиотажный интерес - проблема для всех, кто рассматривает переквалификацию в эту сферу. Потому что рынок труда может оказаться наводнён соискателям без опыта.

С точки зрения потенциального работодателя: вы скорее возьмёте выпускника технического вуза, или человека за 40, без профильного опыта

Всем привет! Меня зовут Александр и я пишу код для 2ip.ru. За добрую половину сервисов можно пинать меня, готов отбиваться. Cегодня я хочу немного рассказать про переделку одного нашего старого сервиса. Это конечно не "big data", но всё равно довольно большие объемы информации, поэтому думаю будет интересно.

Речь пойдет про

Мы долго шли к этому и вот наконец! Наш внутренний RamblerMeetup&Usermodel выходит в свет! Уже 30 июня эксперты поделятся своими кейсами в области ML и Big Data.

Митап пройдет в онлайн-формате, начало в 19:00. Обязательна предварительная

Всем привет!

В недавней статье мы рассказали, как мы шли к построению нашей Data Platform. Сегодня хотелось бы глубже погрузиться в желудок нашей платформы и попутно рассказать вам о том, как мы решали одну из задач, которая возникла в связи с ростом разнообразия интегрируемых источников данных.

То есть, если возвращаться к финальной картинке из упомянутой выше статьи (специально дублирую ее, чтобы уважаемым чи

Можно выделить ряд алгоритмов, которые являются базовыми и лежат в основе практически каждой строчки программ, написанных на языках высокого уровня. Хорошо иметь под руками классический многотомный труд Дональда Кнута "The Art of Computer Programming", там детально разобраны многие ба

Иллюстрация: UCI

Наша [Ирвинга Капланского и Пола Халмоша] общая философия в отношении линейной алгебры такова: мы думаем в безбазисных терминах, пишем в безбазисных терминах, но когда доходит до серьезно

IT-технологии развиваются с каждым годом. Многие корпорации полным ходом развивают технологические подходы в области сбора и обработки полученной информации. Одним из таких подходов является использование баз данных цифровых отпечатков пользователей сети Интернет.

Отпеч

Если вам нужно найти фотографию, сделанную на пикнике несколько лет назад, вряд ли вы помните имя, которое камера автоматически присвоила файлу в момент съёмки, например, 2017-07-04 12.37.54.jpg.Вы просматриваете всё подряд фотографии, их эскизы, пытаетесь определить

В один прекрасный день в конце 2020 года мы решили сделать еще один агрегатор удаленных вакансий, начав с исключительно IT-позиций. Логично спросить: зачем? Мол, на ры

В старых и новых приложениях незаметно начинает появляться инструмент, упрощающий взаимодействие и ускоряющий выполнение действий. Это мощное поле поиска, которое я называю power bar; иногда оно имеет название command palette.

Power bar, похожая на поиск Spotlight в macOS, встраивается в приложение и обычно вызывается сочетанием горячих клавиш CMD+K (или CMD+SHIFT+P). После её вызова пользователь вводит в неё

Весной 2021 проходит шестой запуск проектно-образовательных интенсивов Университета 20.35: студенты из 40+ вузов объединились в команды вокруг собственных идей или бизнес-задач от компаний

Выведение сайта в топ поисковой выдачи это тот результат, ради которого чаще всего заказывают SEO-услуги. Но обеспечить его могут не все. Есть компании, которые лишь создают видимость продвижения. Низкую эффективность объясняют жесткой конкуренцией, хотя при заключении договора гарантированно обещали место в топе. Чтобы избежать напрасных трат денег, давайте разбираться, является ли возможным гарантирование результата SEO-продвижен

Большую часть своей жизни я жил и работал в Москве. Занимался тем, что менял здоровье на деньги. Правда, на очень хорошие, поэтому под занавес пятого десятка купил квартиру в тихом приморском городке, далеко от столичной суеты и ежедневной нервотрёпки.

Особой необходимости в работе у меня не было. Дети уже стали самостоятельными настолько, что запросто могут содержать нас с женой. Да и скопить удалось прилично. Однако, были

Я учусь иллюстрировать сложные процессы с помощью комиксов. Нашла себе в копилку крутой кейс: как с помощью комиксов про милых выдр можно ребенку объяснить такую сложную штуку как Apache Kafka,

В Kubernetes не так-то просто что-то удалить вы уверены, что удалили объект, но оказывается, что он все еще присутствует в кластере. Вы, конечно, можете выполнять команду kubectl delete в повседневных операциях и надеяться на лучшее, но знание принципов работы

Что такое single sign-on?

Технология единого входа (Single sign-on SSO) метод аутентификации, который позволяет пользователям безопасно аутентифицироваться сразу в нескольких приложениях и сайтах, используя один набор учетных данных.

Как работает SSO?

SSO базируется на настройке доверительных отношений между приложением, известным как провайдер услуг, и системой управления до

Сегодня, в третьей части серии материалов, посвящённых разработке серверов на Go, мы займёмся реализацией нашего REST-сервера с использованием Gin одного из самых популярных веб-фреймворков для Go. Вот

Технология единого входа обладает массой преимуществ по сравнению с классическими методами аутентификации, главное из которых заключается в том, что именно SSO обеспечивает наилучший баланс между удобством пользователя и информационной безопасностью предприятия. Ранее мы уже рассказывали о том, как реализовать SSO в Zimbra OSE при использовании аутентификации в Active Directory с помощью Kerberos. На этот раз мы

Бесспорно, интерфейс Gravitee представляет достаточно наглядные и удобные средства визуализации работы шлюзов Gravitee. Но в любом случае, возникает потребность предоставить доступ к этим инструментам службе мониторинга, владельцам или потребителям API и при этом они могут находится вне закрытого контура, в котором расположен менеджер API. Да и иметь всю доступную информацию по различным API на одном экране всегда удобнее.
Виде

Всем привет! Меня всё ещё зовут Антон. В предыдущейстатьея провел небольшой обзор APIM Gravitee и в целом систем типа API Management. В этой статье я расскажу,как поднять ознакомительный стенд APIM Gravitee (https://www.gravitee.io), рассмотрим архитектуру системы, содержимое docker compose file, добавим некотор

Перевод материала подготовлен в рамках практического интенсива Централизованные системы логирования Elastic stack.

Пытались ли вы когда-нибудь искать объекты на из

В комментариях к моему туториалу, рассказывающему о парсинге логов с помощью Fluent-bit, было приведено две альтернативы: Filebeat и Vector. Этот туториал рассказывает как

Не так давно передо мной встала задача организации логгирования сервисов, разворачиваемых с помощью docker контейнеров. В интернете нашел примеры простого логгирования контейнеров, однако хотелось большего. Изучив возможности Fluent-bit я собрал рабочий пайплайн трансформации логов. Что в сочетании с Elasticsearch и Kibana, позволило быстро искать и анализировать лог-сообщения.

Цель туториала: организовать л

Каждый индекс Elasticsearch состоит из шардов. Шарды это логическое и физическое разделение индекса. В этой статье мы расскажем о сайзинге шардов Elasticsearch важной его части, серьёзно влияющей на производительность кластера. В высоконагруженных системах выбор правильной конфигурации архитектуры хранения позв

Скачать Cheatsheet по запросам PromQL

Начало работы с PromQL может быть непростым, если вы только начинаете свое путешествие в увлекательный мир Prometheus. Это руководство поможет понять принципы его работы, статья включает интересные и полезные советы, необходимые для начала работы.

Поск

Всем привет. В этом посте я расскажу про pgSCV - новый экспортер метрик для PostgreSQL (и не только), чем он так хорош и какие проблемы решает.

Наверняка все кто используют Prometheus и PostgreSQL сталкивались и с postgres_exporter. Этот экспортер довольно легко запуститьи начать им пользоваться. Также у него есть возможности для расширения, на основе своего запроса можно описать метрики иснимать их. Если есть хорошие знания

В последних релизах Zabbix "из коробки" стал поддерживать некоторые популярные протоколы промышленного оборудования. Имея поддержку Modbus и MQTT, его использование с системами промышленной автоматизации стало чуточку проще. Но подобный подход к мониторингу такого рода оборуд

В прошлом году популярный сервис мониторинга Zabbix представил Agent 2, призванный сократить число TCP-подключений и обеспечить удобную расширяемость за счёт плагинов на Golang.

Меня зовут Даша, и я один из разработчиков плагина мониторинга PostgreSQL для Zabbix Agent 2. В этой статье я расскажу об основных фишках использования Zabbix Agent 2 для мониторинга PostgreSQL, о принципе работы плагина, дам советы по его настройке,

Я системный администратор, более 20 лет занимаюсь управлением и мониторингом критичной в масштабах страны инфраструктуры. Услуги, которые я администрирую, предоставляются по модели SaaS (Software as a Service аренда ПО). Это моя первая публикация, я решил поделиться своими наработками в этой области, возможно кому-то это будет полезно.

Введение

Zabbix поддерживает несколько баз данных, но под рассмотрение попали только MySQL и PostgreSQL, как наиболее подходящие под мою установку. PostgreSQL с его repomgr и pgbouncer или каким-нибудь stolon с одной стороны и MySQL Group Replication с другой. Из-за использования MySQL в текущей конфигурации и тяге к стандартной комплектации, выбор пал на второй вариант.

Так что же такое MySQL Group Replication. Как

Речь пойдет про

Термин бережливого производства (Lean) в настоящее время на слуху. Мы все знаем результаты применения данной идеи в компании Toyota, которые позволили выпускать малые партии комплектующих точно в срок (Just-In-Time, JIT).

В книге Microsoft Secrets (1995 года) авторы (Кузумано и Ричард Селби) описали подходы контроля качества схожие с Lean применяемым в Toyota.

Выпуск малыми партиями как нельзя лучше подходит для разра

Паша Финкельштейн разработчик, серийный спикер, автор и ведущий нескольких подкастов. На конференции Java Meeting Point он сделает доклад Spark: let's touch it, на котором познакомит участников с миром бо

Привет, Хабр! Команда ВТБ запустила серию подкастов о передовых решениях финтеха Деньги любят техно. Журналист, технологический обозреватель Марина Эфендиева будет обсуждать с экспертами банка, рынка, учеными и бизнесменами перспективы и сложности финтеха: внедрения техноло

Представьте, что вы, например, bitly то есть очень большой сервис сокращения ссылок. И вот, вы хотите скопировать свои 150 ТБ сжатых данных с одного физического кластера на другой, новый. Чтобы сделать это, вы запускаете distcp из набора инструментов hadoop и рады тому, наско

Внимание! Если данная статья наберет 1000 положительных голосов, то я организую хакатон по алготрейдингу с ценными призами.

Предыдущая статья о "Расчете дневного изменения цены"

Когда я писал прошлую статью (она была первой из цикла) я не предполагал, что читатели разделятся на 2 категории:
1. Те, кто верят, что в алготрейдинг
2. Те, кто верят, что я

Хочу поделит

	Русский
	English

Долгосрочное хранение данных в Elasticsearch

Дано

Цель

Настройка Elasticsearch

Настройка Logstash

Настройка Kibana

Проблемы

Hot-фаза

Warm-фаза

Cold-фаза

Итоги

Полезные ссылки

Сейчас читают

Блог компании домклик

Быть тимлидом, ч2 Технологии

Выдерни шнур, выдави стекло

Экосистема JavaScript тренды в 2021 году. Всё ли так однозначно?

PGHero дашборд для мониторинга БД PostgeSQL

Перевод Почему нужно автоматизировать эксплуатацию

Кеш бывает разным

*nix

Быстрый запуск Nextcloud и Onlyoffice на Ubuntu SSL от Letsencrypt

Recovery mode macOS 12 Monterey новая ОС от Apple

MacOS 12 Monterey новая ОС от Apple

Recovery mode Сборка ядра Linux 5.12.10 c LLVM 12 Clang и LTO оптимизацией

FOSS News 74 дайджест материалов о свободном и открытом ПО за 713 июня 2021 года

Свой ремейк ZX игры Reskue в Steam

Big data

Стоит ли смотреть в сторону Data science?

Как мы весь интернет сканировали

RamblerMeetupampUsermodel

Что нам стоит загрузить JSON в Data Platform

Запросить 100 серверов нельзя оптимизировать код. Ставим запятую

Перевод Линейная алгебра для исследователей данных

Поисковые технологии

Наша анонимность утрачена?

Перевод Как работает поиск изображений в Dropbox

Как мы запустили агрегатор удаленных вакансий и зачем в нем ML

Перевод У каждого приложения должна быть палитра команд

А контент они за меня тоже выберут? Как умная система рекомендаций студентам советы по учёбе даёт

Recovery mode Гарантии в SEO миф! Или кто что обещает, и кто что реально может выполнить

Системное администрирование

USB over IP удалённое администрирование

Перевод Как объяснить детям, что такое Apache Kafka за 15 минут с картинками и выдрами

Перевод Контролируем удаление с финализаторами

Перевод Как работает single sign-on (технология единого входа)?

Что такое single sign-on?

Как работает SSO?

Перевод Разработка REST-серверов на Go. Часть 3 использование веб-фреймворка Gin

Интеграция SAML в Zimbra OSE

Elasticsearch

Визуализация аналитики APIM Gravitee в Grafana

Продолжаем знакомство с APIM Gravitee

Перевод Как построить систему распознавания лиц с помощью Elasticsearch и Python

Организация сбора и парсинга логов при помощи Filebeat

Парсинг логов при помощи Fluent-bit

Elasticsearch сайзинг шардов как завещал Elastic анонс вебинара предложения по митапу

Monitoring

Перевод Знакомство с PromQL Cheatsheet

PgSCV экспортер метрик для PostgreSQL

Zabbix OPC DA

Мониторинг 95 метрик PostgreSQL с помощью плагина Zabbix Agent 2

SaaS и ALEPIZ мониторинг и управление инфраструктурой

Безотказный Zabbix миграция с асинхронной на групповую репликацию

Введение

Bigdata

Как мы весь интернет сканировали

Мы решили внедрить Agile-Lean принципы в процесс разработки на ходу и вот что из этого получилось

Паша Финкельштейн о Big Data, Apache Spark и DevRel

Чтобы потолка не стало, а крышу не снесло о чем новый подкаст ВТБ

Перевод Сеть в bitly Linux tc для минимизации издержек и забавы ради

Инструменты для алготрейдинга на Python. SMA Полосы Боллинджера на акциях Северстали код готовой стратегии

Ilm

Долгосрочное хранение данных в Elasticsearch

Категории

Последние комментарии