Agenda szkolenia
- Elasticsearch – podstawy
- Analiza danych
- Indeksy Lucene – co to jest i dlaczego mówimy o Lucene w kontekście Elasticsearch,
- Architektura produktu Elasticsearch (cluster, node, index, primary shard, replica shard, mapping, document, JSON, index templates itp.)
- Praca z NoSQL w środowiskach BigData,
- Elasticsearch – cluster
- Budowa klastra
- Konfiguracja nodów w klastrze (ingest/data/master/ml) – dobór ilości masterów w klastrze, ilości nodów w klastrze, ilości indeksów oraz właściwy dobór ilości oraz wielkości shardów dla indeksu,
- Parametry konfiguracyjne,
- Mechanizm Discovery
- Skalowanie klastra Elasticsearch (scale-out i scale-in) – skalowalność horyzontalna i wertykalna
- ILM – Cykle życia oraz stany indeksów,
- Fault tolerance – odporność na awarie
- Optymalizacja klastra – parametry konfiguracyjne, custom allocation, routing, tags, rack_id, zone itp.
- Optymalizacja mappingu
- Split-brain effect, load balancing, transport client,
- Zaawansowane konfiguracja klastra Elasticsearch – przegląd i wyjaśnienie parametrów konfiguracyjnych
- Elasticsearch RESTful API (request/response, klucze _id)
- Cross-cluster search
- Ingest danychLogstash
- Wprowadzenie do produktu Logstash,
- Transformacje danych
- Przykładowe użycie Logstash do importu danych testowych, danych z Twitter’a, enrichment danych
- Massive ingestion,
- Ingest Pipelines
- Beats
- Wprowadzenie do produktu Beats,
- Uruchomienie metricbeat lub filebeat. Przegląd dobrych praktyk podczas pracy z Beats (optymalizacja konfiguracji)
- Query DSL
- Kibana – Podstawy Query DSL z użyciem Kibany (nawigacja, query, tworzenie wizualizacji)
- Tips & tricks optymalizacji zapytań
- Support & maintenance
- Backupy – backup i restore klastra Elasticsearch,
- Monitoring
- Poprawa performance klastra,
- Rozwiązywanie typowych problemów dnia codziennego w pracy z Elasticsearch
- Integracja ElasticSearch z istniejącymi systemami
- Zarządzanie klastrem poprzez RESTful API