REKLAMA

Architektury Big Data i procesowanie strumienia danych w czasie rzeczywistym na bazie Kafka Streams

Sposób, w jaki postrzegamy i analizujemy dane, uległ sporym zmianom w ostatnich latach. Jeszcze do niedawna były one zazwyczaj kojarzone z pojedynczą maszyną i systemami o scentralizowanej architekturze. Dzisiaj często są współdzielone między wieloma maszynami czy odległymi centrami danych w rozproszonej architekturze. Zmianie uległ sposób ich przetwarzania, gdzie terminy takie jak Lambda czy Kappa opisują architekturę użytą przy projektowaniu i budowaniu systemów przetwarzających dane Big Data...

Zagadnienia poruszane w tym artykule:

  • Big Data;
  • Architektura Lambda;
  • Architektura Kappa;
  • Kafka Streams;
  • Apache Spark;
  • Porównanie Spark Streaming z Kafka Streams;
  • Przykłady użycia;
  • Przykładowa implementacja.

Artykuł pochodzi z magazynu Programista nr 100 (1/2022). Magazyn jest z przełomu stycznia i lutego 2022 roku. Szczegółowy spis treści wydania nr 100: https://programistamag.pl/programista-1-2022-100/

Autorami artykułu są:

Marcin Mikłasz - programista, architekt, obecnie Application Development Manager w firmie Accenture, gdzie pracuje nad rozwiązaniami z branży retail i store automation. Wcześniej rozwijał systemy z branży automotive i rozwiązania BI.

Bartłomiej Szczotka - absolwent Informatyki na Politechnice Śląskiej w Gliwicach, aktualnie starszy programista mikroserwisów w firmie Accenture. W wolnym czasie entuzjasta-kolekcjoner gry karcianej Magic: The Gathering. Ulubiony sport: tenis stołowy.

Konrad Kowalczyk - Programista Java w firmie Accenture. Pisanie kodu jest jedną z jego pasji. Rozwija się w kierunku mikroserwisów, a w wolnym czasie pisze aplikacje na Androida. Poza programowaniem do jego pasji należą też piłka nożna, siłownia i muzyka.