Englishpolski

Wykład: Probabilistyczne struktury danych wykorzystywane w świecie BigData.

Piątek, godzina 16:15 (60 minut)

W ciągu ostatnich kilku lat ilość gromadzonych danych gwałtownie wzrosła.
Dodatkowo, wraz z ilością danych rosła popularność paradygmatu Map Reduce oraz strumieniowego przetwarzania danych.
Wspomniane zmiany były motorem napędowym powstania wielu algorytmów i struktur danych aktualnie wykorzystywanych przy analizie gromadzonych informacji.

W prezentacji zostaną pokazane probabilistyczne algorytmy oraz struktury danych wykorzystywane w świecie przetwarzania dużych zbiorów danych. Poza omówieniem rozwiązań CountMinSketch, Bloom Filters oraz HyperLogLog wraz z wyjaśnieniem ich parametrów konfiguracyjnych, prelegent pokaże biblioteki i narzędzia open source’owe implementujące/wykorzystujące te struktury. Dodatkowo zostaną omówione problemy, w których zastosowanie pokazanych algorytmów, może znacząco ułatwić rozwiązanie.

Bartłomiej Alberski

Absolwent Informatyki na Wydziale Informatyki, Elektroniki i Telekomunikacji Akademii Górniczo-Hutniczej w Krakowie. W trakcie kariery zawodowej odbywał praktyki/pracował m.in w CERNie, Swisscomie, Ocado. Wytrwale pracuje nad rozwiązywaniem „problemów”, przy okazji ucząc się nowych rzeczy. Obecnie pracuje w Grupie Allegro.

Podziel się ze znajomymi: