REKLAMA

Analiza danych w Pythonie

Część I: Wprowadzenie do uczenia maszynowego (Machine Learning)

Uczenie maszynowe (ang. Machine Learning) stało się w ostatnich latach modnym terminem. Coraz więcej firm chwali się, że do analizy danych wykorzystały ten mechanizm. W artykule zapoznamy się z podstawowymi pojęciami i „odczarujemy” ML. Przekonamy się, że chociaż ML to sztuczna inteligencja, to zrozumienie go nie wymaga doktoratu z matematyki.

Zagadnienia poruszane w tym artykule:

  • Uczenie maszynowe – crash course;
  • Klasyfikacja i regresja;
  • Featuresets;
  • Uczenie nadzorowane;
  • Algorytmy ML;
  • Przygotowanie: Instalacja bibliotek i narzędzi; Import bibliotek;
  • Przygotowanie danych wejściowych: Ściągnięcie korpusu; Wczytanie korpusu; Wstępne przekształcenie danych wejściowych; Wygenerowanie featuresets; Podział na zbiór uczący i testujący;
  • Naiwny klasyfikator bayesowski.

Artykuł pochodzi z miesięcznika "Programista" nr 59 (04/2017). Jest to wydanie z przełomu maja i czerwca. Szczegółowy spis treści: http://programistamag.pl/programista-4-2017-59/

Autorem artykułu jest Krzysztof Mędrela. Programista i konsultant specjalizujący się przede wszystkim w aplikacjach webowych tworzonych w Django (Python). Trener w firmie Bottega IT Minds i InfoTraining. Działa w lokalnej społeczności Pythona w Krakowie (Pykonik). Prowadzi bloga pod adresem http://medrela.com.