Nazwa przedmiotu: Wprowadzenie do Data Science

  1. Osoba odpowiedzialna: dr inż. M. Bubak
  2. Cel przedmiotu: Przegląd typowych przypadków użycia big data, omówienie najważniejszych definicji, zadania data scientists i jego kompetencje, przegląd programu studiów
  3. Zakres materiału: Definicja pojęcia big data. Taksonomia. Typowe przypadki użycia i wynikające z nich wymagania. Zagadnienia bezpieczeństwa i prywatności w świecie big data, Typowa architektura systemu przetwarzającego big data. Typowe metody i narzędzia przetwarzania big data. Data scientists, jego zadania i wymagane kompetencje na podstawie wyników projektu EDISON. Przegląd programu studiów. W trakcie tych zajęć będzie odwołanie się do doświadczeń uczestników studiów, prezentacja przykładów przetwarzania big data.
  4. Literatura:
    1. Big Data Definitions: http://dx.doi.org/10.6028/NIST.SP.1500-1 and related links
    2. EDISON: building the data science profession; http://edison-project.eu/
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie obecności na wykładzie

 

Nazwa przedmiotu: Statystyka

  1. Osoba odpowiedzialna: dr inż. J. Majewski, dr inż. R. Dębski
  2. Cel przedmiotu:. Celem przedmiotu jest wprowadzenie do statystyki matematycznej i statystycznej obróbki danych oraz nabycie praktycznej umiejętności programowania w języku R.
  3. Zakres materiału: Elementy statystyki matematycznej. Charakterystyka badań statystycznych. Populacja, próbka statystyczna. Cechy statystyczne. Ocena danych: wiarygodność, kompletność, dokładność – rodzaje błędów. Modele probabilistyczne. Zmienne losowe. Wnioskowanie statystyczne. środowisko R i program RStudio; elementy programowania w języku R: wektory, listy, funkcje, typy złożone, wyrażenia warunkowe, pętle, obsługa wyjątków; organizacja kodu, testowanie oprogramowania, debugowanie oraz pomiar i poprawa wydajności kodu; przykładowe zastosowania środowiska R: obliczenia statystyczne, obliczenia numeryczne i symulacje, wspomaganie kolejnych etapów pracy z danymi: import, czyszczenie, przekształcenia, modelowanie, wizualizacja i tworzenie raportów.
  4. Literatura:
    1. T. Górecki, Podstawy statystyki z przykładami w R, BTC, Legionowo 2011
    2. Gągolewski M.: "Programowanie w języku R", PWN, 2016
    3. Wickham H., Grolemund G.: "R for Data Science", O'Reilly, 2016
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Bazy danych

  1. Osoba odpowiedzialna: dr inż. M. Valenta, dr inż. R. Marcjan
  2. Cel przedmiotu:. Poznanie podstaw realizacji systemów baz danych jako podstawowych magazynów danych dla procesów analizy danych. Poznanie zasad logicznego modelowania przestrzeni danych w systemach relacyjnych i NoSQL. Zrozumienie zasad przetwarzania transakcyjnego. Nabycie umiejętności posługiwania się językiem SQL
  3. Zakres materiału: Podstawy technologii baz danych z uwzględnieniem podstawowych funkcji systemów zarządzania bazami danych i języków baz danych. Definiowanie podstawowych elementów modeli relacyjnych baz danych i zasad konstrukcji modelowania rzeczywistości i zasad utrzymania integralności bazy danych. Model funkcjonalny systemów zarządzania bazami danych z uwzględnieniem zasad realizacji transakcji (ACID). Przegląd modeli-architektur systemów baz danych z uwzględnieniem kolejno architektur klient/serwer i rozproszenia bazy danych. Systemy rozproszone z nierelacyjnymi modelami danych – NoSQL. Rodzaje systemów NoSQL , przegląd rozwiązań i najważniejsze problemy realizacyjne. Programowanie w SQL – operacje podstawowe, grupowanie danych i funkcje agregujące, złączenia, stosowanie pododzapytań. Wykonywanie złożonych analiz w SQL. Elementy języków zapytań w bazach NoSQL.
  4. Literatura:
    1. H.Garcia-Molina, J.D.Ullman, J.Widom, „Systemy Baz Danych. Pełny wykład”, Klasyka Informatyki WNT, Warszawa, 2006
    2. T.Connolly, C.Begg, "Systemy baz danych – metody projektowania, implementacji i zarządzania", RM, Warszawa, 2004
    3. D.Sullivan, „NoSQL – przyjazny przewodnik”, Helion, 2016.
  5. Forma zaliczenia: ocena
    1. Ocena wystawiane na podstawie sprawdzianu na zajęciach i/lub zadania domowego

 

Nazwa przedmiotu: Programowanie w języku Python

  1. Osoba odpowiedzialna: dr inż. M. Gajęcki, dr inż. K. Piętak, dr inż. J. Dajda
  2. Cel przedmiotu:. Zapoznanie studentów ze składnią i mechanizmami języka Python. Zaprezentowanie obszarów zastosowania ze szczególnym uwzględnieniem analizy danych i data science . Zdobycie umiejętności implementowania prostych aplikacji w języku Python.
  3. Zakres materiału: Wprowadzenie do języka, podstawowe konstrukcje i pętle, typowanie, wyjątki
    1. Operacje na listach, słowniki, generatory
    2. Operacje na plikach
    3. Funkcje, klasy, obiekty, wątki
    4. Wyrażenia regularne, wybrane biblioteki funkcji
  4. Literatura:
    1. Chris Fehily „Po prostu Python”, Helion 2009
    2. Peter Norton „Python od podstaw”, Helion 2006
  5. Forma zaliczenia: ocena
    1. Ocena wystawiane na podstawie sprawdzianu na zajęciach i/lub zadania domowego

 

Nazwa przedmiotu: Ekstrakcja danych ze źródeł internetowych

  1. Osoba odpowiedzialna: dr inż. J. Dajda
  2. Cel przedmiotu:. Celem przedmiotu jest zapoznanie Słuchaczy z podstawowymi technikami i wybranymi narzędziami procesu ekstrakcji danych ze źródeł internetowych, począwszy od etapu analizy struktury źródła, a skończywszy na odpowiednim przetworzeniu i persystencji pobranych danych w wybranej bazie danych
  3. Zakres materiału:
    1. Pobieranie danych z mikroserwisów (REST, JSON)
    2. Parsowanie danych i zapis w bazie danych (np. SQL, grafowych)
    3. Podstawy web scrappingu (z wykorzystaniem np. biblioteki BeautifulSoup)
    4. Podstawy web crawlingu (z wykorzystaniem np. platformy Scrapy)
  4. Literatura:
    1. Ryan E. Mitchell: Web Scraping with Python, O'Reilly Media, Incorporated, 2015
    2. Dimitrios Kouzis-Loukas: Learning Scrapy Front Cover, Packt Publishing Ltd, 2016
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Hurtownie danych

  1. Osoba odpowiedzialna: dr inż. M. Valenta
  2. Cel przedmiotu:. Poznanie metod integracji danych i budowy rozwiązań pozwalających na integracje danych i przygotowanie modelu danych dla wieloaspektowych analiz – hurtownie danych. Zasady realizacji systemów działających jako OLAP i poznanie podstaw budowy modeli logicznych tych systemów.
  3. Zakres materiału: Przetwarzanie OLTP vs OLAP. Zadania i architektura systemów hurtowni danych. Rola i zadania procesu ETL (ładowanie danych). Modelowanie danych w systemach OLAP – własności wielowymiarowej kostki danych. Realizacje wielowymiarowych struktur danych i ich cechy użytkowe. Realizacje relacyjne modelu gwiazdy i płatka śniegu. Język zapytań analitycznych.
  4. Literatura:
    1. Z. Królikowski, "Hurtownie danych, logiczne i fizyczne struktury danych", Wydawnictwo Politechniki Poznańskiej, 2007.
    2. V.Poe, P.Klauer, S.Brobst, "Tworzenie hurtowni danych", WNT, Warszawa, 1999.
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Analiza dużych zbiorów danych w środowisku Spark

  1. Osoba odpowiedzialna: dr inż. B.Baliś, dr hab. inż. M.Malawski
  2. Cel przedmiotu:. Celem przedmiotu jest zdobycie wiedzy i umiejętności w zakresie wykorzystania zaawansowanych narzędzi do analizy dużych zbiorów danych w rozproszonych infrastrukturach obliczeniowych.
  3. Zakres materiału:
    1. Model przetwarzania Spark, koncepcja Resilient Distributed Dataset, DataFrame
    2. Przykładowe problemy i ich rozwiązanie w modelu Spark (algorytm Page Rank, algorytmy grafowe)
    3. Programowanie w Spark przy pomocy Python API w środowisku Jupyter lub Zeppelin
    4. Architektura i konfiguracja środowiska obliczeniowego Spark w rozproszonej infrastrukturze obliczeniowej (klaster obliczeniowy, chmura Amazon)
    5. Rozwiązanie przykładowych problemów wykorzystujących uczenie maszynowe w środowisku Spark
  4. Literatura:
    1. Zaharia, Matei, et al. "Resilient distributed datasets: A fault-tolerant abstraction for in-memory cluster computing." Proceedings of the 9th USENIX conference on Networked Systems Design and Implementation. USENIX Association, 2012.
    2. Petar Zečević, Marko Bonaći, Spark in Action, Manning 2016
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Uczenie maszynowe

  1. Osoba odpowiedzialna: dr hab. inż. B.Śnieżyński, dr inż. M.Kurdziel
  2. Cel przedmiotu:. Zapoznanie studenta z problematyką i algorytmami uczenia maszynowego
  3. Zakres materiału: Wprowadzenie i podstawowe pojęcia (Charakterystyka obszaru problemowego i pojęcia podstawowe. Rodzaje uczenia się.) Indukcja drzew decyzyjnych i reguł (Algorytmy ID3, C4.5, AQ, CN) Uczenie ze wzmocnieniem (Procesy decyzyjne Markowa, Q-learning, SARSA, rozszerzenia algorytmów) Architektury sieci neuronowych (sieci MLP, sieci konwolucyjne). Uczenie sieci neuronowych (Algorytm wstecznej propagacji błędu). Klasyfikacja danych sieciami neuronowymi (Regresja logistyczna)
  4. Literatura:
    1. P. Cichosz: Systemy uczące się, Wydawnictwa Naukowo-Techniczne, 2000
    2. Ian Goodfellow, Yoshua Bengio, Aaron Courville, Deep Learning - Systemy uczące się, Wydawnictwo Naukowe PWN, 2018
  5. Forma zaliczenia: ocena
    1. Ocena wystawiane na podstawie sprawdzianu na zajęciach i/lub zadania domowego

 

Nazwa przedmiotu: Eksploracja danych

  1. Osoba odpowiedzialna: dr inż. A. Zygmunt
  2. Cel przedmiotu:. Zapoznanie się z metodami zaawansowanej analizy danych z wykorzystaniem podejścia opartego o sztuczną inteligencję
  3. Zakres materiału: Etapy procesu odkrywania wiedzy w bazach danych. Zadania we wstępnym przetwarzaniu danych. Klasyfikacja metod DM. Metodyki eksploracji danych (właściwy cykl DM, Six-Sigma, Semma, Crisp-DM). Sposoby integracji DM z systemami BD/DW. Szczegółowe omówienie metod: odkrywania reguł asocjacyjnych, klasyfikacji, klastrowania - zaprezentowanie podstawowych algorytmów i dziedzin zastosowania.
  4. Literatura:
    1. Larose D. T.: "Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych", PWN, 2006
    2. Larose D.T.: "Metody i modele eksploracji danych", PWN, 2008
  5. Forma zaliczenia: ocena
    1. Ocena wystawiane na podstawie sprawdzianu na zajęciach i/lub zadania domowego

 

Nazwa przedmiotu: Analiza danych tekstowych

  1. Osoba odpowiedzialna: dr inż. A. Smywiński-Pohl
  2. Cel przedmiotu: zaznajomienie studentów ze specyfiką przetwarzania danych tekstowych, jako szczególnego rodzaju danych nieustrukturyzowanych. Przedstawienie najważniejszych problemów związanych z przetwarzaniem danych tekstowych oraz narzędzi wykorzystywanych do przetwarzania danych tego rodzaju
  3. Zakres materiału:
    1. Kodowanie tekstu - UNICODE, UTF-8, inne standardy
    2. Wyrażenia regularne.
    3. Podział tekstu na słowa (tokenizacja).
    4. Fleksja.
    5. Wyszukiwanie pełnotekstowe
    6. Tagowanie morfosyntaktyczne.
  4. Literatura:
    1. Martin, James H., and Daniel Jurafsky. Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Pearson/Prentice Hall, 2009.
    2. Perkins, Jacob. Python 3 text processing with NLTK 3 cookbook. Packt Publishing Ltd, 2014.
    3. Sarkar, Dipanjan. Text Analytics with Python: A Practical Real-world Approach to Gaining Actionable Insights from Your Data. Apress, 2016.
  1. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Sieci społeczne

  1. Osoba odpowiedzialna: dr inż. A. Zygmunt
  2. Cel przedmiotu:. Zaznajomienie studentów z najnowszymi trendami analizy tzw. mediów społecznych takich jak portale społecznościowe, blogosfera itd.
  3. Zakres materiału: Definicja sieci społecznej, jej charakterystyka. Miary sieci społecznej i ich interpretacja. Praktyczne zastosowania sieci społecznych. Właściwości sieci społecznych (homofilia, przechodniość, mosty, gęstość, współczynnik grupowania). Zjawisko małych światów. Preferencyjne dołączanie. Modele sieci (losowe, bezskalowe).
  4. Literatura:
    1. Hansen D. L., Shneiderman B., Smith M. A.: "Analyzing Social Media Networks with NodeXL. Insights from Connected World", Morgan Kaufmann, 2010
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Analiza danych przestrzennych

  1. Osoba odpowiedzialna: dr inż. R. Marcjan
  2. Cel przedmiotu: Zaznajomienie studentów nowoczesnymi technologiami przetwarzania i analizy danych o charakterze przestrzennym (spatial data) oraz budową współczesnych systemów GIS
  3. Zakres materiału: Definicja danych przestrzennych. Modele danych. Sposoby przetwarzania i analizy danych przestrzennych w systemach bazodanowych. Przykładowe SZBD wspierające przetwarzanie danych GIS: Oracle Spatial, PodtGIS. Wizualizacja na mapie (Map Viewer, Google Maps).
  4. Literatura:
    1. Paul A. Longley, Michael F. Goodchild, David J. Maguire, David W. Rhind, "GIS. Teoria i praktyka", Wydawnictwo Naukowe PWN, 2008
    2. Ravikanth V. Kothuri, Albert Godfrind, Euro Beinat, "Pro Oracle Spatial" Apress 2009
  5. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Wizualizacja dużych zbiorów danych

  1. Osoba odpowiedzialna: prof. dr hab. inż. W. Dzwinel
  2. Cel przedmiotu:. „Wizualizacja dużych zbiorów danych” jest zapoznanie kursantów z nowoczesnymi metodami eksploracyjnej analizy danych.
    1. Zakres materiału:
      1. Przegląd klasycznych metod uczenia maszynowego ze szczególnym uwzględnieniem metod
      2. klasteryzacji, oraz podstawowcyh metod wykorzystywanych do analizy big data.
      3. Metody całościowej wizualizacji danych wraz z oprogramowaniem.
      4. Wizualizacja danych wielowymiarowych w postaci tzw. scatter plots.
      5. Metody klasyczne: PCA oraz MDS.
      6. Metody nowoczesne bazujące na algorytmie t-SNE.
      7. Metody generatywne oparte o koncepcję autoenkoderów i sieci głębokich
      8. Nowoczesne metody wizualizacji grafów w tym sieci społecznościowych
      9. Metody analizy i wizualizacji tekstu.
      10. Koncepcja osadzania (word2vec) paragraph vector (doc2vec) oraz node2vec a wizualizacja dużych wielowymiarowych danych.
  3. Literatura:
    1. Chen, C. H., Härdle, W. K., & Unwin, A. (Eds.). (2007). Handbook of data visualization. Springer Science & Business Media.
    2. Tamassia, R. (Ed.). (2013). Handbook of graph drawing and visualization. CRC press.
    3. Cao, N., & Cui, W. (2016). Overview of Text Visualization Techniques. In Introduction to Text Visualization (pp. 11-40). Atlantis Press, Paris.
    4. Leskovec, J., Rajaraman, A., & Ullman, J. D. (2014). Mining of massive datasets. Cambridge university press.
  4. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Prawne aspekty analizy danych

  1. Osoba odpowiedzialna: mgr M. Menszig
  1. Cel przedmiotu:. Zapoznanie studentów z prawnymi aspektami analizy danych oraz elementami prawa autorskiego.
  2. Zakres materiału: Charakterystyka możliwości przeprowadzania analiz na danych z punktu widzenia prawa. Ochrona danych osobowych. Kwestie związane z anonimizacją danych. Charakter umów dotyczących oprogramowania oraz dostępu do danych. Prawne problemy zbierania i przetwarzania danych.
  3. Literatura:
    1. Barta J., Markiewicz R., Główne problemy prawa komputerowego, WNT, Warszawa, 1993.
    2. Byrska M., Ochrona programu komputerowego w prawie autorskim, Akademicka Oficyna Wydawnicza, Warszawa 1994.
    3. Szewc A., Jyż G., Elementy prawa informatycznego, Wydawnictwo Uniwersyteu Śląskiego, Katowice 2009.
  4. Forma zaliczenia:
    1. Zaliczenie wystawiane na podstawie obecności na wykładzie

 

Nazwa przedmiotu: Seminarium - Projekty dyplomowy

  1. Osoba odpowiedzialna: dr inż. R.Marcjan, dr inż. A.Zygmunt
  2. Cel przedmiotu: Podstawowym celem przedmiotu jest znacząca pomoc studentom w realizacji własnych przedsięwzięć projektowych z analizy danych, które kończą się opracowaniem projektu dyplomowego. Celem przedmiotu jest też sukcesywna kontrola kolejnych etapów realizacji tych projektów.
  3. Zakres materiału:Seminarium - to cały cykl zajęć poświęcony pracy nad zagadnieniami wybranymi przez słuchaczy jako tematy ich projektów dyplomowych. Dużą wagę przykłada się do nabycia przez słuchaczy umiejętności prawidłowego metodycznego i zgodnego ze standardami dokumentowania projektów oraz opracowania wyników. Znaczna część zajęć przeznaczona jest na dyskusje indywidualnych problemów i rozwiązań.
    1. Forma zaliczenia:
      1. Zaliczenie wystawiane na podstawie aktywności na zajęciach

 

Nazwa przedmiotu: Projekt dyplomowy

  1. Osoba odpowiedzialna: dr inż. R.Marcjan, dr inż. A.Zygmunt
  2. Cel przedmiotu: Najważniejszym celem przedmiotu jest nabycie przez studentów umiejętności i doświadczenia w samodzielnej realizacji pełnego projektu związanego z analizą danych
  3. Zakres materiału: Zakres realizowanych prac jest każdorazowo dobierany przez opiekunów do doświadczeń, umiejętności, możliwości realizacyjnych i zainteresowań słuchaczy. Postępy prac kontrolowane są na seminariach. Realizacja projektu polega na wykonaniu analizy danych związanych z określonym wybranym problemem.Studenci samodzielnie wybierają dane do analiz, przygotowują je, dobierają odpowiednie techniki i narzędzia analizy danych (np. spośród tych z którymi zapoznali się w toku studiów) oraz opracowują wyniki.
  4. Forma zaliczenia:Ocena
    1. Ocena projektu przez opiekuna projektu
Go to top