Metody automatycznego pozyskiwania danych z Internetu dla celów biznesowych i cyberbezpieczeństwa

Numer: 11/2020

Raport został przygotowany przez zespół w składzie:

  • prof. Witold Abramowicz
  • dr Elżbieta Lewańska
  • dr Milena Stróżyna
  • dr Marcin Szmydt
  • Martyna Chmielewska
  • Oskar Dołżkiewicz
  • Wojciech Dopieralski
  • Alex Drożdż
  • Damian Klimarczyk
  • Eryk Rutkowski
  • Joanna Sobkowiak
  • Miłosz Sojka
Rok publikacji2020
Obszar badawczyNowe technologie w sektorze bankowym, cyberbezpieczeństwo banków i systemy płatnicze.
słowa kluczoweAPI, cyberbezpieczeństwo, web crawling, web scraping, źródła danych
Opis

Celem raportu jest przedstawienie przypadków użycia źródeł danych dostępnych w Internecie do wsparcia procesów biznesowych, marketingowych oraz związanych z cyberbezpieczeństwem w sektorze bankowym. Raport omawia zagadnienia technicznego pozyskiwania danych, ujęcie ekonomiczne (uzyskania efekty skali, szacunkowe koszty wykorzystania wybranych źródeł) i prawne (bieżące rozwiązania legislacyjne, licencje źródeł danych). Struktura raportu obejmuje:

  • przegląd potrzeb informacyjnych manifestowanych przez podmioty sektora bankowego,
  • przedstawienie listy przykładowych źródeł danych, ich klasyfikacji oraz odwzorowania na zidentyfikowane potrzeby informacyjne,
  • przedstawienie narzędzi służących do automatycznego pozyskiwania danych ze źródeł internetowych. Omówiono również ograniczenia prawne i technologiczne takich procesów.
  • przedstawienie przykładowych przypadków użycia wybranych narzędzi, ale różnych typów źródeł (stron w języku HTML, API oraz danych udostępnionych w plikach).
  • rekomendacje związane z procesami automatycznego pozyskiwania danych z Internetu dla sektora bankowego.
Przeczytaj
Webinar