Metody automatycznego pozyskiwania danych z Internetu dla celów biznesowych i cyberbezpieczeństwa
Numer: 11/2020
Raport został przygotowany przez zespół w składzie:
- prof. Witold Abramowicz
- dr Elżbieta Lewańska
- dr Milena Stróżyna
- dr Marcin Szmydt
- Martyna Chmielewska
- Oskar Dołżkiewicz
- Wojciech Dopieralski
- Alex Drożdż
- Damian Klimarczyk
- Eryk Rutkowski
- Joanna Sobkowiak
- Miłosz Sojka
| Rok publikacji | 2020 |
|---|---|
| Obszar badawczy | Nowe technologie w sektorze bankowym, cyberbezpieczeństwo banków i systemy płatnicze. |
| słowa kluczowe | API, cyberbezpieczeństwo, web crawling, web scraping, źródła danych |
Opis
Celem raportu jest przedstawienie przypadków użycia źródeł danych dostępnych w Internecie do wsparcia procesów biznesowych, marketingowych oraz związanych z cyberbezpieczeństwem w sektorze bankowym. Raport omawia zagadnienia technicznego pozyskiwania danych, ujęcie ekonomiczne (uzyskania efekty skali, szacunkowe koszty wykorzystania wybranych źródeł) i prawne (bieżące rozwiązania legislacyjne, licencje źródeł danych). Struktura raportu obejmuje:
- przegląd potrzeb informacyjnych manifestowanych przez podmioty sektora bankowego,
- przedstawienie listy przykładowych źródeł danych, ich klasyfikacji oraz odwzorowania na zidentyfikowane potrzeby informacyjne,
- przedstawienie narzędzi służących do automatycznego pozyskiwania danych ze źródeł internetowych. Omówiono również ograniczenia prawne i technologiczne takich procesów.
- przedstawienie przykładowych przypadków użycia wybranych narzędzi, ale różnych typów źródeł (stron w języku HTML, API oraz danych udostępnionych w plikach).
- rekomendacje związane z procesami automatycznego pozyskiwania danych z Internetu dla sektora bankowego.
Przeczytaj
Webinar
