Załącznik A — Katalog danych

B Katalog danych

Plik	Rozmiar dydaktyczny	Najlepsze zastosowanie	Uwagi
`datasets/mpg.csv`	399 wierszy	wykres punktowy (scatter plot), kolor, panele (facets), trend	Dobry zbiór danych na start.
`datasets/insurance_premiums.csv`	52 wiersze	regresja, etykiety, regiony	Dobry do pierwszych mapowań i `geom_smooth()`.
`datasets/schoolimprovement2010grants.csv`	758 wierszy	histogramy, wykresy pudełkowe (boxplots), kategorie	Ma pierwszą kolumnę indeksową bez nazwy.
`datasets/FY18_4050_FMRs.csv`	4770 wierszy	rozkłady, skale, obserwacje odstające	Czynsze rynkowe, wiele zmiennych numerycznych.
`datasets/bike_share.csv`	731 wierszy	szeregi czasowe, sezonowość, wykres heksagonalny (hexbin plot)	Daty dzienne, dobra struktura.
`datasets/climate_change.csv`	707 wierszy	linie, dwie serie, narracja	Dobry do osi czasu i etykiet.
`datasets/stocks_cleaned.csv`	139501 wierszy	szeregi czasowe i interaktywność	Warto filtrować do jednej spółki.
`datasets/seattle_weather.csv`	205 wierszy	małe wielokrotności (small multiples), brak danych	`-7777` oznacza braki.
`datasets/austin_weather.csv`	13 wierszy	porównanie miesięcy	`-7777` oznacza braki.
`datasets/medals_by_country_2016.csv`	11 wierszy	wykresy słupkowe (bar charts), zmiana układu danych	Ma pierwszą kolumnę bez nazwy.
`datasets/summer2016.csv`	2015 wierszy	kategorie, sport, wzrost, medal	Ma pierwszą kolumnę indeksową.
`datasets/daily_show_guests_cleaned.csv`	2694 wiersze	mapa ciepła (heatmap) i tabele krzyżowe	Dobry do `count()` i `pivot_wider()`.
`datasets/college_datav3.csv`	6703 wiersze	podział na panele (faceting), wykres punktowy (scatter plot), instytucje	Duży, dobry do późniejszych rozdziałów.
`datasets/melb_clean.csv`	13581 wierszy	ceny, transformacje, obserwacje odstające (outliers)	Ma pierwszą kolumnę indeksową.
`datasets/bakery.csv`	17487 wierszy	kategorie, dni tygodnia, agregacje	Dobry do `count()` i rankingu.
`datasets/nba.csv`	425 wierszy	wykres punktowy (scatter plot), etykiety, interaktywność	Dobry do Plotly.
`datasets/countries-of-the-world.csv`	228 wierszy	czyszczenie nazw, geografia	Nazwy kolumn wymagają czyszczenia.
`datasets/student-alcohol-consumption.csv`	396 wierszy	kategorie, wykresy pudełkowe (boxplots), edukacja	Ma pierwszą kolumnę indeksową.
`datasets/young-people-survey-responses.csv`	1011 wierszy	ankiety, skale Likerta	Ma sporo kolumn, dobre na projekt.
`datasets/bike_v1.csv`	1237 wierszy	import trudniejszych danych	Wartości rozdzielone białymi znakami mimo rozszerzenia `.csv`.
`datasets/bike_2.csv`	1237 wierszy	diagnostyka importu	Wartości rozdzielone białymi znakami, nie na początek pracy.