Hej alle jernbane-entusiaster!
Vi er en gruppe studerende, der er gået i gang med et spændende supervised machine learning-projekt, hvor vi vil forsøge at forudsige forsinkelser og mønstre i den danske togtrafik.
Vi har dog ramt en mur: De officielle kilder (Banedanmark/Rejseplanen) udstiller ofte kun data for en måned ad gangen, eller også er det meget aggregeret statistik. Til en god ML-model har vi brug for "rå" data over en længere periode (+1 år) for at kunne tage højde for sæsoner, vejr og ferier.
Derfor rækker vi ud til jer: Er der mon en af jer herinde, som selv har kørt en datatræk-maskine eller scraper i baggrunden det sidste års tid (eller mere), og som ligger inde med en CSV eller Excel-fil, I vil dele med os til vores skoleprojekt?
Vi leder specifikt efter data, der indeholder:
Station
Planlagt ankomst
Faktisk ankomst
Togtype (IC3, IC4, IR4 osv...)
Kategori (Regional, Lyn, InterCity, S-Tog)
Hvis du har noget liggende – uanset om det er for hele landet eller blot en specifik strækning – vil det være en kæmpe hjælp for os!
På forhånd tak for hjælpen
Hilsen
Jonas og Jakob