Velkommen til Jernbanen.dk forum. Log venligst ind eller registrér dig.

Generelt

- Søger datasæt til skoleprojekt...
Hej alle jernbane-entusiaster!

Vi er en gruppe studerende, der er gået i gang med et spændende supervised machine learning-projekt, hvor vi vil forsøge at forudsige forsinkelser og mønstre i den danske togtrafik.

Vi har dog ramt en mur: De officielle kilder (Banedanmark/Rejseplanen) udstiller ofte kun data for en måned ad gangen, eller også er det meget aggregeret statistik. Til en god ML-model har vi brug for "rå" data over en længere periode (+1 år) for at kunne tage højde for sæsoner, vejr og ferier.

Derfor rækker vi ud til jer: Er der mon en af jer herinde, som selv har kørt en datatræk-maskine eller scraper i baggrunden det sidste års tid (eller mere), og som ligger inde med en CSV eller Excel-fil, I vil dele med os til vores skoleprojekt?

Vi leder specifikt efter data, der indeholder:

    Station

    Planlagt ankomst

    Faktisk ankomst

    Togtype (IC3, IC4, IR4 osv...)

    Kategori (Regional, Lyn, InterCity, S-Tog)

Hvis du har noget liggende – uanset om det er for hele landet eller blot en specifik strækning – vil det være en kæmpe hjælp for os!

På forhånd tak for hjælpen :)

Hilsen

Jonas og Jakob

Måske et dumt spørgsmål. Men har I haft fat i Banedanmark direkte? Det kunne være at de var interesseret i at samarbejde. Data findes 😊

Jeg ved at både DSB og Banedanmark har dataset med forsinkelser. Men det er ikke noget som de lægger ud. Men spørg dem.. om de kan lave et udtræk, som i kan arbejde med.

Mvh
Steen

jeg tror måske zugfinder.de har nogle af de data som i søger


Data som
    Station
    tog
    Planlagt ankomst
    Faktisk ankomst

er noget BaneDK sidder inde med. Bemærk dog at et tog der kører godt kan blive "aflyst" og "erstattet" - dvs de få et nyt tognummer. Om i kan få de data? Det koster ikke noget at spørge.
Johannes Schuberts side Zugfinder.de er allerede nævnt. De har ikke dansk regionaltrafik med.

BaneDk ved umiddelbart ikke hvad for noget materiel operatørerne kører med. Det vil være en sammenkædning til "en anden afdeling". Lidt mere anstrengende - har i virkelig brug for det?

De københavnske S-tog er et system for sig selv - både teknisk og organisatorisk. Det giver mere mening at betragte dem for sig selv og evt. sammenholde dem med den københavnske Metro og sporvognene rundt omkring.

 

Gå op Sider:[1]
ContecRailIndsend billeder

Billeder, rettelser og tilføjelser til denne side modtages med tak