Treintypes

Niet elke trein is hetzelfde — er zijn stoptreinen, sneltreinen, en zelfs internationale treinen. Aan de hand van hun afkortingen is het meestal eenvoudig te achterhalen met welk type je reist.

Afkorting Betekenis
IC InterCity – stopt enkel in de belangrijkste steden.
P Piekuurtrein – rijdt tijdens de spitsuren als extra versterking.
L Lokale trein – stopt aan elk station langs het traject.
S Stoptrein – bedient voorstedelijke gebieden en stopt frequent.
INT Internationale trein – klassieke grensoverschrijdende verbindingen.
ICT Toeristentrein – gericht op toeristische bestemmingen.

Bron: Wikipedia

Maar hoe vaak komt elk treintype voor in de dataset? Om daar een visueel beeld van te krijgen, gebruiken we een bubble chart.

De visualisatie maakt meteen duidelijk dat sommige treintypes veel vaker voorkomen dan andere. Om die verschillen verder te onderzoeken, kijken we ook naar hoe de aanwezigheid van elk treintype doorheen de tijd evolueert.

Wat opvalt: slechts drie treintypes (IC, P, L) komen consistent voor in elk jaar van de dataset. Andere types, zoals ICT, INT en S, zijn maar gedurende een korte periode opgenomen. Dit kan een vertekend beeld geven van de algemene trends.

Daarom nemen we deze treintypes niet altijd mee in verdere vergelijkingen of verbanden. Zo houden we de analyses representatief en vermijden we foutieve conclusies.

Verdere inzichten

Wanneer we de stiptheid van de treinen door de jaren heen bekijken, kunnen we mogelijk trends ontdekken: is de situatie verbeterd of net verslechterd? Hieronder tonen we dat aan de hand van een interactieve line chart.

Hoewel we niet voor elk treintype gegevens uit elk jaar hebben, springt één ding meteen in het oog: de INT-trein scoort het slechtst op stiptheid. Daarnaast blijft de algemene stiptheid doorheen de jaren vrij stabiel rond de 90%, met hier en daar lichte schommelingen.

Om te onderzoeken of het seizoen invloed heeft op de vertragingen, visualiseren we per treintype de gemiddelde vertraging per seizoen.

De winterpiek bij ICT is ook te zien in de line chart hierboven over de stiptheid van de treinsoorten. In 2022 zie je een duidelijke daling in stiptheid naar 70%.

Op basis van al deze grafieken samen kunnen we echter geen duidelijk verband vaststellen tussen seizoen en vertraging. Zo zien we geen algemene trend over al de treintypes heen. De variaties lijken eerder willekeurig dan seizoensgebonden.

Echter, als we ons beperken tot de 3 treintypes waarvoor we over alle jaren consistente data hebben, valt er wel iets interessants op.

Over het algemeen is er een seizoenspatroon in de gemiddelde vertraging te zien: de herfst kent de hoogste vertragingen, gevolgd door de winter, daarna de lente, en ten slotte de zomer, die het best scoort. Bij de IC is de winter en lente echter wel gelijk aan elkaar, maar voor de rest klopt dit patroon wel.

Om te achterhalen of één bepaald treintype meer bijdraagt aan de totale vertragingen dan een andere, visualiseren we de gegevens in een boxplot. Deze grafiek geeft ons een gedetailleerd beeld van de spreiding en verdeling van vertragingen per treintype. Hier laten we opnieuw de treintypes weg die niet frequent voorkomen in de dataset.

Voor extra duidelijkheid tonen we zowel relatieve als absolute cijfers:

Deze combinatie laat toe om niet alleen te zien hoe vaak treinen vertraging hebben, maar ook hoe zwaar die vertragingen doorwegen per treintype.

Uit de boxplot kunnen we halen dat de L trein gemiddeld beter doet dan de andere treinen — dit op basis van de 3 treintypes waarvoor we over alle jaren data hebben. We zagen dat deze trein op de 2e plaats komt van de meest voorkomende treinsoorten en dus een representatieve trein is in de dataset. Dit duidt dus op de beste stiptheid van deze 3 treintypes aan.

De IC-trein, die het vaakst voorkomt in de dataset, vertoont het meeste minuten absolute vertraging. Hoewel deze het meeste voorkomt, geeft deze trein dus de grootste impact op de totale vertragingen.

Conclusie

Hoewel er een licht patroon te zien is bij de seizoenen, kunnen we die niet veralgemenen voor alle treintypes. Ook zijn de verschillen tussen de seizoenen erg klein. Hier kunnen we dus niet veel uit besluiten.

Wanneer we kijken naar de 3 treintypes waarvoor we over alle jaren data hebben, kunnen we wel iets besluiten. De L-trein vertoont gemiddeld de minste vertragingen en de IC-treinen zijn degene met het grootste aandeel aan vertragingen.

Kijken we daarentegen naar alle treinen, dan valt de INT-trein op als de minst stipte. Toch moeten we daar voorzichtig mee zijn: omdat er van de INT-trein geen data is over alle jaren, kunnen we daaruit geen conclusies trekken.

De onderstaande area chart toont duidelijk hoe de 3 treintypes doorheen de jaren het aandeel aan vertragingen hebben veroorzaakt.