Predicting Demand for Bike-Sharing Systems Incorporating Inter-Station Features and Clustering Strategies - A Case Study on Oslo Bysykkel
Description
Full text not available
Abstract
Denne rapporten undersøker den økende betydningen av sykkeldelingsystemer (BSS) som effektive og bærekraftige løsninger for utfordringene med bymobilitet. Fokusområdet er Oslo Bysykkel-systemet som en case-studie. Studien benytter maskinlæringsmodeller, spesifikt Random Forest Regression og Support Vector Regression, for å nøyaktig forutsi sykkelbehov på både stasjons- og områdenivå. Målet er å forbedre ressursallokering, implementere effektive utjevningsstrategier og forbedre brukeropplevelsen. Ved å inkludere variabler som tilgjengelighet av sykler og stativer, tid, værforhold og karakteristikkene til nærliggende stasjoner, har disse modellene som formål å forbedre nøyaktigheten i prognoser for sykkelbehov. En sammenlignende analyse av fire modellvarianter viser at Support Vector Regression-modellen med tilgjengelighet (SVR-A) er den mest effektive. Rapporten introduserer også en klyngermetodologi som grupperer stasjoner basert på geografisk nærhet og etterspørselsmønstre. Denne tilnærmingen gir ulike nivåer av prediksjonsnøyaktighet og detaljnivå avhengig av klyngens størrelse. Studien benytter tre datasett fra Oslo Bysykkel-systemet, som gir detaljert informasjon om individuelle turer, værforhold og sykkeltilgjengelighet ved hver stasjon. Disse datasettene gir verdifulle innsikter i brukeratferd, behov for utjevning og effekten av tilgjengelighet til nærliggende stasjoner på etterspørselen.Konklusjonen av rapporten gir et betydelig bidrag til litteraturen om BSS ved å adressere mangelen på etterspørselsmodellering og foreslå avanserte modeller som tar hensyn til komplekse sammenhenger mellom stasjoner. Disse funnene legger grunnlaget for et mer effektivt og bærekraftig urbant miljø. This thesis examines the growing significance of bike-sharing systems (BSS) as effective and sustainable solutions to urban mobility challenges, focusing on the Oslo Bysykkel system as a case study. The study employs machine learning models, specifically Random Forest Regression and Support Vector Regression, to forecast bike demand at both the station and area levels. By incorporating variables such as bike and dock availability, time, weather conditions, and the characteristics of nearby stations, these models aim to improve resource allocation, implement efficient rebalancing strategies, and enhance the overall user experience. A comparative analysis of four model variations reveals that the Support Vector Regression model incorporating availability data (SVR-A) is the most effective. The research also introduces a clustering methodology that groups stations based on geographical proximity and demand patterns. This approach offers varying levels of prediction accuracy and detail depending on the size of the cluster. The study utilizes three datasets from the Oslo Bysykkel system, providing detailed information on individual trips, weather conditions, and bike availability at each station. These datasets offer valuable insights into user behavior, rebalancing requirements, and the impact of nearby station availability on demand. In conclusion, this report makes a significant contribution to the literature on BSS by addressing the gap in demand modeling and proposing advanced models that consider complex inter-station correlations. These findings pave the way for a more efficient and sustainable urban environment.