Vis enkel innførsel

dc.contributor.advisorAndersson, Henrik
dc.contributor.authorKjærran, Adrian
dc.contributor.authorStrømstad, Simen
dc.date.accessioned2022-10-04T17:21:44Z
dc.date.available2022-10-04T17:21:44Z
dc.date.issued2022
dc.identifierno.ntnu:inspera:116343971:116356465
dc.identifier.urihttps://hdl.handle.net/11250/3023771
dc.descriptionFull text not available
dc.description.abstractButikkeiere og innehavere av kommersiell eiendom har felles utfordringer knyttet til å forstå de underliggende faktorene som påvirker inntekter og definerer passende lokasjoner for ulike typer butikker innen detaljhandel, servering, og andre tjenester. Konsekvensene av feilplasserte butikker er underprestasjon og potensielt konkurs, noe som er kostbart for samfunnet som helhet. Formålet med denne studien er å legge til rette for identifisering av passende lokasjoner for fysiske butikker ved å bruke avanserte maskinlæringsalgoritmer til å predikere butikkers potensielle inntekter i ulike områder. Sentrale begrensninger ved tidligere artikler innen forskningsfeltet er at de ofte baserer seg på enkle statistiske metoder og ekspertkunnskap som er lite generaliserbar, i tillegg til at de er begrenset til en spesifikk butikktype eller et mindre avgrenset geografisk område. Denne studien utnytter omfattende data relatert til geografiske områder, demografi, bevegelse og finansiell informasjon om butikker for å utlede informative inputvariabler til prediksjonsmodellene. I løpet av studien blir det utviklet originale måter for å modellere kommersielle områder, opptaksområder, samt konkurranse, og disse teknikkene viser seg viktige for å forbedre prediksjonene. De fire modellarkitekturene som blir undersøkt er Lineær Regresjon, Nevrale Nettverk, TabNet, og LightGBM. Den sistnevnte modellarkitekturen, LightGBM, har best ytelse totalt sett med en gjennomsnittlig absolutt og prosentvis feil på henholdsvis 3.6 MNOK og 66\% for prediksjoner på nye observasjoner. Disse måltallene er noe bedre enn for de andre modellene. Derimot, på grunn av kompleksiteten til problemet som løses, viser små forbedringer i måltallene seg signifikante for hvilke relasjoner de ulike modellene lærer seg. For å utvide den gjeldende litteraturen foreslår denne studien en maskinlæringsmodell som, kombinert med forklarbarhetsverktøyet SHAP, er i stand til å identifisere inntektsdrivere og predikere omsetningen til alle typer butikker på vilkårlige lokasjoner over hele Norge.
dc.description.abstractRetail businesses and commercial property owners share the common problem of understanding the underlying factors affecting revenue for different retail stores. The issues of wrongly located stores result in under-performance and potential bankruptcies, which is also costly for society. The purpose of this study is to develop an advanced Machine Learning model to identify suitable locations for physical retailers by predicting their potential revenues in different areas. A central limitation in related research papers is that they, in many cases, are based on simpler statistical methods and expert opinions prone to subjective biases. Further, the research is often restricted to a particular area and retail industry. This study utilizes extensive geospatial data sets related to demography, movement, and financial information to predict the revenue of retailers. The application of advanced feature engineering techniques to create data-driven commercial areas, catchment areas, and competition features further enhances the predictions. The four model architectures tested are Linear Regression, Neural Network, TabNet, and LightGBM. The best performing architecture is LightGBM, achieving a mean absolute error of 3.6 MNOK and an average percentage error of 66\% on the predicted revenues for unseen observations. These scores are slightly better than for the other models. Despite similar loss metrics, due to the complexity of the problem, the applicability and level of detail in the learned representations vary significantly. To advance the current research, this study develops a Machine Learning model that, combined with the explainability framework SHAP, identifies revenue drivers and predicts the revenue for all retail stores at arbitrary locations across Norway.
dc.languageeng
dc.publisherNTNU
dc.titlePredicting Retail Revenues in Norway Using Machine Learning: A Data-Driven Approach
dc.typeMaster thesis


Tilhørende fil(er)

FilerStørrelseFormatVis

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel