Vis enkel innførsel

dc.contributor.advisorNguyen, Hai Thanh
dc.contributor.authorTryman, Håvard Stene
dc.date.accessioned2019-11-06T15:02:30Z
dc.date.available2019-11-06T15:02:30Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/11250/2627011
dc.description.abstractNøyaktig forutsigelse av etterspørsel er nødvendig for å lagre og forberede matvarer med lite svinn og stor sikkerhet om at etterspørselen møtes. Å forutse fremtidige gjester kan hjelpe restauranteiere med å ta handling for å maksimere inntekt ved å planlegge arbeidskraften som trengs og råvarene som skal bestilles. Denne masteroppgaven skal vurdere statistiske- og veiledet læringsmetoder for å forutse antall daglige transaksjoner i tre kontorkantiner i Norge. De implementerte metodene består av flere typer naive metoder, eksponensiell glatting (ETS), seasonal autoregressive integrated moving average (SARIMA), gradient boosting, beslutningstre, tilfeldig skog, støttevektorregresjon (SVR), flerlags perceptron (MLP) og et ensemble av ETS, SARIMA, SVR, tilfeldig skog og to gradient boosting-modeller. Datasettet besto av poster fra oktober 2016 til februar 2019. Veiledet læringsmetodene brukte features fra de følgende kategoriene: historiske features (f. eks. antall transaksjoner forrige arbeidsdag), dato-features (f. eks. ukedagen) og parkerings-features (f. eks. antall biler som var parkert i de tilknyttede parkeringskjellerne klokken 07:00). Vær-features (temperatur, luftfuktighet og nedbør ved lunsj) ble prøvd, men ble ikke valgt som endelige features. Forutsigelser ble gjort for hver kantine individuelt og for et aggregat over alle tre kantinene. Label-en var antall transaksjoner i løpet av lunsj som ble registrert i kantinen en gitt dag. Label-er ble forutsett med tre tidshorisonter: "nulldagers forutsigelse" (0WDF), "todagers forutsigelse" (2WDF) og "15-dagers forutsigelse" (15WDF). 0WDF-, 2WDF- og 15WDF-metodene gjorde forutsigelser for henholdsvis samme dag, to arbeidsdager fremover og 15 arbeidsdager fremover. Forutsigeslen må være klar før 10:00. Hvor mye tidligere enn 10:00 kommer an på metoden. Vurdering ble gjort i en expanding window-prosess hvor de seneste 50% av datasettet ble brukt som vurderingsdata. Den beste metoden for alle kantine-horisont-kombinasjonene bortsett fra fire var ensemble-et, og for disse fire kombinasjonene presterte ensemble nesten like bra som den beste metoden. Den beste statistiske metoden var ETS. Naiv forutsigelse med riktig sykluslengde for kantinen og imputering basert på sykluslengden utgjorde et referansepunkt for kantine-horisont-kombinasjonen. For forutsigelse av aggregat 0WDF label, gir den naive metoden mean squared error (MSE) og mean absolute percentage error (MAPE) på 8507 og 4.03%, mens ensemble gir MSE og MAPE på 4332 og 2.86%. For aggregat 15WDF forutsigelse, gir naiv MSE og MAPE på 10482 og 4.58%, mens ensemble gir MSE og MAPE på 7508 og 3.91%. ETS og flere maskinlæringsmetoder presterer nesten like bra som ensemble, men med mer variasjon mellom kantine-horisont-kombinasjoner.
dc.description.abstractAccurate predictions of demand are necessary to stock and prepare items with low waste and high certainty that the demand is met. Forecasting future visitors can help restaurant owners take action to maximize revenue by planning the labor needed and the amount of raw goods to order. This thesis will evaluate statistical and supervised learning methods for forecasting the number of daily transactions in three office cafeterias in Norway. The implemented methods are several types of naive forecasts, exponential smoothing (ETS), seasonal autoregressive integrated moving average (SARIMA), gradient boosting, decision tree, random forest, support vector regression (SVR), multi-layer perceptron (MLP) and an ensemble of ETS, SARIMA, SVR, random forest and two gradient boosting models. The dataset consisted of entries from October 2016 to February 2019. The supervised learning methods used features from the following categories: historical features (e.g., the number of visitors on the previous weekday), date features (e.g., the day of the week) and parking features (e.g., how many cars were parked in the company’s parking garages at 07:00). Weather features (temperature, humidity and precipitation during lunchtime) were considered, but eliminated during feature selection. Forecasts were made for each cafeteria individually and for an aggregate over all three cafeterias. The forecast label was the number of lunchtime transactions recorded in the cafeteria on a given day. Labels were forecast with three horizons: "zero weekday forecast" (0WDF), "two weekday forecast" (2WDF) and "15 weekday forecast" (15WDF). 0WDF, 2WDF and 15WDF methods make forecasts for the same day, two weekdays ahead and 15 weekdays ahead respectively. The forecast has to be ready before 10:00. How much earlier than 10:00 the forecast is ready depends on the method. Evaluation was done in an expanding window process where the latest 50% of the dataset was used as evaluation data. The best method for all cafeteria-horizon combinations except four was the ensemble, and for these four combinations, ensemble’s score was close to the best score. The best statistical method was ETS. Seasonal naive forecasts with an appropriate season length for the cafeteria and imputation based on the seasonality provided baseline forecasts for the cafeteria-horizon combination. For the aggregate forecast with the 0WDF horizon, the naive forecast gives a baseline mean squared error (MSE) and mean absolute percentage error (MAPE) of 8507 and 4.03%, while the ensemble gives an MSE and MAPE of 4332 and 2.86%. For the aggregate 15WDF forecast, the naive forecast gives an MSE and MAPE of 10482 and 4.58%, while the ensemble given an MSE and MAPE of 7508 and 3.91%. ETS and several machine learning methods score close to the ensemble, but with more variation between different cafeteria-horizon combinations.
dc.languageeng
dc.publisherNTNU
dc.titleForecasting Cafeteria Visitors With Machine Learning
dc.typeMaster thesis
dc.description.localcodeDenne masteroppgaven er ikke tilgjengelig etter forfatters ønske.


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel