Show simple item record

dc.contributor.advisorPeron, Mirco
dc.contributor.authorKinat, Luisa Alina
dc.date.accessioned2023-09-15T17:19:34Z
dc.date.available2023-09-15T17:19:34Z
dc.date.issued2023
dc.identifierno.ntnu:inspera:146717033:84360757
dc.identifier.urihttps://hdl.handle.net/11250/3089835
dc.description.abstractIntroduksjonen av samarbeidsroboter i samlebånd gir et stort potensial for å øke produktiviteten og redusere ergonomiske risikoer for menneskelige operatører. Men det fører også til et stadig mer komplekst miljø. For å utnytte det fulle potensialet er det derfor nødvendig med avanserte løsninger for oppgavefordeling og sekvensplanlegging. Bruken av reinforcement learning tilbyr en lovende tilnærming til å løse optimaliseringsproblemet og muliggjøre sanntidsbeslutninger. Så langt har forskningen på dette området først og fremst fokusert på økonomiske faktorer som kort gjennomføringstid. Målet med denne oppgaven er for det første å identifisere den nyeste teknologien innen håndtering av samlebåndssekvenseringsproblemet i denne sammenheng ved å gjennomføre en systematisk litteraturstudie, og for det andre å utvikle en optimaliseringsmodell som bruker reinforcement learning og tar hensyn til økonomiske samt ergonomiske faktorer. Målene er å identifisere relevant litteratur, vurdere deres styrker og begrensninger, utlede områder der fremtidig forskning er nødvendig, utvikle en optimaliseringsmodell basert på tidligere resultater, og til slutt trene og teste modellen på en eksemplarisk monteringsoppgave. I det systematiske litteraturstudiet ble det kun funnet et begrenset antall dokumenter med minimert gjennomføringstid som ett mål for de fleste modellene. En multi-objective modell ble identifisert som tok hensyn til gjennomføringstid og oppgavevanskelighet. Det rene fokuset på ergonomi har så langt ikke vært gjenstand for forskning. Modellen utviklet i denne oppgaven har som mål å optimalisere gjennomføringstiden samt det menneskelige ergonomiske stressnivået ved å bruke multi-agent reinforcement learning. Resultatene viser at flere mål kan vurderes og vektes ved å tildele belønninger til flere forhold. Begrensningene i litteraturstudien ligger i det lave antallet dokumenter, bruken av kun én database hvor kun engelsk litteratur ble vurdert, og at det fortsatt er en viss grad av subjektivitet under utvelgelsen av dokumentene. Begrensningene til den utviklede modellen er at den kun støtter samarbeid mellom robot og menneske på én arbeidsstasjon, dens begrensede evne til å tilpasse seg uforutsett atferd og dens stokastiske elementer, som kanskje ikke alltid fører til en optimal løsning.
dc.description.abstractThe introduction of collaborative robots in assembly lines offers great potential to enhance productivity and reduce ergonomic risks for human operators. However, it leads to an increasingly complex environment. Therefore, in order to exploit the full potential, advanced solutions for task allocation and sequence planning are necessary. The use of reinforcement learning offers a promising approach to solving the optimization problem and enable real-time decisions. So far, the research in this area is mainly focused on economic factors such as a short completion time. The goal of this thesis is, firstly, to identify the state of the art of addressing the assembly line sequencing problem within this context by conducting a systematic literature review, and secondly, to develop an optimization model using reinforcement learning and taking economic as well as ergonomic factors into account. The objectives are to identify relevant literature, to evaluate their strengths and limitations, to derive areas where future research is needed, to develop an optimization model based on the previous findings, and finally, to train and test the model on an exemplary assembly task. In the systematic literature review, only a limited number of documents was found with minimized completion time as single objective for most models. One multi-objective model was identified taking completion time and task difficulty into account. The pure focus on ergonomics was not a subject of research so far. The within this thesis developed model aims to optimize the completion time as well as the ergonomic stress level of the human using multi-agent reinforcement learning. The results show that multiple objectives can be considered and weighted by assigning rewards to multiple conditions. Limitations of the review lay in the low number of documents, the use of only one database in which solely English literature was considered and that a degree of subjectivity remains during the selection of the documents. Limitations of the developed model are the support of only cooperation between robot and human in one workstation, its limited capabilities to adapt to unforeseen behavior and its stochastic elements which might not always lead to the choice of the optimal solution. Keywords: assembly line sequencing, collaborative robots, reinforcement learning, ergonomics
dc.languageeng
dc.publisherNTNU
dc.titleAssembly Line Sequencing with Collaborative Robots using Reinforcement Learning
dc.typeMaster thesis


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record