Show simple item record

dc.contributor.advisorLund, Jostein
dc.contributor.authorBergum, Sveinung
dc.contributor.authorHauglie-Hanssen, Amund
dc.date.accessioned2020-08-16T16:02:12Z
dc.date.available2020-08-16T16:02:12Z
dc.date.issued2020
dc.identifier.urihttps://hdl.handle.net/11250/2672176
dc.description.abstractDagens IT-bedrifter utfordres av stadig større mengder data, ellers kjent som «Big Data». Dette kommer av at mer og mer av teknologien vår digitaliseres og samler informasjon om omgivelsene rundt seg. For at bedriftene skal kunne dra nytte av dataen og sette den i sammenheng må den lagres et sted i mellomtiden. Problemet er at lagring hverken er gratis eller logisk problemfritt. Big Data krever smarte og sikre lagringsløsninger som kan hjelpe til med å strukturere og sortere dataen riktig. Dette er essensielt for å holde kostnader, ytelseskrav og kompleksitet under kontroll. I tillegg har ofte større bedrifter mange systemer og enheter med ulikt operativsystem som skal kommunisere med hverandre, noe som krever en felles plattform som kan fungere som et samlepunkt. I forstudierapporten ble Kongsberg Seatex sine problemstillinger rundt akkurat dette temaet belyst. Vi så her på hva bedriften kan gjøre for å håndtere de store datamengdene som kommer inn fra sin autonome flåte. Her kom vi frem til at lagringssystemet IBM Spectrum Scale kunne være et relevant alternativ for bedriften. I hovedrapporten har vi gått dypere inn på programmets funksjonalitet, og undersøkt om det har det som skal til for å dekke kravene til bedriften. Filsystemer som er designet for strategisk styring av data, kalles for «Software Defined Storage», og IBM Spectrum Scale er et eksempel på dette. Her tar man i bruk et konsept som kalles «Information Lifecycle Management», som ser på hvordan data bør styres gjennom livssyklusen basert på dataens verdi. Ut ifra resultatet av slik styring, bestemmer man hvordan lagringssystemet skal analysere og behandle dataene som importeres. IBM Spectrum Scale innebærer funksjonalitet for å automatisk migrere filer til et lagringsmedium som passer for typen data, noe som både sparer kostnader og øker responstiden til filsystemet. Slik kan man bruke billige og trege medier for arkivering, mens man bruker raske og dyrere medier for hurtiglesing. Spectrum Scale er også svært skalerbart, har høy ytelse, og sikrer dataen mot tap og korrupsjon. I bachelorprosjektet har vi utarbeidet en omfattende dokumentasjon om Spectrum Scale, som har til hensikt å gi leseren en innføring i hvordan systemet fungerer, hvilke oppgaver det kan løse, og hvordan det installeres og tas i bruk. Vi har også satt opp et testsystem i Azure i liten skala, for å prøve ut og å dokumentere programmet i praksis. Hensikten med å ta i bruk en løsning som Spectrum Scale over et tradisjonelt lineært filsystem, er at man sparer betydelige mengder ressurser på lagring av Big Data. Samtidig er systemet designet for å takle fremtidig skalering, og belastningene slike datamengder skaper. Bachelorprosjektet skal gi Kongsberg Seatex verdi i form av innsikt i filsystemets funksjoner, og Spectrum Scales relevans i forhold til problemstillingen. Vi har igjennom arbeidet med dette prosjektet konkludert med at IBM Spectrum Scale er et sterkt alternativ for bedriftens utfordringer, og som dekker kravene som ble satt i begynnelsen av prosjektet. Likevel må bedriften selv avgjøre om nytten av et slikt system veier opp for kostnadene, og hvordan dette kan forsvares økonomisk sett. Spectrum Scale krever innkjøp av en del maskinvare og programvare, og da vi ikke har oversikt over prisen på dette utstyret, kan vi ikke si mer om virkelig nytte bedriften vil ha av dette.
dc.description.abstractIn these days, IT-organizations are being challenged by ever increasing amounts of data, otherwise known as “Big Data”. This increase is caused by the digitalization of our technology, which captures more and more information about its environment. To make use of this data, it needs to be stored somewhere in the meantime. But storing data is neither free nor simple, and Big Data requires smart and secure solutions that can help structure information effectively. This is crucial to keep costs and complexity at bay. Additionally, larger companies usually harbor many different systems that need to communicate, creating the need for a common platform. In the feasibility study of this thesis, the project group has uncovered Kongsberg Seatex’s issue regarding the storage of Big Data. We have looked at what the company can do to handle the large amounts of data gathered from their autonomous fleet. The conclusion of this study was that the storage solution IBM Spectrum Scale could be a solid alternative for this issue. The main study of this project dives further into Spectrum Scale’s functionality and compares it to Kongsberg’s needs. File systems designed to strategically manage data are otherwise known as “Software Defined Storage”-solutions, and IBM Spectrum Scale is an example of one of these systems. To manage data, we utilize a concept called ILM (Information Lifecycle Management). By analyzing the value of our data, we can effectively assign it to the appropriate storage medium. In this way, we can control how the storage system is handling the data. IBM Spectrum Scale can automatically migrate files to the medium that matches the value of the data, simultaneously increasing performance and saving costs. Slow and cheap storage is then used to file data, while faster and more expensive hardware is used for high-speed reading. Spectrum Scale is also highly scalable, high performing, and secures data against loss and corruption. In this bachelor project, we have written extensively about IBM Spectrum Scale to inform the reader on the functionality and the components of this program. By installing and configuring a test system in Azure, we have demonstrated some of the possibilities of Spectrum Scale and shown that it is a strong option for the company’s challenges. The solution has a lot to offer over a traditional, linear file system. Being able to save resources while maintaining high performance and stability during scaling is the main selling point of IBM Spectrum Scale. The intention of the project is to present Kongsberg Seatex with knowledge about the file system, its functions, and Spectrum Scales relevance according to Kongsberg's needs. After working with the project, we have concluded that IBM Spectrum Scale is a good alternative for the company, as the system covers the demands defined at the start of the project. Kongsberg Seatex must further validate if the benefits of the system is worth the costs. Because we do not have an oversight of the cost of equipment, we cannot comment on the total value Spectrum Scale will have for the company.en
dc.publisherNTNU
dc.titleSoftware Defined Storage med IBM Spectrum Scale
dc.typeBachelor thesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record