Datadeling i forskningsmiljøer. En empirisk casestudie.
Abstract
Den teknologiske fremgangen har bidratt med å gi store muligheter og skape nytekning når det kommer til hvordan forskere henter inn data, behandler denne og hvilke roller personer kan ha i forskning. Rollen til den tradisjonelle forskeren er endret og de må nå bruke nye verktøy og metoder for å hente inn, behandle, beskrive data og dele. De nye mulighetene fører samtidig med seg utfordringer knyttet til store mengdene data som genereres. Hvordan kan forskerne stole på kvaliteten på all dataene som genereres og hvordan kan de dele alle dataene med hverandre?Forskningen i dette prosjektet har som mål å bidra med et empirisk bidrag som beskriver hvordan forskere bruker teknologier og verktøy til å hente inn, behandle, beskrive og dele data med hverandre. Samtidig skal forskningen være med å gi et teoretisk bidrag til forskere og andre som behandler data ved å beskrive problemet knyttet til hvordan databehandling i tidligere forskning blir beskrevet som en perfekt strømlinjeformet prosess uten store utfordringer. Prosjektet skal også være med å besvare hvordan forskere kan dele data på en mer effektiv måte og hvordan forskere kan beskrive data for å gjøre de mer forståelig.For å finne svar på spørsmålene og kunne gi et bidrag til andre er det gjennomført en empirisk casestudie. Studien er har en interpretivistisk tilnærming og datainnsamlingen er gjennomført med observasjoner og ustrukturerte intervjuer. Funnene i oppgaven er basert på følelsene og holdningene som kommer frem i intervjuene og hvordan forskerne jobber med data basert fra observasjonene. Informantene som har vært en del av studien er forskere eller dataforskere som arbeider med data. Funnene viser hvordan det er store utfordringer og muligheter når det kommer til databehandling i de undersøkende forskningsmiljøene. Databaser og datadepoter benyttes til å dele data med andre selv om det er knyttet utfordringer til hvordan gjennomføringen skjer i praksis. Det er også utfordringer knyttet til hvordan forskerne beskriver dataen de besitter. Til slutt kommer det frem hvordan databehandling ikke er like strømlinjeformet som beskrevet av tidligere forskning, men heller er en mer kompleks og kontinuerlig prosess som må tas til etterretning. Technological progress has contributed to providing great opportunities and creating innovation when it comes to how researchers collect data, process data and what roles people may have in research. The role of the traditional researcher has changed, and they must use new tools and methods to collect, process, describe, and share their data. The new possibilities also bring challenges related to enormous amounts of data that are generated. How can researchers trust the quality of all the data generated and how can they share all the data with each other?The research in this project aims to make an empirical contribution that describes how researchers use technologies and tools to collect, process, describe and share data with each other. At the same time, the paper will help make a theoretical contribution to researchers and others who process data. The paper will help address this problem by contradicting how former research present data as a perfectly streamlined process without major challenges. The project will also help to answer how researchers can share data in a more efficient way and how researchers can describe data to make it more understandable.To find answers to the questions and be able to contribute to others, a multiple case study has been conducted. The study has an interpretive approach, and the data collection is conducted with observations and unstructured interviews. The findings in the thesis are based on the feelings and attitudes that emerge in the interviews, and how the researchers work with data based on the observations. The informants who have been part of the study are researchers or computer scientists who work with data.The findings show how there are major challenges and opportunities when it comes to data processing in investigative research environments. Databases and data repositories are used to share data with others, although there are challenges associated with how the implementation takes place in practice. There are also challenges related to how researchers describe the data they possess. Finally, it emerges how data processing is not as streamlined as described by previous research. However, it is a more complex and continuous process that must be considered.