Konseptekstraksjon fra store dokumentsamlinger

Løkse, Svein Ola

Løkse, Svein Ola

Master thesis

Åpne

350253_FULLTEXT01.pdf (1.228Mb)

Permanent lenke

http://hdl.handle.net/11250/251638

Utgivelsesdato

2005

Metadata

Vis full innførsel

Samlinger

Institutt for datateknologi og informatikk [6788]

Sammendrag

Konseptekstraksjon er ingen ny teknologi. Den har eksistert helt siden 60-tallet, da man først begynte å digitalisere tekstlig informasjon for lagring og gjenfinning. I de siste årene har det oppstått fornyet interesse for faget da vi i dag har en litt annen situasjon. Det finnes i dag en overflod av dokumenter på digitalform. Informasjon må filtreres og ekstraheres for at vi ikke skal drukne i dem. Overfloden av tekstlig informasjon finner spesielt sted på internett, men også i større bedrifter og organisasjoner. I denne oppgaven blir det sett på anvendelser av konseptekstraksjon slik det foregår i dag, og hvordan man kan ta fatt på problemene rundt den voksende mengden av digital informasjon. Det er implementert en komponent for en lingvistisk arbeidsbenk som utfører lingvistiske operasjoner på dokumentsamlinger. Resultatene fra disse operasjonene kan igjen brukes for å trekke ut konsepter fra dokumentsamlingene.

Utgiver

Institutt for datateknikk og informasjonsvitenskap