Konseptekstraksjon fra store dokumentsamlinger
Master thesis
Permanent lenke
http://hdl.handle.net/11250/251638Utgivelsesdato
2005Metadata
Vis full innførselSamlinger
Sammendrag
Konseptekstraksjon er ingen ny teknologi. Den har eksistert helt siden 60-tallet, da man først begynte å digitalisere tekstlig informasjon for lagring og gjenfinning. I de siste årene har det oppstått fornyet interesse for faget da vi i dag har en litt annen situasjon. Det finnes i dag en overflod av dokumenter på digitalform. Informasjon må filtreres og ekstraheres for at vi ikke skal drukne i dem. Overfloden av tekstlig informasjon finner spesielt sted på internett, men også i større bedrifter og organisasjoner. I denne oppgaven blir det sett på anvendelser av konseptekstraksjon slik det foregår i dag, og hvordan man kan ta fatt på problemene rundt den voksende mengden av digital informasjon. Det er implementert en komponent for en lingvistisk arbeidsbenk som utfører lingvistiske operasjoner på dokumentsamlinger. Resultatene fra disse operasjonene kan igjen brukes for å trekke ut konsepter fra dokumentsamlingene.