Show simple item record

dc.contributor.advisorGulla, Jon Atlenb_NO
dc.contributor.authorHellerud, Helge Thomasnb_NO
dc.date.accessioned2014-12-19T13:35:31Z
dc.date.available2014-12-19T13:35:31Z
dc.date.created2010-09-11nb_NO
dc.date.issued2005nb_NO
dc.identifier350832nb_NO
dc.identifierntnudaim:1036nb_NO
dc.identifier.urihttp://hdl.handle.net/11250/251961
dc.description.abstractDet er i denne oppgaven testet og evaluert hvorvidt to teknikker med utspring fra informasjonsgjenfinning (eng: Information Retrieval, IR) kan anvendes for ekstraksjon av setninger til nyhetssammendrag. Vektorrommodellen (eng: Vector Space Model) og LSA (Latent Semantic Analysis) med SVD (Singular Value Decomposition) er tilpasset og forsøkt optimalisert for ekstraksjon av det minste settet setninger som best beskriver en nyhetssak. Optimalisering er gjort med bakgrunn i særegenheter funnet i nyhetsartikler, og basert på antagelsene om at egennavn, numeriske verdier og setningslengde er viktige elementer for å beskrive en nyhetssak. For testing og evaluering er det benyttet norske nettavisers omtale av 10 ulike nyhetssaker. Til hver nyhetssak inngår et sett med artikler, og datagrunnlaget for oppgaven er artiklenes overskrifter og ingresser, publisert i RSS-format. Det automatisk genererte nyhets¬sammendraget er evaluert mot et manuelt generert nyhetssammendrag, som er konstruert av en gruppe på fire personer. Det er lagt vekt på at sammendraget skal inneholde de viktigste konseptene for å beskrive innholdet i en nyhetssak, og bestå av så lite redundans som mulig. Automatisk setningsekstraksjon, med beste optimalisering, gir et sammendrag som inneholder 60% manuelt definert gode setninger (presisjon, eng: precision), der over 70% av de ønskede setningene er ekstrahert fra artiklene (funnrate, eng: recall).nb_NO
dc.languagenornb_NO
dc.publisherInstitutt for datateknikk og informasjonsvitenskapnb_NO
dc.subjectntnudaimno_NO
dc.subjectSIF2 datateknikkno_NO
dc.subjectProgram- og informasjonssystemerno_NO
dc.titleAutomatisk sammendragsgenerering av nyhetsartiklernb_NO
dc.title.alternativeAutomatically Generating Summaries of News Articlesnb_NO
dc.typeMaster thesisnb_NO
dc.source.pagenumber175nb_NO
dc.contributor.departmentNorges teknisk-naturvitenskapelige universitet, Fakultet for informasjonsteknologi, matematikk og elektroteknikk, Institutt for datateknikk og informasjonsvitenskapnb_NO


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record