Vis enkel innførsel

dc.contributor.advisorNguyen, Hai Thanh
dc.contributor.authorLundenes, Morten
dc.contributor.authorKlaussen, Stein-Aage Nibe
dc.date.accessioned2019-11-06T15:03:36Z
dc.date.available2019-11-06T15:03:36Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/11250/2627020
dc.description.abstractSvindel i telekommunikasjonsnettverk er et økende problem på verdensbasis, og en betydelig inntektsstrøm for dem som utfører det. Av den grunn oppstår det stadig nye svindelmetoder som har teleselskaper og deres abonnementer som mål. En av disse metodene kalles Wangiri, også kjent som "ett ring og kutt". Metoden gjennomføres ved at svindlerne ringer én gang for så å legge på, i håp om at de blir ringt tilbake. Numrene de ringer fra er ofte utenlandske spesialnumre som har høyere kostnader enn andre numre. Eierne av disse spesialnumrene samarbeider med svindlerne som driver trafikk til numrene. Inntektene fra den genererte trafikken deles så mellom begge parter som er delaktig i svindelen. Forskningen i denne masteroppgaven er gjennomført i samarbeid med det største teleselskapet i Norge, som på daglig basis må håndtere et stort antall svindelsaker. Deres nåværende metode for å oppdage svindel består av et regelbasert system, i kombinasjon med kunnskap fra deres egne eksperter. Denne prosessen kan bli automatisert og betydelig effektivisert ved bruk av maskinlæring. Innholdet i denne oppgaven fokuserer derfor på å bruke forskjellige teknikker innen maskinlæring for å oppdage tilfeller av svindel. I oppgaven brukes derfor data som blir generert i nettverket til teleselskapet vi samarbeider med. Nærmere bestemt vil det bli undersøkt hvordan veiledet læring kan brukes for å oppdage Wangiri, og hvordan ikke-veiledet anomalideteksjon kan brukes til å indikere generell svindel. I tillegg brukes dataene til å bestemme kjennetegnene ved Wangiri. Fremgangsmåten består av å designe og utføre to eksperimenter, evaluere resultatene og å analysere dataene. Resultatene av forskningen viser at ikke-veiledet anomalideteksjon (Isolation Forest) kan brukes til å indikere generell svindel, med nær maksimal "recall" for bekreftede Wangiri-tilfeller, og lignende "recall" for mistenkte svindelsaker. Dette indikerer at anomaliteter som blir oppdaget av algoritmen, samsvarer med virkelige svindelsaker i nettverket. De veiledede metodene (Neural Network and Support Vector Machine) presterer også veldig godt når det kommer til klassifisering av Wangiri-svindel innenfor et kort tidsvindu. Forskningen viser at deteksjonstiden kan reduseres fra 60 minutter med dagens tilnærming, til 5 minutter med den foreslåtte løsningen, og samtidig opprettholde høye verdier for både presisjon og "recall".
dc.description.abstractFraud has become an increasingly costly problem for telecommunication network operators, and correspondingly a significant revenue stream for those who commit it. As such, a plethora of fraudulent methods for targeting telecommunication companies has come into existence. One method is the callback scheme Wangiri, also known as "one ring and cut". It is performed by fraudsters luring victims into calling a costly number, which is usually a Premium-Rate Number. The owners of these Premium-Rate Numbers collude with the fraudster, and they share the revenue generated by the call from the victim. The research in this thesis is conducted in cooperation with the largest telecommunication network operator in Norway, which has to handle a large amount of fraud cases on a daily basis. Currently, their approach consists of using a rule-based system in combination with expert domain knowledge to detect and mitigate fraud in their network. By applying machine learning, this process can be automated, potentially increasing the efficiency and effectiveness of fraud mitigation. This thesis will therefore use the data generated in the network of the cooperating telecommunication company to explore the application of different machine learning approaches. More specifically, what will be researched is how supervised machine learning can be applied for detecting Wangiri, and how unsupervised anomaly detection can be used to indicate general fraud cases. In addition, the data will also be used to determine the characteristics of Wangiri. The approach taken consists of designing and performing two experiments, evaluating the results against suitable metrics, and analyzing the data. The results of the research shows that the unsupervised anomaly detection method (Isolation Forest) can be used for indicating general fraud cases, with close to maximum recall for confirmed Wangiri cases, and similar recall for suspected fraud cases. This indicates that anomalies being detected by the algorithm matches real world fraud in the network. The supervised methods (Neural Network and Support Vector Machine) also perform very well for classifying Wangiri fraud within a feasible time window. The research shows that detection time could be reduced from 60 minutes with the current approach, to 5 minutes with the suggested solution while still maintaining high values for both precision and recall.
dc.languageeng
dc.publisherNTNU
dc.titleApplying Machine Learning to Detect Fraud in Telecommunication Networks
dc.typeMaster thesis


Tilhørende fil(er)

FilerStørrelseFormatVis

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel