Vis enkel innførsel

dc.contributor.advisorStahl, Annette
dc.contributor.advisorKelasidi, Eleni
dc.contributor.advisorEilertsen, Espen
dc.contributor.authorJin, Kristoffer Chi Rong
dc.date.accessioned2022-09-27T17:21:07Z
dc.date.available2022-09-27T17:21:07Z
dc.date.issued2022
dc.identifierno.ntnu:inspera:102231297:67444996
dc.identifier.urihttps://hdl.handle.net/11250/3021927
dc.description.abstractDenne hovedoppgaven presenterer en metode for å estimere distansen og hastigheten til fisk ved å bruke to dyplæring metoder og et stereoskopisk kamera i samarbeid med SINTEF Ocean. Stereobilder er fanget av kameraet og rettet opp for å etablere epipolar geometri. YOLOv5, et objekt deteksjon nettverk, er brukt på bildene for å detektere fisk. Dette nettverket er trent på to forskjellige datasett. Etter å ha detektert fisken blir et forhåndstrent nerual nettverk, Superglue, tatt i bruk for å etablere punktkorrespondanser innenfor avgrensningsboksene på en en robust måte. Superglue er tatt ibruk ettersom den har vist seg å utkonkurerer tradisjonelle metoder som SIFT og ORB. Punktkorrespondansene er brukt til å rekonstruere 3D punktene ved hjelp av triangulering. 3D punktene er brukt for å regne ut den euklidiske distansen og hastigheten. Et eksperiment er gjennomført i et kontrollert miljø for å validere distanse målingen. I valideringen er det observert at metoden produserer gode resultater. Etter valideringen er metoden testet i et mer realistisk miljø med ekte fisk. Den viser lovende resultater på fisk som svømmer alene, selv om det ikke er noe referansemåling tilgjengelig for å måle ytelsen. Denne hovedoppgaven gjennomfører også et literaturstudie med fokus på visuell sporing. En sporingsmetode burde bli innarbeidet i den foreslåtte metoden for å spore fisken over en bildesekvens på en robust måte.
dc.description.abstractThis thesis presents a method to estimate the distance and speed of the fish by using two deep learning methods and a stereo camera in collaboration with SINTEF Ocean. Stereo images are captured by the camera and rectified to establish the epipolar geometry. YOLOv5, an object detection network, is applied to the images to detect the fish. This network is trained on two different datasets. After detecting the fish, a pretrained network, Superglue, which outperforms traditional matching methods such as SIFT and ORB, is utilized to establish point correspondences within the bounding boxes robustly. The point correspondences are used to reconstruct the 3D world point by triangulation. The 3D points are used to compute the Euclidean distance and speed. An experimental test is created in a controlled environment to validate the distance measurement. It is seen from the validation that the method produces good results. After validating the distance measurements, the method is tested with live fish in a more realistic environment. It shows promising results on fish that swims alone, despite no ground truth available to measure the performance. This thesis also conducts a literature review focusing visual tracking. A tracking method should be incorporated into the suggested method to track the fish over an image sequence robustly.
dc.languageeng
dc.publisherNTNU
dc.titleDeep-learning algorithms for estimation of fish-population parameters from video data
dc.typeMaster thesis


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel