dc.contributor.advisor | Stahl, Annette | |
dc.contributor.advisor | Kelasidi, Eleni | |
dc.contributor.advisor | Eilertsen, Espen | |
dc.contributor.author | Jin, Kristoffer Chi Rong | |
dc.date.accessioned | 2022-09-27T17:21:07Z | |
dc.date.available | 2022-09-27T17:21:07Z | |
dc.date.issued | 2022 | |
dc.identifier | no.ntnu:inspera:102231297:67444996 | |
dc.identifier.uri | https://hdl.handle.net/11250/3021927 | |
dc.description.abstract | Denne hovedoppgaven presenterer en metode for å estimere distansen og hastigheten til fisk ved å bruke to
dyplæring metoder og et stereoskopisk kamera i samarbeid med SINTEF Ocean. Stereobilder er fanget av
kameraet og rettet opp for å etablere epipolar geometri. YOLOv5, et objekt deteksjon nettverk, er brukt på
bildene for å detektere fisk. Dette nettverket er trent på to forskjellige datasett. Etter å ha detektert fisken
blir et forhåndstrent nerual nettverk, Superglue, tatt i bruk for å etablere punktkorrespondanser innenfor
avgrensningsboksene på en en robust måte. Superglue er tatt ibruk ettersom den har vist seg å utkonkurerer
tradisjonelle metoder som SIFT og ORB. Punktkorrespondansene er brukt til å rekonstruere 3D punktene
ved hjelp av triangulering. 3D punktene er brukt for å regne ut den euklidiske distansen og hastigheten.
Et eksperiment er gjennomført i et kontrollert miljø for å validere distanse målingen. I valideringen
er det observert at metoden produserer gode resultater. Etter valideringen er metoden testet i et mer realistisk
miljø med ekte fisk. Den viser lovende resultater på fisk som svømmer alene, selv om det ikke er noe
referansemåling tilgjengelig for å måle ytelsen.
Denne hovedoppgaven gjennomfører også et literaturstudie med fokus på visuell sporing. En sporingsmetode
burde bli innarbeidet i den foreslåtte metoden for å spore fisken over en bildesekvens på en robust
måte. | |
dc.description.abstract | This thesis presents a method to estimate the distance and speed of the fish by using two deep learning methods and a stereo camera in collaboration with SINTEF Ocean. Stereo images are captured by the camera and rectified to establish the epipolar geometry. YOLOv5, an object detection network, is applied to the images to detect the fish. This network is trained on two different datasets. After detecting the fish, a pretrained network, Superglue, which outperforms traditional matching methods such as SIFT and ORB, is utilized to establish point correspondences within the bounding boxes robustly. The point correspondences are used to reconstruct the 3D world point by triangulation. The 3D points are used to compute the Euclidean distance and speed.
An experimental test is created in a controlled environment to validate the distance measurement. It is
seen from the validation that the method produces good results. After validating the distance measurements,
the method is tested with live fish in a more realistic environment. It shows promising results on fish that
swims alone, despite no ground truth available to measure the performance.
This thesis also conducts a literature review focusing visual tracking. A tracking method should be incorporated into the suggested method to track the fish over an image sequence robustly. | |
dc.language | eng | |
dc.publisher | NTNU | |
dc.title | Deep-learning algorithms for estimation of fish-population parameters from video data | |
dc.type | Master thesis | |