Fiskerne har ingen måde at adskille de fisk, de fanger, når de kaster deres net til søs. Beskyttede arter og fisk uden markedsværdi - hammerhajen, for eksempel - ende med at blive fanget og dø uden grund. I et forsøg på at minimere dette tilfældige fiskeri, statistikere fra University of Geneva (UNIGE, Schweiz), Dalhousie University (Halifax, Canada) og Australian National University (Canberra) har udviklet en ny statistisk metode til at forudsige bifangster mere præcist i fremtiden. Teknikken, hvilket forklares fuldstændigt i journalen Annals of Applied Statistics , kan også anvendes på andre forskningsområder, herunder sundhedsøkonomi, medicin og uddannelsesvidenskab.
Når fiskere tog ud på deres ekspeditioner til søs, beskyttede arter fanges utilsigtet i deres net ved siden af de fisk, der er bestemt til salg. Biologer indsamler datasæt om fisketal og artsbevarelsestal, så de kan studere omfanget af tilfældigt fiskeri og dets indvirkning på havdyr. Opbygningen af disse data, kendt som "indlejret", er kompleks, fordi den integrerer en masse teknisk information, f.eks. antallet af ekspeditioner eller typen af brugte både. Dataene registrerer også mængden af beskyttede fisk fanget i netene på hver fisketur. Imidlertid, nogle arter - hammerhajen er et sådant tilfælde - fanges normalt ikke, gør det svært at etablere modeller, der omfatter antallet af nulfangster for hver art. "Indtil nu, der har ikke været nogen generel statistisk metode, der kombinerer en indlejret datastruktur med en stor mængde nuller i observationerne ", forklarer Eva Cantoni, professor ved Research Center for Statistics ved UNIGE's Geneva School of Economics and Management (GSEM). "Så dette hul skulle udfyldes, hvilket vi gjorde ved at oprette en meget generel og fleksibel model, kaldet Random-Effects Hurdle Model. "
Kompleksiteten af generalitet
Statistikerne udviklede en ny metode med det ultimative mål at indføre administreret fiskeri og reducere bifangst. "Vi var nødt til at tage højde for en række dynamikker, "fortsætter Cantoni." Målet var ikke bare at analysere ændringerne i antallet af fangster over tid, men også at studere de forskellige årstider og vejret, alt imens der tages hensyn til de tekniske forhold:Netets dybde, årstiderne (som jeg allerede har nævnt), hvilken type kroge der bruges, om der blev brugt lyspinde eller ej og typen af fartøj. "Baseret på disse data, forskerne identificerede de let påvirkelige forhold (såsom krogens dybde), der ville reducere mængden af ikke-omsættelige arter, der fanges.
Statistikerne skabte derefter en ny metode, der kombinerede ældre modeller med speciale i enten indlejrede strukturer eller nulstyring. "Vanskeligheden lå i at bringe disse to aspekter sammen og samtidig sikre, at modellen var så generel som muligt, så den kunne tilpasse sig mange situationer, "siger Joanna Mills Flemming, fra Institut for Matematik og Statistik på Dalhousie University. Jo mere generel en model er, jo mere kompleks det er at behandle. Moderne simuleringsteknikker blev brugt til at estimere modellens parametre (relateret, for eksempel, til krogens dybde) og deres variabilitet. Forfatterne demonstrerede sætninger, der bestemmer og kvantificerer fejlmargener for modellen og dens forudsigelser. Forebyggelse af tilfældige fangster og støtte miljøpolitik. Denne modellering betyder, at det nu er muligt at estimere potentielle bifangster for en fiskeriekspedition. "Når fiskere giver os deres rejsedata, vi kan forudsige den tilfældige fangst for hammerhajer, for eksempel, med mere præcision, "siger Cantoni." Metoden kan bruges til at bakke op om miljøpolitikker ved at forbyde fiskeri på en bestemt dybde på et bestemt tidspunkt på året, da det ville indebære for meget bifangst, "tilføjer Alan Welsh fra Australian National University.
Modellen udfylder et statistisk hul:tidligere har der var ingen generel model i stand til samtidig at indregne komplekse og indlejrede datastrukturer og et stort antal observationer, der er lig med nul. I dag, den nye model tjener ikke kun kommercielt fiskeri:den kan også bruges i andre områder med kompleks datastruktur, herunder sundhedsøkonomi, medicin og uddannelsesvidenskab.