Bootstrapping er en nyere statistisk metode som ofte anvendes for å oppnå robuste estimater. Norske fagmiljøer bruker det engelske ordet. En god norsk oversettelse mangler.
Illustrasjonsfoto istockphoto
«Bootstrapping» brukes om en statistisk metode der nye datasett simuleres med utgangspunkt i et opprinnelig datasett. Dette skjer ved gjentatte tilfeldige uttrekk og tilbakelegging av data. Ved denne metoden oppnås mer robuste estimater.
Begrepet ble introdusert i 1979 av den amerikanske statistikeren Efron Bradley (f. 1938), som har forklart at termen stammer fra uttrykket «to pull oneself up by one’s own bootstrap» (1), altså å stramme seg opp, ta seg selv i kragen. I Oxford English Dictionary er bootstrap forklart som «to make use of existing resources or capabilities to raise (oneself) to a new situation or state; to modify or improve by making use of what is already present» (2). Det dreier seg altså om å bygge på det man allerede har – uten hjelp utenfra. Det statistiske begrepet er laget i en tradisjon der man danner tekniske termer ut fra dagligdagse ord (3). En annen og liknende statistisk metode er jackknifing (jackknife = foldekniv), som gir samme problemer med oversettelse (4).
Et Internett-søk på ordet «bootstrap» viser at det har ulike definisjoner og brukes i mange ulike sammenhenger (5). Det kan være substantiv, verb eller adjektiv. Som substantiv kan bootstrap bety den lille hempen øverst på en støvel som gjør det lettere å trekke støvelen på, altså støvelstropp – en direkte oversettelse av de to ordene i det sammensatte uttrykket (boot + strap). Som adjektiv kan det bety selvbærende, selvregulerende eller selvforsørgende (5). I Engelsk teknisk ordbok er kun oppført en forklaring fra datavitenskap: «laste inn for første gang, laste inn urprogram» (6).
Å finne et dekkende norsk ord for bootstrapping som statistisk metode er ikke enkelt. Ved å søke i Tidsskriftets nettutgave fås fem treff på «bootstrap/bootstrapping», men uten norsk oversettelse (29.4.2012).
Universitetet i Oslo tilbyr et emne med den norske tittelen Bootstrapping og resampling ved Matematisk institutt (7). I omtalen av emnet står det bl.a.: «Den skisserte og lignende metoder kalles bootstrapping, og involverer generelt simuleringer av pseudo-datasett fra en estimert modell.»
Et norsk ord kunne baseres på simulering, pseudodatasett og gjentatte tilfeldige uttrekk med tilbakelegging, for eksempel «gjentatte tilfeldige utvalg». Siden bootstrapping er blitt et etablert begrep, må man nok skrive bootstrapping i parentes – «gjentatte tilfeldige utvalg (bootstrapping)».
Hvis noen av Tidsskriftets lesere har et forslag til en god norsk oversettelse av «bootstrapping», tar redaksjonen gjerne imot det.