Allmennlegenes diagnosesetting i journalnotatene har flere formål. Journalen er legenes arbeidsverktøy, og det er nyttig å dokumentere diagnoser som en del av de faglige vurderingene. Dette er også et krav i journalforskriften (1). Dernest krever Helseøkonomiforvaltningen (Helfo) at regningskortene er påført én eller flere diagnosekoder etter kodeverket Den internasjonale klassifikasjonen for primærhelsetjenesten (International Classification of Primary Care, ICPC-2) (2). Disse diagnosene inngår i databasen KUHR (Kontroll og utbetaling av helserefusjoner) og benyttes i helsestatistikk, forskning, fagutvikling og kvalitetskontroll. Når man i denne databasen rapporterer diagnoser satt hos fastlege og legevakt, brukes summen av alle kontakttyper (3). Disse dataene brukes som indikator for forekomst av sykdom i befolkningen, både i Folkehelseprofilene (3) og i tallgrunnlaget for statistikkbanken Kommunehelsa (4) og Norgeshelsa (5).
Utviklingen av ICPC-kodeverket startet med at Verdensorganisasjonen for allmennmedisin (WONCA) i 1972 opprettet en internasjonal klassifikasjonskomité. I dag benyttes kodeverket i flere land (6). I Norge har alle primærleger fra 1992 vært pålagt å bruke minst én ICPC-kode for diagnoser på legeregningskort og sykmeldinger. Versjon ICPC-2 har vært i bruk fra 1998 (elektronisk utgave fra 2002). Videre i denne artikkelen brukes betegnelsen ICPC.
ICPC-kodene består av én bokstav og to sifre (7). For noen spesielle diagnoser brukes tre sifre. Bokstaven angir organkapittel (A – Allment, B – Blod osv.). Sifrene 00–29 angir symptomdiagnoser, mens 70–99 angir sykdomsdiagnoser. Kodene 30–69 er prosesskoder som er felles for alle organkapitlene.
Av diagnosene som legen skriver i den elektroniske pasientjournalen (EPJ), blir de to første (hoveddiagnose og eventuell bidiagnose) automatisk kopiert til regningskortet. I 2015 var det 29,4 millioner allmennlegekontakter fordelt på 14,2 millioner enkle kontakter (oppmøte på legekontor, telefonkonsultasjoner, reseptfornyelser) (48,2 %), 13,8 millioner konsultasjoner (47,1 %), 1,1 million administrative kontakter (3,9 %), 142 558 tverrfaglige samarbeidsmøter (0,5 %) og 89 362 sykebesøk (0,3 %) (8).
Fordelingen av diagnoser satt av allmennleger er en viktig kilde til fortløpende informasjon om helsetilstanden i befolkningen, aktualisert etter innføring av kommunalt pasient- og brukerregister (KPR) i 2017 (9). Imidlertid vet vi ikke i hvilken grad diagnosene som brukes i legenes regningskort til Helfo, gir et riktig bilde av kontaktårsak og sykdomsforekomst i befolkningen. Noen elektroniske journalsystem har hurtigvalg for automatisk diagnosesetting, for eksempel ved å foreslå «sist brukte diagnose». Dette vil ofte, men ikke alltid, være riktig diagnose. Etter vår erfaring er det stor bruk av «generelle diagnoser» ved reseptfornyelser og telefonhenvendelser (f.eks. A29: Generelle symptomer/plager og A97: Administrativ kontakt/undersøkelse).
I sin høringsuttalelse til Helse- og omsorgsdepartementets forslag om kommunalt pasient- og brukerregister påpekte Legeforeningen at diagnosene på regningskortene ofte ikke avspeiler legekontaktenes innhold, særlig ikke ved såkalte enkle kontakter (10). Man risikerer også en systematisk underrapportering i data fra multimorbide pasienter, fordi KUHR-databasen bare importerer de to første diagnosene fra regningskortene.
Hvis informasjon fra helseregistre basert på denne rapporteringen skal være nyttig, er kvaliteten på diagnosekodingen viktig. Dette har vært undersøkt med forskjellige metoder. Resultatene spriker. En dansk studie om inter- og intraobservatørvariasjoner i ICPC-diagnosesetting viste 71 % samsvar for enkeltdiagnoser og 94 % når diagnosene var gruppert etter ICPC-kapittel (11). En studie av 400 journaler fra til sammen 20 allmennleger i Stockholm viste korrekt ICD-10-kode i 97 % av tilfellene (12). En større studie fra Tromsø for årene 1992–2008 undersøkte diagnosesetting ved bruk av den problemorienterte elektroniske pasientjournalen PROMED (13). Den fant manglende samsvar mellom problembeskrivelse i journalen og standard ICPC-2-tekst i 53,8 % av tilfellene.
Denne studien undersøker grad av samsvar mellom bruk av ICPC-diagnosekoder og innholdet i journalnotatene hos et ikke-tilfeldig utvalg allmennleger.
Materiale og metode
Diagnosekvalitet i allmennlegers journaler var et diskusjonstema i 2014 i en forskergruppe hvor forfatterne deltar. For å studere dette nærmere valgte vi å se retrospektivt på diagnosekvalitet i året 2013. Fem legekontor rekruttert av forskergruppen deltok i undersøkelsen, ett i Kristiansand og fire i Arendal. Fire av kontorene var rekrutterende legers egne arbeidsplasser, ett var et nabokontor med kjente kolleger. Alle legene som hadde drevet praksis i 2013, var villige til å delta. Legenes gjennomsnittsalder var 51 år (spredning 28–67). 18 av de 23 legene var spesialister i allmennmedisin og fem var kvinner. Kontorene brukte journalsystemene Winmed2 (16 leger) og Infodoc Plenario (7 leger).
Vi vurderte samtlige pasientkontakter i løpet av to arbeidsdager for alle legene, én full kontordag om våren og én om høsten. Hver lege skrev ut navneliste over alle pasientkontaktene for disse to datoene og fant frem de aktuelle journalnotatene. Notatene med diagnoser ble kopiert til en tekstfil og skrevet ut på papir i anonymisert form (fødselsår og kjønn var bevart). To av forfatterne (BB og GM) foretok analysene med gjennomlesing, registrering og vurdering av diagnosekvaliteten. Følgende variabler ble registrert: lege-id, pasientens fødselsår og kjønn, kontakttype, hoveddiagnose og eventuelle bidiagnoser med ICPC-koder og eventuell resept eller sykmelding. Kontaktene ble registrert som: konsultasjon, enkel kontakt med resept, enkel kontakt uten resept, samarbeidsmøte, sykebesøk eller annet. Grad av samsvar mellom journalnotat og ICPC-diagnose ble inndelt i seks kategorier (ramme 1).
Ramme 1 Kategorisering av grad av samsvar i studien.
Kategori 1 var «godt og fullstendig samsvar» der hoveddiagnose og eventuelle bidiagnoser ga et korrekt bilde av hva som var registrert i journalen.
Kategori 2 var «riktig diagnose, men upresist». Eksempel: Ny resept på insulin. Diagnose: Kontakt/undersøkelse for administrative formål A97.
Kategori 3 var «riktig hoveddiagnose, men manglende eller feil bidiagnose». Eksempel: Vanlig diabeteskontroll. I tillegg svelgbesvær de siste ukene. Diagnose: Diabetes mellitus T90.
Kategori 4 var «hoveddiagnosen beskriver deler av kontakten, men ikke hovedårsaken». Eksempel: Kommer til kontroll for å sjekke blodprøver etter pneumoni. Såret på kneet er grodd. Diagnose: Kutt i huden S18.
Kategori 5 var «ikke samsvar». Her var diagnosen på ingen måte dekkende for innholdet i journalnotatet. Eksempel: Notat om akutt anfall av urinsyregikt. Diagnose: Diabetes mellitus T90.
Kategori 6 var «notat mangler helt eller innholdet lar seg ikke vurdere mot diagnosen». Eksempel: Telefon med hjemmesykepleien uten nærmere beskrivelse.
Ved enkel kontakt hvor det kun var skrevet ut resept, ble det vurdert å være godt samsvar hvis minst ett av medikamentene samsvarte med hoveddiagnose eller bidiagnose. Ved svært knappe eller manglende notater kunne det ligge journalopplysninger i en henvisning eller brev som vi ikke hadde tilgang til. Disse ble registrert i kategori 6, altså ikke mulig å vurdere. De to legene vurderte samsvar mellom diagnoser og journalnotat uavhengig av hverandre. I 85 % av tilfellene var de helt enige. For de øvrige 15 % diskuterte de seg frem til konsensus.
I videre resultatpresentasjon har vi forenklet samsvarsbetegnelsene til tre grupper: 1 – godt samsvar (kategori 1 og 2), 2 – ufullstendig samsvar (kategori 3 og 4) og 3 – ikke samsvar (kategori 5). Kategori 6 ble utelatt.
Regionale komiteer for medisinsk og helsefaglig forskningsetikk (REK) fant at studien falt utenfor helseforskningslovens virkeområde jf. § 2 (sak 2016/669). Norsk senter for forskningsdata (NSD) fant at prosjektet ikke medførte meldeplikt eller konsesjonsplikt etter personopplysningsloven §§ 31 og 33 (ref. 49101/3).
Resultatene ble behandlet i statistikkprogrammet NSDstat 1.3.
Resultater
De 23 legene registrerte til sammen 1 819 pasientkontakter på to arbeidsdager. Det var i gjennomsnitt 79 kontakter per lege (spredning 46–124). Medianverdi for antall kontakter per lege per arbeidsdag var 42. Pasientenes gjennomsnittsalder var 48,8 år (spredning 0–98 år). 1 026 av kontaktene (56,4 %) gjaldt kvinnelige pasienter.
839 av kontaktene (46,1 %) var konsultasjoner, 461 (25,3 %) enkle kontakter med resept, 398 (21,9 %) enkle kontakter uten resept, 68 (3,7 %) samarbeidsmøter, 6 (0,3 %) var sykebesøk, mens 47 (2,6 %) ble rubrisert som annet/ukjent.
I denne undersøkelsen ble 346 ulike ICPC-diagnoser benyttet som hoveddiagnose. For alle registreringene ble det brukt én diagnose i 1 622 (89,2 %) av tilfellene, to diagnoser i 169 (9,3 %), tre diagnoser i 24 (1,3 %) og fire diagnoser i 4 (0,2 %) av tilfellene. For konsultasjoner ble det registrert én diagnose i 705 (84,0 %) av tilfellene, to diagnoser i 114 (13,6 %), tre diagnoser i 17 (2,0 %) og fire diagnoser i 3 (0,4 %) av tilfellene. Det var i gjennomsnitt 1,2 diagnoser per konsultasjon. 1 175 (64,6 %) av hoveddiagnosene var sykdomsdiagnoser (kodenummer 70–99), 641 (35,2 %) var symptomdiagnoser (kodenummer 1–29) og tre (0,2 %) var prosesskoder (kodenummer 30–69).
I 228 av kontaktene (12,5 %) manglet det notat eller notatene var for knappe til å vurderes mot diagnosekodene. Disse ble ekskludert fra videre vurderinger. 1 591 av totalt 1 819 notater ble derfor vurdert med tanke på samsvar (tabell 1).
Tabell 1
Antall notater og grad av samsvar mellom ICPC-diagnoser og innholdet i journalnotatet for 1 819 kontakter hos 23 leger ved 5 legesenter i Agder for to arbeidsdager i 2013. Andelen i de ulike samsvarskategoriene er regnet ut fra notater som lot seg vurdere.
Kontakttype
|
Notater totalt, n
|
Notater ikke mulig å vurdere1, n (%)
|
Notater som lot seg vurdere, n
|
Godt samsvar, n (%)
|
Ufullstendig samsvar, n (%)
|
Ikke samsvar, n (%)
|
Konsultasjoner
|
839
|
27 (3,2)
|
812
|
693 (85,3)
|
68 (8,4)
|
51 (6,3)
|
Enkle kontakter med resept
|
461
|
2 (0,4)
|
459
|
321 (69,9)
|
5 (1,1)
|
133 (29,0)
|
Enkle kontakter uten resept
|
398
|
144 (36,2)
|
254
|
213 (83,9)
|
5 (2,0)
|
36 (14,2)
|
Andre2
|
121
|
55 (45,5)
|
66
|
58 (87,9)
|
1 (1,5)
|
7 (10,6)
|
Totalt
|
1 819
|
228 (12,5)
|
1 591
|
1 285 (80,8)
|
79 (5,0)
|
227 (14,3)
|
Hver enkelt leges konsultasjonsnotater hadde andel «godt samsvar» som varierte fra 53,6 % til 97,6 % (medianverdi 87, 8 %) og «ikke samsvar» som varierte fra 0,0 % til 35,7 % (medianverdi 3,1 %).
Diskusjon
Vi fant at diagnosene som allmennlegene satte, samsvarte godt med journalnotatene for konsultasjoner og enkle kontakter uten reseptutskriving, og i noe mindre grad for enkle kontakter med reseptutskriving. Imidlertid var det en stor andel av enkle kontakter uten resept som ikke lot seg vurdere, pga. manglende eller mangelfulle journalnotat. Styrken med studien var at den interne validiteten av ICPC-diagnoser ved et stort antall pasientkontakter ble undersøkt ved at to erfarne allmennleger gjorde en grundig analyse av tekstinnholdet i journalnotatene uavhengig av hverandre. Vi har funnet få studier der man har gjort noe liknende (11–13). I flere studier er imidlertid validiteten av ICPC-diagnoser evaluert ved å undersøke i hvilken grad grupper av pasienter eller diagnoser blir korrekt fanget opp i EPJ-systemene eller i andre medisinske databaser, f.eks. pasienter med kols (14) og kroniske sykdommer (15). I noen studier har man sett på om ICPC inneholder de diagnosene som allmennlegene finner nødvendige (16–18).
Svakheter ved undersøkelsen er at de undersøkte legepraksisene ikke er tilfeldig utvalgt, men rekruttert fra leger som enten direkte eller indirekte er tilknyttet vår forskergruppe. Man kan derfor stille spørsmål ved undersøkelsens representativitet. Det at noen av de deltakende legene ikke selv var medlemmer av forskergruppen, og at praksisene var av ulike størrelser og lå i ulike kommuner, mener vi likevel styrker representativiteten.
Vi undersøkte kontakter i 2013, før kvaliteten på ICPC-diagnoser ble et diskusjonstema i forskergruppen i 2014. Det kunne ha vært en fordel om materialet var av nyere dato. Dette kunne kanskje ha fanget opp en større grad av automatisk diagnosesetting, noe vi tror er blitt vanligere, særlig ved digitale pasientkontakter (elektronisk reseptbestilling og e-konsultasjon).
Det er flere mulige årsaker til mindre samsvar og mangelfulle opplysninger for enkle kontakter. Slike kontakter er ofte av administrativ karakter og med få medisinske vurderinger. Noen journalsystemer tilbyr hurtigvalg av sist brukte diagnose(r). Ved noen legekontorer er det hjelpepersonell som klargjør fornyelse av resepter og samtidig lager regningskort med diagnose.
Noen tilfeller av dårlig samsvar kan ha med manglende diagnosekode å gjøre (19). Når aktuelle diagnosekoder mangler eller ikke kommer opp ved aktuelle søkeord, kan legen velge mindre relevante diagnosekoder eller «sekkediagnoser». Et større ICPC-søkeregister i legenes elektroniske pasientjournaler vil kunne bedre validiteten av diagnosekoder.
Vi vet ikke noe om legenes oppfatning av nytteverdien ved ICPC-diagnosesetting i journalene. Legene er klar over at den er en forutsetning for refusjon fra Helfo, hvor det er tilstrekkelig med én diagnose for å få refusjon. Om legene ved diagnosesettingen også tenker på at ICPC-kvaliteten kan påvirke statistikk, kvalitetssikring og forskning, er usikkert. Dersom legene ikke oppfatter diagnosesettingen som nyttig eller viktig, kan det føre til at det brukes for mange upresise diagnoser eller at man lar være å sette bidiagnoser når pasientene har flere sykdommer. I vår undersøkelse hadde 16 % av konsultasjonene mer enn én diagnose. Denne lave andelen tyder på en underrapportering av det faktiske innholdet i konsultasjoner i allmennpraksis. En norsk undersøkelse fra 2015 viste at det gjennomsnittlig tas opp 2–3 problemstillinger per konsultasjon (20).
Legenes arbeidsrutiner gjør at det haster med å sette diagnose(r) på regningskortet når konsultasjonen er ferdig og pasienten forlater kontoret. Legen skriver deretter som regel ferdig journalnotatet og kan eventuelt rette opp, nyansere eller tilføye flere diagnoser, som da ikke nødvendigvis samsvarer med diagnosen på regningskortet. I denne undersøkelsen har vi bare undersøkt de diagnosekodene som fremkommer av journalen og ikke vurdert regningskortet, slik at dette ikke har vært en feilkilde for samsvarsvurderingen. I forskning og statistikk som benytter ICPC-diagnosene som rapporteres fra regningskortet til Helfo, kan dette teoretisk sett være en svakhet. Vår erfaring med arbeidsprosesser i allmennpraksis er imidlertid at slike endringer av diagnosekoder gjøres svært sjelden.
Resultatene i dette materialet kan tyde på at kvaliteten på statistikker laget på grunnlag av KUHR-data bedres når enkle kontakter utelates og kun data fra konsultasjoner presenteres.
Denne studien er en retrospektiv gjennomgang av et stort antall journalnotater fra et begrenset, ikke-representativt utvalg allmennleger. Selv om vi fant godt samsvar mellom diagnosekode og journalnotat, spesielt ved konsultasjoner, er det behov for å evaluere diagnosekvaliteten i norsk allmennmedisin i større, nasjonale studier. Da vil man også kunne få mer pålitelige data om forskjeller mellom legene.