De gewoonte om vragenlijsten af te nemen bij patiƫnten/cliƫnten-ervaringsonderzoek lijkt onuitroeibaar. Ik kwam er in 2007 bij gelegenheid van de publicatie van de Consumer Quality Index (CQ-index) al tegen in opstand. Ik stelde toen dat vragenlijsten-als-meetinstrument niet voldoen aan eisen van betrouwbaarheid en validiteit en pleitte voor een fundamenteel andere methode van onderzoek. Dit keer schrijf ik naar aanleiding van de hulpvraag van een koepelorganisatie (VGN): Hoe om te gaan met het gemopper in het veld over het werken met vragenlijsten? Het moet eenvoudiger, met meer zeggingskracht en minder administratieve lasten. Dergelijke eisen lijken mij gerechtvaardigd, maar hoe eraan te voldoen?
Eerst het begrip āvragenlijstā. Met die term doel ik op een meetinstrument. Dit bestaat uit een lijst met vraagzinnen die door een interviewer van een respondent wordt afgenomen of aan hem wordt voorgelegd. De vragen zijn gesloten of open geformuleerd of in de vorm van een stelling geponeerd. Elke vraag betreft een aspect van het te onderzoeken onderwerp, dat vooraf door de onderzoeker is bepaald (aspectmethode). Op de lijst staan bij elke vraag of stelling de antwoordcategorieĆ«n voorgedrukt, zoals: āja/neenā, ānooit ā altijdā, āzeer tevreden ā zeer ontevredenā en āonvoldoende ā zeer goedā en āzeer mee eens ā zeer mee oneensā. Een dergelijke vragenlijst-als-meetinstrument ligt hier onder vuur; buiten kijf blijven nut en noodzaak van ervaringsonderzoek als middel tot verbeteren en verantwoorden.
Alternatieve meetinstrumenten
Mijn boodschap is tweeledig. Van ervaringsonderzoek uitgevoerd met behulp van vragenlijsten, zijn de uitkomsten onbetrouwbaar en niet valide en het werken met vragenlijsten voldoet niet aan eisen van integriteit, uitvoerbaarheid en responsiviteit. Net als bij het vorige artikel lever ik dus kritiek, maar ik kom ook met alternatieve meetinstrumenten. Het uitgangspunt daarbij is steeds hetzelfde en simpel: een lijst met vraagzinnen (die wordt afgenomen) is wezenlijk iets anders dan een lijst met aandachtspunten (waaruit kan worden geput). Wie zich hieraan houdt, geeft direct al gehoor aan de roep tot vereenvoudiging.
Betrouwbaarheid
Ervaringsonderzoek is betrouwbaar als het qua uitkomst geen verschil maakt op welk moment het plaatsvindt of door wie het wordt uitgevoerd. Maar kunnen we op betrouwbaarheid rekenen? Van moment tot moment doen patiƫnten/cliƫnten nieuwe ervaringen op en de ene interviewer is geduldiger, empatischer, behulpzamer dan de andere. De uitkomsten zullen dan verschillen. Op grond van deze argumenten durfde ik al eerder te stellen dat het afnemen van vragenlijsten niet voldoet aan de eis van betrouwbaarheid. Na mijn vorige publicatie in 2007 heb ik nog een ander argument gevonden.
BeĆÆnvloedende factoren
Dit argument put ik uit eigen ervaring. Het betreft een factor die sterk bepalend is voor de uitkomsten verkregen door middel van vragenlijsten, maar die bij mijn weten geen aandacht krijgt in de literatuur. Wat is het geval? Eind 2010 onderging ik een openhartoperatie (zes bypasses) en kreeg tijdens en na het verblijf in twee ziekenhuizen maar liefst negen vragenlijsten voorgelegd. Hoe ging ik daar nu zelf mee om? Misschien is het niet het juiste woord, maar ik heb ze een beetje balorig ingevuld. Waarom? Ik raakte steeds meer geĆÆrriteerd. Over de Intensive Care kon ik geen zinnig woord zeggen omdat ik toen vrijwel buiten bewustzijn was, mijn ontevredenheid over Fysiotherapie kon ik niet uiten omdat vragen daarover ontbraken en vragen over de Verpleegafdeling Cardiologie moest ik beantwoorden op een zeven-puntsschaal, die dan misschien wel wetenschappelijk verantwoord is, maar een onding voor praktisch gebruik. Ik was al met al bepaald niet in de stemming om ook die nog eens serieus in te vullen. Deze en andere van mijn eigen reacties op vragenlijsten maakten mij nieuwsgierig. Hoe werkt dit bij anderen? Wat zegt de literatuur op dit punt?
Conclusie: Alvorens iets zinvols te kunnen zeggen over de betrouwbaarheid van een vragenlijst-als-meetinstrument voor de kwaliteit van zorg, zou moeten worden bepaald wat de invloed is van de stemming waarin de patiƫnt/cliƫnt verkeert op de nauwkeurigheid, juistheid en volledigheid van de uitkomsten van het onderzoek.
Validiteit
Ervaringsonderzoek met behulp van een vragenlijst is valide als ook werkelijk wordt onderzocht wat men wil onderzoeken. Bij de CQ-index gaat het bij veel vragen om de frequentie van het optreden van een bepaalde gebeurtenis over een voorbije periode. Box 1 geeft een voorbeeld.
Box 1. Validiteit van ervaringsonderzoek naar aspecten (i.c. frequentie versus emotie)
āHoe vaak in de afgelopen twaalf maanden heeft uw huisarts u informatie verteld die tegenstrijdig is met informatie van andere zorgverleners?ā (D. Delnoij, Klantervaringen in de zorg meten met CQ Index, Kwaliteit in Beeld, 2006, nr. 6.) Commentaar De hier geciteerde vraag gaat over ātegenstrijdige informatie vertellenā. Dit lijkt me inderdaad iets om (on)tevreden over te zijn, maar is de frequentie daarvan (ānooit, soms, meestal, altijdā) voor de patiĆ«nt/cliĆ«nt een juiste, waarachtige, geldige, kortom valide maat? En wat is de zeggingskracht van een āfrequentieā? |
Wat leert echter common sense? Als mensen worden bevraagd over hun ervaringen met gebeurtenissen, of als ze daarover spontaan iets vertellen, hangen ze hun antwoord of verhaal niet zozeer op aan de frequentie van het optreden van een gebeurtenis, maar aan de emotie die erdoor werd opgeroepen. Een valide uitkomst bestaat dus eerder uit verhalen of gezegden (kwaliteiten), dan uit in maat en getal uitgedrukte antwoorden (kwantiteiten).
Als mensen worden bevraagd over hun ervaringen met gebeurtenissen, of als ze daarover spontaan iets vertellen, hangen ze hun antwoord of verhaal niet zozeer op aan de frequentie van het optreden van een gebeurtenis, maar aan de emotie die erdoor werd opgeroepen.
Daar komt, op het punt van validiteit, nog iets bij. Bij het werken met vragenlijsten bepaalt de onderzoeker het wat en hoe van het onderzoek. Hij kiest de onderwerpen (items), formuleert daarover de vragen, kiest de woorden. Maar hebben die ook dezelfde betekenis voor de patiƫnt/cliƫnt? Waar heeft de vraag betrekking op, waar gaat het over? Box 2 geeft nog een voorbeeld.
Box 2. Validiteit van objecten van onderzoek (dingen versus handelingen)
Observatie (video-opname, voorjaar 2011) In het kader van de jaarlijkse evaluatie wordt de cliĆ«nt geĆÆnterviewd door de begeleider van zijn eigen groep gehandicapten. Ze zitten samen aan tafel en de begeleider begint na een korte inleiding met het hardop voorlezen van vraag 1 van de vragenlijst die voor hem ligt: āHoe vind je het eten?ā Er valt een stilte, en als het antwoord op zich laat wachten, komt de begeleider met de vervolgvraag: āVind je het lekker?ā Na enige aarzeling zegt de cliĆ«nt: āNou, eh, op maandag komt het eten altijd te laat, dan moet ik voetballen.ā Commentaar Het begrip āetenā wordt verschillend geĆÆnterpreteerd. Voor de Ć©Ć©n slaat het op āvoedselā (ding, zelfstandig naamwoord), voor de ander op āactiviteitā (handeling, werkwoord). Het antwoord komt uit een ander referentiekader dan de vraag. Bij het maken van de voorgedrukte antwoordcategorieĆ«n is hiermee geen rekening gehouden. |
Conclusie: Uitkomsten verkregen door middel van een vragenlijst zijn niet valide indien in de vraagzinnen of stellingen termen voorkomen die door de patiĆ«nt/cliĆ«nt anders worden geĆÆnterpreteerd dan door de onderzoeker bedoeld.
Integriteit
Het werken met vragenlijsten bij ervaringsonderzoek is integer als de woorden en uitdrukkingen van de patiƫnt/cliƫnt worden weergegeven in de uitkomsten en daarbij niet wordt gemanipuleerd. Antwoorden op vragen mogen niet in de mond worden gelegd. Maar het gevaar dat dit toch gebeurt, is inherent aan de meetmethode.
In mijn eerdere publicatie (2007) wees ik er al op: achter de vragenlijst als meetinstrument schuilt een methode die afkomstig is uit de natuurwetenschappen. Bij die methode voert de onderzoeker de regie. Hij bepaalt welke aspecten in welke volgorde worden onderzocht. Daarmee staat deze methode (aspectmethode), en daarmee ook de vragenlijstals-meetinstrument, op gespannen voet met een hedendaags beleidsuitgangspunt in de zorg: āde cliĆ«nt voert de regie over zijn eigen bestaanā.
Conclusie: Ervaringsonderzoek is niet integer als het bestaat uit het afnemen van vragenlijsten.
Kan het anders? Zeker, maar dit vergt wel een bepaalde houding en vaardigheid van de onderzoeker/interviewer. Ik wijs hierbij op āNiet sturende communicatieā (NSC), een vorm van communicatie waarbij tijdens het gesprek met de patiĆ«nt/cliĆ«nt zo min mogelijk richting wordt gegeven of gestuurd door de onderzoeker/interviewer (Ries van den Nieuwenhuizen; zie box 3).
Box 3. Een alternatief voor het afnemen van een vragenlijst: Niet-sturende communicatie (NSC)
Belangrijkste kenmerken:
Bron en informatie: rvdnie@gmail.com |
Uitvoerbaarheid
Ervaringsonderzoek met behulp van vragenlijsten is beter uitvoerbaar naarmate het aantal onderwerpen (items) kleiner is, de administratieve last beter draagbaar en het tijdsbeslag per patiƫnt/cliƫnt geringer.
Minder onderwerpen
Dit is te bereiken door per patiĆ«nt/cliĆ«nt een beperkt aantal onderwerpen aan te roeren. Als de keuze daarvan aan hen wordt overgelaten, komt dit ten goede aan de zeggingskracht van de uitkomsten. De patiĆ«nt/cliĆ«nt heeft het echter niet alleen voor het zeggen. Andere partijen willen, in het kader van verantwoording en voorlichting, over āhunā onderwerpen worden geĆÆnformeerd. Denk daarbij aan inspecteurs, zorgverzekeraars, patiĆ«ntenorganisaties, beroepsverenigingen, bestuurders en politici.
Administratieve last verlichten?
Die andere partijen stellen hun eigen eisen aan de uitkomsten, waaronder die van vergelijkbaarheid. Zij willen weten ā op meso- en macroniveau ā hoe de kwaliteit van zorg van vandaag zich verhoudt tot die uit het verleden en die van andere instellingen. Het is vooral om die reden dat onderzoeksuitkomsten in kwantitatieve termen moeten worden weergegeven. Er moet worden gescoord op (prestatie-)indicatoren. Dit vraagt, zowel voor als tijdens en na het onderzoek, gecompliceerde vertaalslagen, die veel tijd en energie kosten. Bij elke vraag die aan respondenten wordt gesteld, moet een tegennatuurlijk kunstje worden opgevoerd: van ervaringen die patiĆ«nten/cliĆ«nten uitdrukken in kwalitatieve termen (verhalen met zeggingskracht), moeten uitkomsten worden gegenereerd in kwantitatieve termen (onbetrouwbare cijfers). Hier ligt ook een bron van gemopper. De vertaalslag wordt als onwaarachtig ervaren en doet de patiĆ«nt/cliĆ«nt geen recht.
Geringer tijdsbeslag
Per patiĆ«nt/cliĆ«nt is de tijd te beperken door het gesprek toe te spitsen op zijn ervaringen met de momentane zorg, in het hier en nu. āJe moet meten op het productā, adviseerde ooit Niek van Omme (kwaliteitsfunctionaris van NS en in de jaren negentig hoogleraar kwaliteitsmanagement aan de RUG). Je moet niet afgaan op oude ervaringen en verhalen die spelen in het verleden. Niet alleen zijn herinneringen onbetrouwbaar, ze zouden ook betrekking hebben op oude zorg, zoals die ooit was en inmiddels veranderd kan zijn.
Hier en nu ā¦ dit is iets anders dan het ādaar en straksā van het jaarlijkse evaluatiegesprek. Daarover werd ooit door een zorgverzekeraar het volgende opgemerkt: āHet is toch niet waar dat jullie eens per jaar een gesprek voeren met de cliĆ«nt over zijn ervaringen met de kwaliteit van zorg. Dat doe je toch doorlopend, tussen de bedrijven door? Anders loop je toch altijd achter de feiten aan?ā
In plaats van een regulier gesprek te plannen, kunnen ook tussentijds gelegenheden worden aangegrepen. Ik doel daarbij vooral op incidenten die de gemoederen in beweging brengen, zoals ruzie aan tafel, geschreeuw op de gang, vieze groente of een defecte lift. Na een kort gesprek daarover kan een aantekening worden gemaakt in het individueel zorg- en ondersteuningsplan en kunnen ervaringen met zorg en leven worden opgetekend. Die aantekeningen (op microniveau) kunnen worden geaggregeerd tot een concreet, nauwkeurig, en actueel beeld (op meso- en macroniveau). Jaarlijks herhaald geeft dit de vereiste verantwoordings- en verbeterinformatie.
Conclusie: Bij ervaringsonderzoek door middel van vragenlijsten moet een onwaarachtige draai worden gemaakt van verhalen over ervaringen (kwaliteiten) naar cijfers over aspecten (kwantiteiten). Het geringe effect van die beweging staat niet in verhouding tot de inspanning die zij vergt.
Responsiviteit
Ervaringsonderzoek voldoet aan de eis van responsiviteit indien de uitkomsten gerichte impulsen en aanwijzingen geven voor het verbeteren en verantwoorden van zorg. Maar gebeurt dit ook? Of stapelen de ingevulde vragenlijsten zich op en kijkt niemand ernaar? Dit overkwam ooit Jos Kimenai, kwaliteitsfunctionaris bij het Elisabeth Ziekenhuis in Tilburg. Hij besloot het voortaan anders te doen (box 4).
Box 4. Een alternatieve werkwijze ter verhoging van de responsiviteit
Met willekeurige patiĆ«nten die het ziekenhuis verlieten, knoopte Kimenai een gesprekje aan. āUw hoofd staat er nu niet naar, maar als ik u de volgende week woensdag bel, om een uur of elf, wilt u me dan vertellen wat u goed vond in het ziekenhuis en wat u niet zo goed vond?ā Hij had goede ervaring met deze werkwijze. āZet de recorder maar aan en draai hem af in het werkoverleg van de betreffende afdeling. Naar aanleiding hiervan werd in ons ziekenhuis het ontslagprotocol nog eens tegen het licht gehouden en aangepast.ā |
Conclusie: Twee open vragen op een geschikt ogenblik gesteld vormen een praktisch alternatief voor een hele lijst die op een gepland moment wordt afgenomen.
Slot
Onderzoek met behulp van vragenlijsten (aspectmethode) voldoet niet aan de eisen die redelijkerwijs aan ervaringsonderzoek kunnen worden gesteld. In dit artikel zijn suggesties gedaan voor een alternatief (incidentmethode) en voor andere meetinstrumenten, waaronder ā heel eenvoudig ā het hanteren van een aandachtspuntenlijst in plaats van een vragenlijst.
Al met al is er materiaal aangereikt om het gemopper in het veld over vragenlijsten-als-meetinstrument te reduceren. Inspecteurs, zorgverzekeraars en patiƫntenverenigingen kunnen
bijdragen aan het vergroten van de eenvoud van het onderzoek en het verminderen van de administratieve last door bij onderzoekers aan te dringen op een accentverschuiving van aspectmethode naar incidentmethode. Het effect zal zichtbaar zijn in de responsiviteit van het ervaringsonderzoek.
Literatuur
Vinkenburg, H.H.M., āWaarom toch altijd die vragenlijst?ā Kwaliteit in Beeld, 2007, nr. 3, 18-23.
Dr.ir. Huub H.M. Vinkenburg is zelfstandig adviseur, coach en docent.
Bron: Sigma, nr. 6, december 2011