Oratie prof.dr. O.M. Dekkers

24 maart 2017

Over waarheid en interne ziekten


Rede uitgesproken door Prof.dr. O.M. Dekkers op 24 maart 2017 bij de aanvaarding van het ambt van hoogleraar bij de afdeling Interne Geneeskunde van het het LUMC, in het bijzonder de Methodologie van Klinisch Onderzoek.


Mijnheer de Rector Magnificus, Leden van de Raad van Bestuur van het LUMC, Geachte toehoorders,


I. Een voorwerp van onderzoek

Om te beginnen wil ik graag mijn verwondering met u delen. Daarvoor hebben we een beetje fantasie en een voorwerp van ongeveer 64 kubieke decimeter nodig; dat is 40 cm lang, 40 cm hoog en 40 cm breed. Ik vraag u een dergelijk voorwerp in gedachten te nemen; de materiaalkeuze laat ik aan uw fantasie over. Misschien stelt u zich een klomp goud voor of een blok ijs. En als u in gedachten al bij de borrel bent, een grote vierkante bitterbal is ook een prima optie.

Vervolgens zou ik willen vragen om het voorwerp zo goed mogelijk te onderzoeken. U krijgt twee jaar de tijd, genoeg geld voor onderzoeksmaterialen en u mag gebruik maken van alle beschikbare expertise. Laten we afspreken dat u na twee jaar verslag doet van uw bevindingen. U kunt in dat verslag beschrijven uit wat voor mariaal uw voorwerp bestaat, hoe het voorwerp reageert op hitte of vocht en hoe de interactie met andere voorwerpen is. Een klein voorwerp, een redelijke hoeveelheid tijd en inzet van ruime financiële middelen en expertise. Kortom, een haalbaar project.

Mijn eigen voorwerp van onderzoek heeft ook een inhoud van zo'n 64 kubieke decimeter. Er wordt al eeuwen onderzoek naar gedaan, en er zijn miljarden euro's in dit onderzoek geïnvesteerd. Om u een getalsmatige indruk te geven van deze onderzoeksvlijt: er worden over mijn voorwerp jaarlijks meer dan 1,2 miljoen artikelen gepubliceerd; dat is 1 nieuw artikel per 2 minuten. En desondanks kent mijn voorwerp nog veel geheimen en open vragen. Mijn voorwerp van onderzoek en verwondering is: de mens met inbegrip van zijn ziekten. 

Een simpel voorbeeld maakt duidelijk dat we veel nog niet weten. Een vrouw komt op het spreekuur met een minimale hypothyreoïdie, een aandoening waarbij de schildklier te weinig schildklierhormoon produceert. Ze heeft twee simpele vragen: hoe is de aandoening ontstaan en wat kunnen we er aan doen. Plat gezegd: hoe kom ik er aan en hoe kom ik er vanaf? Over hypothyreoïdie zijn meer dan 40,000 artikelen verschenen, over de milde variant meer dan 3,300. Maar we kunnen haar niet met zekerheid vertellen wat de oorzaak van haar ziekte is, en of behandeling met schildklierhormoon haar gezondheid ten goede komt. We kunnen haar zelfs niet met zekerheid zeggen of ze wel een ziekte heeft. Alle gepubliceerde artikelen ten spijt.

Dat de waarheid aangaande mijn onderzoeksonderwerp moeilijk is, blijkt ook uit het gegeven dat onderzoeksresultaten niet altijd betrouwbaar zijn. We kennen allemaal berichten met het nieuwste epidemiologisch onderzoek. Gister veroorzaakte het eten van worst hoofdpijn, morgen blijkt pizza een oorzaak van allergie. Conclusies die steevast nuancering behoeven. Dit heeft geleid tot vergaande en principiële scepsis aangaande epidemiologisch onderzoek. Sterker nog, er wordt veel epidemiologisch onderzoek gedaan dat moet aantonen hoe slecht het met epidemiologisch onderzoek gesteld is. Een bekend voorbeeld is een 10 jaar oud artikel van de Griekse epidemioloog Ioannidis met als veelzeggende titel 'Why most research findings are false'. Dit artikel is meer dan 5,000 keer geciteerd en claimt dat 80% van alle positieve epidemiologische onderzoeksresultaten onwaar zijn. Hoewel er op de argumentatie van het stuk zeker iets af te dingen is, is de strekking dat er veel niet zinvol onderzoek wordt gepubliceerd wel algemeen geaccepteerd.


II. Waarom we niet zonder klinisch onderzoek kunnen

Er is me wel eens gevraagd waarom we onderzoek moeten doen naar oorzaken van ziekten en effecten van behandelingen. Immers, zo luidde de toelichting, we kunnen toch zien wat oorzaken van ziekten zijn, en of therapieën werken? Als we daarbij optellen dat goed onderzoek met valide conclusies moeilijk is en bovendien duur, is het de moeite waard om na te gaan of en waarom we onderzoek naar interne ziekten nodig hebben.

Laat me beginnen met een analogie uit de rechtspraak. Jaren geleden sprak ik een rechter over de moord op een Nederlands politicus. Juridisch gezien geen spannende casus, sprak ze. We hebben een verdachte, die gevolgd is vanaf de moord tot aan de arrestatie, we hebben een moordwapen en een bekentenis. Er is niets meer te bewijzen, er zal enkel nog discussie over de strafmaat zijn. Vertaald naar de geneeskunde: we hebben een patiënte met een ziekte waarbij geen onzekerheid over oorzaak en diagnose bestaat. Een voorbeeld. Een fietsster wordt aangereden door een auto (omdat ik weinig verstand heb van auto's laat ik merk naar eigen keuze en inzicht) en breekt haar been. Hier is duidelijk wat er medisch aan de hand is en waardoor dat komt. 

Voor veel ziekten geldt deze duidelijkheid niet zonder meer. Zoals de naam al aangeeft spelen interne ziekten zich af binnen de uiterlijk zichtbare contouren van de mens; ontstaan en genezing van deze ziekten zijn voor arts of onderzoeker niet direct zichtbaar. Terug naar de vrouw met hypothyreoïdie. We hebben in haar geval niet kunnen waarnemen hoe, wanneer en waarom de ziekte is ontstaan, en we kunnen ook niet direct zien in hoeverre haar klachten mede veroorzaakt zijn door het lage niveau van het schildklierhormoon.

Maar ik wil betogen dat zelfs wanneer we menen een ziekte-oorzaak te kennen, we causaliteit vaak interpreteren, en niet direct zien. Laat me een voorbeeld geven. Er komt een patiënt op de eerste hulp met een hartinfarct. De patiënt heeft gerookt en heeft overgewicht. De conclusie ligt voor de hand dat het roken en het overgewicht de oorzaak van het hartinfarct zijn. Maar let wel, zowel de patiënt als de dokter heeft de processen die zich in het hart in de tijd voor de diagnose hebben afgespeeld niet kunnen waarnemen. En, zijn beide factoren bij deze patiënt daadwerkelijk oorzaken in de strikte zin van het woord geweest? Het zou zelfs nog kunnen dat het roken en het overgewicht geen rol hebben gespeeld, en dat de oorzaak terug te voeren is op de genetica van de patiënt. De waarneming is dat de patiënt een hartinfarct heeft en daarnaast ook heeft gerookt en overgewicht heeft. De interpretatie, overigens heel goed verdedigbaar, is dat het hartinfarct veroorzaakt is door roken en overgewicht. Onderzoek leert ons dat roken een oorzaak is van een hartinfarct, niet de waarneming van de individuele patiënt. Was dat wel zo geweest, dan had het niet tientallen jaren hoeven duren voor de wetenschappelijke wereld overtuigd raakte van de schadelijke effecten van roken.

Maar als we oorzaken van ziekte niet zien, dan toch ten minste de effecten van een behandeling? Een arts ziet toch wat het effect van een therapie is die zij aan een patiënte geeft? Zeker, er zijn situaties waarbij het effect van een behandeling min of meer met het blote oog zichtbaar is. Denk bijvoorbeeld aan de chirurg die met spoed een lekkende slagader moet opereren. Het effect van een behandeling is hier direct waarneembaar. Immers, als de slagader niet meer lekt na de ingreep dan is de effectiviteit van de ingreep aangetoond. Maar voor de meeste interne ziekten en hun behandeling zijn dergelijke conclusies moeilijker, en ik wil hier twee redenen noemen.

Er komt een patiënte bij de huisarts. Ze voelt zich niet lekker, hoest en heeft koorts. De huisarts besluit antibiotica te geven, een 'kuurtje' zoals het in de volksmond heet. Twee dagen later gaat het beter met de patiënte. Mogen we nu concluderen dat de antibioticakuur effectief geweest is? Niet zonder meer; het zou kunnen zijn dat de patiënte ook zonder antibiotica opgeknapt was. De meeste aandoeningen waar de huisarts mee te maken heeft gaan vanzelf over. Mensen komen naar de dokter als ze zich echt niet lekker voelen en de kans dat de klachten de volgende dagen afnemen is groot, ook zonder behandeling. Merk hier het verschil met de chirurg die de lekkende slagader opereert. Een lekkende slagader stopt doorgaans niet vanzelf. Dus wanneer de arts zeker weet wat het ziektebeloop is zonder behandeling, en ziet dat het beloop onder een behandeling hiervan evident afwijkt, dan kan bij een individuele patiënt geconcludeerd worden dat de behandeling werkt. Dat is het geval bij de lekkende slagader, maar niet bij de hoestende patiënte.
 
Er is een tweede reden waarom effecten van behandeling niet goed waarneembaar zijn zonder onderzoek en daarvoor zou ik graag gebruik maken van uw geheugen. Denkt u terug aan de kalenderjaren van 2010 tot en met 2015, maak een schatting van de hoeveelheid regen per jaar. Bepaal vervolgens in welk jaar de meeste regen is gevallen. Goede kans dat u twijfelt. U zult mogelijk een prachtige dag met een romantische wandeling in uw geheugen vinden, of u denkt terug aan het huwelijk van uw neefje dat helemaal verregende. Uw geheugen wordt getrokken naar de extreme dagen, niet direct naar goede schattingen van hoeveelheid regen over een jaar tijd. En zelfs als u zich concentreert op de totale hoeveelheid regen per jaar, dan nog zijn de verschillen tussen de jaren niet dusdanig groot dat makkelijk te bepalen is in welk jaar de meeste regen is gevallen.

Dit denken over regen laat zien dat ook artsen in de praktijk moeite kunnen hebben te zien of behandelingen werken. Ze zullen zich die ene patiënte heel goed herinneren met een ernstige bijwerking, of de patiënte die opvallend snel opknapte. Maar in analogie aan de hoeveelheid regen per jaar is het zo dat veel therapieën een klein effect hebben dat zich zonder onderzoek moeilijk precies laat schatten.

Ik heb geprobeerd u te overtuigen dat het moeilijk is om door enkel het waarnemen van individuele patiënten valide conclusies over oorzaken van interne ziekten en werkingen van behandelingen te trekken. Dit gegeven onderstreept de centrale rol die onderzoek in de geneeskunde is toebedeeld. Oh ja, voor diegenen met een aangeboren vermogen tot kwantitatief waarnemen, de meeste neerslag viel inderdaad in 2015, namelijk 947 mm in een jaar, 1 mm meer dan in 2012.


III. Wittgenstein: een correspondentietheorie van waarheid

Nadat ik heb betoogd dat onderzoek nodig is voor inzicht in oorzaken en behandeleffecten, wil ik u meenemen naar het denken van Ludwig Wittgenstein alvorens dieper in te gaan op de vraag waarom epidemiologisch onderzoek fundamenteel moeilijk is.

Ludwig Wittgenstein werd in 1889 geboren in een van de rijkste families van Wenen. Zijn jeugd kenmerkte zich door een rijk cultureel leven. Johannes Brahms was een huisvriend, en Gustav Klimt heeft een beroemd portret van zijn zuster geschilderd. Wittgenstein besluit op jonge leeftijd zijn diepe passie, namelijk de filosofie, te volgen. Hij verlaat Wenen, neemt afstand van zijn erfdeel met de mededeling 'geef maar aan mijn zuster, die is toch al verpest', en leeft zijn verdere leven op zo primitief mogelijke wijze om zich optimaal op de filosofie te kunnen concentreren. Wittgenstein zet zijn filosofische gedachten uiteen in een relatief kort werk met de titel Tractatus logico-philosophicus, een werk dat hij gedeeltelijk aan het front in de Eerste Wereldoorlog heeft geschreven. Het basisidee van Wittgenstein in de Tractatus is dat er een directe correspondentie is tussen taal en gedachten enerzijds en de waarneembare werkelijkheid anderzijds. De waarheid komt volgens Wittgenstein neer op het zo goed mogelijk weergeven van de zichtbare werkelijkheid in stellingen.

Een voorbeeld uit het dagelijkse leven: de stelling 'er staan 2 pakken abrikozenvla op de tafel' is waar wanneer er inderdaad twee pakken abrikozenvla op de tafel staan. Natuurlijk niet heel relevant of interessant vanuit wetenschappelijk perspectief; waar het om gaat is dat de uitspraak een voorbeeld is van een beschrijving van de wereld zoals ze is. Een dergelijke simpele beschrijving van de werkelijkheid kan al belangrijke epidemiologische kennis opleveren. Zo berekende het Centraal Bureau voor Statistiek dat in 2015 50,3% van de volwassen bevolking overgewicht had. Van deze mensen met overgewicht gebruikte 7% ten minste 1 dag per week meer dan 5 glazen alcohol. Hoewel het onderzoek logistiek complex kan zijn, gaat de kenniswaarde niet uit boven het beschrijvende niveau van de werkelijkheid. Uitspraken over het aantal pakken abrikozenvla op tafel zijn beschrijvend, uitspraken over het aantal mensen met overgewicht in een land zijn op eenzelfde manier beschrijvend. Het denkkader van Wittgenstein waarin waarheid gaat over het exact weergeven van de werkelijkheid past goed op dergelijke beschrijvende uitspraken.

We komen binnen dit beschrijvende denkkader nog een stap verder wanneer we onderzoeken of twee variabelen vaak samen voorkomen. We noemen deze variabelen geassocieerd. Abrikozenvla staat vaker op tafel na het avondeten dan na het ontbijt. Suikerziekte komt vaker voor bij mensen met dan bij mensen zonder overgewicht. Suikerziekte en overgewicht zijn geassocieerd.

Maar meestal wil epidemiologisch onderzoek meer zijn dan tellen en beschrijven van de werkelijkheid. Waarom neemt overgewicht of suikerziekte toe? Verlengt een vegetarisch dieet de levensverwachting? Wat zijn oorzaken van hypothyreoïdie en hoe kan ik haar het beste behandelen? Voor dergelijke vragen moet een tweede laag van de werkelijkheid worden onderzocht. Een laag van oorzaak en gevolg.

Misschien is het goed om hier een korte tussenstop te maken bij de zogenaamde big data in medisch onderzoek. De term staat voor de verzameling van hele grote hoeveelheden gegevens die direct of indirect betrekking hebben op de gezondheid. Deze gegevens kunnen vervolgens in onderzoek worden gecombineerd. Bijvoorbeeld kan het gaan om gegevens over ziekteverzuim en over bezoek aan de sportschool in combinatie met informatie over genetica en medicatie gebruik. Maar bedenk wel dat het niet het aantal data is dat zonder meer maakt dat we zicht krijgen op oorzaken. Ook hele grote datasets leveren in eerste instantie beschrijvingen van de werkelijkheid en associaties op. Een bekend voorbeeld van big data gebruik is de mogelijkheid om met gegevens over zakdoekjesverkoop de start van een griepepidemie te voorspellen. Maar dergelijke data vertellen niet waarom de ene persoon wel en de andere persoon niet de griep krijgt.


IV. Over epidemiologisch onderzoek

Stel, we willen de onderzoeksvraag proberen te beantwoorden of een vegetarisch dieet leidt tot langer leven. Een vraag dus naar oorzaak en gevolg, een vraag naar een werkelijkheid voorbij de directe waarneming. U kent vast een vegetariër. Leeft deze persoon langer door haar vegetarische dieet? Op basis van het bestuderen van deze ene persoon zullen we de vraag niet kunnen oplossen. Ten eerste leeft de persoon nog, en ten tweede leeft deze persoon maar een keer. (Dat laatste geldt overigens ook voor een niet-vegetariër.) We weten dus niet wat met deze persoon gebeurd was, zou zij geen vegetariër zijn geweest. Om verder te komen met de vraag moeten we de levensduur van vegetariërs met niet-vegetariërs vergelijken. Vergelijkt u in gedachten een overleden vleeseter en een overleden vegetariër.  Uw onderzoek begint dus met een beschrijving van een stand van zaken, een associatie. Stel, uit uw kleine onderzoek blijkt inderdaad dat de vegetariër langer leeft. Mogen we dan concluderen dat dit verschil in levensduur oorzakelijk terug te voeren is op het vegetarisch zijn? Helaas bestaat er geen logische wet die ons logisch noodzakelijk aangeeft welke associatie daadwerkelijk causatie impliceert. Logisch leidt dus de stelling dat een vegetarisch dieet tot een langer leven leidt als ook de stelling dat dit niet het geval is, niet tot een contradictie.

Het grote probleem van epidemiologisch onderzoek is, in de woorden van Frits Rosendaal, dat mensen verschillend zijn. De vegetariër zal in veel opzichten verschillen van de niet-vegetariër. Zij zal mogelijk vaker yoga doen, meer groente eten, minder televisie kijken. Allemaal verschillen die ook een verschil in levensduur zouden kunnen verklaren. Voor een goede vergelijking willen we dus een controlepersoon, of zoals in onderzoek gebruikelijk is, een controlegroep, die in alle opzichten gelijk is aan de vegetariër; behalve dat de controle niet vegetarisch eet.

Maar het zal nagenoeg onmogelijk zijn om vleeseters te vinden die identiek zijn aan vegetariërs, behalve dat ze wel vlees eten. De oplossingsrichting die in de epidemiologie gebruikt wordt om toch de vraag te beantwoorden is: de verschillen die er kunnen zijn tussen de vegetariërs en niet-vegetariërs zo goed mogelijk meten. We meten rookgewoonten, het sla-eet gedrag en het aantal yoga-uren per week in beide groepen. We kunnen vervolgens statistisch de vegetariërs en niet-vegetariërs vergelijken voor wat betreft levensduur, daarbij rekening houdend met de gemeten verschillen in het aantal uren yoga en sla eten. Technisch gezien noemen we dit statistisch corrigeren voor verschillen tussen groepen. Onder de aanname dat we alle belangrijke verschillen hebben gemeten, kunnen we op deze wijze toch een uitspraak proberen te doen over het effect van een vegetarisch dieet op levensduur.

Even terug naar ons voorwerp van onderzoek van het begin van de oratie - laten we zeggen een klomp goud. Goud kent geen complexe structuur, is redelijk stabiel in de tijd, en reageert slechts beperkt op omgevingsfactoren. De mens daarentegen bestaat onder andere uit miljarden cellen, genen en eiwitten. Al deze factoren kunnen met elkaar reageren, en gehoorzamen verschillende chemische en natuurkundige wetten. En dan hebben we het nog niet eens over hoe deze fysieke laag zich verhoudt tot gedrag of gezondheid. Het aantal mogelijke verschillen tussen mensen, ook verschillen die van invloed op levensduur kunnen zijn, is dus gigantisch. Hebben we dan ooit de garantie dat we alle belangrijke verschillen tussen vegetariërs en niet-vegetariërs goed in kaart hebben gebracht? 

Vanuit dit perspectief wordt ook duidelijk waarom het gerandomiseerde onderzoek zo hoog in het vaandel staat. Randomisatie is een onderzoekstechniek waarbij het toeval voor een studiepopulatie bepaalt wie in welke groep terecht komt. Hierdoor mag je er redelijkerwijs van uitgaan dat de groepen vergelijkbaar zijn. Daarnaast hebben we middels randomisatie een techniek in handen die in onderzoekers staat stelt direct causaal in de werkelijkheid te interveniëren. Laten we een voorbeeld geven. Er is decennia discussie geweest of milde hypothyreoïdie moet worden behandeld. Typisch een onderzoeksvraag waarbij niet alle verschillen tussen groepen goed gemeten zullen zijn en waarbij statistisch corrigeren de onvergelijkbaarheid waarschijnlijk niet helemaal kan opheffen. Samen met onderzoekers uit Bern, Cork en Glasgow hebben we een grote gerandomiseerde studie opgezet om de vraag te beantwoorden of de behandeling met schildklierhormoon zinvol is. Toeval bepaalde welke patiënten schildklierhormoon kregen, en welke een identiek uitziend maar onwerkzaam middel. Een zogenaamde placebo. Kosten van de studie: 10 miljoen euro. U hoort het goed, 10 miljoen euro om een simpele vraag te beantwoorden of het geven van een klein beetje schildklierhormoon een verbetering van de kwaliteit van leven geeft. Randomisatie is dus duur. Maar laten we eerlijk zijn. Geld is vooral een kwestie van perspectief. Wij hebben voor een bedrag waar je nog nauwelijks een goede voetballer voor kan kopen, een valide antwoord op een belangrijke klinische vraag kunnen geven.

Maar ook randomisatie is geen wondermiddel. Ten eerste kunnen we veel factoren die we willen onderzoeken niet door toeval aan personen toewijzen. Stelt u zich voor dat, omwille van onderzoek, het toeval vanaf morgen bepaalt of u als vleeseter of vegetariër verder door het leven dient te gaan. Ondenkbaar. Ook factoren als gedrag of geslacht kunnen om praktische of ethische redenen niet door toeval worden toegewezen aan mensen. Ten tweede is randomisatie een moeilijk instrument om langdurende effecten van behandelingen te meten. Patiënten zijn, om uiteenlopende redenen, immers geneigd zich steeds minder aan de voorgeschreven studie behandeling te houden. Randomisatie is dus als een steen die in de vijver wordt gegooid. Hoe verder de ringen, hoe kleiner de golven. Daarnaast heb ik met mijn discussie over het vegetarisch dieet een voorbeeld gekozen waarbij de groepen die worden vergeleken in heel veel aspecten zullen verschillen. Er zijn gelukkig ook veel onderzoeksvragen waarbij de onvergelijkbaarheid minder prominent is. Zo heeft mijn leermeester Jan Vandenbroucke belangrijk werk verricht door te laten zien dat bijwerkingen van geneesmiddelen zich valide in epidemiologische setting laten onderzoeken, ook zonder randomisatie. Dit betekent dat epidemiologisch (niet-gerandomiseerd) onderzoek belangrijk zal blijven om relevante klinische vragen te beantwoorden.


V. The bad name of epidemiology and its future

Epidemiologisch onderzoek is dus zowel noodzakelijk als moeilijk. En die moeilijkheid ontstaat met name daar waar we de grens tussen Wittgensteins pure beschrijven van de werkelijkheid passeren en uitspraken willen doen over een diepere werkelijkheidsstructuur van oorzaak en gevolg. En het eerder geschetste imagoprobleem van onderzoek is direct verbonden met deze intrinsieke moeilijkheid. Wat kunnen we hieraan doen?

Een oplossing is niet om met voorzichtig taalgebruik elke causale claim te vermijden. Dat helpt de wetenschap niet vooruit. Dit geldt, met uitzondering van hypothese genererende benaderingen, tevens voor studies met de voorzichtige conclusie dat iets mogelijk een risicofactor is. Zoals ik eerder heb aangegeven is er geen logische wet waarmee we noodzakelijk kunnen bepalen welke associaties wel - en welke associaties niet causaal zijn. De conclusie dat iets mogelijk een oorzaak is, kunnen we dus veelal ook zonder onderzoek claimen. 

Ik zie vier pijlers voor een gezonde epidemiologie in de toekomst, pijlers waaraan ik met mijn leerstoel wil bijdragen.

Als eerste pijler stel ik een mindset voor, die ook het weerleggen van de eigen stelling als een waardig onderzoeksdoel ziet. De drive van onderzoekers is vaak het bijdragen aan genezing van een ziekte, of aan de oplossing voor een medisch probleem. Meestal hebben onderzoekers ook al een idee of hypothese alvorens ze met het onderzoek beginnen. Laten we aannemen dat onderzoekers een belangrijke causale rol zien voor eiwit KV466 in het ontstaan van hun favoriete ziekte. De meeste onderzoeksprojecten zullen er dus op gericht zijn deze rol ook daadwerkelijk aan te tonen. Sterker nog, de onderzoekers hebben in subsidieaanvragen al moeten aangeven hoe uiteindelijk het eiwit KV466 kan helpen de ziekte te behandelen. Valorisatie heet dat. Ik hoop dat u snapt dat de mindset van dergelijke onderzoekers niet primair gericht is op het weerleggen van de eigen hypothese. Sterker nog, in een onderzoek rapporteerde 30% van de onderzoekers druk om de hypothese van de eigen onderzoeksgroep te bevestigen, ook als de data een ander verhaal vertelden. Maar vanuit het oogpunt van de waarheid is het aantonen dat iets niet het geval is, minstens zo belangrijk als het aantonen dat iets wel het geval is. Het zou naar onderzoekscollegae of subsidiegevers dan ook niet als nederlaag ervaren moeten worden als de conclusie van jaren onderzoek is dat eiwit KV466 niet de belangrijke rol speelt die men het toedichtte. Laten we dus ook in onderzoeksprotocollen en subsidieaanvragen ook een proef opnemen waarbij we proberen de onderzoekshypothese te weerleggen.

Deze houding om actief onderzoekshypothesen te weerleggen is volgens de filosoof Karl Popper een centraal aspect van wetenschap. Sterker nog: alleen die onderzoeksvelden waarvan de stellingen in principe weerlegd kunnen worden, zijn wetenschappelijk te noemen.

Laat me een voorbeeld geven van dit streven tot weerleggen. Er is discussie over de vraag of  griepvaccinatie sterfte voorkomt bij verder gezonde mensen. Veel onderzoeken lieten zien dat gevaccineerden een lager sterfterisico hebben dan niet-gevaccineerden. Maar voor dergelijk onderzoek geldt dat gevaccineerde mensen vaak een betere ziektekostenverzekering hebben, gemiddeld meer sla eten en vaker yoga doen. Kortom, gevaccineerden en niet-gevaccineerden zijn misschien te verschillend om een valide conclusie over de werkzaamheid toe te laten. Amerikaanse onderzoekers kwamen op het idee het sterfterisico tussen gevaccineerden en niet-gevaccineerden niet alleen tijdens het griepseizoen te vergelijken, maar ook voor het griepseizoen. Ze vonden een vergelijkbare sterftereductie voorafgaand aan het griepseizoen, dus toen het griepvaccin nog niet effectief had kunnen zijn, als ten tijde van het griepseizoen. Hiermee hebben deze onderzoekers een groot effect van vaccinatie op sterfte heel onaannemelijk gemaakt.

Een tweede pijler voor een gezonde epidemiologie gaat over de vorm waarin we epidemiologisch onderzoek publiceren. Juist omdat epidemiologisch onderzoek fundamenteel moeilijk is, kan niet worden verwacht dat de waarheid in een enkel onderzoek naar boven komt. Elke onderzoeksdatabase en elke onderzoeksvorm kent eigen sterke en zwakke punten. Vaker zouden epidemiologische onderzoekers mogen overwegen om in een publicatie verschillende onderzoeken te bundelen die elkaar door de verschillende benadering versterken. Men zou men eraan kunnen denken om voor 1 publicatie dezelfde hypothese in twee verschillende populaties te onderzoeken, of de onderzoeksresultaten te combineren met data uit basaal onderzoek. In predictieonderzoek is het al gangbaar dat resultaten pas geaccepteerd en vaak ook gepubliceerd worden als ze minstens één keer gerepliceerd zijn in een tweede onderzoekspopulatie.

De derde pijler wil ik slechts kort aanduiden. Een gezonde epidemiologie zal ook noodzakelijk onderzoek naar de waarde van haar eigen methoden moeten blijven doen. Het onderzoek dat ik samen met mijn collega Saskia le Cessie doe naar instrumentele variabelen, netwerk meta-analyses en meetfouten past binnen deze pijler. Ook de toekomstige nauwere samenwerking van de klinische epidemiologie met de medische statistiek is vanuit dit gezichtspunt belangrijk.

De vierde en laatste pijler raakt aan de ethiek van het publiceren. U kent dat vast wel. U komt 's avonds thuis, moe van een dag hard werken. U loopt naar de koelkast. Bijna leeg. Er ligt nog een halve vale bloemkool, zichtbaar randje uiterste houdbaarheidsdatum. Een plank erboven ligt een bordje rijst van eergister. Bij gebrek aan beter besluit u de bloemkool toch maar te koken en de rijst op te bakken. Over smaak valt te twisten, mij lijkt dit geen culinair hoogtepunt.

Wetenschappers doen soms ook een kast open met minder (goede) data dan gehoopt. Bijvoorbeeld, iemand komt op het idee om in een bestaande dataset te kijken of vegetariërs langer leven. Dan blijkt de vragenlijst maar door de helft van de deelnemers ingevuld, er is weliswaar gevraagd of mensen vegetariër zijn, maar informatie over verdere eet- en rookgewoonten ontbreekt. Kortom, het wetenschappelijke equivalent van een nagenoeg lege koelkast met een vale bloemkool. De primaire reactie van de wetenschapper zou moeten zijn om het analyseren van deze data achterwege te laten. Slechte data worden zelfs door de beste statistische technieken niet gered en het antwoord dat deze studie op de onderzoeksvraag gaat geven is onwaar en irrelevant. Het is een wet in de epidemiologie dat enkel het feit dat data voorhanden zijn, een studie niet valide maakt.

William Clifford, een negentiende-eeuwse wiskundige, beschrijft en bekritiseert in een essay de besluitvorming van een scheepseigenaar. Deze scheepseigenaar twijfelt over de zeewaardigheid van een van zijn schepen, maar hij onderdrukt zijn twijfel met als argument dat het schip immers meerdere malen in goede staat teruggekeerd is van een verre reis. De scheepseigenaar laat het schip uitvaren en het schip gaat ten onder. Hij strijkt vervolgens de verzekeringspremie op en laat zijn geweten verder zwijgen. In bijtend scherpe bewoording veroordeelt Clifford het handelen van de scheepseigenaar. Want, zo schrijft hij:  'de oprechtheid van zijn overtuiging kan hem op geen enkele wijze helpen; dit omdat hij geen recht had om te geloven wat hij geloofde. Hij verkreeg zijn overtuiging niet door zorgvuldig onderzoek, maar enkel door zijn geweten te sussen.'

Laten we Clifford de bovengenoemde onderzoeker spreken dan zou hij er zeker op hebben gewezen dat we niet het recht hebben om deze resultaten te publiceren, omdat we niet alles hebben gedaan om tot een wetenschappelijk oordeel te komen dat zo goed mogelijk de waarheid benadert. Maar of het nu om haast, ijdelheid, financiële belangen of slechte datasets gaat, we zijn niet altijd geneigd de waarheid te laten prevaleren.

Het interessante is dat iedereen weet dat er veel onderzoek wordt gepubliceerd dat de kritiek van Clifford niet kan weerstaan, zoals ook blijkt uit het volgende citaat: 'Onderzoekers realiseren zich maar al te goed dat het verschijnen van hun namen in tijdschriften het prestige verhoogt. Het gevolg is een continue stroom publicaties van nietszeggende repetities van eerdere studies en lege onderzoeken van inferieure kwaliteit. Dit alles is het gevolg van een liefde voor zelf-promotie'.

Nog opvallender dan de scherpe bewoording, is het jaar waarin deze uitspraak werd opgeschreven, namelijk 1922. Klaarblijkelijk is het probleem niet alleen al 100 jaar zichtbaar, maar tevens moeilijk aan te pakken. Ik zou een pleidooi willen houden voor wetenschap waarin kwantiteit een minder prominente rol speelt. En omdat verandering niet zonder commissie van wijze dames en heren kan worden ingevoerd, heb ik ook al de titel bedacht voor het rapport van deze commissie die de wetenschap als productiesysteem gaat herijken: Towards lean Science in Medicine 2032. Maar omdat we zo lang niet kunnen wachten en we iets moeten proberen te doen aan de overproductie heb ik een test bedacht die naar mijn idee even simpel, goedkoop als effectief is. Maak een onderzoeker midden in de nacht wakker met de vraag of zijn onderzoek een zinnige en vooral valide bijdrage gaat leveren aan de medische wetenschap. Ik weet zeker dat de onderzoeker het antwoord weet. Indien het antwoord ontkennend is, is het vriendelijke doch dringende verzoek het betreffende onderzoek niet uit te voeren.


VI. De rol van wetenschappelijke discussies

Dit brengt me tot slot van deze oratie bij wetenschappelijke discussies. In 2007 deed een Amerikaanse cardioloog, Steve Nissen, onderzoek naar mogelijke bijwerkingen van een middel tegen suikerziekte en hij kwam tot de conclusie dat het middel een toename van hartinfarcten leek te geven. Op zich een opvallende bevinding omdat middelen tegen suikerziekte uiteindelijk als doel hebben de vaatschade, waaronder schade in het hart, te voorkomen. Hij stuurde het artikel naar een vooraanstaand wetenschappelijk tijdschrift en terwijl het artikel op het redactiebureau lag, kreeg Nissen bezoek van de fabrikant van het middel. Ze hadden het artikel, dat nog niet was gepubliceerd, onder ogen gekregen. In een gesprek bekritiseerden ze de methode die Nissen had gebruikt om tot zijn conclusies te komen, om vervolgens te suggereren het stuk niet te publiceren omdat anders openlijk de waarheid van zijn conclusie in twijfel getrokken zou moeten worden.

Nissen komt als antwoord met twee sterke argumenten: een ethisch en een wetenschappelijk argument. Ten eerste, zo betoogt hij op een wijze die doet denken aan Clifford, hebben jullie het recht niet te geloven dat het middel veilig is. Jullie hebben alle data in je databases om een eigen analyse naar veiligheid te doen. Sterker: jullie hadden dat al lang moeten doen. En ten tweede stelt hij dat angst voor weerlegging onwetenschappelijk is: ik publiceer het artikel en wacht de discussie af. That is how science works.

Het pleidooi voor een open discussie van wetenschappelijke resultaten is in een filosofische context door Habermas gepropageerd. Habermas noemde zijn ideaal hier de Machtsvrije Discussie. Machtsvrij in die zin dat deelnemers aan een wetenschappelijke discussie geen belang hebben bij een specifieke uitkomst; waarheid en niet het eigen gelijk of belang prevaleert. Dat is zoals we maar al te goed weten in geneeskundig onderzoek soms anders. De invloed van de farmaceut is bekend en zoals eerder betoogd is het streven naar bevestigen van een eigen onderzoekshypothese ook een belang dat de waarheid in de weg kan staan. Dat maakt het streven naar een discussie die machtsvrij is onverminderd relevant.

Drie opmerkingen tot slot over deze wetenschappelijke discussie. Mensen zijn oordelende wezens. U zal een oordeel over de oratie vellen. U heeft waarschijnlijk tijdens de oratie een oordeel geveld over abrikozenvla en bloemkool. Bij een smaakoordeel over bijvoorbeeld bloemkool zeggen we meer over onszelf dan over de bloemkool in eigenlijke zin. Een wetenschappelijk discussie gaat ook over oordelen, maar anders dan bij een smaakoordeel staat de waarheid centraal. Zinvolle discussies vereisen dat de deelnemers inhoudelijk op de hoogte zijn van het onderwerp. We hebben in Nederland een politica gehad die zich erop liet voorstaan haar stukken niet te lezen omdat ze op die manier een oordeel kon vellen dat dichter tegen het oordeel van de kiezers aanligt. Een dergelijke houding mag politiek stemmen opleveren, maar zal de waarheid niet dienen. Stelt u zich voor, een commissie die oordeelt over werkzaamheid van geneesmiddelen en de toelating hiervan op de markt, waarbij niemand de relevante onderzoeken heeft bestudeerd. Naast inhoudelijk geïnformeerd, moet ook beoordeeld worden wat de sterke en zwakke elementen zijn van de studies die ter discussie staan. Dit maakt dat wetenschappers met kennis van onderzoeksmethodologie ook een belangrijke rol in deze discussies moeten spelen. Onderdeel van mijn leerstoel zal ook zijn om het methodologische perspectief verder in te brengen in bijvoorbeeld de Gezondheidsraad of de richtlijnen commissie van de Europese Vereniging van Endocrinologie.

Ten tweede kan een dergelijke discussie ook een platform zijn waarin wordt besloten in welke richting en op welke wijze onderzoek zich bij voorkeur verder ontwikkelt. Dit vergroot de mogelijkheid tot het bundelen van expertise en reduceert mogelijk de productie van onzinnige artikelen. Er hadden geen duizenden artikelen over hypothyreoïdie geschreven hoeven te worden alvorens te concluderen dat enkel een groot gerandomiseerd onderzoek antwoord op de vraag naar de effectiviteit van een behadeling kan geven.

Ten derde zullen verschillende invalshoeken in een discussie samen moeten komen. De waarheid is gelaagd, we kennen weinig ziekten die slechts een enkele oorzaak hebben. Neem de relatie tussen overgewicht en hartinfarcten. Basale onderzoekers zullen op tafel leggen via welke mechanismen zij denken dat overgewicht vaatschade veroorzaakt; psychologische onderzoekers zullen aangeven welke mechanismen een rol spelen bij het beheersen van een eetimpuls en sociologische onderzoekers brengen mogelijk de relatie tussen de lage prijs van ongezond voedsel en overgewicht in het spel. Verschillende invalshoeken die allemaal een andere laag van de waarheid blootleggen.

Dames en heren. Ik heb betoogd dat epidemiologisch onderzoek zowel moeilijk, noodzakelijk als uitdagend is. En er is in de woorden van Nancy Krieger en George Davey Smith geen alternatief voor heel hard nadenken over de fenomenen die we in onderzoek willen verklaren. Ik hoop met mijn leerstoel dit nadenken te cultiveren en verder te ontwikkelen en daarmee positief bij te dragen aan de kwaliteit van epidemiologisch onderzoek van interne ziekten.


Een woord van dank

Rest mij een woord van dank.

Toen Willem van Oranje in 1574 de opmaat gaf om de Universiteit van Leiden te stichten was een belangrijk motief dat de Universiteit de 'Vrijheid zou dienen en ondersteunen'. Het College van Bestuur dank ik niet alleen voor het in mij gestelde vertrouwen maar ook als hoeder van deze Academische vrijheid. Een groot goed vandaag de dag.

Hooggeleerde Vandenbroucke, beste Jan: omdat ik me geen betere leermeester had kunnen wensen. Je hebt me de mogelijkheid en het perspectief van het klinisch onderzoek gegeven.

Hooggeleerde Rabelink, beste Ton: omdat jouw unieke vermogen om kwaliteiten scherp te zien, maar mensen tevens vrij te laten, het beste in iedereen naar boven haalt.

Hooggeleerde Rosendaal, beste Frits: omdat je een afdeling klinische epidemiologie hebt neergezet die kwalitatief hoogstaand is; jouw unieke combinatie van scherpzinnigheid en humor is epidemiologisch gezien een schoolvoorbeeld van positieve interactie.

Hooggeleerde Pereira, beste Alberto: omdat ik me onvoorwaardelijk gesteund weet, als vriend en als collega.

Hooggeleerde le Cessie, Cannegieter en van der Bom, beste Saskia, Suzanne en Anske: omdat we een liefde voor nadenken over causaliteit delen.

Hooggeleerde de Fijter en Dekker, beste Hans en Friedo: omdat onderwijs en opleiding cruciaal zijn voor valide klinisch onderzoek.

Hooggeleerde Smit, beste Jan: omdat wijsheid een gave is.

Hooggeleerde Romijn, beste Hans: omdat jouw vermogen om nieuwe ideeën te genereren ongeëvenaard is.

Collega's, aio's en secretaressen van de endocrinologie: omdat we als team hoogwaardige en menselijke medische zorg leveren aan onze patiënten. Staf, promovendi en secretaressen van de epidemiologie: omdat klinische epidemiologie een prachtig vak is en ik iedere dag met plezier naar het werk ga.

Yvonne Souverein en Marianne Wanders: omdat een oratie meer is dan een tekst alleen.

Hooggeleerde Bossuyt en Versluijs, Zeergeleerde Mulder, Beste Patrick, Miguel John en Jesse: omdat discussies buiten de muren van het eigen instituut en vakgebied heel inspirerend zijn en een belangrijker element van het academische leven zouden moeten vormen.

Mijn ouders, omdat liefdevol en vrijlatend opvoeden een kunst is. Mijn vrouw Christine, omdat het waardevol is dat mensen verschillend zijn en mogen zijn; en omdat ik blij van je word. Mijn zoon Laurens, omdat ik van jou heb geleerd dat niet de verwondering maar de kracht van de twijfel het begin van de filosofie is. Mijn dochter Elisa, omdat je me er elke dag weer aan herinnert dat leven meer is dan epidemiologisch denken en filosofie.

U heeft geluisterd en geoordeeld

Ik heb gezegd