In diesem Kapitel sind wichtige Aussagen mit Verweisen auf entsprechende Literaturangaben im Anhang versehen. Außerdem sei auf die Monographie von Fletcher: Klinische Epidemiologie verwiesen.
Phase-IV-Studien [11] dienen der Arzneimittelüberwachung nach der Zulassung, d.h. der Prüfung der Wirksamkeit von Arzneimitteln unter Praxisbedingungen und der Bestimmung unerwünschter Wirkungen in Bezug auf Inzidenz und Ätiologie.
Phase-IV-Studien sind äußerst wichtig, da wirksame Arzneimittel bekanntlich auch unerwünschte Wirkungen hervorrufen können. Häufig sind unerwünschte Wirkungen so selten oder treten erst nach so großen Zeiträumen auf, dass sie im Rahmen der Zulassung des Arzneimittels (Phase-III-Studie) nicht erkennbar sind. Insbesondere können auch unerwünschte Wirkungen aufgrund von Komedikationen bei Multimorbidität eintreten, an die bei der Prüfung des Arzneimittels nicht zu denken war.
Zur Auswertung von Phase-IV-Studien benötigt man Methoden der Risiko-Analyse.
Im allgemeinen Sprachgebrauch versteht man unter einem Risiko eine Gefahr, die uns droht oder zu drohen scheint, z.B. an Lungenkrebs zu erkranken, bei einem Flugzeugabsturz ums Leben zu kommen oder bei einer Operation aus der Narkose nicht wieder aufzuwachen.
Solchen Gefahren möchten wir vorbeugen oder sie zumindest verringern, z.B. indem wir nicht rauchen, oder wir können versuchen, sie auszuschließen, z.B. indem wir nicht fliegen. Gänzlich ausschließen lassen sich solche Gefahren allerdings nicht: Auch ein Nichtraucher kann an Lungenkrebs erkranken und das Flugzeug kann auf das Haus stürzen, in dem wir uns gerade befinden.
Allerdings dürfte das Risiko, als Nichtraucher Lungenkrebs zu bekommen erheblich größer sein, als das Risiko, als Nichtflieger (und sogar als Flieger) an einem Flugzeugabsturz beteiligt zu sein und dabei umzukommen.
In diesem Kapitel wird daher die Frage behandelt, wie Risiken quantitativ beurteilt und objektiv verglichen werden können.
Aus den einleitenden Beispielen geht hervor, dass Risiko die Bedeutung einer Wahrscheinlichkeit hat, nämlich der (bedingten) Wahrscheinlichkeit, dass ein unerwünschtes Ereignis (z.B. Lungenkrebs) eintritt, falls eine bestimmte Exposition (z.B. Rauchen) vorliegt. Dies ist das Risiko der Exponierten.
Andererseits besteht auch das Risiko der Nicht-Exponierten, nämlich die (bedingte) Wahrscheinlichkeit, dass ein unerwünschtes Ereignis (z.B. Lungenkrebs) eintritt, falls eine bestimmte Exposition (z.B. Rauchen) nicht vorliegt.
Ob das unerwünschte Ereignis im Einzelfall eintritt oder nicht, kann nicht mit Sicherheit vorhergesagt werden. Allerdings kann man mit Hilfe empirischer Studien die Wahrscheinlichkeit für das Eintreten unerwünschter Ereignisse ermitteln.
Das Erkennen und Beurteilen der Wertigkeit sogenannter Risiko-Faktoren ist von allgemeinem Interesse für die Medizin und besonders für das öffentliche Gesundheitswesen. Die Wertigkeit von Risikofaktoren wird durch Risiko-Maßzahlen beurteilt, z.B. durch das relative Risiko, die ätiologische Fraktion und die absolute Risikoreduktion [14].
Hierzu bedarf es eines Vergleiches zwischen exponierten (z.B. Raucher) und nicht-exponierten Personen (z.B. Nichtraucher) in Bezug auf das Eintreten des unerwünschten Ereignisses (z.B. Lungenkrebs), d.h. eines Vergleiches des Risikos der Exponierten mit dem Risiko der Nicht-Exponierten.
Das relative Risiko (relative risk, rr) ist der Faktor, um den sich das Risiko unter Exposition gegenüber dem Risiko unter Nicht-Exposition unterscheidet.
Bereits in den 1950er Jahren [3] wurden Lungenkrebs-Risikofaktoren systematisch untersucht. Die Angaben über das relative Risiko für Raucher schwankten zwischen 5 und 10, in Abhängigkeit von der Definition des Begriffes Raucher.
Dies bedeutet, dass unter den Rauchern 5- bis 10-mal so häufig Lungenkrebs aufgetreten ist, wie unter den Nichtrauchern. Andererseits wurden für Arbeiter in bestimmten chemischen Industrien relative Lungenkrebs-Risiken in der Größenordnung von 40 bis 50 festgestellt.
Obgleich nun Rauchen ein weit geringeres relatives Lungenkrebs-Risiko aufweist als die Exposition durch bestimmte chemische Substanzen, treten doch unter den Rauchern (absolut gesehen) erheblich mehr Fälle von Lungenkrebs auf, als unter den Chemiearbeitern. Und das liegt daran, dass der Anteil der durch Rauchen exponierten Personen in der Gesamtbevölkerung (Prävalenz der Exposition) erheblich höher ist, als der Anteil der durch gewisse chemische Substanzen exponierten.
Aus diesem Grunde ist es unangebracht, die Bedeutung (möglicher) Risikofaktoren ausschließlich durch das relative Risiko bewerten zu wollen, was in der epidemiologischen Literatur leider allzu häufig geschieht.
Eine Risiko-Maßzahl, die die Prävalenz der Exposition berücksichtigt, ist die ätiologische Fraktion (etiological fraction, ef). Die ätiologische Fraktion ist der Anteil aller unerwünschten Ereignisse, die auf die Exposition zurückzuführen sind.
In Deutschland soll zum Beispiel nach einer Verlautbarung des Bundesgesundheitsamtes [2] die ätiologische Fraktion für Lungenkrebs bei Rauchern 85% betragen und das bedeutet, dass 85% aller Lungenkrebs-Fälle auf das Rauchen zurückgeführt werden.
Die gleiche Quelle [2]behauptet, dass die ätiologische Fraktion von Lungenkrebs bei Hausvogelhaltern 5% beträgt. Das bedeutet, dass 5% allerLungenkrebsfälle bei Hausvogelhaltern durch die Vogelhaltung bedingt sind.
Dies bedeutet aber keineswegs, dass 85% aller Raucher einen raucherbedingten Lungenkrebs bekommen, oder dass 5% aller Hausvogelhalter einen dadurch bedingten Lungenkrebs erleiden.
Absolute Risikoreduktion / absolute Risikozunahme
Die absolute Risikoreduktion (excess risk, absolute risk reduction, arr) ist der Anteil aller Exponierten, bei denen ein expositionsbedingtes unerwünschtes Ereignis eintritt.
Statt eine Angabe über die ätiologische Fraktion zu erhalten, wäre es für Betroffene, Ärzte und Verantwortliche im Gesundheitswesen vermutlich wesentlich aufschlussreicher, zu erfahren, bei wieviel Prozent der Raucher ein raucherbedingtes Karzinom auftritt, oder bei wieviel Promille der "Nehmer" (d.h. Anwender) eines bestimmten Arzneimittels eine arzneimittelbedingte Nebenwirkung auftritt, oder bei wieviel Prozent der Hausvogelhalter ein dadurch bedingtes Lungenkarzinom auftritt.
Dieses zusätzliche Risiko, dem ein Exponierter gegenüber einem Nicht-Exponierten ausgesetzt ist, wird durch die absolute Risikoreduktion beschrieben. Sie berücksichtigt nicht die Prävalenz der Exposition, sondern die Prävalenz bzw. die Inzidenz des unerwünschten Ereignisses.
Die absolute Risikoreduktion ist die Differenz zwischen dem Risiko unter Exposition und dem Risiko unter Nicht-Exposition und kann auch als das Risiko interpretiert werden, das Nicht-Exponierte gegenüber Exponierten vermeiden.
Von allen diskutierten Risiko-Maßzahlen ist also die absolute Risikoreduktion das Maß, das die medizinische und die gesundheitspolitische Bedeutung eines Expositions-Risikos am besten wiedergibt. Allerdings wird in der epidemiologischen Literatur fast ausschließlich das relative Risiko bzw. das odds ratio ermittelt. Dies liegt daran, dass zur Risikoanalyse überwiegend Fall-Kontroll-Studien durchgeführt werden, die eine Berechnung der absoluten Risikoreduktion nicht gestatten.
Wenn das Risiko unter Exposition kleiner als das Risiko unter Nicht-Exposition ist, weil die Rate der unerwünschten Ereignisse unter Exposition geringer ist als unter Nicht-Exposition, stellt die Exposition kein Risiko dar, sondern sie hat einen positiven Effekt. Das Relative Risiko ist dann kleiner als 1. Diese Situation tritt z.B. bei kontrollierten Studien auf, wenn die Exposition die Behandlung mit einem wirksamen Medikament darstellt.
Weil das Risiko der Nicht-Exponierten also nicht reduziert ist, definiert man in diesem Fall die Differenz zwischen dem Risiko unter Nicht-Exposition und dem Risiko unter Exposition als absolute Risikozunahme (absolute risk increase, ari). Diese Maßzahl kann als das Risiko interpretiert werden, dem Nicht-Exponierte gegenüber Exponierten ausgesetzt sind. Es gilt also: absolute Risikozunahme = - absolute Risikoreduktion.
Die Begriffe Reduktion und Zunahme werden also auf die Nicht-Exponierten bezogen. Das ist besonders bei epidemiologischen Studien sinnvoll, wo Nicht-Exposition die Vermeidung eines Risikos bedeutet.
Bei kontrollierten Therapiestudien werden die Begriffe Reduktion und Zunahme aber meistens auf die Exponierten, d.h. die mit dem wirksamen Medikament Behandelten, bezogen. In diesem Kontext sind auch die Bezeichnungen folgender abgeleiteter Maßzahlen verständlich, deren englische Bezeichnung auch im Deutschen verwendet wird. Der Kehrwert des Betrags der absoluten Risikoreduktion heißt "Number needed to treat (NNT)". Diese Maßzahl gibt an, wieviele Patienten im Mittel behandelt werden müssen, um ein unerwünschtes Ereignis zu vermeiden. Der Kehrwert des Betrags der absoluten Risikozunahme heißt "Number needed to harm (NNH)". Diese Maßzahl gibt an, auf wieviele Patienten im Mittel ein durch die Exposition bedingtes unerwünschtes Ereignis kommt. Da absolute Risikozunahme und absolute Risikoreduktion sich nur im Vorzeichen unterscheiden, sind NNT und NNH immer gleich. Welche Bezeichnung gewählt wird, hängt davon ab, welcher Aspekt bei der Interpretation stärker betont werden soll (siehe Beispiele).
Es gibt drei Studienformen zur Risikoanalyse:
Alle Studienformen führen formal auf das gleiche Schema zur Darstellung der Studienergebnisse (Tab. 1a). Dabei sind a, b, c und d absolute Häufigkeiten, z.B. ist b die Anzahl der Fälle, bei denen die Exposition vorlag und das unerwünschte Ereignis nicht eingetreten ist.
vorhanden |
Ereignis eingetreten ja nein |
Gesamt | |
|
|
|
|
|
|
|
|
|
|
|
|
Aus dieser Kontingenztafel können die Risiko-Maßzahlen berechnet werden (Tab. 1b), deren Bedeutung im vorigen Abschnitt genannt wurde und in den folgenden Abschnitten an Beispielen eingehend erläutert wird.
Zusätzlich zu den bereits erwähnten Maßzahlen wird in Tab. 1b das sogenannte odds ratio (Quotenverhältnis, or) angegeben. Das odds ratio ist eine für Fall-Kontroll-Studien verwendete Maßzahl, die bei selten auftretenden unerwünschten Ereignissen (rare adverse events) mit dem relativen Risiko übereinstimmt. Das odds ratio berechnet sich aus dem Quotient der Verhältnisse von Exponierten zu Nicht-Exponierten jeweils für die Fälle, bei denen das unerwünschte Ereignis eingetreten bzw. nicht eingetreten ist (siehe Formel in Tab. 1b).
Risiko-Maßzahl |
|
|
|
Risiko unter Exposition |
![]() |
![]() |
|
Risiko unter Nicht-Exposition |
![]() |
![]() |
|
relatives Risiko |
![]() |
![]() |
|
absolute Risikoreduktion |
![]() |
![]() |
|
odds ratio |
![]() |
![]() |
![]() |
Prävalenz der Exposition |
![]() |
|
![]() |
ätiologische Fraktion |
![]() |
|
![]() |
Als Beispiel nehmen wir eine Kohortenstudie zur Ätiologie von Wundheilungsstörungen [13]. Über einen Zeitraum von 6 Monaten wurden in einer Chirurgischen Universitätsklinik sämtliche Operationen (n = 1013) in aseptischen OPs prospektiv erfasst. Anamnestische und intraoperative Befunde wurden erhoben und das Auftreten von Wundheilungsstörungen während der stationären Liegezeit erhoben.
Als Exposition betrachten wir die Risiko-Anamnese, d.h. das Vorliegen einer der Aufnahmebefunde: Anämie, Hypoproteinämie, Diabetes, Adipositas oder Malignom.
Als unerwünschtes Ereignis betrachten wir die postoperative Wundheilungsstörung, d.h. das Vorliegen einer der postoperativen Befunde: Hämatom, Wundbrandnekrose, Serom und subkutaner oder tiefer Abzess, die während der stationären Liegezeit auftraten.
Das Ergebnis dieser Analyse kann in einer Kontingenztafel dargestellt werden:
Anamnese |
Wundheilungsstörung ja nein |
Gesamt | |
|
|
|
|
|
|
|
|
|
|
|
|
Als Maßzahlen für die Risiken ergeben sich:
Risiko unter Exposition |
![]() |
Risiko unter Nicht-Exposition |
![]() |
relatives Risiko |
![]() |
absolute Risikoreduktion | arr = 0.20 - 0.08 = 0.12 |
odds ratio |
![]() |
Prävalenz der Exposition |
![]() |
ätiologische Fraktion |
![]() |
Das relative Risiko
beträgt rr = 2.5 [1.79,3.63], d.h.
unter den Patienten mit Risiko-Anamnese tritt 2.5 mal so häufig Wundheilungsstörung auf, wie
bei Patienten ohne Risiko-Anamnese,
oder
das Risiko der Wundheilungsstörung unterscheidet sich um den Faktor 2.5 zwischen
Exponierten und Nicht-Exponierten.
Die absolute Risikoreduktion
beträgt arr = 0.12 [0.06,0.18], d.h.
12% der Patienten mit Risiko-Anamnese erleiden eine Wundheilungsstörung, die auf die
Risiko-Anamnese zurückzuführen ist,
oder
auf etwa 9 Patienten mit Risiko-Anamnese (genauer 1/ |arr| = 8.33)
kommt im Mittel ein Fall von Wundheilungsstörung, der auf die
Risiko-Anamnese zurückzuführen ist, d.h. die Number needed to harm beträgt 9.
Die ätiologische Fraktion
beträgt ef = 0.24, d.h.
24% der Patienten mit Wundheilungsstörung weisen eine Wundheilungsstörung auf, die auf die
Risiko-Anamnese zurückzuführen ist,
oder
auf 4 Fälle mit Wundheilungsstörung (genauer 1/ef = 4.16) kommt im Mittel ein
Fall, der auf die Risiko-Anamnese zurückzuführen ist.
Am Beispiel dieser Kohortenstudie lässt sich gut erläutern, warum die absolute Risikoreduktion ein besseres Maß für die Gefährdung einer Bevölkerung darstellt als das relative Risiko und die ätiologische Fraktion.
Nehmen wir einmal an, dass das
Risiko unter Exposition und das Risiko unter Nicht-Exposition um den
Faktor 1000 kleiner ist als in der Wundheilungsstudie: also p1 =
0.00020
und p0 = 0.00008.
Dann erhalten wir das gleiche
relative Risiko rr = 2.5 und die gleiche ätiologische
Fraktion ef = 0.24, aber eine tausendfach kleinere
absolute Risikoreduktion, nämlich arr = 0.00012. Die absolute
Risikoreduktion berücksichtigt also die Prävalenz des unerwünschten
Ereignisses, d.h. die Gefährdung der Bevölkerung ist in diesem Fall
wesentlicher geringer als in der Wundheilungsstudie.
Bei dem relativen Risiko und der
absoluten Risikoreduktion wurde in eckigen Klammern das entsprechende
95%-Konfidenzintervall angegeben. Dies bedeutet, dass das wahre
relative Risiko bzw. die wahre absolute Risikoreduktion mit 95%
Sicherheit in diesem Intervall liegt. Denn die Maßzahlen selbst
wurden aufgrund einer Stichprobe berechnet und sind daher nur
Schätzungen für den jeweiligen wahren Wert.
Es ist intuitiv klar, dass der wahre
Wert des relativen Risikos bzw. der absoluten Risikoreduktion um so
ungenauer bestimmt wird, je kleiner der Stichprobenumfang ist. Das
Konfidenzintervall ist ein Maß für diese Ungenauigkeit.
Die Angabe des Konfidenzintervalls ist unbedingt erforderlich, um den zufälligen Fehler einer Risiko-Maßzahl zu quantifizieren, und sie bedeutet in unserem Falle, dass mit 95% Sicherheit die wahre absolute Risikoreduktion zwischen 6% und 18% und dass das wahre relative Risiko zwischen 1.79 und 3.63 liegt.
Diese Aussage ist wesentlich, denn, falls die untere Grenze kleiner als 1 wäre (z.B. 0.8), bedeutet dies, dass das wahre relative Risiko gleich oder kleiner als 1 sein kann. Dies würde heißen, dass das wahre Risiko der Exponierten gleich dem wahren Risiko der Nicht-Exponierten oder sogar geringer sein kann, obgleich das berechnete relative Risiko gleich rr = 2.5 ist.
Bei dem Beispiel der Wundheilungsstörung war aber die untere Grenze des Konfidenzintervalls gleich 1.79, so dass von einem signifikanten Ergebnis gesprochen werden kann.
In Tabelle 2c werden approximative Berechnungsformeln für die 95%-Konfidenzintervalle angegeben (siehe Tab. 1a):
relatives Risiko | ![]() |
odds Ratio | ![]() |
absolute Risikoreduktion | ![]() |
Für weitere Informationen über Konfidenzintervalle siehe [14] und die Monographie von Kreienbrock und Schach [15].
Eine kontrollierte Studie vergleicht prospektiv eine Gruppe von Exponierten (z.B. Aspirin-Nehmer) mit einer Gruppe von Nicht-Exponierten (z.B. Placebo-Nehmer) bezüglich des Auftretens eines unerwünschten Ereignisses (z.B. Herzinfarkt oder Duodenal Ulcus).
Manchmal werden auch kontrollierte Phase-IV-Studien durchgeführt. Es geht also dabei in erster Linie um das Erkennen unerwünschter Ereignisse und weniger um den Nachweis der Wirksamkeit. Als Beispiel wird hier die Physicians' Health Study [10], an der mehr als 22000 Ärzte (nur Männer!) in Neu-England freiwillig teilnahmen, vorgestellt.
Nach Randomisierung bekam die Hälfte von ihnen Aspirin über einen Zeitraum von 6 Jahren und die andere Hälfte bekam ein (Aspirin-)Placebo, das nicht den Wirkstoff Acetyl-Salicylsäure enthielt.
Die Tabellen 3a und 3b zeigen den Zusammenhang zwischen Aspirin-Einnahme und dem Auftreten von Herzinfarkt mit den zugehörigen Risiko-Maßzahlen.
Einnahme |
Herzinfarkt ja nein |
Gesamt | |
|
139 | 10898 |
|
|
239 | 10795 |
|
Maßzahl | Wert |
|
|
![]() |
|
|
![]() |
|
|
![]() |
|
|
![]() |
|
|
![]() |
|
Das relative Risiko der
Aspirin-Nehmer, einen Herzinfarkt zu erleiden, ist also rr =
0.58 und sogar signifikant kleiner als 1, da das
95%-Konfidenzintervall die 1 nicht überdeckt. Die obere Grenze
des Konfidenzintervalls ist nämlich 0.71.
Daraus lässt sich schließen,
dass die regelmäßige Einnahme von Aspirin das Risiko, einen
Herzinfarkt zu erleiden, signifikant verringert. Die Einnahme von Aspirin ist also kein Risikofaktor,
sondern verhindert das Auftreten von Herzinfarkten.
Man kann diesen Sachverhalt auch so formulieren: Das relative Risiko von Nicht-Nehmern gegenüber Nehmern beträgt 1/rr = 1.72 und hat ein Konfidenzintervall von 1/0.71 = 1.41 bis 1/0.47 = 2.13.
Entsprechend lässt sich die absolute Risikoreduktion interpretieren: Im Mittel erleiden 0.91%, also fast 1%, der Nicht-Nehmer einen nicht-nehmer-bedingten Herzinfarkt. Also könnten 0.91% der in der Grundgesamtheit auftretenden Herzinfarkte durch die Einnahme von Aspirin vermieden werden. Die negative absolute Risikoreduktion enspricht also einer absoluten Risikozunahme für die Nicht-Nehmer.
Das 95%-Konfidenzintervall dieser Aussage liegt zwischen 0.56% und 1.25%. Das Konfidenzintervall der absoluten Risikoreduktion überdeckt nicht die 0, so dass von einem signifikanten Effekt gesprochen werden kann.
Die Number needed to treat (1/ |arr|) beträgt 109.9, d.h. man müsste 110 ältere Männer 6 Jahre lang mit Aspirin behandeln, um einen Fall von Herzinfarkt zu vermeiden.
Betrachtet man dagegen die Tabellen 3c und 3d, in denen die Aspirin-Einnahme und das Auftreten von Duodenalulcera gegenübergestellt werden, dann erkennt man, dass durch die Einnahme von Aspirin das Risiko, ein Zwölffingerdarmgeschwür zu erleiden, um den Faktor 1.7 erhöht wird.
Bei der Aspirin-Therapie treten also konkurrierende unerwünschte Wirkungen sowohl für Nehmer als auch für Nicht-Nehmer auf.
Einnahme |
Duodenal Ulcus ja nein |
Gesamt | |
|
|
|
|
|
|
|
|
Maßzahl | Wert |
|
unter Exposition |
![]() |
|
unter Nicht-Exposition |
![]() |
|
|
![]() |
|
|
![]() |
|
|
![]() |
|
Das relative Risiko besagt, dass unter den Aspirin-Nehmern im Mittel 1.7-mal so häufig Duodenal Ulcus auftritt wie unter den Nicht-Nehmern, und dass das wahre relative Risiko mit 95% Sicherheit zwischen 1.06 und 2.34 liegt. Das Konfidenzintervall überdeckt beim relativen Risiko nicht die 1, d.h. das relative Risiko ist signifkant größer als 1. Die Einnahme von Aspirin stellt also einen signifikanten Risiko-Faktor für das Auftreten eines Duodenal-Ulcus dar.
Die absolute Risikoreduktion
besagt, dass im Mittel 1.7‰
der Exponierten (Aspirin-Nehmer) einen Ulcus erleiden, der auf
die Exposition zurückzuführen ist, und ferner, dass die wahre
absolute Risikoreduktion mit 95% Sicherheit zwischen 0.2‰
und 3.2‰ liegt,
oder
dass auf 582 Aspirin-Nehmer
(genauer Number needed to harm = 1/ |arr| = 581.4 [312,5000]) im Mittel ein Aspirin-bedingter Fall
von Duodenal Ulcus kommt. Das Vertrauensintervall besagt ferner, dass
das wahre Verhältnis mit 95% Sicherheit zwischen 312:1 und 5000:1
liegt.
Die Prävalenz der Exposition und die ätiologische Fraktion können bei kontrollierten Studien nicht berechnet werden, da das Verhältnis zwischen Exponierten und Nicht-Exponierten in dieser Studienform vorgegeben ist, nämlich meistens 1:1.
Will man nun die erwünschte Wirkung, nämlich Vermeidung von Herzinfarkt, mit der unerwünschten Wirkung, nämlich Auftreten von Duodenal Ulcus in Beziehung setzen, so sieht man, dass die Angabe von relativen Risiken zu keinem großen Erkenntnisgewinn führt.
Das relative Herzinfarkt-Risiko für Nicht-Nehmer von Aspirin beträgt rr = 1.72 und das relative Duodenalulcus-Risiko für Nehmer beträgt rr = 1.70. Im Gegensatz dazu liefert uns die Angabe der absoluten Risikoreduktionen die Möglichkeit, den Nutzen und den Schaden der Aspirin-Einnahme quantitativ gegeneinander abzuwägen. Nicht-Nehmer von Aspirin haben eine Zunahme des Herzinfarktrisikos von arr = 9.1‰, und Nehmer haben eine Zunahme des Duodenalulcusrisikos von arr = 1.7‰.
Bei diesem Vergleich der konkurrierenden Risiken werden die Prävalenzen der unerwünschten Ereignisse als Maß für die Gefährdung einer Population berücksichtigt.
Die Studienform, die am häufigsten in der Risikoforschung eingesetzt wird, ist die Fall-Kontroll-Studie. Dabei werden retrospektiv die Fälle, d.h. Personen, bei denen das unerwünschte Ereignis bereits eingetreten ist, mit den Kontrollen, d.h. mit Personen, bei denen das unerwünschte Ereignis nicht eingetreten ist, bezüglich ihrer Exposition verglichen.
In einer Fall-Kontroll-Studie
werden also nicht die Exponierten mit den Nicht-Exponierten
verglichen, sondern Personen, bei denen das unerwünschte Ereignis
eingetreten ist, mit Personen, bei denen das unerwünschte Ereignis
nicht eingetreten ist.
Ein solcher Vergleich ist nur
dann sinnvoll, wenn die beiden Personengruppen hinsichtlich wichtiger
Strukturmerkmale, z.B. Alter, Geschlecht und Wohnort, vergleichbar
sind. Diese Eigenschaft erreicht man, indem zu jedem Fall eine Kontrollperson
sucht, die in ihren Strukturmerkmalen mit dem Fall übereinstimmt.
Dieses Vorgehen heißt matched-pairs-Technik. Um zu sichereren Aussagen zu gelangen, d.h. um die Power zu erhöhen, kann man auch jedem Fall zwei, drei oder mehr Kontrollen zuordnen. Dies gilt insbesondere dann, wenn die Prävalenz der Exposition in der Fallgruppe erheblich höher ist als in der Kontrollgruppe. Eine Erhöhung des Verhältnisses über 1:4 hinaus bringt aber keine wesentliche Steigerung der Power.
Um verallgemeinerbare Aussagen machen zu können, muss ferner sichergestellt sein, dass die Kontrollgruppe in Bezug auf die Exposition repräsentativ für diejenige Bevölkerung ist, auf die sich die Aussage der Studie beziehen soll. Bei einer bevölkerungsbasierten Fall-Kontrollstudie bilden die Kontrollen eine Zufallsstichprobe aus der gleichen Grundgesamtheit, aus der die Fälle stammen.
Bei Fall-Kontroll-Studien kann kein Risiko der Exponierten, kein Risiko der Nicht-Exponierten, und deshalb auch kein relatives Risiko und keine absolute Risikoreduktion berechnet werden, weil die Auswahl der Fälle und Kontrollen willkürlich ist und ihre Anzahl nicht der tatsächlichen Prävalenz entspricht.
Eine Maßzahl, die dem relativen Risiko bei selten auftretenden unerwünschter Ereignissen entspricht, ist das odds ratio.
In der Wundheilungsstudie (Tab. 2b) wurden ein relatives Risiko von rr = 2.5 und ein odds ratio von or = 2.95 ermittelt. Diese Unterschiede sind zwar nicht gravierend, sie treten aber hier auf, da das Ereignis einer Wundheilungsstörung nach einer Operation nicht als selten angesehen werden kann. Die Prävalenz des unerwünschten Ereignisses (Wundheilungsstörung) beträgt immerhin 108/1013 = 11%.
Die folgende Tabelle zeigt den Einfluss der Prävalenz auf die Übereinstimmung zwischen odds ratio und relativem Risiko am Beispiel der Kohortenstudie zu Wundheilungsstörungen.
Population n = | 1013 | 10000 | 100000 | 1000000 |
Prävalenz der Wundheilungsstörung | 0.11 | 0.01 | 0.001 | 0.0001 |
odds ratio | 2.95 | 2.95 | 2.95 | 2.95 |
Relatives Risiko | 2.5 | 2.88 | 2.91 | 2.95 |
Prävalenz und Inzidenz des unerwünschten Ereignisses sind in Fall-Kontroll-Studien nicht feststellbar. Um das odds ratio als relatives Risiko interpretieren zu können, muss das Vorwissen gegeben sein, dass das absolute Risiko des unerwünschten Ereignisses in der betrachteten Population gering ist (z.B. kleiner als 3%).
In der Aspirin-Studie berträgt z.B. das Herzinfarkt-Risiko (Tab. 3b) bei Nicht-Nehmern von Aspirin p0 = 2.2%, so dass das relative Risiko rr = 0.58 numerisch mit dem odds ratio or = 0.58 übereinstimmt. Das gleiche gilt für Duodenal-Ulcus (Tab. 3d). Das Risiko der Nicht-Nehmer beträgt p0 = 2.4‰ und es gilt rr = 1.70 und or = 1.70.
Bei Fall-Kontroll-Studien ist es üblich, die Prävalenz der Exposition durch die Kontrollen zu schätzen. Aus dem odds ratio und der Prävalenz der Exposition lässt sich dann die ätiologische Fraktion berechnen, siehe Tab. 1b.
In einem Beispiel sollen die Auswertungsverfahren von Fall-Kontroll-Studien erläutert werden. Es handelt sich um eine Studie, die 1972-74 in einem regionalen Krankenhaus im französischen Departement Ille-et-Vilaine (Bretagne) durchgeführt wurde [1]. Es sollte der Einfluss von Alkohol- und Tabak-Konsum für das Auftreten von Ösophagus-Karzinomen untersucht werden.
|
Ösophagus-Karzinom ja nein |
|
|
|
|
|
|
|
|
|
|
Maßzahl | Wert |
|
odds ratio |
![]() |
|
Prävalenz der Exposition |
![]() |
|
ätiologische Fraktion |
![]() |
Das unerwünschte Ereignis Ösophagus-Karzinom kann als äußerst selten betrachtet werden. Dies bedeutet also, dass das relative Risiko durch das odds ratio von or = 5.64 ersetzt werden kann und dass mit 95% Sicherheit der wahre Wert des relativen Risikos zwischen 4.00 und 7.95 liegt.
Die Prävalenz der Exposition besagt, dass q = 14% der Personen der Kontrollgruppe, die als repräsentativ für die Bevölkerung angesehen werden, Trinker sind.
Die ätiologische Fraktion besagt dann, dass ef = 39% der Ösophagus-Karzinom Fälle auf das Trinken zurückzuführen sind.
Für eine genauere Analyse wurde der Alkohol- und Tabakkonsum in jeweils 4 Kategorien eingeteilt. Die folgende Tabelle zeigt die Ergebnisse, die mit der Methode der logistischen Regression gewonnen wurden.
Sie enthält alters-adjustierte relative Risiken (odds ratios) für jede Kategorie, wobei die Referenzkategorie (or = 1.0) aus Probanden besteht, die täglich bis zu 40 g Alkohol und bis zu 10 g Tabak zu sich nehmen.
Aus Tabelle 4c lässt sich z.B. ablesen, dass das Risiko des Ösophagus-Karzinoms bei einem Konsum von täglich 80g bis 119g Alkohol und 20g bis 29g Tabak gegenüber der Referenzkategorie um den Faktor or = 12.1 erhöht ist.
(g/Tag) |
0-9 |
10-19 |
20-29 |
30+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Man erkennt, dass sich das relative Risiko bei multipler Exposition (Tabak-Konsum und Alkohol-Konsum) nicht additiv verhält, sondern multiplikativ.
In der Fontham-Studie [6] wurde das Risiko des Passiv-Rauchens bei Frauen untersucht. Dazu wurden als Fälle verheiratete Frauen mit Lungenkrebs betrachtet. Die Exposition durch Passiv-Rauchen wurde dann angenommen, wenn die Ehemänner Raucher waren. Alle Frauen waren Nichtraucherinnen.
Die Fontham-Studie ist zweifellos eine der gründlichsten Studien zum Thema Passivrauchen. Die Erhebung der Exposition erfolgte durch Befragung und durch Laboruntersuchungen der Probandinnen. Es handelte sich um keine matched-pairs-Studie, da die Gruppen bezüglich Alter nicht balanciert wurden.
Raucher |
Ehefrau Lungenkrebs ja nein |
|
|
|
|
|
|
|
|
|
|
Aus dieser Kontingenztafel lassen sich folgende Maßzahlen berechnen:
Maßzahl | Wert |
|
odds ratio |
![]() |
|
Prävalenz der Exposition |
![]() |
|
ätiologische Fraktion |
![]() |
Aus Tabelle 5b ergibt sich ein signifikantes odds ratio von or = 1.37.
Die Prävalenz der Exposition, die aus der Exposition der Kontrollen errechnet wurde, beträgt q = 63%. Diese Prävalenz muss repräsentativ für die Referenzbevölkerung (verheiratete Nichtraucherinnen) sein, auf die sich die Aussage der Studie bezieht.
Das würde aber bedeuten, dass 63% aller Ehemänner von Nichtraucherinnen (starke) Raucher sind und dies wäre wohl eher unwahrscheinlich. Es erhebt sich daher die Frage, ob in der Fontham-Studie eine repräsentative Kontrollgruppe für passiv-rauchende Frauen in der Bevölkerung gewählt wurde.
Sollte die Kontrollgruppe nicht repräsentativ sein, ergäbe sich in der Fontham-Studie eine Verzerrung der Ergebnisse durch Selektion. Ist die Prävalenz der Exposition in der Bevölkerung kleiner, dann wird das relative Risiko unterschätzt.
Eine alters-adjustierte Auswertung [6] ergab ein odds ratio von or = 1.29 und ein 95%-Konfidenzintervall von [0.99,1.68]. Das besagt, dass der wahre Wert des odds ratios noch 1 sein kann, d.h. dass die Exponierten und die Nicht-Exponierten das gleiche Lungenkrebs-Risiko haben könnten.
In der Presse war allerdings zu lesen, dass die Studie ergab, dass durch Passiv-Rauchen das Lungenkrebs-Risiko um 30% steigt. Diese Information ist sachlich unrichtig, da die Studie nicht ergab, dass die absolute Risikoreduktion von Nicht-Passiv-Rauchern 30% beträgt, denn die absolute Risikoreduktion lässt sich mit den Daten der Fontham-Studie nicht ermitteln.
Diese Information bezog sich auch nicht auf die ätiologische Fraktion ef = 19%, die bedeuten würde, dass durch diese Studie 19% aller auftretenden Lungen-Karzinome auf Passivrauchen zurückgeführt werden. Vielmehr betrug das alters-adjustierte odds ratio or = 1.29, d.h. es war gegenüber 1 um 29% erhöht. Allerdings war diese Erhöhung nicht signifikant, d.h. dass das Ergebnis auf purem Zufall beruhen kann.
Reserpin ist ein Rauwolfia-Alkaloid und wirkt blutdrucksenkend. In den siebziger Jahren wurde eine weltweite wissenschaftliche Diskussion geführt, in der aufgrund der Ergebnisse von Fall-Kontroll-Studien behauptet wurde, dass dieses Medikament bei Frauen Brustkrebs verursacht.
Aus klinisch-pharmakologischer
Sicht hielten Kewitz u.a. [7] eine solche Behauptung für
unglaubwürdig. Sie führten ihrerseits eine Fall-Kontroll-Studie
durch.
Fälle waren Patientinnen, bei denen während einer Krebsuntersuchung
Brustkrebs festgestellt wurde, und Kontrollen solche
Patientinnen, bei denen in dieser Untersuchung kein Brustkrebs
festgestellt wurde.
Auch in dieser Studie wurde die Arzneimittel-Exposition durch Befragung der Probandinnen erhoben und nicht etwa retrospektiv aus Krankenakten. Die Studie war nicht alters-standardisiert (kein matched-pairs) und kam zu dem Zwischenergebnis:
Einnahme |
ja nein |
|
|
|
|
|
|
|
|
|
|
Maßzahl |
|
|
|
![]() |
|
Der Schätzwert für das relative Risiko ergibt or = 1.32. Obgleich das relative Risiko nicht signifikant von 1 verschieden ist, denn das 95%-Konfidenzintervall überdeckt den Wert 1, könnte man dennoch eine Risiko-Tendenz annehmen, da das berechnete relative Risiko um 32% gegenüber 1 erhöht ist. Ähnliche Befunde führten in den siebziger Jahren dazu, Reserpin als Risikofaktor für Brustkrebs zu verdächtigen.
Kewitz [7] konnte aber zeigen,
dass ein solcher Verdacht auf einem schlichten Trugschluss
beruht, der auch als Simpson'sches Paradox bekannt ist [9].
Er argumentierte aus klinisch-pharmakologischer Sicht, dass Hypertonie bei Frauen im
höheren Alter häufiger vorkommt und daher auch ältere Frauen
häufiger Reserpin einnehmen. Andererseits bekommen ältere
Frauen auch häufiger Brustkrebs.
Er konnte durch seine Studie
nachweisen, dass die Prävalenz der Exposition
(Reserpin-Einnahme) bei älteren Frauen erheblich größer ist (q
= 25%) als bei jüngeren Frauen (q = 6%).
Das bedeutet, dass nicht
die Reserpin-Einnahme der eigentliche Risikofaktor ist, der das
Brustkrebs-Risiko erhöht, sondern vielmehr das Alter als Risikofaktor
anzusehen ist, das als Begleitvariable (confounder) in
Tab. 6a gar nicht berücksichtigt wurde.
Alter |
|
|
||
Reserpin- Einnahme |
|
ja nein |
||
|
|
|
|
|
|
|
|
|
|
Gesamt |
|
|
|
|
Maßzahl |
Wert |
|
Bis 50 Jahre | ||
odds ratio |
![]() |
|
Prävalenz der Exposition |
![]() |
|
Über 50 Jahre | ||
odds ratio |
![]() |
|
Prävalenz der Exposition |
![]() |
|
Betrachtet man nämlich Altersklassen (Tab. 6c), so stellt sich heraus, dass das relative Risiko für unter 50-jährige Frauen or = 0.75 [0.16,3.42] beträgt und das relative Risiko für über 50-jährige Frauen or = 0.85 [0.50,1.44] beträgt. Innerhalb beider Altersklassen ergibt sich also eine Verringerung des relativen Brustkrebs-Risikos gegenüber 1 um 15% bis 25%. Es besteht daher die Tendenz, dass Reserpin prophylaktisch gegen Brustkrebs wirkt. Aber auch diese Tendenz kann nicht objektiv bestätigt werden, da beide Konfidenzintervalle die 1 einschließen.
Betrachtet man das Alter als Exposition für Brustkrebs, so zeigt sich, dass das Alter der eigentliche Risikofaktor ist.
|
ja nein |
|
|
|
|
|
|
|
|
|
|
Maßzahl |
|
|
|
![]() |
|
In der Regel treten bei einem Exponierten gleichzeitig mehrere Expositionen (multiple Exposition) auf. Es stellt sich die Frage, wie man bei multipler Exposition (d.h. mehreren Einflussgrößen) die Wertigkeit der einzelnen möglichen Risikofaktoren bestimmt und eine Selektion der prognostisch ungünstigen Faktoren durchführt.
Eine mathematische Methode zur quantitativen Beurteilung multipler Risikofaktoren bei dichotomer Zielgröße, d.h. sie hat nur zwei Ausprägungen, nämlich unerwünschtes Ereignis eingetreten oder unerwünschtes Ereignis nicht eingetreten, ist die logistische Regression. Mit dieser Methode lassen sich z.B. erwünschte und unerwünschte Wirkungen bei multipler Arzneimitteleinnahme [8] beurteilen oder der Ausgang therapeutischer Maßnahmen [12] vorhersagen. Wenn die Zielgröße nicht dichotom bzw. kategorial ist, werden andere Regressionsverfahren angewendet, z.B. die lineare Regression bei stetiger Zielgröße.
In diesem Abschnitt wird die logistische Regression am Beispiel der Reserpin-Studie erläutert. Wir haben zwei mögliche Risikofaktoren, nämlich Reserpineinnahme (X1) und Alter (X2), und wollen die Wahrscheinlichkeit für das Eintreten eines unerwünschten Ereignisses Y, nämlich Brustkrebs, in Abhängigkeit von beiden Risikofaktoren bestimmen.
Zunächst werden sämtliche
Variablen dichotomisiert:
X1 = 1,
falls Reserpineinnahme erfolgt, sonst X1 = 0,
X2 = 1,
falls älter als 50 Jahre, sonst X2 = 0
und
Y = 1, falls Brustkrebs vorliegt, sonst Y = 0.
Mit den Einflussvariablen bildet man einen Risikoscore:
X = c + b1X1 + b2 X2
Dabei sind b1 und b2 sogenannte Ladungen, die die prognostische Wertigkeit der einzelnen Risikofaktoren angeben. Zum Beispiel würde b1 = 0 bedeuten, dass Reserpineinnahme ohne jeden Einfluss ist, und b1 < 0, dass Reserpin prophylaktisch wirkt.
Die Konstante c beschreibt das Grundrisiko, das bei einer Person herrscht, wenn beide Risikofaktoren nicht vorhanden sind, d.h. X1 = 0 und X2 = 0.
Das Risiko p(X) ist die Wahrscheinlichkeit, dass das unerwünschte Ereignis (Y = 1) eintritt, falls ein bestimmter Risikoscore-Wert X = x vorliegt, also genauer: p(X) = p(Y = 1ΙX = x). Das Verhältnis p(X) / 1-p(X) wird als odd (englisch für Verhältnis) bezeichnet.
Bei der logistischen Regression wird der Risikoscore X als log-odd:
oder das Risiko als logistische Funktion dargestellt:
Aus der Darstellung des Risikos durch das log-odd lässt sich leicht zeigen, dass mit Hilfe der logistischen Regression adjustierte odds ratios berechnet werden können. Dies bedeutet, dass das odds ratio nur von dem einen betrachteten Risikofaktor abhängt und nicht von weiteren Risikofaktoren, die gleichzeitig im logistischen Modell analysiert werden.
Diese Adjustierungs-Eigenschaft des logistischen Modells soll am Beispiel der Reserpineinnahme erklärt werden:
Frauen, die Reserpin einnehmen, haben den Risikoscore X = c + b1 + b2 X2. Frauen, die kein Reserpin einnehmen, haben den Risikoscore Z = c + 0 + b2 X2 oder Z = c + b2 X2. Dabei soll nicht näher unterschieden werden, ob die Frauen jünger, d.h. X2 = 0, oder älter als 50 Jahre sind, d.h. X2 = 1.
Die entprechenden odds und das daraus resultierende odds ratio, d.h. der Quotient der odds, lassen sich darstellen als:
und
Im logistischen Modell kann das odds ratio or = eb1 einer spezifischen Exposition (Reserpin) also unabhängig von dem Einfluss der anderen Risikofaktoren (Alter) bestimmt werden. Das odds ratio ist ebenfalls unabhängig vom Grundrisiko c bzw. p(X = c).
Die Berechnung der Ladungen eines Risikoscores wird mit Hilfe der Maximum-Likelihood-Methode durchgeführt. Eine mathematische Darstellung [5] dieser komplexen nichtlinearen Approximations-Methode würde den Rahmen dieses Textes sprengen. Wir werden jedoch im folgenden Abschnitt zeigen, dass das logistische Modell eine ausgezeichnete Anpassung an die Reserpin-Daten erlaubt.
Aus den Daten der Tabelle 6c der Reserpin-Studie (n = 589) ergibt sich:
|
Wert | 95%-Konfidenzintervall | odds ratio |
|
95%-Konfidenzintervall |
|
-1.67 | [-2.00,-1.34] | or = e−1.67 |
|
[0.14,0.26] |
|
-0.18 | [-0.68,0.32] | or = e−0.18 |
|
[0.51,1.38] |
|
+1.47 | [1.07,1.88] | or = e1.47 |
|
[2.92,6.55] |
Die Ergebnisse der Reserpin-Studie führen zu dem Risikoscore:
X = − 1.67 − 0.18 X1 + 1.47 X2.
Für die Reserpin-Einnahme ergibt sich ein alters-adjustiertes relatives Brustkrebs-Risiko von or = 0.84 [0.51,1.38]. Dies besagt, dass Reserpin in der Tendenz prophylaktisch wirkt. Da jedoch das Konfidenzintervall die 1 überdeckt, ist diese Aussage nicht signifikant. Gleichzeitig überdeckt das Konfidenzintervall [−0.68,0.32] der Ladung b1= −0.18 des Risikoscores die 0, so dass von einem Nulleffekt der ausgegangen werden muss.
Für Reserpin-Einnahme ergibt sich ein alters-adjustiertes relatives Brustkrebs-Risiko von or = 4.37 [2.92,6.55]. Dies besagt, dass das Brustkrebs-Risiko bei älteren Frauen um den Faktor 4.37 gegenüber jüngeren Frauen erhöht ist. Die untere Grenze des 95%-Konfidenzintervalles ist erheblich größer als 1, nämlich 2.92. Daher kann man schließen, dass das Alter der eigentliche Risikofaktor ist und dass diese Aussage signifikant ist.
Die Konstante c = −1.67 bzw. das odds ratio or = 0.19 lässt sich bei Fall-Kontroll-Studien nicht interpretieren, denn sie ergibt sich aus dem Verhältnis von Fällen zu Kontrollen, das bei Fall-Kontroll-Studien vom Experimentator festgelegt wird. Das Grund-Risiko p(X = c) = 19% entspricht daher nicht der Prävalenz bzw. der Inzidenz des unerwünschten Ereignisses (Brustkrebs) in der Bevölkerung.
Werden allerdings Kohortenstudien oder kontrollierte Studien durchgeführt, siehe z.B. die Arzneimittelstudie [8] oder die Prognosestudie [12], dann ist p(X = c) die tatsächliche Prävalenz des unerwünschten Ereignisses (Brustkrebs) in der Referenzpopulation und or = ec wäre als odds ratio zu interpretieren.
Die Güte der Logistischen Regression lässt sich durch den Vergleich der berechneten Risiken mit den beobachteten Risiken beschreiben. In Tabelle 7b sind die entsprechenden Werte für die vier möglichen Kombinationen der Ausprägungen der beiden Risikofaktoren der Reserpin-Studie gegenübergestellt und in Abbildung 7c zusammen mit der Ausgleichskurve der logistischen Regression grafisch dargestellt.
X1 | X2 | Risiko berechnet | Risiko beobachtet |
0 | 0 | 0.159 | 0.160 |
0 | 1 | 0.452 | 0.451 |
1 | 0 | 0.136 | 0.125 |
1 | 1 | 0.411 | 0.406 |
Mit dem logistischen Modell können bei der Reserpin-Studie 4 Risikoscorewerte (siehe Kästchen in Abb. 7c) berechnet werden, nämlich für X1 = {0,1} und X2 = {0,1}.
Den kleinsten Risikoscorewert haben Frauen unter 50 Jahren (X2 = 0), die Reserpin (X1 = 1) nehmen, X = c + b1 = −1.84. Sie haben daher auch das kleinste berechnete (Tab. 7a) und beobachtete (Tab. 6c) Risiko:
und
Dies ist nicht das tatsächliche Brustkrebsrisiko, dem Frauen unter 50 Jahren ausgesetzt sind. In einer Fall-Kontroll-Studie ist das Verhältnis zwischen der Prävalenz des unerwünschten Ereignisses (Brustkrebs) und der Prävalenz des erwünschten Ereignisses (kein Brustkrebs) fest vorgegeben. Daher sind die tatsächlichen Risiken unter Exposition und Nicht-Exposition nicht berechenbar.
Dennoch werden diese formalen Berechnungen der absoluten Risiken in der logistischen Regression verwendet, um die Ladungen des Risikoscores und die odds ratios zu bestimmen. Aus Abbildung 7c geht hervor, dass die formalen berechneten Risiken sehr gut an die formalen beobachteten Risiken angepasst sind. Das bedeutet, dass die Ladungen sehr gut geschätzt wurden.
Den größten Risikoscorewert haben Frauen über 50 Jahren (X2 = 1), die kein Reserpin (X1 = 0) nehmen, X = c + b2 = −0.19, mit einem berechneten und beobachteten Risiko von
und
Das Grundrisiko, also das Risiko von Frauen, die kein Reserpin (X1 = 0) nehmen und unter 50 Jahren (X2 = 0) sind, d.h. die den Risikoscore-Wert X = c = −1.67 haben, beträgt
und
Wie bereits diskutiert, entspricht dies nicht dem Grundrisiko in der Referenzpopulation, d.h. der Prävalenz von Brustkrebs bei hypertonen Frauen unter 50 Jahren.
Falls das tatsächliche Grundrisiko π bekannt wäre (z.B. π = 1:10000), ergibt sich der Risikoscore:
mit
Mit Hilfe dieses Risikoscores könnten auch bei Fall-Kontroll-Studien tatsächliche Risiken aus der logistischen Regression berechnet werden.
Die Ladungen b1 und b2 und die odds ratios hängen nicht von der Konstanten c ab und werden daher in Fall-Kontroll-Studien durch die logistische Regression auch dann richtig berechnet, wenn die Konstante c dem tatsächlichen Grundrisiko nicht entspricht.
Für weitere Verfahren zur Untersuchung der Güte der Anpassung bzw. zur Prüfung des statistischen Modells (model check) wird auf die Literatur verwiesen.Im obigen Beispiel wurden zwei dichotome Risikofaktoren (Einflussvariable) betrachtet. Eine logistische Regression ist aber auch mit kategorialen (nominalen) Einflussvariablen (auch als Faktoren bezeichnet) mit mehr als 2 Ausprägungen und mit stetigen Einflussvariablen möglich. Ordinale Variablen werden meistens als stetige Variablen behandelt. Dabei können Variablen mit unterschiedlichen Typen in einem Modell kombiniert werden. Außerdem kann die Interaktion von Einflussvariablen modelliert werden. Ob eine Interaktion vorliegt kann bei kategorialen Variablen mit einer Kontingenztafelanalyse und bei stetigen Variablen z.B. durch Berechnung des Korrelationskoeffizienten festgestellt werden, d.h. ein betragsmäßig großer Wert des Korrelationskoeffizienten spricht für eine Interaktion.
Bei kategorialen Einflussvariablen mit mehr als 2 Ausprägungen werden sog. dichotome Dummyvariable eingeführt, um jede Ausprägung in eine eindeutige 0-1-Kombination abbilden zu können. Dieser Vorgang geschieht in den Statistikprogrammen automatisch, wenn eine kategoriale Variable mit mehr als 2 Ausprägungen ausgewählt wird. Die Intepretation bezieht sich dann auf eine sog. Referenzkategorie (entweder die in der numerischen Kodierung kleinste oder die größte Ausprägung), d.h. die berechneten odds ratios geben jeweils das Verhältnis der Risiken bei einer beliebigen Ausprägung zur Referenzkategorie an.
Beispiel: In einer logistischen Regression mit der Zielvariable Mikroalbuminurie wurde die glomeruläre Filtrationsrate (GFR) der
Niere gemessen in ml/min als Einflussvariable betrachtet und zwar klassiert in 4 Kategorien (siehe Tabelle 7d). Dazu sind 3 Dummyvariablen nötig. Die
Referenzkategorie war die letzte Ausprägung (>80), wo alle drei Dummyvariablen den Wert 0 haben.
Das Ergebnis (Tabelle 7e) zeigt, dass das Risiko für eine Mikroalbuminurie bei einer GFR < 30 [ml/min] etwa um den Faktor 1.5
höher ist im Vergleich zur Referenzkategorie GFR > 80 [ml/min]. Für die beiden anderen Kategorien besteht kein statistisch
signifikanter Riskounterschied im Vergleich zur Referenzkategorie.
GFR [ml/min] | Häufigkeit | Dummy1 | Dummy2 | Dummy3 |
<30 | 20 | 1 | 0 | 0 |
30-<60 | 394 | 0 | 1 | 0 |
60-<80 | 407 | 0 | 0 | 1 |
>80 | 492 | 0 | 0 | 0 |
Variable | Regressionskoeffizient (Ladung) | odds ratio | 95%-Konfidenzintervall |
GFR(0): >80 | - | - | - |
GFR(1): <30 | 0.394 | 1.483 | [1.13,4.26] |
GFR(2): 30-<60 | -.228 | 0.796 | [0.4,1.48] |
GFR(3): 60-<80 | -0.367 | 0.693 | [0.4,1.2] |
Bei stetigen Einflussvariablen bezieht sich das odds ratio auf die Änderung um eine Einheit. Wird in einer logistischen Regression z.B. für die Einflussvariable diastolischer Blutdruck, gemessen in mmHg, ein odds ratio von 1.08 ermittelt, dann bedeutet das, dass bei Zunahme des Blutdrucks um 1 mmHg das Risiko (odd) um 8% zunimmt. Das odds ratio hat also einen multiplikativen Effekt auf die odds.
Mit dem Wald-Test kann - wie bei der linearen Regression - die Hypothese bi = 0 getestet werden. Dieser Test entspricht dem Test, den man durchführt, wenn man prüft ob der Wert 1 im Konfidenzintervall für das zugehörige odds ratio exp(bi) enthalten ist.
Je nach Anwendungsfall kann die logistische Regression in unterschiedlicher Art durchgeführt werden. Bei einer konfirmatorischen Analyse werden meistens alle relevanten Einflussvariablen en bloc in das Modell einbezogen. Bei einer explorativen Analyse kann man schrittweise Variablen in das Modell aufnehmen oder - ausgehend vom "vollen" Modell - schrittweise weglassen. Dabei können unterschiedliche Kriterien für das Einbeziehen bzw. Weglassen angewendet werden. Man spricht daher in diesem Fall auch von einer bedingten (conditional) logistischen Regression.
Für die Ermittlung des erforderlichen Stichprobenumfangs muss u.a. der Typ der Zielgröße und die Art des Test bekannt sein. Auch wenn als Auswertung eine logistische Regression vorgesehen ist, gibt es Verfahren zur Ermittlung des erforderlichen Stichprobenumfangs. Für Einzelheiten wird auf die entsprechende Literatur verwiesen.
Literaturhinweis: Weitere Informationen zur logistischen Regression siehe Agresti: An Introduction to Categorical Data Analysis (zu diesem Buch hat der Autor eine eigene WWW-Seite eingerichtet) und Vittinghoff et al.: Regression Methods in Biostatistics.
Es gibt verschiedene Fehlerquellen, die zu einer Verzerrung (bias) von Ergebnissen bei Fall-Kontroll-Studien führen können. Die drei wichtigsten Fehlerquellen sollen im folgenden diskutiert werden.
Wie am Beispiel der Reserpin-Studie ausführlich dargestellt wurde, kann es bei Fall-Kontroll-Studien vorkommen, dass ein formaler Zusammenhang zwischen einer Exposition (Reserpin) und einem unerwünschten Ereignis (Krebs) erkannt wird, der aber nicht kausal ist, sondern durch eine Hintergrundvariable (Alter) erzeugt wird.
Variablen, die einen ursächlichen Einfluss auf die Zielgröße (z.B. Krebs) haben können, die aber bei der Auswertung nicht berücksichtigt werden oder sogar bei der Dokumentation nicht erfasst wurden, nennt man Begleitvariable oder Confounder.
So soll z.B. bei nicht-tonsillektomierten Personen gegenüber Tonsillektomierten das relative Risiko (odds ratio) für das Auftreten von Karzinomen im Kopf-Halsbereich or = 3 betragen.
Als mögliche Confounder kämen z.B. Alkoholgenuss und Rauchen in Frage, siehe auch Ille-et-Vilaine-Studie. Obiges Ergebnis könnte nämlich dadurch erklärt werden, dass in der Gruppe der Tonsillektomierten im Mittel weniger geraucht und getrunken wird.
Falls diese Begleitvariablen bei der Auswertung nicht berücksichtigt wurden, oder nicht vollständig bzw. gar nicht erfasst wurden, wäre obige Aussage nicht nur verzerrt, sondern unsinnig.
In einer Fall-Kontroll-Studie müssen daher sämtliche explanatorischen Variablen, die einen Einfluss auf die Zielvariabe (unerwünschtes Ereignis) haben könnten, erfasst und ausgewertet werden. Eine multivariate Auswertung der Einflussfaktoren ist mit Hilfe der logistischen Regression möglich.
Die häufigste Ursache für Verzerrungen bei der Aussage von Fall-Kontroll-Studien besteht in der Wahl der Kontrollgruppe.
Einer der wichtigsten Risikofaktoren ist das Alter. Es sollte also zwischen der Kontrollgruppe und der Fallgruppe Strukturgleichheit bezüglich des Alters und gegebenenfalls auch bezüglich des Geschlechts und des Wohnortes erzeugt werden, z.B. durch die matched-pairs-Technik. Dies vermeidet, dass sich banale Effekte auf die Ergebnisse einer Fall-Kontroll-Studie auswirken.
Darüber hinaus entscheidet die Wahl der Kontrollgruppe darüber, ob und wie die Ergebnisse einer Fall-Kontroll-Studie verallgemeinert werden können. Bei der Reserpin-Studie waren sowohl die Fälle, als auch die Kontrollen Patientinnen mit hohem Risiko, so dass die Aussagen dieser Studie nicht notwendigerweise repräsentativ für die Normalbevölkerung sind. Sie wäre höchstens für hypertone Frauen in der untersuchten Altersklasse repräsentiv, die einen Verdacht auf Brustkrebs haben.
Bei klinisch-epidemiologischen Fall-Kontroll-Studien ist es üblich, sowohl die Fallgruppe als auch die Kontrollgruppe (retrospektiv) aus Patienten einer Klinik zu gewinnen.
Um die Übertragbarkeit der Ergebnisse solcher Studien auf die Normalbevölkerung zu gewährleisten, muss sichergestellt sein, dass die Hospital-Kontrollgruppe sich in ihren Expositions-Merkmalen genau so verhält, wie dies in der Normalpopulation üblich ist. Wird z.B. das Risiko von Arzneimittel-Expositionen untersucht, so kann es gut möglich sein, dass die Hospital-Kontrolle eine andere Einnahmegewohnheit (Prävalenz der Exposition) aufweist, als dies in der Normalbevölkerung der Fall ist.
Wichtig ist die präzise Definition und Erhebung dessen, was unter Exposition und unerwünschtem Ereignis verstanden wird.
Expositions-Grad und Expositions-Dauer müssen festgelegt sein. Dies erweist sich z.B. schon bei dem Begriff Raucher als schwierig. Wann ist man Raucher? Bei 5, 10, oder 40 Zigaretten täglich? Und wie lange muss man rauchen, um als Raucher zu gelten, 5, 10 oder 30 Jahre? Noch schwieriger wird die Definition des Begriffes Passivraucher [6].
Bei der Erfassung von Expositions-Merkmalen ist man häufig auf die Angaben von Betroffenen angewiesen, z.B. auf Angaben über Rauch- und Trinkgewohnheiten sowie auf Angaben über den Arzneimittel-Konsum. Häufig kommt es zu einer Verzerrung in der Datenerhebung aufgrund unvollständiger oder sogar falscher Angaben.
Fälle, bei denen das unerwünschte Ereignis (z.B. Ösophagus-Krebs) bereits eingetreten ist, werden wohl bereitwilliger ihren Tabak- bzw. Alkoholkonsum zugeben als Kontrollen, die diesen Konsum wohl eher verharmlosen. Dadurch werden selbstverständlich mögliche Risikoaussagen erheblich verzerrt.
Bei der Erfassung von Arzneimittel-Expositionen ergibt sich die allgemeine Schwierigkeit, dass man sowohl von den Fällen als auch den Kontrollen keine exakten Angaben über die Arzneimittelnahme erwarten kann, zumal wenn verschiedene Medikamente eingenommen wurden und sich der erfragte Einnahme-Zeitraum über Jahre rückwirkend erstreckt. Noch schwieriger werden die Verhältnisse, falls sporadische Arzneimittelnahme [4] vorliegt.
Dieses Problem verstärkt sich bei retrospektiven Auswertungen, z.B. anhand von Krankenakten. Diese Akten werden nicht zum Zwecke der Forschung angelegt, sondern zur Dokumentation der Behandlung. Vermutlich wird ein Arzt bei Krebspatienten die Exposition durch Rauchen und Trinken gründlicher erfassen und in der Krankenakte festhalten, als bei Patienten, die nicht an Krebs leiden.
Daher ist bei retrospektiven
Auswertungen von Krankenakten weder gleicher Dokumentationsumfang
noch gleiche Dokumentationstiefe zwischen der Fall- und der
Kontrollgruppe zu erwarten.