A+ R A-

SAS - REG

In einer Regressionsanalyse wird die Beziehung zwischen einer (abhängigen/response)Variable Y und einer Menge von (unabhängigen/predictors, explanatory) Variablen Xn. Die Beziehung wird als Gleichung beschrieben, in der Y durch die Variablen Y quasi vorhergesagt (predicted) wird.

Allerdings hat diese Vorhersage nichts mit einer Vorhersage der Zukunft zu tun (forecasting). Es ist durchaus möglich, dass mit den Daten von 1975 ein Modell entwickelt wurde, um zum Beispiel das Kaufverhalten 1975 vorherzusagen. Möglicherweise haben sich aber wichtige Einflussgrößen im Laufe der Zeit geändert, so dass das Modell 1985 völlig untauglich ist.

In dem nachfolgenden Beispiel wird das Gewicht unnd die Größe (inch) zueinander in Beziehung gesetzt (Beispiel aus SAS Chap. 3).

SAS: proc reg;
model gewicht*größe;
               plot gewicht*größe;


Das Gewicht kann demnach nach der Formel "Gewicht=-143,03 + 3,899*Größe" approximativ vorhergesagt werden.
Wie man an der Funktion leicht erkennen kann, handelt es sich um eine einfache lineare Funktion.

Der Zusammenhang von Größe und Gewicht darf nicht mit einem kausalen Zusammenhang verwechselt werden. Nur in einem Experiment könnte die Kausalität überprüft werden.

Die Regressionskurve wird nach der Methode der kleinsten Quadrate berechnet, so dass die Abstände jeder einzelnen Beobachtung zu der Kurve auf ein Minimum beschränkt wird.

Regressionsanalysen sind sehr komplex, weil man auch quadratische, kubisch etc oder nicht-lineare Funktionen erwägen muss.

Achtung!!!
Regressionsmodell bieten maximal eine grobe Annäherung an die reale Situation. Reale Zusammenhänge sind extrem komplex und häufig kennen wir die relevanten Faktoren gar nicht, die sie beeinflussen.
Meistens beschränken wir uns auf ein Modell, das nur diejenigen Faktoren enthält, die wir  gemessen oder dokumentiert haben.

CONSORT - Statement

Randomisierte Studien stellen derzeit den Goldstandard bei vergleichenden Therapiestudien dar.

Um die Validität dieser hochwertigen Studien allen Lesern hinreichend verständlich zu machen, wurden von der CONSORT Gruppe Empfehlungen zur Abfassung einer Veröffentlichung zusammengefasst. Dieses so genannte CONSORT-Statement wurde überarbeitet publiziert. Eine deutsche Zusammenfassung existiert ebenfalls.

Die Kenntnisse des CONSORT-Statements ist auch für das Verständnis solcher Studien sehr hilfreich.

Evidenz-basierte Medizin

Der Begriff "Evidenz-basierte Medizin" (EBM) wird inflationär verwendet und häufig missverstanden, so dass an dieser Stelle auf eine kurze und prägnante Zusammenfassung der Prinzipien der EBM von David Sackett verwiesen werden soll.

EBM ist nichts Neues, sondern war und wird von allen ernsthaften Ärzten schon immer praktiziert, die (selbst)kritisch ihre klinische Tätigkeit beurteilen. EBM ist vom Prinzip her relativ einfach, weil sie auf drei Prämissen basiert:

1. mache Dich mit den Wünschen und Erwartungen des Patienten vertraut;
2. bringe Deine klinische Erfahrung ein und
3. mache Dich mit der externen, wissenschaftlichen Evidenz vertraut.

Nach diesen Prämissen sind gute Ärzte schon immer vorgegangen. Das neue Element besteht lediglich in der Betonung der dritten Prämisse, weil wir durch die Flut an neuen medizinischen Erkenntnissen, die erstmals allen leicht zugänglich ist, in die einfache und doch zugleich schwierige Situation versetzt werden, diese Informationen zu verarbeiten.

Die Berücksichtigung der verfügbaren externen Evidenz führte in den letzten Jahren zu großen Verbesserungen in der Diagnostik und Therapie. Gerade in der Chirurgie haben wir uns von altem Ballast und unbegründeten Ritualen getrennt.

Von einigen Ärzten wird primär die dritte Prämisse betont und die anderen vergessen oder in den Hintergrund gestellt. Es sollte aber allen Ärzten klar sein, dass alle drei Prämissen zu einer ärztlichen Behandlung gehören.

Wie wird die externe Evidenz  am Besten beurteilt und worauf sollten Empfehlungen beruhen?

Einge gute un leicht verständliche Einführung finden Sie in meinem Buch "Statistik ohne Statistik".

Quantitative Daten

Bei der Auswertung quantitativer Daten muss zunächst überprüft werden, wie die Daten verteilt sind. Dazu eignet sich UNIVARIATE. Erst danach kann entschieden werden, welche Tests geeignet sind. Im Zweifel werden immer die nicht-parametrischen Tests (NPAR1WAY oder GLM) bevorzugt.

Exploration numerischer Daten proc univariate
Vergleich numerischer Daten zwischen zwei Gruppen proc ttest , proc npar1way
Vergleich numerischer Daten zwischen mehreren Gruppen proc glm, proc anova, proc npar1way
Korrelationsanalyse proc corr
Regressionsanalyse proc reg, proc glm
Überlebensdaten proc logrank, proc survival

Beurteilung der Evidenz und Empfehlungen

Die Qualität der vorhandenen Evidenz wird allgemein in Graden angegeben, woraus dann Grade der Empfehlung abgeleitet wurden.

Eine gute Einteilung ist die der Oxforder Arbeitsgruppe, die sich aber in den letzten Jahren als untauglich erwiesen hat. Die Klassifikation ist nicht eindeutig und trennscharf genug, um sinnvoll angewendet zu werden.

Diese Mängel erkennend wurde von einer Schottischen Arbeitsgruppe (SIGN) ein neues System eingeführt, das sich als sinnvoll und praktikabel erwiesen hat.

Aufbauend auf SIGN konstituierte sich die GRADE Working Group, die sich zum Ziel gesetzt hat, ein funktionstüchtiges Evaluationsinstrument von systematischen Reviews zu entwickeln.

Die Entwicklung von Leitlinien sollte nach GRADE mit einer klaren Formulierung von Fragen oder Problemen beginnen, ein unabhängiges und kompetentes Panel konstituieren und die Vorgehensweise festlegen. Für alle relevanten Zielkriterien wird die beste verfügbare Evidenz gesucht und für jedes Zielkriterium ein Profil erstellt (Subpopulationen, Risikostratifizierung, Studienqualität). Danach wird für jedes Zielkriterium die Qualität der Evidenz und ihre klinische Relevanz (sehr bedeutend oder nur bedeutend) bestimmt. Die gesamte Qualität der Evidenz berücksichtigt alle Zielkriterien. Zusätzlich wird die Balance zwischen den Vor- und Nachteilen eingestuft sowie Benefit und Kosten gegenübergestellt. Aus allen Bewertungen wird dann eine einfache Gesamtempfehlung abgegeben.

Grade der Gesamtevidenz

Hoch Weitere Forschung wird wahrscheinlich unser Vertrauen in die Wirkung nicht ändern.
Mittel Weitere Forschung wird wahrscheinlich unser Vertrauen in die Wirkung und das geschätzte Ausmaß ändern.
Gering Weitere Forschung wird sehr wahrscheinlich unser Vertrauen in die Wirkung und das geschätzte Ausmaß ändern.
Sehr gering Jede Schätzung eines Therapieeffektes ist sehr unsicher.

Die Beschreibung der Evidenzgrade weist bereits daraufhin, dass es sich um die Gesamtbeurteilung der Evidenz handelt und nicht nur um eine Auflistung der Studienarten.

Evidenz von Studien

Hoch Randomisierte Studie
Niedrig Beobachtungsstudien
Sehr niedrig Jede andere Evidenz

Die Studien werden zusätzlich nach den folgenden Kriterien höher oder niedriger qualifiziert:

Bewertung Kriterium
-1 Schlechte Studienqualität
-2 Sehr schlechte Studienqualität
-1 Relevante Inkonsistenz
-1 Unsicherheit über Anwendbarkeit
-1 Ungenaue oder zu wenig Daten
-1 Hohes Biasrisiko
+1 Starker und konsistenter Hinweis aus zwei oder mehr Beobachtungsstudien mit RR <0,5 oder >2, ohne Hinweis von Confounders
+2 Sehr starker und konsistenter Hinweis aus zwei oder mehr Beobachtungsstudien mit RR <0,2 oder >5, ohne Hinweis von Confounders
+1 Hinweise auf einen Dosis-Antwort-Gradienten
+1 Alle plausiblen Confounders hätten den Effekt vermindert.

Bevor eine Empfehlung abgegeben werden kann, sollten die Vor- und Nachteile abgewogen werden. Dazu wird folgende Einteilung empfohlen:

Nettobenefit Die Vorteile überwiegen eindeutig
Bedingter Vorteil Es gibt neben den überwiegenden Vorteilen auch relevante Nachteile
Unsicherer Vorteil Es ist nicht eindeutig, dass die Vorteile überwiegen.
Keine Nettobenefit Die Vorteile überwiegen nicht.

Unter Berücksichtigung aller genannter Faktoren (Abwägen der Vor- und Nachteile, Qualität der Evidenz, Berücksichtigung der realen Umsetzung in der klinischen Praxis, Unsicherheit über das allgemeine Risiko des betroffenenenPatienten) sollte eine eine eindeutige Empfehlung abgegeben werden, die in zwei Gruppe eingeteilt wird:

Mach es oder mach es nicht! Dieses Gesamturteil wird von den allermeisten aus den Fakten gezogen.
Erwäge es oder erwäge es nicht! Dieses Urteil wird von der überwiegenden Mehrheit abgegeben, aber von einigen nicht.

Humane Medizin

Dem Einen mag der Ausdruck "Humane Medizin" als Pleonasmus erscheinen und dem Anderen lediglich an den Ausdruck "Humanmedizin" erinnern. In diesem Kontext soll durch die bewusste Verwendung von "human" das Augenmerk auf die Menschlichkeit gerichtet werden. Praktizierte Medizin muss menschlich sein und bleiben, trotz aller Bestrebungen, sie auf das Nötigste zu begrenzen.

Was wird unter Menschlichkeit verstanden? "Menschlichkeit" bedeutet ein Denken und Handeln basierend auf Selbstlosigkeit, Mitgefühl, Warmherzigkeit, Herzensgüte, Ehrlichkeit, Verständnis, Toleranz, Einfachheit, Gewissenhaftigkeit, Zufriedenheit, Achtsamkeit, gegenseitiges Verantwortungsgefühl und Respekt. Wird die Menschlichkeit im Alltag umgesetzt, führt dies zu Vorbildlichkeit, Klarheit und Erkenntnis."

Menschlichkeit ist natürlich ein wichtiges Fundament der ärztlichen Tätigkeit. Als Ärzte unterliegen wir besonderen Verpflichtungen. So können die Patienten zu Recht von uns erwarten, dass wir uns zum Wohle der Patienten kontinuierlich fortbilden, dass wir mit dem vorhandenen Fachwissen bestens vertraut sind und dass wir dem Patienten keine Therapie empfehlen, von der wir nicht sicher wissen, ob sie zur effektiven Behandlung geeignet ist oder ihm Schaden zufügt.

Es reicht nicht aus, dass wir als Ärzte an gewisse Wirkprinzipien glauben und von unserer eigenen Tätigkeit überzeugt sind. Es wird zu Recht gefordert, dass sich die ärztliche Tätigkeit am verfügbaren Wissen ausrichtet und nicht allein an der persönlichen Meinung. Was wir heutzutage als gesichertes Wissen akzeptieren, hängt nicht in erster Linie von Autoritäten bzw. Spezialisten ab, sondern davon, ob es durch akzeptierte wissenschaftliche Methoden fundiert ist. Die Methodologie informiert uns somit, wie verläßlich unser Wissen ist. Wenn wir also abschätzen wollen, ob wir uns auf ein Wissen verlassen können oder eher misstrauisch sein sollten, dann müssen wir genau betrachten, wie die Erkenntnisse gewonnen wurden.

Aus diesem Grund sollte sich jeder Arzt mit den Prinzipien der Evidenz-basierten Medizin, ihren Vor- und Nachteilen, vertraut machen.

Mit den nachfolgenden Hinweisen wird versucht, Ihnen Einblicke in die Methodologie klinischer Studien und ihrer Auswertung zu verschaffen, um Sie dadurch mit dem nötigen Rüstzeug auszustatten, die Wertigkeit und Verlässlichkeit unseres medizinischen Wissens richtig einzustufen.

1.Was ist Evidenz-basierte Medizin und wie integriere ich sie im klinischen Alltag?

2. Welche Anforderungen werden an Berichte über randomisierte Studien gestellt?

3. Nach welchen Kriterien beurteilen wir Studien?

4. Wie werden Daten statistisch ausgewertet?

SAS - NPAR1WAY

Quantitative Daten können mit dem parametrischen TTEST ausgewertet werden, wenn sie normalverteilt sind und die Daten zwischen zwei Gruppen verglichen werden sollen. Wenn Daten in mehr als zwei Gruppen eingeteilt sind, dann ist PROC ANOVA oder PROC GLM zu wählen.

Ob die Daten normalverteilt sind, wird mit PROC UNIVARIATE überprüft. Wenn sie nicht normalverteilt sind, dann sollten nicht-parametrische Testverfahren gewählt werden wie in PROC NPAR1WAY.

Der Ausdruck "parametrisch"  ist darauf zurückzuführen, dass Daten mit einer definierten Häufigkeitsverteilung durch bestimmte Parameter eindeutig definiert sind. Wenn keine bestimmte Verteilung unterstellt werden kann, dann sind die nicht-parametrischen Testverfahren geeignet. Die Prozedur "npar1way" funktioniert so, dass die Daten ihrer Rangordnung nach sortiert werden und dann mit den Rängen gerechnet wird udn nicht mit den absoluten Werten.

Ziel SAS Programm Erläuterung
Entspricht eine Messreihe a einem bestimmten Wert q proc npar1way data=x.x h0=q wilcoxon; var a; Der Nullhypothese (h0) wird ein bestimmter Wert q zugeordnet und die Variable a daraufhin überprüft, ob sie von diesem Wert verschieden ist. Der Test wird Wilcoxon signd rank test genannt.
Vergleich von Medianen der Variablen a zwischen zwei Gruppen proc npar1way data=x.x ; class x; var a; Die beiden Gruppen werden durch die Variable x definiert. Wenn zwei Gruppen vorkommen entspricht der test dem Mann-Whitney U-Test. Bei mehr als zwei Gruppen wird der Kruskal-Wallis-Test ausgeführt.
Vergleich gepaarter Ergebnisse y=a-b proc npar1way data=x.x; var y; Sind Ergebnisse gepaart, dann wird im "data step" eine neue Variable y eingeführt, die die Differenz zwischen den beiden Ergebnisse a und b berechnet. Es wird dann getestet, ob y mit Null übereinstimmt, was keinem Unterschied entspräche.