--> Statistische Analysen, Würzburg

Sie sind unter Zeitdruck?


... hier sind die Kontaktdaten!

0178 87 55 145 oder 0157 740 58 477 oder 0931 260 91 554 (im Büro bin ich meist zwischen 9 - 19 Uhr)
Untere Bockgasse 5 (Altstadt)
97070 Würzburg
Dr. Ulrich Stefenelli, ulrich.stefenelli@googlemail.com

Warum und wofür? ..... Analytik für Studien

Forschende brauchen eine statistische Analytik, die kompetent und präzise ist. Sie soll verlässlich sein, damit Sie selber Ihre eigenen hohen Anforderungen bei ihrer Publikation erfüllen können, ohne dass lästige und zeitintensive Nachbearbeitungen anfallen. Sie soll fristgerecht vorliegen. Sie soll verständlich sein, ohne dass viel Zeit für eine Einarbeitung anfällt. Deswegen erhalten Sie von mir sorgfältig erstellte, sofort verwendbare Analysen in Word oder als HTML zum vereinbarten Zeitpunkt für ein Copy & Paste. Ich gebe nichts nach draußen oder an einen Subunternehmer ab, ich selber habe keinen umfangreichen "Mitarbeiterstab" wie andere Firmen. Hier rechnet der Chef persönlich. Ich möchte, dass sie sich auf das konzentrieren können, was sie am besten können. Dafür stehe ich ihnen als zuverlässiger Partner für die statistisch-fachliche Seite zur Verfügung.

Ziele ... was Sie erwarten können.

Die Statistik ist ein kompliziertes Gebiet. Vielleicht kennen Sie es: .... auch nach intensiver Einarbeitung bleibt eine Unsicherheit, etwa, ob die selbst erarbeiteten Befunde kritiksicher sind, ob Sie alle nötigen Voraussetzungen erfasst haben, ob Sie sie verstanden haben, ob die Rechenprozeduren nicht nur liefen, sondern auch richtig liefen, ob sie die richtigen Kennwerte gelesen haben und diese richtig bewertet haben, letztlich auch, ob der Übertrag eines Befunds in Ihr Fachgebiet möglich ist, und mit der richtigen Kennzahl gelingen kann.
Auch langjährig erfahrene Wissenschaftler kennen sich selten in allen Facetten der Statistik aus oder haben Überblick über die Fallstricke und Stolpersteine.
Ich arbeite an der Schnittstelle zwischen Daten Ihres Faches und verwertbaren Schlussfolgerungen. Es liegt mir am Herzen, sicherzustellen, dass Sie sich damit wohlfühlen und leicht zurechtfinden, indem sie selbst immer alle Dokumente lesen können, also in einer verständlichen Sprache ohne Formeln und ohne Fachchinesisch. Effektive, verständliche, leicht les- und übertragbare Statistiken ..... das ist es, was Sie von mir bekommen. So können Sie selbst ohne schlechtes Gewissen die Statistiken vor Ihrem Zielpublikum darstellen oder Ihre Publikation in überschaubarer Zeit fertigstellen.

Ihre Vorteile bei einer Zusammenarbeit

Wenn Sie mit mir arbeiten, haben Sie folgende Vorteile: Ich nehme Ihnen den Druck, sich in ein Fachgebiet einzuarbeiten, das Ihnen vielleicht nicht liegt und die Einarbeitung ungemein viel Zeit verschlingt, gerade weil man in der Statistik zu Beginn einen sehr geringen Wirkungsgrad hat. Ich stelle sicher, dass die Berechnungen anhand Ihrer Daten überhaupt getätigt werden dürfen, d.h. ob die Voraussetzungen stimmen, die richtigen Kennwerte verwendet werden, ob die Befunde überhaupt signifikant und wertbar sind, ob Sie fachlich überhaupt passen und eine Beurteilung erlauben. Ich stelle sicher, dass die Statistiken fachlich einwandfrei sind. Ich verwende stets validierte Prozeduren, eine Validierungsdokumentation kann ich Ihnen gesondert erstellen, wenn Sie eine solche benötigen. Die Berechnungen sind quer-gecheckt, d.h. mit 2 Statistik-Paketen überprüft (meist SPSS plus R, oder R plus SAS). Sie erhalten von mir eine Schweigepflichtserklärung, so dass eine Vertraulichkeit unserer Zusammenarbeit sichergestellt ist. Ich berücksichtige Ihre Sonderwünsche und optimiere diese anhand Ihrer Daten. Ich nehme Fristen sehr ernst und liefere Ihre Befunde grundsätzlich immer zum vereinbarten Zeitpunkt.

... ich bin Ihre externe Statistik-Abteilung ... wofür?
... ich unterstütze Sie bei ...

  • Deskriptive Statistiken, Gruppenvergleiche, Modelle (z.B. Überlebensprädiktion), Tabellen in einfachen Übersichten (z.B. alle Studiendaten auf einer Querseite), Grafiken, Kommentare zu den wichtigsten Statistiken, Schlussfolgerungen...
    Entwurf von Studiendesigns, insbesondere der Phasen I (Dosisfindung, "first in man") bis III (randomisiert, Sicherheit und Wirksamkeitsbeleg)
    Planung so genannter "adaptiver Designs", d.h. man plant schon von vorne herein die Möglichkeit ein, früher stoppen zu können bei einem schnellen Erfolg.
    Dosisfindung mittels "MCP-Mod" (Multiple Comparisons - Modelling)
    Bayes-Methodik bei Phasen I und II (auch CRM = continual reassessment method = Dosiseskalations-Schema)
    Simulationen als Hilfe für die Entscheidungsfindung bei Studien-Design und nötiger Fallzahl
    Unterstützung beim Studienprotokoll oder Ethikantrag
    Teilnahme und argumentative Unterstützung bei Board-Meetings in statistischen Belangen
    Vorbereitung der Treffen und Unterstützung bei Treffen mit den jeweiligen Aufsichtsbehörden
    Aufbau eines "Data and Safety Monitoring Board", d.h. ein unabhängiges Datenüberwachungskomitee. Es bewertet regelmäßig den Fortgang einer Studie, die Sicherheitsdaten der Studie und die Wirksamkeitskriterien. Es gibt Empfehlungen ab, ob die Studie fortgesetzt, abgeändert oder abgebrochen werden sollte. Unterstützung zur Prüfung von "Machbarkeit" einer Studie und zur Frage, ob Zentren, die einbezogen werden sollen, überhaupt den Anforderungen in Ihre geplante Studie gerecht werden können
    Aufbau eines zentralen Web-Monitoring-Tools, in dem die Studiendaten eingetragen werden (ein electronic Case Record Form), alle Studienprozesse gelenkt werden, das den Studienfortschritt anzeigt und ein zeitnahes Projektmanagement erlaubt.
    Erstellung eines statistischen Analyseplans
    Statistisches Programmieren (TFL = tables, figures and listings)... natürlich mit Validierungs-Doku
    Interim Analysen
    Meta-analysen
    Pharmacoökonomische Auswertungen
    Random-Listen, klassisch auf Paper oder webbasiert über eine Maske, zentrumsweise, Sie als Admin

... ich kümmere mich um Ihr Daten Management
... ich unterstütze Sie bei ...

  • Aufnahme von Studiendaten per Web-Form (eCRF, d.h. electronic Case Record Forms), jedes Ihrer Zentren kann sofort darauf zugreifen ... die Studienzentren können den aktuellen Stand abfragen und sehen, wer welchen Beitrag liefert.
    eCRF regelkonform nach CDIC, SDTM format
    eCRF mehrsprachig, wenn die Studie multinational läuft
    Kurzberichte zum jeweiligen Stand der Studie, tagesaktuell
    regelkonform nach ICH-GCP and 21 CFR Part 11
    Kodierung von AE (adverse events) nach MedDRA®, WHO DDEnhanced, NCI-CTCAE
    Kodierung von AE (adverse events) nach MedDRA®, WHO DDEnhanced, NCI-CTCAE

Wichtig zu wissen... manches geht leider nicht (sorry...)

Meine statistischen Befundberichte können nicht auf Zuruf ohne statistisch-fachliche Grundlage um- oder nachgearbeitet werden ... und ich ghostwrite nicht.

Beispiele zum Download

Hier finden Sie einige Beispiele zum Download, wie Grafiken aussehen könnten, wie ein Bericht gestaltet wird.

Beispiele

Was der Statistiker für Sie tun kann.

Vieles kann der Statistiker für Sie übernehmen ... und er macht es gerne ... darunter Rechnen, Berichten, Erklären und vor allem schön darstellen, insbesondere nachvollziehbar, leicht verständlich, ohne größere Hürden beim ersten Lesen und beim Verstehen, vor allem ohne Fachchinesisch und ohne Formeln.

Der Statistiker macht ... Auswertungen

Ergebnisse und Schlussfolgerungen aus Daten zu extrahieren und sie nachvollziehbar und kritiksicher dokumentieren ... ist das A und O für den Statistiker.

Berichterstattung und Doku

Die Darstellung der Befunde in einem Ergebnisbericht, der intuitiv und ohne Einarbeitung verständlich ist. Die Zeit, bis beispielsweise Ihr Paper eingereicht werden kann, wird klar verkürzt.

Graphiken

Grafiken sollen Ihre Daten kurz und knackig zusammengefasst zeigen ... die Befundlage soll auf einen Blick intuitiv verständlich sein... die Ergebnisse sollen "ins Gesicht springen"....

Programmieren (R, SPSS, SAS, Python, Access)

Für kompliziertere Datenpakete oder für Prädiktionsmodelle verwendet man eine Programmierung. Ich verwende hauptsächlich das R, weil hier die Freiheiten und die Beweglichkeit beim Arbeiten am größten sind. Aber auch das SPSS bietet mit seiner Syntax eine hervorragende Basis.

Datenbanken & Webmasken bauen

Größere Daten sollte man in eine Datenbank packen, sofern nicht schon geschehen. Es gibt herrliche Datenbanken, die schnelle Abfragen erlauben, darunter Access, das auch den Bau von Masken erlaubt, aber auch das kostenfreie MySQL, ein sehr schneller Data-Engine.

Ergebnisberichte korrekturlesen

Sie haben schon Ergebnisse? Sie haben diese auf schon als Manuskript? Prima. Ich lese Ihr Manuskript Korrektur, prüfe die Statistiken, deren Umsetzung und inwieweit Ihre Schlussfolgerungen und Statistiken übereinstimmen.

Fokusbereiche

Aufgrund meiner Erfahrung als Statistiker (seit 1992) bin ich mit einem recht breiten Spektrum der statistischen Analytik vertraut, angefangen von intuitiver und einfacher Deskription (keine Selbstverständlichkeit), Mehrprädiktoren-Modelle (z.B. für progressionsfreies Überleben), für Risiken, für Rangdaten, aber auch Metaanalysen. Ich habe auch eine breite Palette an Grafiken, mit denen Daten intuitiv verständlich sind.

Über mich

Ich bin studierter Sozialwissenschaftler und Statistiker (Dr. rer. nat.) und approbierter Arzt (Dr. med., das war mein zweites Studium).
Ich arbeite seit 1992 in Vollzeit als Statistiker in der klinischen Forschung.
Ich habe mein Handwerk in der klinischen Forschung und Biometrie bei Pharmafirmen erlernt
(ich habe seiner Zeit dort mit SAS angefangen und durfte neurologische Studien mit-betreuen).
Aktuell werte ich hauptsächlich klinische Studien aus und unterstütze kleinere Forscherteams an Universitäten konsiliarisch als externer Statistiker.
Darüber hinaus betreue ich kleinere Doktorandengruppen.
Ich biete auch an, Studien komplett zu erstellen ("alles aus einer Hand", d.h. von der Planung, über das Monitoring und Data Management bis zum Reporting oder zum Paper).

Sonstiges

Ich programmiere leidenschaftlich gerne, erstelle Ihre Statistiken, gerne auch, wenn Sie eine Datenbank benötigen, oder statistische Flächenkarten, so z.B. diese hier. Oder wie diese hier. Das ist ein vergrößerter Ausschnitt.



Oder ich baue Bilder, so wie dieses hier. Drei Gruppen, ein einfacher Verlauf und zusätzlich mit Vertrauensbereich.
Die p-Werte kommen aus Rangvarianzanalysen (ein p kleiner gleich 0.05 zeigt einen Unterschied an, 'Diff.' meint 'Differenzwerte', d.h. Verlaufsunterschiede zur Frage, ob die Änderungen mal stärker oder mal schwächer ausfallen).


Manchmal möchte man Signifikanzwerte vergleichen. Im nächsten Beispiel sieht man Werte für 4 Messmethoden für Antikörper. Die Frage war, ob sich Unterschiede herauskristallisieren. Man testet hier einfach einmal 'jeder gegen jeden'. Wenig spektakulär. Aber: Das Bild ist voll automatisiert erstellt (in R mit ggplot2). Es waren keine manuellen Ergänzungen nötig, was den Zeitaufwand optimiert und den Kopf für umfangreichere Fragen im Projekt freihält.



Hier ein Boxplot. Der Querstrich innerhalb der Box ist der Median, der Diamant kennzeichnet den Mittelwert. Auch dieses Bild ist voll automatisiert erstellt (in R mit ggplot2). Es waren keine manuellen Ergänzungen nötig.

Manchmal möchte man einfach nur Inzidenzraten über die Zeit verfolgen. Im nächsten Beispiel sieht man ein Symptomprofil ('Sy'), die Ungenauigkeiten (Konfidenzintervall für 0/1-Daten) sind als dünne Fehlerbalken um die Kurven herum gezeichnet.


Manchmal möchte man ein Risiko über die Zeit verfolgen. Im nächsten Beispiel sieht man Risikoverläufe, eine klassische "Kaplan-Meier-Überlebenskurve". Sie ist in R mit ggplot2 erstellt (Vollautomatisiert, ohne händische Einträge, die viel Zeit kosten. Die Ungenauigkeiten sind in Pastel um die Kurven herum gezeichnet. CI meint die Genauigkeit ('confidence interval', je breiter desto ungenauer).



Zusammenfassend

  • Ich löse Ihr Datenproblem, beschleunige die Statistik.
  • Sie haben in dieser Zeit frei, können die Beine baumeln lassen.
  • Ich dokumentiere die Ergebnisse, leicht nachvollziehbar und verständlich. Sie brauchen keinerlei Einarbeitung in die Statistik.
  • Sie erhalten die Befunde zum Copy & Pasten.
  • Ich beantworte Ihre Fragen.
  • Wenn Sie selber rechnen wollen ... einmal die Woche biete ich einen Crash-Kurs zur Statistik an (Dauer 2h, 75€). Im Idealfall können Sie Ihre Statistik-Hürde damit überspringen.
  • Ich beantworte Ihre Fragen.
  • Ich coache Sie. So können Sie die Befunde nach Außen selbstsicher vertreten und auf Kritik oder Nachfragen gelassen und angemessen reagieren.

Zum Ablauf

Wenn Sie eine Anfrage bei mir starten (0157 740 58 477 oder 0931 260 72 110)
so sollten Sie mir Einblick in Ihre Daten geben (ein Auszug reicht, ich muss nur Ihre Struktur erkennen können).
Beispielsweise ein Excel-Blatt, die Daten in SPSS oder Access,
und natürlich eine Liste in Word mit Ihren Fragen.
Das Ganze in meine Mailbox und los geht's.... wir sprechen kurz zu Daten und Hypothesen.
Die Telefonbesprechung wird etwa 15 Minuten dauern.

1

Besprechung zu den Daten (15 Minuten am Telefon)

2

Besprechung Ihrer Fragen an die Daten

3

Erstellung eines Kostenplans

4

Besprechung der Kosten

5

Programmierung und Abarbeitung Ihrer Fragen, Berichterstattung

6

Beantwortung Ihrer Fragen, Ergebnisse für Sie zum Copy & Pasten

Wer wir sind...

Ich arbeite in Vollzeit als Statistiker, statistischer Analytiker und Konsiliarius für Statistik,
Petra Lerch unterstützt mich.

Dr. rer. nat. Dr. med. Ulrich Stefenelli

Statistiker, Analytiker

...fast 30 Jahre Erfahrung als Statistiker, ca. 1550 Projekte von klein bis groß

Petra Lerch

Sekretariat

...sucht Kooperationspartner, hält mir den Rücken frei und unterstützt mich

Leistungen

Statistik mit SPSS, SPSS-Programmierung
100%
Statistik mit R, R-Programmierung
95%
Statistik mit PHP-Web (RServe, ähnlich wie R Shiny)
100%
Datenbanken mit MySQL und Access
100%

Fragen

Text in Word, Tabellen in Excel, Graphiken als JPG.

Sie erhalten vorab einen Kostenvoranschlag zur freien Entscheidung, d.h. er ist unverbindlich und enthält einen Festpreis. Hier sind alle Leistungen, Kosten und Lieferzeit auflistet. Ich garantiere die Einhaltung von Festpreisen.

Preise

  • 69 € pro Stunde
    Begutachtung
  • Besprechungen zu fertigen Auswertungen
  • kurze schriftliche Kommentierungen
  • Wertungen von Ergebnissen
  • Problemlösungen
  • Beantwortung von Fragen
  • Anleitung zum Selbstrechnen
  • Anleitung zur Befundinterpretation
  • 79 € je Stunde
    Analytik
  • Programmierung in SPSS oder R
  • Ergebnisse in Tabellen und Grafiken mit p-Werten
  • Ausführliche Kommentare, Wertungen
  • Validierung der Berechnungen
  • 79 € pro Stunde
    Prognostische Modelle und KI
  • Programmierung in SAS oder R, VBA mit Access, Javascript, PHP mit MySQL
  • Entwurf von Simulationsmodellen, mit Web-Grafik
  • Entwurf von Prognosemodellen, mit Web-Grafik
  • Entwurf von Szenarien, mit Web-Grafik

Blog und Neuigkeiten...

Pfadmodelle testen

Lange geplant, immer wieder verschoben ... endlich einmal ein Test von Pfadmodellen. Früher war die Software unbezahlbar, heute umsonst: Tolles Angebot im R. Hier gibt es das "plsPM", das "matrixPLS" oder das "semPLS".

Warum ein Pfadmodell? Alles mit allem korrelieren ist leicht. Aber eine ganze Modellvorstellung (die man auch als Pfeildiagramm aufmalen kann, siehe das obige Beispiel) einem Test zu unterziehen und hier einen einzigen p-Wert zuzuordnen.... das ist schon crazy...



Flächenkarten mit ggplot2

Große Datenmengen über Flächen (z.B. die Corona-Raten) lassen sich mit R prima darstellen. Die Einarbeitung ist allerdings alles andere als leichtgängig. Es gibt etliche Hürden zu überwinden....
Ein großes Dankeschön an Timo Grossenbacher, der das hervorragend vorgemacht hat.


Datenarrays mit PHP

Eine ordentliche Programmiersprache für Daten-Auswertungen (idealerweise an c++ angelehnt) und das Ziel, Data-Arrays zu programmieren... das war mein lange gehegter Traum.
Irgendwann hat mich die SPSS-Syntax genervt .... für mich persönlich: viel zu umständlich und eine zu lange Einarbeitungszeit. Auch bei anderen Programmen (R bleibt allerdings nach wie vor spannend)..
Aber man kann auch Auswertungen mit PHP programmieren und der Ärger beim Scripten hat ein Ende. PHP bietet (fast) alles, was c++ auch hat, das ist (fast) eine "echte" Programmiersprache. Man erstellt ein Script in Form einer Webseite und läßt sie in einem Browser laufen (Firefox beispielsweise). Apache2 als Webserver liefert, die Ausgabe ist reines HTML mit Tabellen, Grafiken und - wenn man möchte - sofort automatisch kommentiertem Text.
Und siehe da: Der Spass am Programmieren beim Auswerten von Daten war wieder da.
Ein Beispiel: Excel-Daten einlesen (Excelblatt vorher als 'csv' gespeichert)

$myfile = fopen("c:\temp\test.csv", "r"); while(!feof($myfile)){ $line = fgets($myfile); myarray[] = explode(",", $line); #Spaltensplit } print_r($myarray); echo "Der Spaltenmittelwert liegt bei ".average(myarray[0]).".";



Study Data Tabulation Model

Klinsche Studiendaten müssen nach FDA-Standard dokumentiert werden.... nach einem sogenannten Study Data Tabulation Model. Das Ganze nennt sich dann SDTM und .... Vorsicht, jede Menge Abkürzungen ... CDISC und ADaM.



In Excel-VBA eine selber erstellte dll einbinden

Schon mal versucht, mit Excel mehr als mit VBA zu machen?
In Excel lassen sich externe Programme einbinden, C++ beispielsweise. So kann man endlich eine höhere Programmiersprache mit einbinden. Man ist nicht mehr auf VBA angewiesen. ... ich weiß, ich weiß .... Python als VBA-Ersatz im Excel ist jetzt groß am kommen ... mehr demnächst ...



Daten ersetzen, mit einer 'echten' Programmiersprache am Beispiel von PHP

Daten ersetzen kann zeitraubend sein, obwohl man durch die Automatisierung eigentlich Zeit sparen möchte.
Ein Beispiel: Man möchte folgenden Text ersetzen (nämlich durch Jahre):
$s = "5 Jahre 6 Monate 30 Tage";
In den Rohdaten ist das eine Datenspalte und sie ist mehrere Tausend Einträge lang.
Damit man nicht händisch ran muß, gibt es in PHP preg_replace, das ist eine Funktion für regelhalfte Ausdrücke.

$s = "5 Jahre 6 Monate 30 Tage"; $bywhat = '/(\d{1,}) Jahre? (\d{1,}) Monate? (\d{1,}) Tage?/'; echo preg_replace_callback($bywhat, function ($matches) { return $matches[1] * 365 + $matches[2] * 30 + $matches[3]; }, $s);

... das ergibt im Beispiel dann 5 * 365 + 6 * 30 + 30 Tage.
... händisch muss man nun wirklich nicht mehr ran ....


Vollautomatisierte Grafik mit p-Werten

... schnell mal eine Grafik erstellen und alles eintragen, was wichtig ist ... meist ein Zeitfresser.
Im nächsten Beispiel sieht man Werte für 4 Messmethoden im Vergleich. Dieses Bild ist voll automatisiert erstellt (in R mit ggplot2). Es waren keine manuellen Ergänzungen nötig, dankenswerterweise .... was den Zeitaufwand optimiert und den Kopf für umfangreichere Fragen im Projekt freihält.




Statistik-Programmierung in C

Es hat mich schon immer interessiert, ob es geht ... Statistik in einer echten Programmiersprache, hier im Beispiel C (nein, nicht C++) ... und ja, es geht ... C ist granatenschnell, und insbesondere bei großen Datensätzen (z.B. n = 10 000) schrumpft die Wartezeit auf wenige Millisecs zusammen ...