• Hallo Gast, wir suchen den Renner der Woche 🚴 - vielleicht hast du ein passendes Rennrad in deiner Garage? Alle Infos
  • Rennrad-News User Awards 2025: Jetzt abstimmen und Preise im Wert von über 9.000 Euro gewinnen!
    Stimme in einer kurzen Umfrage über deine Produkte des Jahres 2025 ab und gewinne dabei Preise im Wert von über 9.000 Euro!
    ➡️ Jetzt abstimmen!

Wissenschaftliche Arbeiten & Artikel zu Training und Physiologie etc.

Es gibt eine neue Studie zur Frage, wie gut der bekannte 20 min. FTP-Test die 60 min.-Leistung schätzen kann. Das - soweit ich weiß - neue an der Studie ist, dass die Autoren die Beziehung zwischen 20min.-Leistung und 60min.-Leistung differenziert nach Leistungsklassen der Radfahrer untersucht haben. Basis für die Einteilung in Leistungsklassen war die VO2max.
Für die verschiedenen Leistungsklassen ergeben sich folgende Koeffizienten für die Beziehung 20min.-Leistung zu 60min.-Leistung

Professional: PO60min=PO20min × 0.96;
well trained: PO60min=PO20min × 0.95;
trained: PO60min=PO20min × 0.92
recreationally trained: PO60min=PO20min × 0.88.

D.h. bei Profis ist die 60min.-Leistung im Durchschnitt 96% der 20min.-Leistung, bei "Freizeitfahrern" ist der Wert nur noch bei 88%.
Kommt nicht ganz überraschend, liefert aber nochmal Hinweise zur Nutzung des beliebten 20min.-Tests.
Hier ist der Link zum Abstract
https://pubmed.ncbi.nlm.nih.gov/37802084/
Leider habe ich keinen Zugriff auf den Volltext. Daher ist es insbesondere schwierig, die Einteilung der Probanden in die Leistungsklassen nachzuvollziehen.

Falls jemand Zugriff auf den Volltext hst, würde ich mich über die Überlassung einer Kopie ausschließlich für private Zwecke freuen.
 

Anzeige

Re: Wissenschaftliche Arbeiten & Artikel zu Training und Physiologie etc.
Für die verschiedenen Leistungsklassen ergeben sich folgende Koeffizienten für die Beziehung 20min.-Leistung zu 60min.-Leistung ...

Falls jemand Zugriff auf den Volltext hat, würde ich mich über die Überlassung einer Kopie ausschließlich für private Zwecke freuen.
Leider habe ich auch keinen Volltext-Zugriff.

Inhaltlich: der letzte Satz ist eigentlich der Schlüssel. Trotz der verbesserten Korrelation ist die Fehlerbreite immer noch enorm. Grund dafür mag sein, dass der erheblichere Teil der Schwankung nicht durch die VO2max (bzw. die P(VO2max)), sondern stärker durch die individuellen Unterschiede der anaeroben Kapazität W' begründet sein mag. Ein Sprintertyp wird nun mal von CP20 zu CP60 stärker abfallen als ein Marathontyp. Da Anfänger eher als "Sprintertypen" einzustufen sind, dürfte dies einen erheblichen Anteil der Spannbreite zwischen Anfängern und Profis mit erklären, ohne dass die VO2max hierfür als ursächlich anzusehen wäre, sondern nur "zufällig" mit korreliert.

Der "Normabschlag" von 5% zwischen CP20 und CP60 ist auch im uralten Monod-Scherrer-Modell nicht derart fixiert. Er wird je nach W'- und CP-Ausprägung in einem Band von ca. 2,5% bis 8% zu liegen kommen.

Bei 12% Abschlag werden zusätzliche Aspekte hineinspielen, wie beispielsweise die Fähigkeit einer wenig trainierten Person, die Tests überhaupt richtig pacen zu können.
 
Eine neue Review zur alten, aber immer wieder spannenden Frage, ob Training über oder unter "der Schwelle" den größten trainingsmethodischen Nutzen bringt.

Die Autoren haben Daten aus 14 Studien, mit zeitlich befristeten Trainingsinterventionen bei trainierten Sportlern, in einem Datensatz zusammengefasst und statistisch ausgewertet.
Mit in den ausgewerteten Studien sind u.a. auch bekannte Werke, wie die auch hier immer wieder mal diskutierten Studien von Stepto und Seiler zu verschiedenen Intervalltrainingsprogrammen.

Alle berücksichtigen Studien vergleichen Training über und unter dem "Maximal Metabolic Steady State" MMSS miteinander. Der Begriff MMSS dient in der Review als Sammelbegriff, um die verschiedenen in der Literatur üblichen Schwellenkonzepte (MLSS, VT2, FTP, CP etc. pp.) zusammenzufassen und dadurch Training über oder unter "der Schwelle" zuordnen zu können.
Untersucht wurde, wie sich die Trainingsinterventionen auf VO2max, Wpeak (Abbruchleistung in einem Stufentest) und die Performance in simulierten Zeitfahren (Time Trial / TT) auswirken.

Nach Analyse der Daten kommen die Autoren zu der Aussage, dass alle berücksichtigten Studien von der Probandenzahl erheblich zu klein dimensioniert sind, um statistisch sicher auf bestimmte Effekte aus den Trainingsprogrammen zu schließen. Um die in den Studien ermittelten positiven Effekte bestimmter Trainingsinterventionen statistisch sicher belegen zu können, müsste die Probandenzahl zumeist ein Vielfaches der tatsächlichen Probandenzahl betragen!

Durch Zusammenfassung der Studien lässt sich der Mangel der fehlenden statistischen Aussagekraft allerdings beheben. Die übergreifende statistische Auswertung bestätigt dabei, dass Training über dem MMSS ("Schwelle") einen positiven Effekt auf die VO2max hat. Das ist zunächst wenig überraschend, interessant ist aber, dass sich dieser Effekt unabhängig vom gewählten Trainingsmodus (Laufen, Radfahren, Rudern) und offenbar auch unabhängig vom Design der Intervention (also eines konkreten Intervalltrainingsprogramms) zeigt. Anders gesagt: Aus den verfügbaren Studien lässt sich ableiten, dass Training über dem MMSS einen Effekt auf die VO2max hat, aber nicht sicher, wie dieses Training konkret gestaltet werden muss.

Bei den anderen beiden betrachteten Variablen, Wpeak und TT-Performance, konnte kein sicherer Effekt von Training über dem MMSS ermittelt werden. Man kann also zwar nachweisen, dass intensives Training über "der Schwelle" die Sauerstoffaufnahme verbessert, dies aber weder zwangsläufig zu einer höheren Abbruchleistung im Stufentest führt, noch zwingend die TT-Performance verbessert. Woran das liegt, ist nicht völlig klar, eine mögliche Erklärung für die fehlende Performance-Verbesserung bei TTs liegt möglicherweise darin, dass es bei TT nicht nur auf physische Fitness ankommt, sondern auch darauf, sich das TT richtig einzuteilen, um die maximale Leistung abrufen zu können. Gerade wenn Probanden TTs nicht gewohnt sind, liegt hier ein großes Fehlerpotenzial, denn ohne Erfahrung kann man ein TT zu hart oder zu leicht angehen und dann am Ende nicht die eigentlich physiologisch möglichen Watt abrufen können. Um TTs zur Ermittlung von Leistungsverbesserungen einsetzen zu können, ist es daher nötig, dass die Probanden die Möglichkeit bekommen, sich vor den initialen Tests mit TT vertraut zu machen und diese zu üben.

Eine andere mögliche Erklärung liegt nach den Erörterungen der Autoren darin, dass die Dauer der Trainingsinterventionen in den berücksichtigten Studien, die in der Regel nur Wochen bis wenige Monate betrug, nicht ausreicht, um den erzielten Zuwachs in der Sauerstoffaufnahme auch metabolisch so nutzen zu können, dass daraus eine höhere TT-Leistung oder Abbruchleistung resultiert. Hintergrund der Überlegungen ist, dass die mögliche Dauerleistung (etwa in einem TT) als dauerhaft realisierbarer Anteil der VO2max angesehen werden kann. Wie groß dieser Anteil ist, hängt maßgeblich von muskulären Faktoren ab. Wenn man vor einer Trainingsintervention 80% seiner VO2max als Dauerleistung realisieren kann und steigert durch eine entsprechende Trainingsintervention seine VO2max, ist nicht garantiert, dass man nach der Trainingsintervention weiterhin 80% der VO2max als Dauerleistung realisiert kann und damit die Dauerleistung quasi automatisch in gleichem (prozentualem) Umfang steigt, wie die VO2max. Vielmehr ist es nötig, durch geeignetes Training, die höhere Vo2max auch in eine höher Dauerleistung "umzusetzen".

Die Autoren sehen das als starkes Argument für langfristige Periodisierung von Training, also für eine langfristige Struktur, bei der sich Phasen mit unterschiedlichen Schwerpunkten im Training abwechseln. Die Diskussion der Autoren fügt sich hier an Periodisierungs-Überlegungen, die schon früher von Coggan und anderen, z.B. auf der Wattage-Liste, erörtert wurden. Nach diesen Ideen sollten sich Phasen mit VO2max-Fokus mit Phasen, die stärker auf die realisierbare Dauerleistung zielen, abwechseln, also z.B. Phasen, in denen vermehrt z.B. 5*5 min. L5 trainiert wird, mit solchen, in denen längere Intervalle (2*20 min. etc.) trainiert werden. Während die 5*5 min. darauf zielen, die VO2max, zu erhöhen, soll die längeren Intervalle den Stoffwechsel in der Muskulatur so konditionieren, dass ein möglichst hoher Anteil der VO2max als Dauerleistung abgerufen werden kann.

Tatsächlich verweisen die Autoren der hier vorgestellten Review auf eine andere Review, die zeige, dass für die Entwicklung der TT-Leistung die Zeit >MMSS wichtiger ist als die Intensität > MMSS. Ich habe diese Arbeit zwar noch nicht gelesen, aber scheinbar spricht dies dafür, dass man die TT-Leistung am besten über längere Intervalle knapp über der MMSS/Schwelle entwickelt.

Alles in allem eine sehr interessante Arbeit mit vielen Punkten, die zum Nachdenken anregen und der erneuten Bestätigung, dass statistische Aussagekraft viele trainingsmethodischer Interventionsstudien aufgrund der geringen Zahl von Probanden begrenzt ist. Das sollte man, wenn man einzelne Studien betrachtet, im Blick behalten. Das Problem zu geringer Probanden-Anzahl ist dabei nicht auf die in der Review berücksichtigen Studien beschränkt, sondern gilt wohl für praktisch fast alles, was in den letzten Jahrzehnten an experimentellen Studien zu Intervalltraining veröffentlicht wurde. Dabei ist das Problem je größer, je besser trainiert die Probanden vor Studienbeginn bereits sind. Je besser die Fitness der Probanden vor Studienbeginn, desto kleiner die zu erwartenden Effekte eines Trainingsprogramms, desto mehr Probanden werden benötigt, um statistisch gut abgesicherte Effekte nachweisen zu können.

In der Review diskutieren die Autoren auch Möglichkeiten, wie man dieses Problem mit den kleinen Probandenzahlen lösen kann und schlagen dafür u.a. den Rückgriff auf Online-Trainingsplattformen vor, über die man Teilenehmer in Studien integrieren könne (ohne sie für jede Trainingssessions ins Labor zu holen, um sie z.B. auf einem Ergometer ein vorgegebenes Intervallprogramm fahren zu lassen.)

Hier geht es zum lesenswerten Volltext:
https://www.researchgate.net/public...ematic_Review_Meta-analysis_and_Reality_Check
 
Die Autoren haben ...
Besten Dank für die sorgfältige Zusammenfassung!

Irgendwie ist es lustig zu erkennen, dass jede einzelne Studie unterpowert ist und erst nach bzw. durch eine solche Meta-Analyse vieler Studien ein Ergebnis mit statistischer Signifikanz bestätigt wird, welches man als Individuum per Leistungsmessung an sich selber wesentlich schneller herauskristallisieren kann: mittellange Intervallformate (3 x 8-10min oder 2 x 12-15 min) ergeben nun mal sehr effektive Fortschritte.

Flashback vor 10 Jahren mit Erkenntnissen, die ich an mir innerhalb meiner ersten 2 Trainingsjahre (also 2008-2009) herauspröbeln konnte:
https://www.rennrad-news.de/forum/threads/intervalltraining-aber-welches.124450/#post-3000729
Das bedeutet jetzt leider noch nicht, dass dieses Trainingsformat zwingend die beste Lösung für jedes Individuum sein müsse. Die Streubreite der Einzelstudien deutet ja sogar ziemlich zwingend darauf hin, dass Individuen sehr unterschiedlich auf bestimmte Formate reagieren. Dies bedeutet wiederum, dass man auch nach Lesen von zig Studien keine Garantie haben wird, dadurch die für sich selbst besten Trainingsformate erlernt zu haben. Vielmehr sollte man seinen eigenen Datensatz pflegen, um per Trenderkennung die individuell am effektivsten wirkenden Trainingsformate erkennen zu können.
 
Ich hatte die Studie auch überflogen, zumal das auch ne Fragestellung ist die mich schon länger beschäftigt und auf die ich keine Antwort habe.
Letztlich sind bezüglich der Schwelle ja nur wenige Studien übrig geblieben, die auch noch sehr heterogen waren. Ich würde da nicht so viel daraus ableiten.
welches man als Individuum per Leistungsmessung an sich selber wesentlich schneller herauskristallisieren kann: mittellange Intervallformate (3 x 8-10min oder 2 x 12-15 min) ergeben nun mal sehr effektive Fortschritte.
ist leicht OT:
Ich find es immer noch schwierig. Ich hab jetzt von mir fast 10 Jahr Leistungsdaten und wirklich eindeutig ist da wenig. Am ehesten noch das Umfang (sowohl quantitativ als auch qualitativ )dominant ist. Bis zu einem gewissen Punkt funktioniert für mich jedes Intervalltraining im Bereich >= schwelle.
Und dann kommt halt als Störvariablen sowohl das Traningsalter als auch das biologische Alter dazu.
Im Ergebnis hab ich zwar ein paar Eckfeiler von dem ich weiss was grundsätzlich für mich gut funktioniert, aber ich bin immer am Experimentieren.
 
Ich find es immer noch schwierig. Ich hab jetzt von mir fast 10 Jahr Leistungsdaten und wirklich eindeutig ist da wenig. Am ehesten noch das Umfang (sowohl quantitativ als auch qualitativ )dominant ist. Bis zu einem gewissen Punkt funktioniert für mich jedes Intervalltraining im Bereich >= schwelle.
Und dann kommt halt als Störvariablen sowohl das Traningsalter als auch das biologische Alter dazu.
Im Ergebnis hab ich zwar ein paar Eckfeiler von dem ich weiss was grundsätzlich für mich gut funktioniert, aber ich bin immer am Experimentieren.
Habe sehr ähnliche Erfahrungen. Ich habe dabei auch gelernt, dass bestimmte Konzepte, die in einer Saison funktioniert haben, in anderen Saisons nicht so gut funktionierten, ohne klar erkennen zu können, was dafür nun die Gründe waren.
 
Zuletzt bearbeitet:
Ich find es immer noch schwierig. ...

Habe sehr ähnliche Erfahrungen. Ich habe dabei auch gelernt, dass bestimmte Konzepte, die in einer Saison funktioniert haben, in anderen Saisons nicht so gut funktionierten, ohne klar erkennen zu können, was dafür nun die Gründe waren.
Hmm, wenn das so ist, dann helfen Studienergebnisse ja sogar noch weniger beim Findungsprozess für individuell optimale Trainingsformate. Da muss ich ja froh sein, dass mein Körper weniger erratisch reagiert, sondern auch über mehrere Jahre hinweg auf bestimmte Impulse recht zuverlässig reagiert.
 
Ich habe praktisch jede Trainingsmethode schon mal übertrieben mit immer dem selben Effekt. Soviel weiß ich zumindest besser, als diese Untersucher aus der 50-Jahre Langzeitstudie. Hilft aber auch nur begrenzt weiter und war auch nicht neu.
 
So erratisch ist das nur auch nicht. Ich hab druchaus ein Format das bei universell gut funktioniert und die Basis bildet. Das sind intermittierende Serien die im Leistungsmittel > CP liegen und nicht zu kurz sind.
Das basiert schon im wesentlichen auf der Arbeit von Véronique Billat und später dann Bent Rønnestad. Von daher sind die Studienergebnisse schon die Basis dessen was ich mache.
Eben z.b. das klassische 13x30/15. Aber da gibt es dann eben auch unendliche Variationen von. Ich kann nur einen Serie sehr hart fahren oder z.b. 3 Serien etwas defensiver. Womit auch experimentiere sind längere Serien bis zu 20 min.Oder ich fahre 10x40/20 oder auch 15-20-15/15. Ich kann die konstant, hard start oder progressiv fahren.
Das ergänzt mit Intervalle nahe Wettkampftempo (zb. 3x15 min)funktioniert zuverlässig. Aber im Detail weiss ich nicht ob ein Format besser ist als ein anderes.
Und Funfact. Nach vielen Jahren bin ich aus rein praktischen Erwägungen mal wieder 4x4/5 gefahren und das hat auch gut funktionert, war halt nur unangenehmer.
Ich hab das schon Ideen zu wie warum ich was mache, bzw periodische. Beim Zeitfahren ist der Outcome auch noch einigermaßen vorhersagbar.
Beim CX rennen hab ich hingegen schon positive,wie negative Überraschungen erlebt ohne das ich sagen könnte woran das lag. Es gibt da zwar naheliegende Vermutungen, aber wrklich plausibel ist auf Basis meiner Daten nichts.
 
Zuletzt bearbeitet:
Das wollte ich damit nicht sagen. Aber die vielen Ausreißer oder Non-Responder in den Studien sind in Anbetracht der geringen Stichprobenzahlen schon eher ein Indiz dafür, das die Stichproben wahllos zusammengestellt wurden. In Bezug auf die aktuellen Status der Probanden.
Wenn man z.B. die Studien in der Built- oder Peakphase testen würde, dann wären zumindest mal die Voraussetzungen der Probanden, dann käme man einem Erkenntnisgewinn eher näher.
Zudem ist auch die Frage, wann nachgetestet wird oft nicht gut überlegt, insbesondere bei den Blockstudien.
Wenn man die verschiedenen Trainingsmethoden in der Summe der Balstung besser beurteilen würde käme evtl. bei verschiedenen Methoden ein ähnlicher Effekt heraus.
Zudem ist die Erkenntnis, das man die intensiven HIT Methoden insbesondere im Blockdesgn, nur sehr kurz anwenden kann und dort dann nach einer Ruhephase von mehreren Wochen erst nachtestet schon publiziert. Mit solchen Überlegungen kann man aber kaum noch Metastudien anstreben. Denn der Zeitpunkt der Nachtestungen ist meistens gar nicht im Vorfeld überlegt worden.
Zur Vereinfachung würden die Studien schon mal viel aufwendiger vorebereitet werden (siehe Grafik) und dann erst nach ein Paar Wochen des Basetrainings begonnen. Dann die Nachtestungszeiten dokumentiert und evtl an zwei Nachtesttagen im Lauf von 2 Wochen nachgetestet, in denen dem Körper mal Zeit zur Anpassung gegeben wird.
Was ich auch denke ist, das man mit längeren Intervallen etwas längere Trainingsphasen auswerten könnte und bei den HIT Methoden schon nach kürzerer Zeit ein Deckeneffekt zu erwarten ist, der danach durchaus wieder in Abfall der Leistung resultieren kann. Was dann zur falschen Annahme führt, die Probanden reagierten nicht auf den Reiz.
Zu kritisch?
Was ich zumindest sagen möchte, das man in bestimmten frühen Trainingsphasen mit Tempo und SST sehr gut fährt und die intensiveren Methoden oder wettkampfspezische Belastungen mit Reizen oberhalb der Schwelle dann für kurze Zeit nachschalten kann.
Oder man gibt sich exessive Blöcke analog zu den kurzen Etappenrennen und steigert sich so an mehrtägige Belastungen in Wellen. Dabei würde nach jeder Blockbelastung eine etwas längere Pause mit erniedrigtem Traininngsstress die Zeit für die eigentliche Anpassung bieten. Es wird also nocht nur die Frage der Methode sondern auch die der zeitlichen Periodisierung miteinbeziehen sein, wenn man letztlich den Erfolg einer Methode in der Praxis bewerten möchte.
 

Anhänge

  • GoToWebinar 005.png
    GoToWebinar 005.png
    281,1 KB · Aufrufe: 69
Zuletzt bearbeitet:
Hmm, wenn das so ist, dann helfen Studienergebnisse ja sogar noch weniger beim Findungsprozess für individuell optimale Trainingsformate. Da muss ich ja froh sein, dass mein Körper weniger erratisch reagiert, sondern auch über mehrere Jahre hinweg auf bestimmte Impulse recht zuverlässig reagiert.
Nein, das sehe ich so nicht. Studienergebnisse eliminieren, wenn sie gut gemacht sind, die verschieden individuellen Störfaktoren, die dazu führen, dass eben bestimmte Trainingsinterventionen mal mehr mal weniger gut funktionieren. Damit könne sie etwas leisten, was man durch Selbstbeobachtung eben nicht leisten kann.
 
Ich halte das Experiment für unglücklich konstruiert. Wie erwähnt kann ich intermittierende Serien, aka short intervals, mit der gleichen Durchschnittsleistung fahren wie gleichmäßig gefahrene Intervallen. Da in den 15 Sek mit 50% nelastung die Sauerstoffaufnahme kaum absinkt. kann man das Rønnestad Experiment auch so lesen das 4x5 gehen 3x9:30 getestet wurden.
Was wir sehen könnte also schon ein
Ich würde im Experiment deshalb 13x30/15 gegen 3x9:30 konstant Isoeffort testen. Das würde den Effekt unterschiedlicher Belastungszeiträume nahe V02max eliminieren. Potenzielle unterschiedliche Outcomes, wären dann wirklich auf die Modulation des Poweroutputs zurückzuführen,.
 
@ronde2009
In der oben von mir zusammengefassten Review haben die Autoren berechnet, dass man für die Ermittlung statistischer signifikanter Effekte bei trainierten Sportlern 81 Probanden benötigt. Davon sind wir in der von DIr verlinkten Arbeit Welten entfernt.

Wenn ich mir die Schaubilder ansehe, sieht das für mich so aus, als seien die größten SI-Effekte bei Probanden zu verzeichnen, die sehr niedrige Peak-Power Werte im Pre-Test hatten. In der SI-Gruppe gibt es insgesamt offenbar nur drei Teilnehmer, die eine sehr deutliche Verbesserung Pre=>Post aufweisen , zwei davon haben offenbar sehr niedrige Pre-Test Werte und davon ausgehend große Steigerungen.
Bei drei weiteren Probanden tut sich nichts!

Die Schlussfolgerung in der Studie, dass kurze Intervalle größere Leistungsverbesserungen versprechen, basiert damit zum Gutteil auf der Beobachtung von Veränderungen bei sehr wenigen Probanden, die auch noch ein spezifisches Ausgangsniveau aufweisen.
Die Schlussfolgerung, dass SI gegenüber LI überlegen ist, finde ich daher erheblich zu weitgehend. Allenfalls scheint SI bei sehr niedrigen Ausgangsniveau deutliche Verbesserungen zu versprechen aber selbst diese Aussage steht bei der Probandenzahl unter Vorbehalt.

Die Studie ist dann doch ziemlich dürftig.
 
Ich bin bei kleinen Stichproben immer erstmal mit dem Gedanken gestartet homogene Gruppen miteinander zu vergleichen und dann kann man mit den konservativen Verfahren für Mittelwertsvergleiche schon Unterschiede statistisch finden wenn die Effekte stark genug sind. N_10 ist dabei eine Minimalanforderung.
Das schafft man, wenn man die Gruppen nach den Eingangstests auf einen sinnvollen Parameter, wie die Leistung bei 4 mmol/l, parallelisiert. Also 20 Probanden testen und dann nach der Leistung aufsteigen zu zwei Gruppen zulosen. Man kann dann aich eine Co-Variate mituntersuchen. Kann man machen.
Damit hat man dann zwei Gruppen in einem Blockdesign, die für einen Methodenvergleich auch bei geringer Stichprobengröße zumindest mal vergleichbar sind.
Wenn man sowas nicht macht und tatsächlich bis zu einer Größe von 80 hochgehen muss, dann sind die Veränderungseffekte wahrscheinlich aber auch nicht eindeutig genug.

Mal abgesehen davon muss ich das aber auch noch mal in Ruhe lesen, was DU da gepostet hast. Schon sehr interessant, weil man ja über Jahre weg, diese Fragen im Kopf hat und mit unterschiedlichen Methoden zu ähnlichen Ergebnissen kommt, je nach Saison.
 
Nein, das sehe ich so nicht. Studienergebnisse eliminieren, wenn sie gut gemacht sind, die verschieden individuellen Störfaktoren, die dazu führen, dass eben bestimmte Trainingsinterventionen mal mehr mal weniger gut funktionieren. Damit könne sie etwas leisten, was man durch Selbstbeobachtung eben nicht leisten kann.
So weit so selbstverständlich. Hohe Stichprobenanzahl oder zusammengefasste Studien erzeugen Signifikanz. Mathematischer ausgedrückt: mit einer Vervierfachung der Fallzahl erhält man bei gegebener Standardabweichung eine Halbierung des Standardfehlers des Mittelwertes - und der Signifikanztest ergibt eine Fehlerwahrscheinlichkeit von 5% oder weniger, mithin also eine statistische Signifikanz. Die Standardabweichung aller Einzeldaten bleibt indes unverändert, d.h. jede Einzelperson streut mit ihrer individuellen positiven oder weniger positiven bzw. gar negativen Reaktion unverändert um einen nunmehr etwas enger definierten Mittelwertbereich.

Die Frage, die ich stellte, bezog sich auf die Vorhersagekraft einer nunmehr als im statistischen Mittel als hinreichend gesichert anzusehenden Erkenntnis für ein Individuum. Genauer: wie hoch ist der prädiktive Wert für das Individuum, welches sich durch Anwendung einer bestimmten Methode auch für sich selber eine optimale Verbesserung erhofft? Wie bei der Evidenzgewinnung selber sind auch bei der Rücktransposition auf das Individuum geringe Effektstärken und hohe Streubreiten die Haupt-Killer. @ronde2009 nutzt hier schon mal den sinnvollen Ansatz, die Frage nach relevanten Confoundern zu stellen, diese zu identifizieren und deren Einfluss zu eliminieren bzw. mit einzupreisen. Wieder mathematischer ausgedrückt: welcher Anteil der Varianz ist durch welchen Störparameter erklärbar? Daran wird man sich voraussichtlich Jahrzehnte lang abmühen können und hat danach vermutlich immer noch keine Sicherheit, dass ein durch Studien belegtes Format auch bei einem Individuum die optimalen Ergebnisse erbringt.

Da irre ich mich in der Tat schneller und besser alleine für mich zur Erkenntnis. Gerne können andere solche Formate für sich übernehmen und an sich ausprobieren. Das mag mal klappen, oft genug aber auch nicht. Ist deswegen das von mir für mich als effektiv gefundene Format schlechter geworden? Wohl kaum.

Wenn dann ein (egal ob aus Literatur entsprungen oder selbst entwickeltes) Format mal wirkt und in einem anderne Jahr mal wieder nicht, dann muss man zur Confoundersuche nicht weit umherschweifen, denn der Confounder muss ja bei der Person selbst und ihrem Trainingsstand, den Begleitbedingungen, ... begründet sein.
 
Wenn dann ein (egal ob aus Literatur entsprungen oder selbst entwickeltes) Format mal wirkt und in einem anderne Jahr mal wieder nicht, dann muss man zur Confoundersuche nicht weit umherschweifen, denn der Confounder muss ja bei der Person selbst und ihrem Trainingsstand, den Begleitbedingungen, ... begründet sein.
Schon klar, aber mehr für mehr als ne Hypothese-Ex Post reicht das nicht, weil man das nicht rausrechnen kann. Ich laufe z.b. mal mehr und mal weniger, mal wettkampfmässig mal nicht. Krafttraining betreibe ich mal ambitionierter, mal weniger. Beruf lässt mir mal mehr Zeit, mal weniger. Die Stressbeladung variiert. Private Situation ändert sich. Anders als früher, fährt z.b. meine Frau auch 2-3 mal die Woche Rad und ich muss/will mein Training um unsere gemeinsamen Touren rumplanen.
Und das ich älter werde weiss ich natürlich, aber nicht wie weit das mein Potenziel reduziert. Wenn ich mit 60 7% schwächer bin als mit 50, ist das eine relative Verbesserung oder Verschlechterung ?
Und noch einges mehr.
Ausserdem ist das ja auch nicht schwarz/weiß. Bei mir funktionen viele Formate, ich würde sogar meinen die meisten.
Daran wird man sich voraussichtlich Jahrzehnte lang abmühen können und hat danach vermutlich immer noch keine Sicherheit, dass ein durch Studien belegtes Format auch bei einem Individuum die optimalen Ergebnisse erbringt.
Man weiss aber auch nie ob die individuell erziehleten Ergebnisse optimal waren. Maxmimal das irgendein Gesamtkontzept effektiver war, als ein Anderes es in der Vergangenheit gewesen ist. . Die Wirkug eines einzelenen Formates ist schwer, bis unmöglich zu isolieren, weil die Gesamtumsände nie indentisch sind und es ja immer nur um wengie Prozent Unterschied geht, jedenfalls bei mir. Und sein eigenes Kontollsebst hat man schlicht nicht
Von daher gibt der gesamte Studienlage schon sowas vor wie Leitplanken an denen sich das Expermentieren lohnen könnte.
 
Schon klar, aber mehr für mehr als ne Hypothese-Ex Post reicht das nicht, weil man das nicht rausrechnen kann. Ich laufe z.b. mal mehr und mal weniger, mal wettkampfmässig mal nicht. Krafttraining betreibe ich mal ambitionierter, mal weniger. Beruf lässt mir mal mehr Zeit, mal weniger. Die Stressbeladung variiert. Private Situation ändert sich. Anders als früher, fährt z.b. meine Frau auch 2-3 mal die Woche Rad und ich muss/will mein Training um unsere gemeinsamen Touren rumplanen.
Und das ich älter werde weiss ich natürlich, aber nicht wie weit das mein Potenziel reduziert. Wenn ich mit 60 7% schwächer bin als mit 50, ist das eine relative Verbesserung oder Verschlechterung ?
Und noch einges mehr.
Ausserdem ist das ja auch nicht schwarz/weiß. Bei mir funktionen viele Formate, ich würde sogar meinen die meisten.
Da sind sie ja schon, die individuellen Confounder. Ist also eine Bestätigung dessen, was ich schrieb.
Man weiss aber auch nie ob die individuell erziehleten Ergebnisse optimal waren. Maxmimal das irgendein Gesamtkontzept effektiver war, als ein Anderes es in der Vergangenheit gewesen ist. . Die Wirkug eines einzelenen Formates ist schwer, bis unmöglich zu isolieren, weil die Gesamtumsände nie indentisch sind und es ja immer nur um wengie Prozent Unterschied geht, jedenfalls bei mir. Und sein eigenes Kontollsebst hat man schlicht nicht
Von daher gibt der gesamte Studienlage schon sowas vor wie Leitplanken an denen sich das Expermentieren lohnen könnte.
Klar wird man sich das alles nicht in einer einzigen Saison aneignen können. Wenn man mal die relevantesten Formate ausgepröbelt und deren Wirkung nach 2-4 Wiederholungen mit Powermeter und analytischem Verstand ausgelotet hat, wird man ein klares Bild entwickeln können, mit welchem Format bei Ausgangszustand x die raschesten und relevantesten Positiventwicklungen erzielbar sind. Dass sich diese Optimalformate entlang der Saison-Periodisierung ändern, dürfte sich auch von selbst verstehen, haut mithin in die Kerbe, die schon @ronde2009 in seinem Beitrag #91 ansprach. Das dort angehängte Schaubild illustriert das ebenfalls gut.

Ob man damit dann nicht nur ein relatives, sondern auch ein absolutes individuelles Optimum erzielt, kann natürlich nicht garantiert werden. Das können Studienergebnisse aber noch viel weniger. Um nicht ausschließlich Geräte- und Zahlen-fixiert zu bleiben, empfehlen sich gelegentliche unabhängige Validitäts-Checks wie z.B. Steigleistungsbestimmungen und natürlich auch der Abgleich mit den Peers bzw. man blickt auf Ergebnisse bei Wettkampf-Teilnahmen in der Anbahnung des Saisonpeaks bzw. bei den Topp-Events selber.
 
Die traditionelle Statistik hat eigentlich keine Methoden um überhaupt etwas über individuelle Behandlungseffekte zu sagen.

Noch weniger klar ist, wie man in n=1 Experimenten alleine anhand von Daten Confounder ausschließen und Kausalität folgern könnte. Das geht in kausalen Graphen, aber da braucht man halt den Graphen und der ist nicht vollständig durch die Daten festgelegt.
 
Zurück