Was im Schlaf passiert, ist Gegenstand der Forschung in vielen Disziplinen – so genau kennt man sich nämlich noch gar nicht damit aus. Landläufig bekannt ist, dass man mehrere Stadien dabei durchläuft. Die Wissenschaft unterscheidet grob zwischen zwei Formen: dem REM-Schlaf (auch Traumschlaf genannt), in dem sich die Augen sehr stark bewegen, und dem orthodoxen Schlaf (Non-REM-Schlaf). Forscher gliedern Non-REM noch einmal auf und benutzen dazu seit 2007 eine Einteilung der American Academy of Sleep Medicine in drei Bereiche: Einschlafen, stabiler Schlaf und Tiefschlaf. Die Schlafphasen wiederholen sich je nach Person in unterschiedlich langen Zyklen.

Die Frage ist: Kann man diese Einteilung messtechnisch voneinander abgrenzen und kann man sie mit Fitnesstrackern, Smartwatches und Sportuhren beziehungsweise mit ganz anderen Sensoren nachvollziehen? Immerhin zeigen die allermeisten Apps von Wearables eine Auswertung des Schlafs mit verschiedenen Phasen.

Messgrößen für die Nachtruhe

Das Verfahren, mit dem man in Schlaflaboren die Phasen voneinander abgrenzt, nennt man Polysomnografie. Sie erfasst diverse Parameter. Klassisch gehören dazu ein Hirnstrombild (EEG), eine Aufzeichnung des Herzrhythmus (EKG) sowie des Sauerstoffgehaltes im Blut und Einzelheiten über die Atmung, die Muskelspannung, Bein- und Augenbewegungen und natürlich über die Körperlage. Außerdem kann man Probanden auch per Video- und Audioaufzeichnung beobachten.

Allein die EEG-Messung erfordert ein umfangreiches Verkabeln der Person, deren Schlaf untersucht werden soll – von der Atemmaske ganz zu schweigen. Das macht kaum jemand freiwillig mit, der nur vage das Gefühl hat, morgens unausgeschlafener zu sein als er sein sollte. Durch den Vergleich der Hirnstrombilder lassen sich die oben angesprochenen Schlafphasen der American Academy of Sleep Medicine voneinander unterscheiden.

Eine Nummer kleiner als die Polysomnografie ist das Verfahren der Aktigrafie. Hierbei tragen die Probanden mehrere Tage lang ein Armband, das die Bewegungen erfasst. Teils notiert das Klinikpersonal oder das Versuchskaninchen auch Umgebungsparameter wie die Helligkeit im Schlafraum oder Lärm und Temperatur. Mit diesen Mitteln lassen sich einigermaßen zuverlässig die Schlafdauer und den Schlaf-Wach-Rhythmus nachweisen. Damit ist schon vielen geholfen, Schlafstadien erkennt man mit einer Aktigrafie nicht.

Schäfchen zählen, mit halb verbundenen Augen

Verlockenderweise gibt es aber auch Uhren, Fitnessbänder und Matten für die Matratze, die ganz ohne peinigenden Drahtverhau Schlafdaten sammeln. Bei denen soll man auch keinen Arzt benötigen, der die Daten auswertet und sie erklärt. Die Analysen der Wearable-Apps wirken – zumindest auf den ersten Blick – auch wissenschaftlich fundiert. Immerhin dokumentieren sie den Wechsel der Schlafzyklen minutiös. Man sieht fein säuberlich aufgeschlüsselt, wie lange man fürs Einschlafen Schäfchen gezählt hat, wie lange und wann man im REM-Schlaf geträumt hat und wann man sich in den anderen erwähnten Schlafphasen befunden hat.

Die "Garmin Connect"-App zeigt wie viele andere Fitnesstracker eine Schlafauswertung, die außer den Schlafenszeiten einzelne Schlafphasen angibt.

Als Nutzer erfährt man jedoch nicht, wie es die Hersteller anstellen, ganz ohne EEG- und all die anderen im Schlaflabor erfassten Parameter so schicke Auswertungen zu präsentieren. Fitnesstracker und andere Wearables fassen ihre Daten über Smartphone-Apps vielmehr in einem Black-Box-Prozess zusammen.

Das ist nicht unbedingt ein Vorwurf, denn auch ein Arzt wird den Theta-Wellenverlauf im EEG einem Patienten nicht im Detail erklären. Doch eines ist klar: So gut wie jedes Wearable hat nur einen Ausschnitt der Datenlieferanten zur Verfügung, den die Labordiagnose auffährt. Viele erfassen heute dauerhaft den Puls, einige zusätzlich die Bewegungen des Körpers. Manche Schlaftracker errechnen daraus auch das Heben und Senken der Brust beim Atmen. Wearables, welche die Sauerstoffsättigung (SpO 2 ) messen können, beziehen auch diesen Wert in ihre Auswertung ein. Bei zu geringer Sättigung kann eine Apnoe die Ursache sein und eine solche beeinträchtigt den Schlaf erheblich.

Einige Hersteller sind so weit in die Offensive gegangen, sich die Tauglichkeit ihrer Helferlein für den klinischen Einsatz bescheinigen zu lassen. So hat die Withings-Schlafmatte eine Zertifizierung erhalten. Laut Hersteller wurden dazu die von der Matte ermittelten Daten mit denen aus Polysomnografie-Messungen verglichen. Das Ergebnis ist so gut ausgefallen, dass Withings damit wirbt und für den Lorbeer der Zertifizierung einen höheren Preis für seine Matte verlangen konnte. Auf den Trichter, die Daten von Schlaftrackern aller Art mit denen aus der Polysomnografie zu vergleichen, sind auch andere Forscher gekommen. Davon ist im Folgenden die Rede.

Gut, dass wir verglichen haben

Ein ungutes Gefühl in der Magengegend haben Wissenschaftler in vergleichenden Studien stets, wenn ein Hersteller Polysomnografie-Daten einfach nach Schema F in ein Punktesystem überführt. Das tun aber alle Wearable-Hersteller. Dagegen beurteilen selbst erfahrene Schlafmediziner die Ergebnisse einer Polysomnografie bisweilen unterschiedlich. Die Polysomnografie wird zwar immer als "Goldstandard" bezeichnet, doch Forscher würden eher davon reden, dass es momentan eben noch nichts Besseres gibt, obwohl man es gern hätte. Oder auch: Unter den Blinden ist der Einäugige König.

Es gibt noch einen weiteren Unterschied zwischen den Messungen im Schlaflabor und denen mit Wearables. Abgesehen davon, dass man voll verkabelt und womöglich aufgeregt im Schlaflabor nicht so schläft wie daheim, trägt man sein Wearable üblicherweise wochen-, wenn nicht monatelang und kann sich jeden Tag morgens noch beim Zähneputzen seine Schlafauswertung in der korrespondierenden App abholen. Damit müssten die Wearables eigentlich eine sehr gute Datenbasis haben.

Tatsächlich werfen viele Apps den Benutzern nicht nur die ausgewerteten Daten vor die Füße, sondern schlauen sie auch auf, wie sie künftig besser schlafen können. Wissenschaftler schätzen den Nutzen dieser Tipps aber als eher gering ein, denn kaum jemand hat vollständige Kontrolle über seine Schlafbedingungen. Empfehlungen wie "Sorgen Sie für eine ruhige Schlafumgebung" helfen wenig, wenn man in der Einflugschneise des Flughafens wohnt.

Tracker besser als Profi-Messtechnik?

Eine herstellerunabhängige Studie von Evan D. Chinoy et al. aus dem Jahr 2020 hat einige Wearables und andere Schlafanalysegeräte für Endkunden untersucht. Sie haben die Ergebnisse solcher Geräte mit denen verglichen, die Mediziner parallel dazu aus Polysomnografie-Messungen und einer Aktigrafie-Uhr abgeleitet haben.

Mitgemacht haben 34 gesunde Probanden, im Schnitt 28 Jahre alt. Sie durchliefen vor der Studie ein mehrtägiges striktes Programm, das beispielsweise Koffein, Alkohol und das Nickerchen zwischendurch verbot und regelmäßige Schlafzeiten von genau acht Stunden verlangte. Dabei konnten sie sich schon an das Tragen und Benutzen der Tracker gewöhnen. Anschließend übernachteten sie an drei Tagen im Labor und nutzten die Testgeräte wechselweise, während sie stets durch Polysomnografie und Aktigrafie überwacht wurden. Während einer Nacht wurde ihr Schlaf absichtlich unterbrochen, um zu testen, wie die Geräte damit klarkommen.

Zusammengefasst: Einige Tracker wie das Fitbit Alta HR und das Fatigue Science Readyband stellten genauso gut den Unterschied zwischen Schlafen und Wachen fest wie Profi-Messtechnik, teils sogar besser. Das galt auch für den Matratzensensor EarlySenseLive. Auch ein Gerät für den Nachttisch, das ResMed S+, schnitt gut ab. Es erfasst die Atmung und kommt allein damit aus. Ähnlich kontaktlos und ebenso gut erledigte das ein Gerät ebenfalls für den Nachttisch: Das SleepScoreMax wertet mithilfe von Radartechnik die Bewegungen und die Atmung im Schlaf aus. Einige Geräte schnitten beim Erkennen des Unterschiedes zwischen Schlafen und Wachen schlechter ab, etwa die Garmin-Wearables Vivosmart 3 und die Fenix 5S. Aber wie immer lohnt ein zweiter Blick auf die Ergebnisse.

Feine Details

Einige Daten gingen beim Synchronisieren verloren. Gleichwohl reichte das, was blieb, für einen Vergleich. Von den Wearables schätzten die Garmin-Geräte die Schlafdauer und die Schlafeffizienz durchgängig höher ein, als die Polysomnografie-Auswertung nahelegte. Fitbit wiederum zeigte eine längere Dauer bis zum Einschlafen als die Vergleichsmessung. Beim Wiedereinschlafen nach einer Störung ergab sich das gleiche Bild. Dennoch zeigten die Daten, dass Schlaftracker die Schlaf- von Wachzeiten insgesamt ganz gut unterscheiden können.

Schlafanalyse vom Nachttisch aus: Das SleepscoreMax nutzt Radartechnik und zeichnet Umgebungsbedingungen auf. (Bild: Sleepscore)

Beim Deuten der Schlafstadien, also der Königsdisziplin, sah das anders aus. Einige Wearables boten außer dem REM-Schlaf nur noch "Leichtschlaf" und "Tiefschlaf". Für den Vergleich mit der Polysomnografie fassten die Autoren daher die Phasen Einschlafen (N1) und stabiler Schlaf (N2) zum Leichtschlaf zusammen, sodass der Rest als Tiefschlaf (N3) verblieb. Alle Wearables wiesen die Leichtschlafphasen länger aus als die Polysomnografie.

Fitbit überschätzte die Länge des REM-Schlafs, wohingegen alle anderen Geräte zu kurze Zeiträume dafür ermittelten. Generell war die Streuung der Vergleichspaare "Gerät vs. Polysomnografie" in den Bland-Altman-Plot-Grafiken sehr groß. Weiter fanden die Forscher heraus, dass kein einziger der getesteten Schlaftracker den ersten REM-Zyklus nach dem ersten Zyklus aus Leicht- und Tiefschlaf erfasste.

Fazit

Wearables scheinen zumindest die Schlafdauer recht gut zu erfassen. Sie erkennen prima, wann man einschläft, wogegen sie nicht so gut mitbekommen, wenn man nachts aufwacht oder nach einer Störung wieder einschlummert. Beim Erforschen der Schlafphasen muss sich sicher noch so mancher Wearable-Entwickler die Nächte um die Ohren schlagen. Und wenn Sie es bis hierhin geschafft haben, bei einem Artikel übers Schlafen nicht einzuschlafen, haben Sie sich das Umblättern redlich verdient.

Große Streuungen der Messwerte im Vergleich zu polysomnigrafischen Messungen zeigen: Schlaftracker-Hersteller haben noch viel zu tun. (Bild: Quelle: Evan D. Chinoy et al.)

(mil)