Montage aus Bildern von Pixabay von Niki Vogt

Über­sterb­lichkeit und COVID-19-“Impfung” – Eine kurze Ein­führung in die Aggregatdatenanalyse

Seit wir zwei Bei­träge ver­öf­fent­licht haben, in denen wir auf Basis von Aggre­gat­daten des Sta­tis­ti­schen Bun­desamts, die ALLE Sterb­fälle nach Kalen­der­wochen und Alter unter­schieden abbilden sollen, ver­öf­fent­licht haben, erreichen uns Fragen von Lesern etwa die Frage, wo die vielen “plötzlich und uner­wartet Ver­stor­benen” sind, was es damit auf sich hat, dass in der fol­genden Abbildung für 70–79jährige keine Über­sterb­lichkeit aus­ge­wiesen ist, und so weiter.

 

Wir nehmen diese Fragen zum Anlass, um eine kurze Ein­führung in die Aggre­gat­da­ten­analyse [es wird nicht mathe­ma­tisch] zu geben, die die meisten dahin­ge­henden Fragen beant­worten sollte.

Beginnen wir mit der Frage, was eigentlich Aggre­gat­daten sind und was sie von Indi­vi­du­al­daten unterscheidet.

Als Aggre­gat­daten gelten Daten, die auf einer bestimmten Ebene der Erfassung oberhalb der Indi­vi­du­al­ebene zusam­men­ge­stellt werden. In unserem Fall sind das alle Ster­be­fälle in einer bestimmten Kalen­der­woche für Deutschland. Auf­grund der Erfas­sungs­ebene ist es NICHT möglich, Aggre­gat­daten direkt zu indi­vi­du­ellen Merk­malen zuzu­ordnen. Sind z.B. in der Kalen­der­woche 14 genau 100 Per­sonen ver­storben, dann ist das die einzige Infor­mation, die man Aggre­gat­daten abge­winnen kann: In der Kalen­der­woche 14 sind 100 Per­sonen ver­storben. Im Gegensatz dazu werden Indi­vi­du­al­daten Indi­vi­du­al­daten genannt, weil sie indi­vi­duell erhoben wurden. Wurde z.B. für Hubert K. die Todes­ur­sache mit “Herz­in­farkt” ange­geben, dann ist dieses Datum in einem Indi­vi­du­al­da­tensatz Hubert K. zuor­denbar. In einem Aggre­gat­da­tensatz ist es das nicht. Denn in einen Aggreat­da­tensatz gehen nur die Gesamt­zahlen ein. Sagen wir 60 der 100 Toten aus Kalen­der­woche 14 sind an Herz­er­kran­kungen ver­storben, dann ist Hubert K. einer davon.

Diese Beschränkung, der Aggre­gat­daten unter­liegen, hat dazu geführt, dass sie in den Sozi­al­wis­sen­schaften nicht wirklich populär sind, denn – früher zumindest – bestanden die meisten Erklä­rungen aus mehr als einer Variable, und ein Aggre­gat­da­tensatz lässt es nicht zu, direkte Zuord­nungen zu machen. Er lässt es nur zu, sys­te­ma­tische Ver­än­de­rungen z.B. bei Herz­er­kran­kungen über einen bestimmten Zeitraum und bei Per­sonen im Alter von 20 bis 29 Jahre in einen Zusam­menhang zu bringen. Steigt sowohl die Gesamtzahl der Herz­er­kran­kungen als auch die Gesamtzahl der 20 bis 29jährigen, die im selben Zeitraum an Herz­er­kran­kungen ver­sterben, dann kann man daraus den Schluss ziehen, dass die beob­achtete Stei­gerung der Tode durch Herz­er­krankung u.a. von 20 bis 29jährigen ver­ur­sacht wird [und natürlich kann man das auch direkt in den Daten sehen, aber das ist nur dem geübten Auge möglich, denn ein Aggre­gat­da­tensatz hat das fol­gende, für amt­liche Ver­öf­fent­li­chungen typische Aussehen:

Das  ist ein kleiner Teil des Daten­satzes, den wir ana­ly­siert haben.

Die beschrie­benen Unter­schiede zwi­schen Aggregat- und Indi­vi­du­al­daten machen auch Aus­sagen darüber, welche Variablen mit einer beob­ach­teten Ent­wicklung, etwa einer Stei­gerung der Sterb­lichkeit, zusam­men­hängen, schwierig, denn, wenn das inter­es­sie­rende Merkmal nicht explizit mit­er­fasst wurde, wie in der Tabelle oben das Alter, dann ist es nur mit aus­ge­feilten sta­tis­ti­schen Methoden, z.B. mit Hilfe einer öko­lo­gi­schen Regression, wie sie Jürgen Falter sehr erfolg­reich ange­wendet hat, um Muster im Wahl­ver­halten unter­schied­licher gesell­schaft­licher Gruppen in der Wei­marer Republik zu finden, möglich, Zusam­men­hänge her­zu­stellen. Und selbst dann ergeben sich erheb­liche Pro­bleme, vor allen das Problem, dass man auf Daten zurück­greifen muss, die das selbe Niveau der Aggre­gation auf­weisen und auf Daten, die auf diesem Niveau auch gesammelt wurden oder werden.

Und selbst wenn, wie im vor­lie­genden Fall, Alters­gruppen mit­er­hoben und aus­ge­wiesen werden, ist eine indi­vi­duelle Zuordnung nicht möglich. Aus­sagen können immer nur auf Ebene der Gruppen gemacht werden, etwa: Die Sterb­lichkeit der 20 bis 29jährigen ist über die Kalen­der­wochen der Jahre 2021 und 2022 suk­zessive ange­stiegen. Wenn auch die Impf­quote der 20 bis 29 jäh­rigen in diesem Zeitraum gestiegen ist und man eine Kor­re­lation zwi­schen beiden her­stellen kann, so ist dies dennoch nicht mehr als ein Anhalts­punkt, denn sowohl die Gruppe der Ver­stor­benen als auch die Gruppe der Geimpften wird per Gesamtzahl erfasst, so dass eine indi­vi­duelle Zuordnung nicht möglich ist. Theo­re­tisch kann es sein, dass alle Ver­stor­benen unge­impft waren oder nur Geimpfte ver­storben sind. Auf Basis von Aggre­gat­daten ist es aber nicht mögilch, der­artige Zusam­men­hänge ein­deutig fest­zu­stellen, dazu wäre es not­wendig, den Impf­status eines bestimmten Ver­stor­benen zu kennen, was in Aggre­gat­daten grund­sätzlich aus­ge­schlossen ist. Dazu benötigt man Individualdaten.

Das bringt uns zur Frage, was man aus unseren Ana­lysen ablesen kann.

Zunächst ein kleiner Ausflug in die Übersterblichkeit.
Über­sterb­lichkeit ist ein sta­tis­ti­sches Maß. Es gibt keine Über­sterb­lichkeit, es gibt nur eine Berechnung von Über­sterb­lichkeit. Maße wie Über­sterb­lichkeit dienen dazu, Ent­wick­lungen erkennen zu können, und zwar als Abwei­chung von einer bekannten Ent­wicklung, die man insofern sta­bi­li­siert, als die jähr­lichen Schwan­kungen, die sich bei allen Daten ergeben, dadurch aus­ge­glichen werden, dass man fünf Jahre auf­sum­miert und einen Mit­telwert für die fünf Jahre berechnet, der dann den Jahren, für die man wissen will, ob sie sich von frü­heren Jahren unter­scheiden, gegen­über­ge­stellt wird. In unserem Fall ist die Sterb­lichkeit nach Alters­gruppen, erfasst auf der Ebene von Kalen­der­wochen für die Jahre 2021 und 2022, die wir dem jewei­ligen Mit­telwert, eben­falls auf Ebene der Kalen­der­wochen berechnet, für die Jahre 2016 bis 2020 gegenüberstellen.

Über­sterb­lichkeit ist defi­niert als jeder Wert, der über dem Mit­telwert der Sterb­lichkeit der fünf Vor­jahre liegt.

Das ist ein sehr krudes Maß, das seine Berech­tigung nur darin findet, dass dann, wenn man eine ERHEB­LICHE Über­sterb­lichkeit fest­stellt, tat­sächlich etwas im Argen liegen muss, denn eine ERHEB­LICHE Über­sterb­lichkeit fest­zu­stellen, das ist in der Regel nur dann möglich, wenn wirlich etwas im Argen liegt. Deshalb sind unsere Ergeb­nisse Spreng­stoff. Aber dazu gleich.

Zunächst zur Frage, was eine erheb­liche Über­sterb­lichkeit ist.

Eine Über­sterb­lichkeit ist ganz all­gemein defi­niert als die Abwei­chung einer Ver­teilung von einer durch­schnitt­lichen Ver­teilung, Abwei­chung nach oben.

Um her­aus­zu­finden, ob diese Ver­teilung erheblich abweicht, wenden wir einen ein­fachen Trick an. Wir pro­zen­tu­ieren z.B. die Ster­be­häu­figkeit für eine Kalen­der­woche des Jahres 2021 auf den ent­spre­chenden Durch­schnittswert der ent­spre­chenden Kalen­der­woche für die Jahre 2016 bis 2020. Die Idee dahinter ist einfach: Sta­tis­tische Ver­tei­lungen haben einen Feh­ler­be­reich, der min­destens bei 2% liegt, wir schieben ihn gemeinhin auf 5%, weil Aggre­gat­daten für alle mög­lichen Ein­flüsse anfällig sind. D.h. Wir inter­pre­tieren aus­schließlich Werte, die 5% unter oder über Parität, in diesem Fall 100% liegen. Aus der fol­genden Abbildung haben wir z.B. nur die Werte für 80+jährige bzw. 60–69jährige inter­pre­tiert. Sie liegen 13% bzw. 20% [2022] über dem Erwar­tungswert, also erheblich über dem Erwar­tungswert. Damit sind die Fragen zu den 70–79jährigen beant­wortet: Der Wert für 70–79jährige liegt bei 98%, somit innerhalb des sta­tis­ti­schen Fehlers. Aus­sagen nicht möglich.

 

Andere Leser haben bei jün­geren die­je­nigen ver­misst, die “plötzlich und uner­wartet” ver­storben sind, fürchten gar Daten­fäl­schung beim Sta­tis­ti­schen Bun­desamt, weil die ent­spre­chenden Todes­fälle sich nicht in einer Über­sterb­lichkeit nie­der­schlagen. Nun, wie wir oben bereits geschrieben haben, wenn ein Ein­zel­er­eignis wie das plötz­liche Ver­sterben als Über­sterb­lichkeit sichtbar wird, dann müssen sich die Todes­fälle in großer Zahl mehr oder minder täglich und kon­stant über eine Kalen­der­woche, einen Monat, ein Jahr ereignen.

Und jen­seits davon ist Aggre­gat­daten wie Ster­be­zahlen eine Trägheit eigen, die in vielen Fällen ver­hindert, dass “bestimmte” Über­sterb­lich­keiten als Gesamt-Über­sterb­lichkeit sichtbar werden.

Gehen wir der Ein­fachheit halber von zwei Mög­lich­keiten, zu sterben aus: Ent­weder an einer Herz­er­krankung oder an einem Unfall bzw. per Suizid.

Die fol­gende Tabelle gibt die Mög­lich­keiten an, wie sich Ver­än­de­rungen in beiden Todes­arten auf die Über­sterb­lichkeit auswirken.

 

Die erste Spalte gibt die Anzahl der an Herz­er­kran­kungen ver­stor­benen, die zweite Spalte die Anzahl der­je­nigen, die durch Unfall oder Suizid aus dem Leben geschieden sind, an, die dritte Spalte enthält die Gesamt­sterb­lichkeit für das jeweilige Jahr, die vierte die durch­schnitt­liche Sterb­lichkeit der fünf Vor­jahre, die wir aus Gründen der EIn­fachheit, kon­stant halten, was keinen Ein­fluss auf die Logik hat. Die fünfte Splate qua­li­fi­ziert, ob Über­sterb­lichkeit vor­liegt oder nicht. Die sechste Spalte gibt die durch­schnitt­liche Sterb­lichkeit für Herz­er­kran­kungen der letzten fünf Vor­jahre an.

Sie haben die Hypo­these, dass eine Über­sterb­lichkeit bei Herz­er­kran­kungen vorliegt.

Im ersten Jahr / der ersten Zeile beträgt die Sterb­lichkeit an Herz­er­kran­kungen 60, es liegt also keine Über­sterb­lichkeit vor. Die Gesamt­sterb­lichkeit liegt wie durch­schnitt­liche Sterb­lichkeit der fünf Vor­jahre bei 100. Im nächsten Jahr steigt die Sterb­lichkeit für Herz­er­kran­kungen auf 70. Das ist für Herz­er­kran­kungen eine Über­sterb­lichkeit, die aber nicht als Über­sterb­lichkeit in Erscheinung tritt, weil die Sterb­lichkeit durch Unfall und Suizid gesunken ist, so dass die Gesamt­sterb­lichkeit sich nicht von der durch­schnitt­lichen Sterb­lichkeit der letzten fünf Jahre unter­scheidet. Im dritten Jahr ist die Sterb­lichkeit an Herz­er­kran­kungen mit 70 abermals erhöhte und dieses Mal beträgt auch die Gesamt­sterb­lichkeit 110, es liegt also eine Über­sterb­lichkeit vor, weil die Todes­fälle durch Unfall / Suizid auf ihr Niveau des Aus­gangs­jahres zurück­ge­kehrt sind. Schließlich haben wir im vierten Jahr eine Über­sterb­lichkeit bei der Gesamt­sterb­lichkeit, obschon bei Herz­er­kran­kungen als Todes­ur­sache keine Über­sterb­lichkeit vor­liegt. Dieses Mal, weil die Anzahl der Todes­fälle durch Unfall oder Suizid gestiegen ist.

Kurz: Die Über­sterb­lichkeit lässt schon bei zwei Variablen keine Rück­schlüsse darauf zu, ob in bestimmten Gruppen, die zu einem Datum ver­manscht werden, eine Über­sterb­lichkeit vor­liegt oder nicht. Jetzt stellen Sie sich vor, sie haben nicht zwei Variablen, wie wir im Bei­spiel, sondern Dut­zende, Dut­zende Variablen, die sich alle gegen­sätzlich ent­wi­ckeln können. Wie wahr­scheinlich ist es über­haupt, eine erheb­liche “Über­sterb­lichkeit” zu finden. Es ist sehr unwahrscheinlich.

Deshalb sind unsere Ergeb­nisse Spreng­stoff, denn sie zeigen ein­deutig, dass die der­zeitige Über­sterb­lichkeit von alten Men­schen, die in uner­wartet großer Zahl sterben, ver­ur­sacht wird. Die Frage, was diese Über­sterb­lichkeit bei alten Men­schen ver­ur­sacht, ist eine offene Frage. Die Variablen, die sich als Erklärung anbieten, sind indes begrenzt, denn sie müssen das Merkmal auf­weisen, eine große Anzahl von alten Men­schen in gleicher Weise zu betreffen. Es gibt nicht viele solcher Variablen:

  • Lock­downs, die bei alten Men­schen zu Ver­ein­samung geführt oder auf andere Weise den Lebens­willen zer­stört haben;
  • Ver­nach­läs­sigung, weil die COVID-19 Manie dazu geführt hat, dass vor­handene Leiden weniger intensiv behandelt werden als vor der Manie;
  • Ver­meidung von Arzt­be­suchen durch alte Men­schen aus Angst, sich mit SARS-CoV‑2 zu infizieren;
  • COVID-19 Impfung / Gentherapie

Welche der genannten Variablen einen Ein­fluss auf die Sterb­lichkeit alter Men­schen hat oder auf Über­sterb­lichkeit all­gemein hat, muss geprüft werden. Um es zu prüfen benötigt man nicht unbe­dingt Indi­vi­du­al­daten, es reichen dif­fe­ren­zierte Aggre­gat­daten, z.B. für jede Kalen­der­woche der Jahre 2021 und 2022 die Anzahl der­je­nigen, die sich haben mit COVID-19 Spritz­brühen trak­tieren lassen, und zwar auf­ge­schlüsselt nach genau den Alters­gruppen, die das Sta­tis­tische Bun­desamt verwendet.

Wenn Sie genau diese Daten haben oder besorgen können, dann bitte an die unten ange­ge­benen eMail-Adresse schicken.

Unsere beiden bis­he­rigen Ana­lysen zur Über­sterb­lichkeit auf Basis der Daten des Sta­tis­ti­schen Bun­desamts finden Sie hier: