Gestern wurde die von SORA im Auftrag des BMBWF abgewickelte Stichprobenanalyse zur Prävalenz von COVID-19 in der gesamten österreichischen Bevölkerung präsentiert.
Dabei wurde ein gewichtetes Stichprobenverfahren verwendet, und die Hauptergebnisse lauteten:
-
Der plausibelste Wert für die Zahl der Infizierten in der Bevölkerung ist 28.500
-
Das 95%-Konfidenzintervall ist der Bereich von 10.200 bis 67.400
Man muss die Stichprobe zur COVID-19-Prävalenz etwas anders lesen als beispielsweise Wahlumfragen. Bei Wahlumfragen will man einen Prozentsatz an der Gesamtbevölkerung schätzen, der normalerweise zwischen 5% und 50% liegt. Die absoluten Zahlen interessieren nicht so sehr, und ob in der Stichprobe 5 Befragte mehr oder weniger eine bestimmte Partei präferieren spielt bei der Interpretation kaum eine Rolle.
Das ist bei der COVID-19-Stichprobe ganz anders. Wir wollen die absolute Zahl der Infizierten in der Gesamtbevölkerung.
In der 1544-er-Stichprobe haben wir 6 positiv getestete - also infizierte - Fälle. Wenn wir jetzt einmal die Gewichtung in der Stichprobe vernachlässigen, dann ergibt eine simple Umlegung des Stichpobenanteils von 6/1544 ≈ 0,39%. auf die Gesamtbevölkerung 6/1544 * 8.700.000 ≈ 33.800 Infizierte. Das Konfidenzintervall (unter diesen vereinfachenden Annahmen) ist dann der Bereich von 12.400 bis 73.400.
Wäre der tatsächliche Anteil der Infizierten in der Grundgesamheit 0,39%, dann wären Fallzahlen für positiv Getestete im Bereich von 4 bis 7 Fälle etwa gleich wahrscheinlich. Jeder positive Fall in der Stichprobe verändert dabei den Schätzwert in der Grundgesamtheit um 1/1544 * 8.700.000 ≈ 5.600.
Wie sähen denn die hochgerechneten Zahlen und die Konfidenzintervalle bei solchen Stichprobenergebnissen aus?
Positive in Hochgerechnet in Untere Obere 4 22.500 6.100 57.600 5 28.200 9.200 65.600 6 33.800 12.400 73.400 7 39.400 15.900 81.100
Stichprobe
Grundgesamtheit
Grenze
Grenze
Die hochgerechneten Werte und die Konfidenzschätzer für absolute Zahlen in der Grundgesamtheit reagieren also sehr sensibel auf eine Änderung von nur ganz wenigen Fällen in der Stichprobe.
Berücksichtigt man diese Überlegungen und will man die Ergebnisse der Stichprobenuntersuchung sicher und allgemein verständlich zusammenfassen, dann empfiehlt sich folgende Formulierung:
Wir können davon ausgehen, dass die Zahl der aktuell tatsächlich Infizierten weniger als 100.000 beträgt.