3 min read

Was sagt die COVID-19-Stichprobe aus?

Gestern wurde die von SORA im Auftrag des BMBWF abgewickelte Stichprobenanalyse zur Prävalenz von COVID-19 in der gesamten österreichischen Bevölkerung präsentiert.

Dabei wurde ein gewichtetes Stichprobenverfahren verwendet, und die Hauptergebnisse lauteten:

  • Der plausibelste Wert für die Zahl der Infizierten in der Bevölkerung ist 28.500

  • Das 95%-Konfidenzintervall ist der Bereich von 10.200 bis 67.400

Man muss die Stichprobe zur COVID-19-Prävalenz etwas anders lesen als beispielsweise Wahlumfragen. Bei Wahlumfragen will man einen Prozentsatz an der Gesamtbevölkerung schätzen, der normalerweise zwischen 5% und 50% liegt. Die absoluten Zahlen interessieren nicht so sehr, und ob in der Stichprobe 5 Befragte mehr oder weniger eine bestimmte Partei präferieren spielt bei der Interpretation kaum eine Rolle.

Das ist bei der COVID-19-Stichprobe ganz anders. Wir wollen die absolute Zahl der Infizierten in der Gesamtbevölkerung.

In der 1544-er-Stichprobe haben wir 6 positiv getestete - also infizierte - Fälle. Wenn wir jetzt einmal die Gewichtung in der Stichprobe vernachlässigen, dann ergibt eine simple Umlegung des Stichpobenanteils von 6/1544 ≈ 0,39%. auf die Gesamtbevölkerung 6/1544 * 8.700.000 ≈ 33.800 Infizierte. Das Konfidenzintervall (unter diesen vereinfachenden Annahmen) ist dann der Bereich von 12.400 bis 73.400.

Wäre der tatsächliche Anteil der Infizierten in der Grundgesamheit 0,39%, dann wären Fallzahlen für positiv Getestete im Bereich von 4 bis 7 Fälle etwa gleich wahrscheinlich. Jeder positive Fall in der Stichprobe verändert dabei den Schätzwert in der Grundgesamtheit um 1/1544 * 8.700.000 ≈ 5.600.

Wie sähen denn die hochgerechneten Zahlen und die Konfidenzintervalle bei solchen Stichprobenergebnissen aus?

Positive in
Stichprobe

Hochgerechnet in
Grundgesamtheit

Untere
Grenze

Obere
Grenze

4

22.500

6.100

57.600

5

28.200

9.200

65.600

6

33.800

12.400

73.400

7

39.400

15.900

81.100

Die hochgerechneten Werte und die Konfidenzschätzer für absolute Zahlen in der Grundgesamtheit reagieren also sehr sensibel auf eine Änderung von nur ganz wenigen Fällen in der Stichprobe.

Berücksichtigt man diese Überlegungen und will man die Ergebnisse der Stichprobenuntersuchung sicher und allgemein verständlich zusammenfassen, dann empfiehlt sich folgende Formulierung:

Wir können davon ausgehen, dass die Zahl der aktuell tatsächlich Infizierten weniger als 100.000 beträgt.