Das lernen meine Zehntklässler doch im Unterricht:
Je kleiner die Prävalenz und je größer die Grundgesamtheit ist, desto kleiner wird der positiv prädiktive Wert eines Tests, welcher Art auch immer. Auch wenn jeder Einzelfall grausam ist, KiPo hat einen sehr geringen Anteil am gesamten Chatvolumen, die Prävalenz ist also schon einmal mikroskopisch klein. Wenn man dann noch die Gesamtbevölkerung als Grundgesamtheit heranzieht, macht man die Chance, überhaupt etwas zu finden, endgültig kaputt.
Kleines Rechenbeispiel:
300Mio Chatnachrichten pro Tag in der EU (extrem niedrig geschätzt, das sollten allein die Schüler meiner 7f schaffen), Prävalenz 0,001% (extrem hoch geschätzt), Sensitivität des Tests 99,999% (sehr hoch geschätzt), Spezifität des Tests 99% (extrem hoch geschätzt)
von den 300Mio Nachrichten enthalten 3000 KiPo, davon werden alle entdeckt.
von den 300Mio Nachrichten enthalten 299,997Mio keine KiPo, davon werden 2,997Mio falsch als KiPo eingestuft
Der positiv prädiktive Wert beträgt dann 3000/2.997.000 = 0,1%
0,1%, also jede tausendste als KiPo eingestufte Chatnachricht wäre dann tatsächlich richtig eingestuft - und das bei den von mir künstlich aufgebauschten Zahlen, die Realität dürfte also noch viel finsterer sein. Die Behörden wären nur noch damit beschäftigt, falschen Alarmen hinterher zu laufen, und die echten KiPo Verbrecher lachen sich ins Fäustchen.
Es ist das gleiche Phänomen wie mit den massenhaften DNA-Screenings (alle Männer aus dem Kreis xy zum Speicheltest), wie mit den massenhaften medizinischen Screenings (alle Frauen über 50 zur Mammografie), wie mit jeder Massenüberwachung überhaupt. Das ist Grundwissen aus der Schule! Haben die Mathelehrer (außer mir natürlich) alle versagt?
Ich habe fertig.