Die offensichtlichen Beispiele lassen sich bestimmt mit hoher Wahrscheinlichkeit finden. Entsprechendes Training vorausgesetzt.
Wenn die Leute Ausweichstrategien nutzen, z.B. harmlose Ausdrücke mit neuen Bedeutungen belegen, dann darf man die KI wieder neu trainierrn. Selbst ein harmloses 'hi welcome' kann in manchem Kontext problematisch sein. Deshalb definiert man Benimmregeln für Foren sehr schwammig, um sich den eigenen Spielraum nicht unnötig einzuengen.
Wie will man bei den subtileren Arten Beleidigungen/ Hate Speech finden? Es ist schon eine Kunst jemanden zu loben und gleichzeitig zu beleidigen. Wenn man auf Nummer sicher gehen wollte, dann müsste man alles verbieten, denn das was Zeit kostet ist die kontextbezogene Betrachtung eines Dialogs (schriflich oder mündlich). ,-)