Anders als bei Texten müssten doch hier auch komplette Physik-Maschinen die gesamten Berechnungen übernehmen. Zum Beispiel die Spiegelungen in der Sonnenbrille der Dame im Tokio-Teil des Videos. Das Trainieren kann doch hier nicht durch Texte bzw. Grafiken und Filme erfolgen.
Irgendwie ist das Alles schwer zu greifen, weiss die KIs können, wenn man nicht wirklich versteht, wie das Ergebnis entsteht.