Da bin ich ja wenn ich's manuell mache schneller.
Warum lässt man das Skript nicht vor dem Upload aufs NAS auf einem Rechner mit GPU laufen? Auch könnte man überlegen, ob es denn Llava sein muss, wenn man nur Schlagworte braucht, oder ein einfacheres Netz reicht.