- Ein Artikel, der die Probleme der Kollapstheorie erläutert:
https://the-decoder.de/ki-daten-zerstoeren-ki-forscher-widersprechen-verbreiteter-these/
- Ein Paper dazu, wie man LLMs mit synthetischen Daten verbessern kann:
https://arxiv.org/html/2406.15126v1
- Das Paper zu ShieldGemma, das hauptsächlich auf synthetischen Daten trainiert wurde:
https://arxiv.org/html/2407.21772v1
- Der Blogartikel über Llama 3.1, dessen Qualität mit synthetischen Daten verbessert wurde:
https://ai.meta.com/blog/meta-llama-3-1/
Was die Praxis betrifft, kannst du dich in Communities umsehen, in denen Hobbynutzer Text- und Bildmodelle trainieren, denn dort werden sehr viele synthetische Daten verwendet und die Ergebnisse sprechen für sich.
Das Posting wurde vom Benutzer editiert (05.08.2024 15:11).