Für optimale Genauigkeit beim Einlesen von Tabellendaten in große Sprachmodelle ist die Wahl des Datenformats entscheidend. Studien zeigen, dass Markdown-KV am zuverlässigsten ist, während Formate wie CSV und JSONL die Modellgenauigkeit verschlechtern können. Dies ist wichtig für die Gestaltung effizienter RAG-Pipelines.
Welches Tabellenformat verstehen große Sprachmodelle am besten?
•