OpenAI SimpleQA: Neuer Benchmark für faktische Präzision von Sprachmodellen
OpenAI SimpleQA SimpleQA ist ein Benchmark, der speziell entwickelt wurde, um die Fähigkeit von Sprachmodellen zu testen, präzise Antworten auf kurze, faktenorientierte Fragen.