🧪 Neuer Notebook-Drop: Bewertung von LLMs auf schädliche Ausgaben! Welche Modelle sind tatsächlich sicher für die Produktion? Wir haben eine LLM-as-a-Judge-Pipeline mit der Together Evals API entwickelt, um Modelle hinsichtlich ihrer Schädlichkeit zu vergleichen. Code👇
1,71K