🧪 Nouveau lancement de carnet : Évaluation des LLM pour les sorties nuisibles ! Quels modèles sont réellement sûrs pour la production ? Nous avons construit un pipeline LLM-en-tant-que-Juge en utilisant l'API Together Evals pour comparer les modèles sur leur nocivité. Code👇
1,67K