🧪 ¡Nuevo lanzamiento de cuadernos: Evaluando LLMs por salidas dañinas! ¿Cuáles modelos son realmente seguros para producción? Construimos un pipeline de LLM-como-Juez utilizando la API de Together Evals para comparar modelos en cuanto a su peligrosidad. Código👇
1.67K