🧪 Nuovo rilascio di Notebook: Valutazione degli LLM per output dannosi! Quali modelli sono realmente sicuri per la produzione? Abbiamo costruito un pipeline LLM-as-a-Judge utilizzando l'API Together Evals per confrontare i modelli in base alla dannosità. Codice👇
1,67K