🧪 Novo Lançamento de Caderno: Avaliando LLMs para saídas prejudiciais! Quais modelos são realmente seguros para produção? Construímos um pipeline LLM-como-Juiz usando a API Together Evals para comparar modelos em termos de prejudicialidade. Código👇
1,71K