ButtBench is nu LIVE
site:
ButtBench is een screener die verschillende LLM's evalueert en hun niveau van opwinding op een percentageschaal bepaalt.
Dit, evenals het whitepaper, zijn precies gemaakt zoals Andy (de maker van Truth Terminal) beschreef.
#ButtBench