Confira o nosso novo guia centralizado para servir LLMs abertos no GKE! O nosso novo guia para servir LLMs abertos no GKE suporta modelos populares como Gemma 3, Llama 4, Qwen3 e gpt-oss-20b. Comece com a nossa arquitetura pré-configurada hoje →