#vLLM

Artigos sobre vLLM

4 artigos encontrados

Ferramentas·20 de janeiro de 2026

vLLM-MLX permite rodar LLMs, modelos de visão, áudio e TTS nativamente em Macs com Apple Silicon, alcançando 464 tok/s n...

Ferramentas·20 de janeiro de 2026

Oumi é um framework open source que unifica fine-tuning, avaliação e deploy de LLMs e VLMs com suporte a técnicas como L...

Tutoriais·20 de janeiro de 2026

Novos benchmarks do GLM-4.7-Flash mostram 4.398 tok/s em H200 com vLLM e 112 tok/s em RTX 6000 Ada usando quantização GG...

Ferramentas·20 de janeiro de 2026

UltraRAG v2 é um framework open-source que usa arquitetura MCP client-server para construir pipelines RAG complexos com...

Fique por dentro das novidades

Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.

Ao se inscrever, você concorda com nossa política de privacidade .