#MoE

Artigos sobre MoE

3 artigos encontrados

Tutoriais·20 de janeiro de 2026

Novos benchmarks do GLM-4.7-Flash mostram 4.398 tok/s em H200 com vLLM e 112 tok/s em RTX 6000 Ada usando quantização GG...

Ferramentas·20 de janeiro de 2026

GLM-4.7 Flash usa arquitetura MoE 30B-A3B, ativando apenas 3B parâmetros por token. Roda em GPUs consumer e já tem GGUFs...

Papers·14 de janeiro de 2026

Novo paper apresenta o Spectral Sphere Optimizer (SSO), que combina descida mais íngreme sob norma espectral com restriç...

Fique por dentro das novidades

Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.

Ao se inscrever, você concorda com nossa política de privacidade .