#inferencia

Artigos sobre inferencia

5 artigos encontrados

Ferramentas·2 de fevereiro de 2026

O Step-3.5-Flash-Int4 da Stepfun AI permite rodar um modelo de 197B parâmetros localmente com 256k de contexto, oferecen...

Tutoriais·16 de janeiro de 2026

Open Responses é um novo padrão de inferência para agentes de IA que padroniza reasoning, tool calling e loops autônomos...

Ferramentas·15 de janeiro de 2026

LMCache é uma biblioteca open-source que otimiza inferência de LLMs através de cache inteligente de Key-Value pairs, pro...

Papers·14 de janeiro de 2026

DeepSeek apresenta Engram, módulo que moderniza embeddings N-gram para lookup O(1), criando um novo eixo de esparsidade...

Mercado·14 de janeiro de 2026

Google DeepMind anuncia Gemini 3 Flash, modelo que combina capacidades de fronteira com otimização agressiva de velocida...

Fique por dentro das novidades

Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.

Ao se inscrever, você concorda com nossa política de privacidade .