Amazon Bedrock Knowledge Bases agora suporta retrieval multimodal: busca unificada em texto, imagem, áudio e vídeo
AWS anuncia disponibilidade geral de retrieval multimodal para Bedrock Knowledge Bases, unificando busca em texto, image...
13 artigos encontrados
AWS anuncia disponibilidade geral de retrieval multimodal para Bedrock Knowledge Bases, unificando busca em texto, image...
vLLM-MLX permite rodar LLMs, modelos de visão, áudio e TTS nativamente em Macs com Apple Silicon, alcançando 464 tok/s n...
Pesquisadores propõem framework para converter VLMs existentes para Multi-Head Latent Attention, reduzindo até 94% do KV...
Microsoft Research lança Argos, framework que treina agentes multimodais verificando se o raciocínio está ancorado em ev...
Novo estudo compara tokenizadores coupled, semi-decoupled e decoupled para speech-language models, mostrando que arquite...
Banana-Slides é um gerador de apresentações baseado no Nano Banana Pro do Google que permite criar PPTs completos a part...
Pesquisadores propõem LiteEmbed, um método que adapta CLIP para reconhecer classes raras ou culturalmente específicas at...
StepFun lança Step-Audio-R1.1 open source com 33B parâmetros que bate GPT-Realtime, Gemini e Grok em raciocínio de áudio...
STEP3-VL-10B alcança 92.2% no MMBench e 80.11% no MMMU com apenas 10B de parâmetros, superando modelos como GLM-4.6V-106...
Google apresenta ScreenAI, modelo de 5B parâmetros que combina PaLI com pix2struct para entender interfaces, gráficos e...
Mistral apresenta Ministral 3, família de modelos de 3B, 8B e 14B parâmetros usando Cascade Distillation. Inclui variant...
GLM-Image adota arquitetura híbrida autoregressiva + difusão, com destaque para renderização precisa de texto em imagens...
Google DeepMind lança Veo 3.1 com recurso 'Ingredients to Video' para maior controle na geração de vídeos, incluindo sup...
Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.
Ao se inscrever, você concorda com nossa política de privacidade .