Browser-Use: o framework open source que transforma qualquer site em API para agentes de IA
Browser-Use é um framework Python que permite a agentes de IA navegar, interagir e extrair dados de qualquer website atr...
48 artigos encontrados
Browser-Use é um framework Python que permite a agentes de IA navegar, interagir e extrair dados de qualquer website atr...
Mem0 é uma biblioteca open-source que adiciona memória de longo prazo a agentes de IA, prometendo 91% menos latência e 9...
Sistema FOCUS identifica que apenas fração dos tokens é decodificável a cada passo de difusão e propõe otimização que au...
PerpetualBooster v1.1.2 traz treinamento 2x mais rápido, suporte a ONNX e exportação nativa para XGBoost. A biblioteca e...
Memori oferece memória persistente para LLMs e agentes de IA usando SQL nativo, com suporte a PostgreSQL, SQLite, MySQL...
OpenClaw é um agente de IA open source que roda localmente e integra com WhatsApp, Telegram e Discord. Com 145k stars no...
Eigent é um agente desktop open source que roda LLMs locais e oferece automação de arquivos e browsers. Conheça a arquit...
vLLM-MLX permite rodar LLMs, modelos de visão, áudio e TTS nativamente em Macs com Apple Silicon, alcançando 464 tok/s n...
Descubra como executar LLMs locais para descobrir algoritmos otimizados usando busca evolutiva, reduzindo custos de milh...
Oumi é um framework open source que unifica fine-tuning, avaliação e deploy de LLMs e VLMs com suporte a técnicas como L...
FlashInfer é uma biblioteca de kernels GPU de alta performance para serving de LLMs, com suporte a paged KV-cache, FP8/F...
Dataset LongPage expande de 300 para 6.067 romances com reasoning traces hierárquicos, permitindo treinar LLMs para gera...
Google DeepMind apresenta o VaultGemma 1B, primeiro LLM de grande escala treinado inteiramente com privacidade diferenci...
Windows-Use é um framework open-source que conecta LLMs ao Windows para automação de GUI. Suporta Ollama, Gemini e model...
Novos benchmarks do GLM-4.7-Flash mostram 4.398 tok/s em H200 com vLLM e 112 tok/s em RTX 6000 Ada usando quantização GG...
Banana-Slides é um gerador de apresentações baseado no Nano Banana Pro do Google que permite criar PPTs completos a part...
A Europa acelera investimentos massivos em IA soberana com gigafábricas, modelos open-source e startups como Mistral AI,...
Código atualizado no GitHub da DeepSeek revela suporte para um misterioso 'MODEL1' com arquitetura diferente dos modelos...
Heretic automatiza a remoção de restrições de segurança em LLMs usando abliteration e Optuna. Análise técnica da arquite...
UltraRAG v2 é um framework open-source que usa arquitetura MCP client-server para construir pipelines RAG complexos com...
O criador do Signal lançou o Confer, um chatbot de IA com criptografia E2E que usa TEEs e remote attestation. Entenda a...
GLM-4.7 Flash usa arquitetura MoE 30B-A3B, ativando apenas 3B parâmetros por token. Roda em GPUs consumer e já tem GGUFs...
ByteDance libera DeerFlow, framework de deep research que orquestra múltiplos agentes para automatizar pesquisas complex...
Framework MatchTIR resolve problema de credit assignment em LLMs com tool use, usando bipartite matching para supervisão...
Unsloth lança técnicas que permitem treinar modelos de 20B parâmetros com contexto de 20K tokens em GPUs de 24GB usando...
MemMachine oferece armazenamento e recuperação de memória escalável e extensível para agentes de IA, com suporte a knowl...
MemOS é um framework Python open-source que aplica conceitos de sistemas operacionais ao gerenciamento de memória de age...
StepFun lança Step-Audio-R1.1 open source com 33B parâmetros que bate GPT-Realtime, Gemini e Grok em raciocínio de áudio...
Microsoft Research lança OptiMind, um SLM de 20B parâmetros que traduz problemas de negócio em formulações matemáticas p...
STEP3-VL-10B alcança 92.2% no MMBench e 80.11% no MMMU com apenas 10B de parâmetros, superando modelos como GLM-4.6V-106...
A OpenAI disponibilizou o Agents SDK, um framework Python leve e poderoso para orquestrar múltiplos agentes de IA. Com m...
Microsoft lança Fara-7B, modelo agentico de 7B parâmetros que navega na web usando apenas screenshots, sem depender de a...
Novo método usa teoria dos jogos para criar feedback loops em agentes LLM. Logs são convertidos em grafos, equilíbrio de...
THUDM lança SLIME, framework Apache 2.0 para pós-treinamento de LLMs usando Reinforcement Learning em escala. Projeto se...
Mistral apresenta Ministral 3, família de modelos de 3B, 8B e 14B parâmetros usando Cascade Distillation. Inclui variant...
verl é um framework open-source da Volcano Engine (ByteDance) para reinforcement learning em LLMs, com 18k+ stars e lice...
Microsoft lança Promptions, framework que gera controles de UI dinâmicos a partir de prompts, reduzindo o ciclo de tenta...
Microsoft Research lança Agent Lightning, framework que separa execução de agentes do treinamento por RL, permitindo oti...
LMCache é uma biblioteca open-source que otimiza inferência de LLMs através de cache inteligente de Key-Value pairs, pro...
RAGFlow é um motor RAG open-source que combina retrieval-augmented generation com capacidades de agentes de IA, oferecen...
DeepSeek apresenta Engram, módulo que moderniza embeddings N-gram para lookup O(1), criando um novo eixo de esparsidade...
Strix é uma nova ferramenta open-source que usa agentes de IA para automatizar testes de penetração. Com quase 20 mil st...
Google DeepMind lança Gemma Scope 2 com ferramentas open-source de interpretabilidade para toda a família Gemma 3, expan...
Google ADK Python é um toolkit open-source code-first para construir, avaliar e deployar agentes de IA sofisticados. Com...
OpenHands é um agente de IA open-source que automatiza tarefas completas de desenvolvimento de software, desde escrever...
Multiplex Thinking é uma nova abordagem de raciocínio para LLMs que agrega K tokens candidatos em um único token contínu...
GLM-Image adota arquitetura híbrida autoregressiva + difusão, com destaque para renderização precisa de texto em imagens...
Entenda como o vLLM revoluciona a inferência de LLMs com PagedAttention, suporte a múltiplas arquiteturas e throughput a...
Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.
Ao se inscrever, você concorda com nossa política de privacidade .