#open-source

Artigos sobre open-source

48 artigos encontrados

Ferramentas·2 de fevereiro de 2026

Browser-Use: o framework open source que transforma qualquer site em API para agentes de IA

Browser-Use é um framework Python que permite a agentes de IA navegar, interagir e extrair dados de qualquer website atr...

Ferramentas·2 de fevereiro de 2026

Mem0: A camada de memória universal para agentes de IA que pode reduzir 90% dos custos com tokens

Mem0 é uma biblioteca open-source que adiciona memória de longo prazo a agentes de IA, prometendo 91% menos latência e 9...

Papers·2 de fevereiro de 2026

FOCUS: novo sistema aumenta throughput de Diffusion LLMs em até 3,5x sem perder qualidade

Sistema FOCUS identifica que apenas fração dos tokens é decodificável a cada passo de difusão e propõe otimização que au...

Ferramentas·2 de fevereiro de 2026

PerpetualBooster v1.1.2: Gradient Boosting sem tuning de hiperparâmetros agora 2x mais rápido com suporte a ONNX e XGBoost

PerpetualBooster v1.1.2 traz treinamento 2x mais rápido, suporte a ONNX e exportação nativa para XGBoost. A biblioteca e...

Ferramentas·2 de fevereiro de 2026

Memori: camada de memória SQL nativa para LLMs e agentes de IA atinge quase 12 mil stars

Memori oferece memória persistente para LLMs e agentes de IA usando SQL nativo, com suporte a PostgreSQL, SQLite, MySQL...

Mercado·2 de fevereiro de 2026

OpenClaw: o agente de IA open source que está conquistando a comunidade tech — e os riscos que vêm junto

OpenClaw é um agente de IA open source que roda localmente e integra com WhatsApp, Telegram e Discord. Com 145k stars no...

Ferramentas·20 de janeiro de 2026

Eigent: alternativa open source ao Claude Cowork para rodar agentes de IA localmente

Eigent é um agente desktop open source que roda LLMs locais e oferece automação de arquivos e browsers. Conheça a arquit...

Ferramentas·20 de janeiro de 2026

vLLM-MLX: inferência LLM nativa em Apple Silicon atinge 464 tok/s no M4 Max

vLLM-MLX permite rodar LLMs, modelos de visão, áudio e TTS nativamente em Macs com Apple Silicon, alcançando 464 tok/s n...

Tutoriais·20 de janeiro de 2026

Como usar LLMs locais para descobrir algoritmos de alta performance — um guia prático

Descubra como executar LLMs locais para descobrir algoritmos otimizados usando busca evolutiva, reduzindo custos de milh...

Ferramentas·20 de janeiro de 2026

Oumi: framework open source que promete ser o 'Linux da IA' para fine-tuning de LLMs

Oumi é um framework open source que unifica fine-tuning, avaliação e deploy de LLMs e VLMs com suporte a técnicas como L...

Ferramentas·20 de janeiro de 2026

FlashInfer: a biblioteca de kernels GPU que está acelerando inferência de LLMs em produção

FlashInfer é uma biblioteca de kernels GPU de alta performance para serving de LLMs, com suporte a paged KV-cache, FP8/F...

Ferramentas·20 de janeiro de 2026

LongPage: dataset com mais de 6 mil romances e traces de raciocínio para treinar LLMs de escrita longa

Dataset LongPage expande de 300 para 6.067 romances com reasoning traces hierárquicos, permitindo treinar LLMs para gera...

Papers·20 de janeiro de 2026

VaultGemma: Google lança o maior modelo de linguagem treinado com privacidade diferencial

Google DeepMind apresenta o VaultGemma 1B, primeiro LLM de grande escala treinado inteiramente com privacidade diferenci...

Ferramentas·20 de janeiro de 2026

Windows-Use: Framework open-source que permite LLMs controlarem o Windows como agentes autônomos

Windows-Use é um framework open-source que conecta LLMs ao Windows para automação de GUI. Suporta Ollama, Gemini e model...

Tutoriais·20 de janeiro de 2026

GLM-4.7-Flash atinge 4.398 tokens/s em H200: benchmarks completos do novo modelo MoE chinês

Novos benchmarks do GLM-4.7-Flash mostram 4.398 tok/s em H200 com vLLM e 112 tok/s em RTX 6000 Ada usando quantização GG...

Ferramentas·20 de janeiro de 2026

Banana-Slides: gerador de PPT com IA que usa Nano Banana Pro do Google para criar apresentações por comando de voz

Banana-Slides é um gerador de apresentações baseado no Nano Banana Pro do Google que permite criar PPTs completos a part...

Mercado·20 de janeiro de 2026

Europa acelera corrida para criar seu próprio DeepSeek: o que isso significa para engenheiros de IA

A Europa acelera investimentos massivos em IA soberana com gigafábricas, modelos open-source e startups como Mistral AI,...

Mercado·20 de janeiro de 2026

DeepSeek revela acidentalmente 'MODEL1' em código no GitHub — o que sabemos sobre o próximo modelo

Código atualizado no GitHub da DeepSeek revela suporte para um misterioso 'MODEL1' com arquitetura diferente dos modelos...

Ferramentas·20 de janeiro de 2026

Heretic: ferramenta open source promete remoção automática de censura em LLMs — análise técnica para engenheiros

Heretic automatiza a remoção de restrições de segurança em LLMs usando abliteration e Optuna. Análise técnica da arquite...

Ferramentas·20 de janeiro de 2026

UltraRAG: Framework Low-Code com MCP para Construção de Pipelines RAG Complexos

UltraRAG v2 é um framework open-source que usa arquitetura MCP client-server para construir pipelines RAG complexos com...

Mercado·20 de janeiro de 2026

Confer: o fundador do Signal lança assistente de IA com criptografia ponta a ponta — o que muda para engenheiros

O criador do Signal lançou o Confer, um chatbot de IA com criptografia E2E que usa TEEs e remote attestation. Entenda a...

Ferramentas·20 de janeiro de 2026

GLM-4.7 Flash: modelo de 30B parâmetros roda localmente com 24GB de VRAM e atinge 59.2% no SWE-bench

GLM-4.7 Flash usa arquitetura MoE 30B-A3B, ativando apenas 3B parâmetros por token. Roda em GPUs consumer e já tem GGUFs...

Ferramentas·20 de janeiro de 2026

DeerFlow: ByteDance lança framework open-source para pesquisa automatizada com agentes de IA

ByteDance libera DeerFlow, framework de deep research que orquestra múltiplos agentes para automatizar pesquisas complex...

Papers·16 de janeiro de 2026

MatchTIR: nova abordagem de supervisão granular para LLMs que usam ferramentas externas

Framework MatchTIR resolve problema de credit assignment em LLMs com tool use, usando bipartite matching para supervisão...

Ferramentas·15 de janeiro de 2026

Unsloth libera RL com contexto 7x maior: treine modelos de 20B com 20K tokens em GPU de 24GB

Unsloth lança técnicas que permitem treinar modelos de 20B parâmetros com contexto de 20K tokens em GPUs de 24GB usando...

Ferramentas·15 de janeiro de 2026

MemMachine: nova camada de memória universal para agentes de IA ganha tração no GitHub

MemMachine oferece armazenamento e recuperação de memória escalável e extensível para agentes de IA, com suporte a knowl...

Ferramentas·15 de janeiro de 2026

MemOS: novo framework open-source traz gerenciamento de memória com arquitetura de sistema operacional para agentes de IA

MemOS é um framework Python open-source que aplica conceitos de sistemas operacionais ao gerenciamento de memória de age...

Ferramentas·15 de janeiro de 2026

Step-Audio-R1.1: modelo open source de áudio com raciocínio supera GPT, Gemini e Grok em benchmark

StepFun lança Step-Audio-R1.1 open source com 33B parâmetros que bate GPT-Realtime, Gemini e Grok em raciocínio de áudio...

Ferramentas·15 de janeiro de 2026

OptiMind: o modelo de linguagem pequeno da Microsoft que transforma problemas de negócio em formulações matemáticas

Microsoft Research lança OptiMind, um SLM de 20B parâmetros que traduz problemas de negócio em formulações matemáticas p...

Papers·15 de janeiro de 2026

STEP3-VL-10B: Modelo open-source de 10B supera gigantes de 100B+ em raciocínio visual — o que engenheiros de IA precisam saber

STEP3-VL-10B alcança 92.2% no MMBench e 80.11% no MMMU com apenas 10B de parâmetros, superando modelos como GLM-4.6V-106...

OpenAI lança Agents SDK para Python: framework leve para criar sistemas multi-agentes

Ferramentas·15 de janeiro de 2026

Fique por dentro das novidades

Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.

Ao se inscrever, você concorda com nossa política de privacidade .