SLIME: novo framework open-source para pós-treinamento de LLMs com Reinforcement Learning
THUDM lança SLIME, framework Apache 2.0 para pós-treinamento de LLMs usando Reinforcement Learning em escala. Projeto se...
3 artigos encontrados
THUDM lança SLIME, framework Apache 2.0 para pós-treinamento de LLMs usando Reinforcement Learning em escala. Projeto se...
verl é um framework open-source da Volcano Engine (ByteDance) para reinforcement learning em LLMs, com 18k+ stars e lice...
OpenAI está pedindo que contratados façam upload de projetos de empregos anteriores para avaliar agentes de IA, levantan...
Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.
Ao se inscrever, você concorda com nossa política de privacidade .