SLIME: novo framework open-source para pós-treinamento de LLMs com Reinforcement Learning
THUDM lança SLIME, framework Apache 2.0 para pós-treinamento de LLMs usando Reinforcement Learning em escala. Projeto se...
1 artigo encontrado
THUDM lança SLIME, framework Apache 2.0 para pós-treinamento de LLMs usando Reinforcement Learning em escala. Projeto se...
Receba as últimas notícias sobre AI Engineering diretamente no seu email. Sem spam, prometemos.
Ao se inscrever, você concorda com nossa política de privacidade .