Por que o SWE-bench Verified já não é mais confiável para avaliar avanços em IA de programação
Nos últimos anos, a avaliação do progresso em inteligência artificial aplicada à programação tem sido um desafio constante para pesquisadores e…
1 publicações encontradas
Nos últimos anos, a avaliação do progresso em inteligência artificial aplicada à programação tem sido um desafio constante para pesquisadores e…