Исследователи Microsoft представили LeMa (Learning from Mistakes) – алгоритм с открытым исходным кодом для улучшения способности больших языковых моделей решать математические задачи.
LeMa заставляет модель учиться на своих ошибках, имитируя процесс обучения людей.
Интересный подход — будто дали LLM собственный «черновик» с разбором ошибок. Любопытно, как это повлияет на устойчивость решений в многошаговых задачах. Уже пробовали LeMa в связке с агентами?
Мы используем cookie-файлы, чтобы улучшить сервисы для вас. Если ваш возраст менее 13 лет, настроить cookie-файлы должен ваш законный представитель. Больше информации
Комментарии 2