🔸 Модель обеспечивает высокую производительность при решении сложных логических задач.
🔸 Phi-4-reasoning была обучена с помощью контролируемой тонкой настройки на основе подсказок, сгенерированных с помощью o3-mini.
🔸 Корпорация также представила Phi-4-reasoning-plus - вариант Phi-4-reasoning с более длинными логическими трассами.
🔸 Новые модели на базе Phi-4-reasoning превосходят несколько более крупных моделей, таких как DeepSeek-R1-Distill-Llama-70B.
🔸 Phi-4-reasoning также превосходит модели Flash Thinking от Anthropic Claude 3.7 Sonnet и Google Gemini 2 по всем задачам, кроме GPQA и календарного планирования.
🔸 Производительность Phi-4-reasoning может быть дополнительно улучшена с помощью обучения с подкреплением (RL).
🔸 Phi-4-reasoning в основном работает с текстом на английском языке и обучена на Python с использованием распространенных пакетов программирования.
🔸 Длина контекста составляет всего 32 тыс. токенов.
#TechNews
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев