Ведущая компания OpenAI решила наглядно расставить все точки над «i».
⠀
Специалисты тестировали свою модель начального уровня o1 и флагманскую модель GPT-4o, а также Claude 3.5 Sonnet от Anthropic. Они применили бенчмарк SWE-Lancer, основанный на 1400 задачах для программистов с сайта фрилансеров Upwork. Модели должны были выполнять задания без доступа в интернет, чтобы они не могли выйти в сеть и «списать» решение. В ходе испытаний инженеры заметили, что модели части допускали ошибки даже в задачах junior-уровня, так как не могли понять контекст. Это приводило к принятию неверных или недостаточно всеобъемлющих решений.
⠀
🤓 Какие выводы были сделаны?
⠀
Самый крутой современный ИИ пока не тянет на замену живому кодеру. Все потому, что он способен решить узкие задачи, но пасует, когда дело доходит до реальной разработки, где нужно думать комплексно и адаптироваться к меняющимся условиям. ИИ не хватает критического мышления, креативности и умения взаимодействовать с командой. А без этого в разработке никуда!
⠀
📑 Что это значит для программистов?
⠀
Во-первых, можно выдохнуть: работу IT-специалисты точно не потеряют. Во-вторых, нужно использовать ИИ как инструмент, а не как замену специалиста. Нейросеть может ускорить какие-то процессы, помочь с рутиной, но сложные задачи и принятие важных решений все еще за человеком. Поэтому не упустите возможность изучить новые инструменты, прокачать свои навыки и оставаться в тренде. Например, на нашем курсе «Искусственный интеллект». Для записи на курс пишите в личные сообщения 📲
#it#обучение#курсы#программирование
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев