В основе классификатора лежит большая языковая модель (LLM, Large language model), обученная на смысловых парах из текстов, в каждой из которых один образец написан человеком, а другой сгенерирован ИИ. Модель, как утверждали разработчики, способна оценить вероятность того, что текст был создан автоматически с помощью программных средств.
В момент запуска сервиса в конце января 2023 г. OpenAI называла его «не полностью надежным», подчеркивая его склонность к ошибочному отнесению написанных человеком текстов к категории сгенерированных машиной.
В частности, классификатор не лучшим образом себя проявлял в работе с текстами, созданными ИИ и в дальнейшем отредактированными людьми, плохо справлялся с прозаической литературой, поскольку образцы таковой отсутствовали в наборе данных, на которых обучалась языковая модель.
Кроме того, в OpenAI отмечали «чрезмерную уверенность» классификатора в своей правоте в тех случаях, когда в действительности он выносил ошибочный вердикт.
Для чего OpenAI запустила классификатор
OpenAI запустила сервис в ответ на растущую в обществе обеспокоенность по поводу того, что инструменты генеративного ИИ, такие как ChatGPT, могут быть использованы учащимися школ и вузов для написания сочинений и выполнения домашней работы без каких-либо интеллектуальных усилий с их стороны. Опасения оказались не полностью беспочвенными. К примеру, бот ChatGPT помог студенту одного из российских вузов Александу Жаданову всего за 23 часа написать дипломную работу, которая вполне удовлетворила аттестационную комиссию учебного заведения.
OpenAI предостерегала преподавателей, решивших воспользоваться новым инструментом, от слепой веры в выдаваемые программой результаты. Вместо этого работникам образовательных учреждений предлагалось использовать классификатор в качестве дополнения к «другим методам определения происхождения фрагмента текста».
Другие классификаторы не лучше
Как отмечает The Register, выявление сгенерированных ИИ текстов оказалось непростой задачей. Существующие аналоги инструмента, созданного OpenAI, также не гарантируют стопроцентную эффективность.
Большой резонанс вызвал скандал в Техасском университете A&M в Коммерсе (США), в ходе которого профессор уличил своих студентов-выпускников в использовании ChatGPT при написании итоговых работ, после чего понизил ранее полученные ими оценки до минимально возможных. Впоследствии вуз разобрался в ситуации и вернул студентам отобранные баллы.
В то же время, как отмечает The Register, все более широкое распространение в школах и университетах получает сервис Turnitin, который по смелому заявлению его разработчиков, позволяет корректно выявлять плагиат с 98-процентной вероятностью. Вразрез с этим заявлением идут результаты исследования, проведенного специалистами Университета Мэриленда (США), из которых следует, что реальная эффективность существующих классификаторов текста в общем случае немногим выше 50%.
OpenAI не оставляет попыток найти оптимальное решение проблемы сгенерированных ИИ текстов и дипфейков. В частности, в компании работают над созданием технологии цифровых водяных знаков, которыми будет помечаться контент, создаваемый компьютерными алгоритмами, для упрощения определения его происхождения.
Чем занимается OpenAI
OpenAI, в которую инвестирует корпорация Microsoft, занимается проектами, связанными с роботизацией и искусственным интеллектом. Например, специалисты компании пытаются научить роботизированную руку выполнять действия с такой же ловкостью, что и человеческая рука, с помощью одного только программного обеспечения. Это должно снизить затраты денег и времени на тренировку роботов.
Также группа занимается исследованиями в сфере безопасности применения искусственного интеллекта и его последствий для общества. Например, OpenAI исследует, как компьютер может генерировать реалистичные новости, и как подобные алгоритмы могут быть использованы злоумышленниками.
С ноября 2022 г. функционирует ChatGPT – чат-бот с искусственным интеллектом на базе языковой модели GPT, разработанный OpenAI и не на шутку испугавший корпорацию Google.
Источник
Нет комментариев