Проект ученых Института динамики систем и теории управления имени В. М. Матросова СО РАН вошел в число 1154 поддержанных инициатив из почти 5000 поданных заявок на конкурс Российского научного фонда «Малые отдельные научные группы».
Исследование «Методы и инструментальные средства построения таблично ориентированных вопросно‑ответных систем с использованием генеративного искусственного интеллекта» будет осуществляться под руководством заведующего лабораторией информационно-телекоммуникационных технологий исследования техногенной безопасности ИДСТУ СО РАН доктора технических наук Александра Юрьевича Юрина. В исследовательскую команду также вошли молодые ученые ИДСТУ СО РАН (до 39 лет) — кандидат технических наук Никита Олегович Дородных, стажеры-исследователи Иван Александрович Поддубный и Кирилл Владимирович Тобола.
«Цель проекта — в создании новых методов и программных инструментов для TQA (Table Question Answering), то есть для автоматического формирования ответов на вопросы, заданных на естественном языке, по табличным данным. Актуальность работы связана с тем, что современные интеллектуальные системы пока недостаточно эффективно используют табличную информацию. Хотя таблицы широко применяются для хранения и систематизации данных, их форматы бывают разными: от строго структурированных до полуструктурированных, таких как Excel или Google Sheets, и неструктурированных — текстовые файлы с элементами псевдографики. При этом полуструктурированные таблицы зачастую не содержат явной семантики, необходимой для их автоматической машинной обработки. Именно над решением этой задачи мы будем работать», — отметил Александр Юрьевич.
В ходе исследования планируется разработать инновационные модели и алгоритмы. В частности, сотрудники ИДСТУ СОРАН намерены применить вычислительные графы для SQL‑подобных рассуждений на базе легковесных языковых моделей. Это позволит снизить вычислительные затраты и повысить интерпретируемость результатов. Кроме того, будет использован метод контрастного обучения для генерации семантических представлений пар «вопрос‑таблица». Важная особенность проекта — впервые для TQA‑систем будет обеспечена поддержка русскоязычных таблиц.
Апробация разработанных решений пройдет на общедоступных наборах табличных данных, а также в рамках создания интеллектуальной системы для выбора конструкционных материалов при проектировании сосудов и аппаратов в нефтехимии.


Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев