В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций

Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
Объем научно-технической информации (патентов, статей, отчетов) с каждым днем стремительно увеличивается. Эффективно работать с этим массивом данных помогает искусственный интеллект. Как правило, большие языковые модели, представленные на рынке, мультиязычные и обучены на разных языках. Но в популярных чат-ботах с генеративным искусственным интеллектом, таких как ChatGPT, превалируют данные на английском, что грозит появлением монокультуры данных в области ИИ.
Ученые Института статистических исследований и экономики знаний НИУ ВШЭ дообучили существующие большие языковые модели, чтобы получить инструмент, способный более точно анализировать научные тексты на русском языке с пониманием предметной специфики. Основой послужил корпус данных iFORA-QA, вручную собранный более чем 150 экспертами ИСИЭЗ из аналитических материалов и отчетов в области науки, технологий и инноваций.
После адаптации точность модели при ответах на узкопрофессиональные вопросы в сфере науки, технологий и инноваций выросла, скорость генерации увеличилась в 2,7 раза, а использование памяти сократилось на 73% по сравнению с открытой мультиязычной моделью.
Анастасия Малашина
«Универсальные языковые модели знают много, но поверхностно. Нам же нужна модель, которая понимает, о чем пишут российские ученые и инженеры. Благодаря проведенным исследованиям мы смогли научить алгоритм мыслить в категориях предметной области, понимать связи между сложными понятиями и корректно интерпретировать запросы», — комментирует главный аналитик проекта, научный сотрудник и ведущий эксперт Центра стратегической аналитики и больших данных ИСИЭЗ Анастасия Малашина.
Уже в этом году исследователи разработают дополнительные полезные инструменты на базе адаптированной модели. Первым станет умный поисковик — он снизит риски галлюцинирования модели и будет формировать выводы только со ссылками на научные источники информации. Второй инструмент — граф связей, который позволит выявлять закономерности, в том числе скрытые, на основе структуры источников. Кроме того, модель получит способность работать с неполной и неоднозначной информацией, а также рассуждать, то есть не просто давать ответ, а сначала анализировать, чего ей не хватает, задавать уточняющие вопросы пользователю и только потом формулировать подробный ответ.
В итоге все эти возможности объединятся в единую мультиагентную систему, которая позволит решать сложные задачи автоматически.
«Мы создаем целостную систему интеллектуальных агентов, адаптированную под реалии российской науки. Она будет работать на базе большой языковой модели и сможет автономно анализировать научно-техническую информацию и выявлять скрытые связи. Это шаг к автоматизации научной аналитики, где ИИ становится партнером исследователя», — подчеркивает Анастасия Малашина.
Модель искусственного интеллекта разрабатывается в рамках реализации программы Центра искусственного интеллекта НИУ ВШЭ по гранту, предоставленному Минэкономразвития России.
Вам также может быть интересно:
В Вышке открыли проектно-учебную лабораторию совместно с Группой «Т-Технологии»
Группа «Т-Технологии» (головная структура Т-Банка) открыла проектно-учебную лабораторию на базе факультета компьютерных наук НИУ ВШЭ (ФКН НИУ ВШЭ). Проектно-учебная лаборатория Группы «Т-Технологии» в НИУ ВШЭ сосредоточится на проектах и задачах в области искусственного интеллекта, распределенных вычислений, анализа больших данных и информационной безопасности в финансовом секторе. Лабораторию возглавит Алексей Теплов, кандидат физико-математических наук.
В НИУ ВШЭ создали базу данных по производственным цепочкам мирового ВПК
Институт мировой военной экономики и стратегии (ИМВЭС) НИУ ВШЭ разработал новый аналитический инструмент для изучения оборонной промышленности зарубежных стран. База данных «Производственные цепочки мирового ВПК» показывает взаимосвязи между производителями на разных уровнях — от конечных систем до комплектующих.
Институт робототехнических систем ВШЭ запустил научно-технический семинар
Институт робототехнических систем (ИРС) ВШЭ запустил новый ежемесячный формат — Научно-технический семинар. Он объединяет сотрудников института, приглашенных экспертов, студентов, исследователей и представителей других подразделений НИУ ВШЭ для обсуждения актуальных задач мехатроники, робототехники и киберфизических систем.
В НИУ ВШЭ разработали сервис обезличивания табличных данных для безопасного использования в ИИ-системах
Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал сервис обезличивания табличных данных, предназначенный для подготовки корпоративных данных к использованию в аналитических и ИИ-сервисах. Решение позволяет выявлять персональные данные в структурированных наборах, применять к ним воспроизводимые правила обезличивания и формировать артефакты, необходимые для контроля качества, аудита и последующего использования данных в защищенных контурах.
«Дни компьютерных наук год от года становятся масштабнее, и это отражает развитие ФКН»
Прошедший недавно в корпусе НИУ ВШЭ на Покровке фестиваль «Дни компьютерных наук» (ДКН) стал главной точкой притяжения для всех, кто интересуется технологиями. Событие, организованное факультетом компьютерных наук (ФКН) Вышки совместно с партнерами, собрало около трех тысяч участников: студентов, абитуриентов, выпускников, преподавателей и экспертов индустрии.
МИЭМ ВШЭ и АО «Нанотроника» запускают совместную мастерскую электронного машиностроения
Под руководством экспертов компании студенты будут решать задачи, связанные с улучшением характеристик устройств для электронного машиностроения. Среди них — моделирование физических и технологических процессов, расчет, конструирование и автоматизация систем, подсистем и элементов технологического и контрольно-измерительного оборудования, сбор данных, метрологические задачи.
Технодень МИЭМ ВШЭ: праздник технологий и старт новых партнерств
В атриуме на Покровке прошел масштабный фестиваль технологических решений инженерных проектных команд Московского института электроники и математики ВШЭ, где были представлены лучшие студенческие разработки и совместные мастерские МИЭМ и партнеров. Кроме того, в рамках события прошел круглый стол, посвященный вопросам инженерного образования, и были подписаны новые соглашения о сотрудничестве с компаниями – технологическими лидерами в своих отраслях деятельности.
Высшая школа экономики и «Ростелеком» поддержат ИИ-стартапы для госсектора
НИУ ВШЭ и «Ростелеком» подписали на ПМЭФ-2026 соглашение о сотрудничестве в рамках реализации акселератора ИИ-решений для государственного сектора. Совместная работа позволит объединить технологическую экспертизу крупнейшего цифрового партнера государства и академический потенциал ведущего исследовательского университета страны.
НИУ ВШЭ второй год подряд на первом месте рейтинга вузов Альянса в сфере ИИ
Альянс в сфере искусственного интеллекта опубликовал рейтинг российских высших учебных заведений по качеству подготовки кадров для работы с ИИ. Высшая школа экономики второй год занимает первую строчку рейтинга, оставаясь единственным университетом в категории A++.
Институт искусственного интеллекта и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса
Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал Predict Core — унифицированное алгоритмическое ядро предиктивной аналитики. Платформа переводит работу с данными из режима отчетности постфактум в управленческую привычку с прогнозами, интерпретацией и понятным следом, показывающим, как была получена эта цифра.


