«Нет цели сказать, как правильно. Мы стремимся исследовать вариативность»
В НИУ ВШЭ работает Международная лаборатория языковой конвергенции факультета гуманитарных наук, в центре внимания которой взаимодействие языков разных народов, живущих в регионах со смешанным полиэтничным населением. Исследования ученых Вышки помогают лучше понять историю развития языков и изучить особенности восприятия и использования языков в многоязычной среде. Подробнее об этом в интервью «Вышке.Главное» рассказал заведующий лабораторией Георгий Мороз.
— Как началась работа лаборатории?
— Она была открыта в 2017 году, заведующей стала Нина Добрушина, а научным руководителем — профессор Университета Беркли Джоханна Николс, работающая сейчас дистанционно. Большинство научных сотрудников изучали языки народов Кавказа и их взаимодействие: например, Нина Добрушина, Михаил Даниэль, Тимур Майсак интересовались в основном Дагестаном, Юрий Ландер и Анастасия Панова исследовали абхазо-адыгские языки.
Одно из центральных направлений работы — типологическое. Типологические исследования в лингвистике предполагают классификацию языков по разным признакам (например, по количеству гласных и согласных звуков). Для этого создаются выборки, которые могут включать десятки языков. Наша лаборатория — один из немногих в России научных центров, где проводятся такие исследования, и, пожалуй, единственный, в котором внимание сосредоточено именно на процессах взаимодействия языков. В лаборатории также продолжается работа по исследованию языков Кавказа и созданию лингвистических ресурсов для них.

На Кавказе русский язык контактирует с языками разных групп: кроме нахско-дагестанских языков, это тюркские (к которым относятся многие языки народов Дагестана, например кумыкский и азербайджанский), а также абхазо-адыгские (абхазский, абазинский, адыгейский и кабардинский), картвельские (грузинский, мегрельский, сванский и лазский языки) и индоевропейские (армянский, осетинский, татский).
Основная цель создания лаборатории — изучить взаимное влияние языков друг на друга. Яркий пример такого влияния — осетинский язык, который является индоевропейским, однако в нем, в отличие от других индоевропейских, есть абруптивные согласные звуки. Это звуки, при произнесении которых голосовые связки смыкаются и поднимаются, образуя разность давления, например кI, пI, тI, цI, чI. Кроме того, во время экспедиции в Азербайджан сотрудники лаборатории изучали диалекты территорий, граничащих с Дагестаном, и Михаил Даниэль обнаружил диалект азербайджанского языка, в котором были абруптивные звуки (правда, сообщения о нем были и в предыдущих работах). Видимо, это можно объяснить тем, что предки жителей селения Илису говорили на некоем нахско-дагестанском языке, предположительно цахурском, а потом перешли на азербайджанский язык, сохранив вот такой абруптивный след. Вероятнее всего, это произошло из-за языковых контактов.
Аналогичную гипотезу выдвигала и наша руководительница Джоханна Николс про жителей некоторых селений в Дагестане. Дело в том, что на севере Дагестана распространен аварский язык, и распространен он в основном в низменности. Однако можно обнаружить носителей аварского языка в высокогорных селениях в окружении неаварских селений. И тут появляется предположение, не говорили ли они раньше на языках, отличных от аварского, а потом перешли на аварский под влиянием его престижа.
Процесс, при котором происходят такие заимствования и даже переходы с одного языка на другой и, как следствие, сближение языков или диалектов, называется языковой конвергенцией. Важно, что этот процесс легче увидеть на примере генетически неродственных языков, однако аналогичное явление может происходить и с родственными языками или диалектами.
— Конвергенция соседних языков обязательна?
— Она происходит в большинстве случаев, но отмечаются и противоположные случаи, когда языки и их носители «пытаются» быть непохожими друг на друга. Этот процесс называется дивергенцией. Например, в прошлом году мы пригласили выступить у нас на семинаре Джона Мэнсфилда, который совместно с коллегами опубликовал типологическое исследование дивергентных процессов на материале 42 языков со всего мира.
— Вы упомянули Дагестан, где говорят на многих языках. Не могли бы вы подробнее рассказать про этот регион и про ваши исследования, связанные с ним?
— Дагестан прекрасен многоязычием и взаимным влиянием местных языков друг на друга; кроме того, в какой-то момент они стали меняться и под воздействием активного проникновения русского языка в местную среду.
Недавно мы с нашим стажером-исследователем Викторией Зубковой и научным сотрудником Кьярой Наккарато отправили в один из ведущих международных лингвистических журналов статью об адаптации русских заимствований в андийских языках. Более ранние заимствования шли преимущественно через аварский язык, через его своеобразное посредничество. А сейчас слова заимствуются уже напрямую, и мы пытаемся смоделировать, в каких языках влияние русского больше и от каких факторов зависит степень его влияния.
В процессе исследования выяснилось, что в аварском и ботлихском языках в последнее время отмечается меньше фонетических изменений в заимствованиях из русского, чем в других андийских языках (см. например, ахвахское кIебекIи — «копейка»). Основная причина: эти языки уже успели подпасть под сильное влияние русского. Аварский язык раньше играл важную роль на севере Дагестана, это был и остается своего рода региональный lingua franca. Результаты нашего исследования показывают, что процесс адаптации русских заимствований в других андийских языках происходил медленнее, чем в аварском, но очевидно, что этот процесс сокращался со временем. Сейчас уже, конечно, любое заимствование, скорее всего, войдет во все эти языки без какой-либо фонетической адаптации.
— Как вы получаете материалы для исследований?
— Для сбора данных мы регулярно ездим в экспедиции, для нас это важнейший источник материала. Недавно наши коллеги вернулись из Армении, другая группа — из Адыгеи. В последнее время мы начали активнее использовать данные, собранные учеными, не работающими в лаборатории.
Так, в лаборатории собрано 10 корпусов речи билингвов, то есть людей, для которых русский язык не является родным, но они его выучили и регулярно используют в повседневном обиходе. Их речь — и произношение, и грамматика — отличается от речи монолингвов.
Также создаются корпуса отдельных диалектов русского языка. Основная сложность сбора такого материала состоит в том, что русские диалектологи раньше неохотно делились своими данными. Благодаря Нине Добрушиной это изменилось, и теперь уже разместить у нас какой-то диалектный корпус считается делом обычным. Всего в лаборатории создано 26 диалектных корпусов.
Мы собираем также корпуса малых языков России, сейчас их уже 14.
— Можно уточнить, что такое «корпус» для лингвистов? Как и зачем вы создаете новые корпуса?
— Корпуса появились как письменные записи речи разного вида или просто размеченные собрания текстов. Корпус отличается от коллекций текстов морфологической или иной разметкой. В частности, можно задавать поиск по категориям: например, какие существительные стоят перед инфинитивами. Например, Национальный корпус русского языка — это собрание большого количества текстов, по которым возможен морфологический поиск. Когда мы подготавливаем устные корпуса — билингвальные и диалектные, — мы используем текстовые расшифровки на литературном русском языке, что делает возможным автоматический морфологический поиск. В корпусах также есть аудиозаписи, благодаря которым мы можем понять и особенности диалектов. Иногда нужно переслушать записи, чтобы точнее понять, используются ли определенные звуки.
Корпус — один из центральных инструментов современной лингвистики. Именно анализируя частотность употребления разных конструкций в нем, мы делаем некоторые обобщения, на основании которых публикуем статьи.
Один из вариантов использования корпусов — сравнить диалекты или малые языки друг с другом: с помощью векторных моделей можно получить пересечения корпусов соответствующих языков и тем самым понять, какие диалекты и языки ближе и какие дальше друг от друга.
Так, согласно нашим наблюдениям над билингвальными корпусами, карелы, в отличие от дагестанцев, говорят на русском языке, который ближе к литературному. В Дагестане на местные языки влияет и нормативный литературный русский, и возникший в республике и самобытно развивающийся региональный дагестанский русский. Для детей важно количество использования языка. И если, например, лезгины говорят по-лезгински, а адыги — по-адыгейски или по-кабардински и затем переходят на русский, то можно задаться вопросом, на какой именно русский — литературный или на специфическую местную версию, имеющую местные особенности, вызванные родными языками. Такие сравнения особенностей возможны как раз благодаря нашим корпусам.
— Какие еще ресурсы вы создаете?
— Как говорилось выше, одним из важных ресурсов лаборатории являются лингвистические атласы малых языков России.
Мы также составляем словари таких языков. Например, мы недавно опубликовали словарь кининского диалекта рутульского языка, носители которого проживают в Дагестане и в Азербайджане; объем словаря — около 1200 слов. Я анализировал зиловский диалект, один из диалектов андийского языка, который длительное время не имел письменности, и тоже разместил на странице лаборатории словарь где-то на 1500 слов. Однако это значительно меньший объем по сравнению со словарями, которые издают лингвисты из регионов, где говорят на соответствующем языке. Они лучше владеют языками и обычно могут больше времени посвятить этой задаче.
Словари, изданные в Дагестане, включают минимум 5000–6000 единиц, а недавно наш коллега Маджид Шарипович Халилов издал словарь цезского (дидойского) языка объемом 11 000 слов. Для бесписьменного языка это что-то феноменальное.
— Каковы ключевые направления нынешней работы лаборатории?
— Основное наше направление — лингвистическая типология, в рамках которой производятся исследования на материале выборки неродственных языков со всего мира.
Другой длительный проект — Типологический атлас языков Дагестана, в нем уже 58 глав, каждая из которых посвящена отдельному лингвистическому явлению, например наличию или отсутствию некоторых абруптивных звуков. Научные сотрудники нашей лаборатории Самира Ферхеес и Кьяра Наккарато изучили, как люди, говорящие на разных языках, здороваются утром, и написали соответствующую главу. Выяснилось, что на 17 языках приветствуют «Доброе утро!», также распространен как приветствие риторический вопрос «Ты проснулся?», «Встал?», а, например, в лакском языке можно встретить оба этих варианта.

Важную роль сейчас играет проект электронных дагестанских словарей. Мы пытаемся сделать некую унифицированную базу данных, которая содержала бы лексический материал нахско-дагестанских языков. База данных возникла благодаря серии курсовых работ студентов образовательной программы «Фундаментальная и компьютерная лингвистика», которые дигитализировали, вычищали данные, создавали транслитератор. В этих работах есть фонетическая и морфологическая разметка и разметка заимствований из русского, арабского, персидского и тюркских языков. Теперь мы располагаем унифицированными материалами по андийским и аварскому языкам.
Это значительно упрощает ряд исследований, в рамках которых нужно было посмотреть разные словари. Уже упомянутая статья Виктории Зубковой и Кьяры Наккарато стала возможной благодаря этой базе данных, которая также открывает поле для новых исследований. Это проект с большим потенциалом, который, надеюсь, будет продолжаться.
Другое важное направление — исследование нестандартного русского, в рамках которого мы занимаемся как диалектами русского языка, так и особенностями русского языка тех, для кого он неродной. Мы называем свою группу DiaL2: dia — диалекты и L2 — стандартное обозначение для второго языка. Нам интересны любые варианты, непохожие на литературные. У нас нет цели сказать, как правильно. Мы стремимся исследовать вариативность, которую наблюдаем. Наша группа включает исследователей лаборатории и студентов. Например, у нашего стажера-исследователя Анны Гришановой недавно приняли к публикации статью про выпадение предлогов в речи билингвов, у которых первый родной язык — чувашский.
Есть отдельный рутульский проект. В рамках гранта «Открываем Россию заново» мы посетили 12 рутульских селений и выпустили атлас, похожий на Типологический атлас языков Дагестана, о котором я говорил раньше. В рутульском атласе собрано 425 отдельных глав, посвященных разным темам рутульской диалектологии: фонетическим, грамматическим и лексическим. Например, одна из глав посвящена лексеме ёж, которая обозначается разными вариантами — как заимствованием из русского, так и собственными гъылленцI, кирпик, жьужьа или кIынгъыр.

Есть и еще два небольших проекта: один по арамейским языкам, использующимся в том числе и в России, на который получен грант РНФ (24-28-01009), — «Ареально-типологическое описание новоарамейских идиомов Армении» под руководством Юрия Корякова — и второй по абхазо-адыгским языкам.
В целом документация языков очень важна для культуры народов, с которыми мы работаем, поскольку некоторые бесписьменные языки могут исчезнуть, а если мы успеем хоть как-то их зафиксировать, то люди смогут посмотреть, как говорили их дедушки и бабушки, даже если они не понимают родного языка.
— Как организована работа лаборатории?
— Одним из столпов лаборатории мне кажется наш еженедельный семинар. Он проходит каждый вторник в 16:00. За время работы лаборатории прошло больше 230 семинаров, на них были представлены почти 300 докладов. Почти все семинары проходят на английском, что позволяет активнее включать иностранных коллег в нашу работу и поддерживать научные контакты. К нам приходят разные известные лингвисты, например Мартин Хаспельмат, один из ведущих специалистов по лингвистической типологии. Во время поездки в Москву в декабре прошлого года он выступил в Вышке с лекцией, вызвавшей большой интерес. Семинары также показывают нашим стажерам, как в принципе делать доклад, задавать вопросы и держать себя во время доклада на английском. Кроме того, когда я стал заведующим, мы стали активнее использовать семинары в качестве площадки для обсуждения новых научных статей. Это связано с моим глубоким убеждением, что легко перестать читать или ограничить чтение только своей узкой специализацией и перейти на штамповку статей. Именно чтение и обсуждение статей, даже далеких от твоей темы исследования, позволяет держать в фокусе общее состояние современной лингвистики, а не тонуть в конкретике, как в притче о слоне и слепых мудрецах.

— Насколько активно вы сотрудничаете с другими университетами и кампусами Вышки?
— В рамках проекта «Зеркальные лаборатории» мы сотрудничали в 2022–2024 годах с Южным федеральным университетом. В него были включены три подпроекта: проект по изучению русского как иностранного, диалектологический проект, благодаря которому мы располагаем корпусом донских говоров, который поддерживаем и при необходимости можем продолжить исследование говоров, а также проект цифровых гуманитарных исследований, или Digital Humanities (DH).
Ныне действующий межкампусный проект с НИУ ВШЭ в Петербурге сфокусирован на DH: мы с коллегами занимаемся прикладной компьютерной лингвистикой. В частности, в Петербурге создали корпус русского рассказа 1930–2000 годов, корпус советских песен и даже разработали чат-бота для Эрмитажа.
— Каков принцип работы этого чат-бота?
— Например, посетитель просит показать картину, где изображена женщина с головой на тарелке, подразумевая Юдифь с головой Олоферна; по задумке бот должен выдавать искомую картину. Но вряд ли кто-то удивится, если это будет Иродиада с головой Иоанна Крестителя.
— Какие еще прикладные работы вы можете представить?
— У нас есть разные прикладные исследования. Например, мы начали разрабатывать транслитераторы для нахско-дагестанских языков. Мы мечтаем создать некий хаб, где были бы представлены транслитераторы текстов на разных языках, что будет очень полезно лингвистам.
Кроме того, у нас разрабатываются морфологические анализаторы для малых языков, собираются корпуса и словари. Все это в конце концов является богатым материалом для верификации моделей машинного обучения самой разной модальности: и аудио, и тексты. Такие модели часто страдают из-за нехватки экспертной разметки данных.
Даниэль Михаил Александрович
Добрушина Нина Роландовна
Панова Анастасия Борисовна
Вам также может быть интересно:
Нейролингвисты ВШЭ выяснили, какие приложения лучше помогают восстановить речь
Ученые Центра языка и мозга НИУ ВШЭ выявили факторы, которые делают цифровые приложения для реабилитации больных с афазией более эффективными. Обратная связь, разнообразие игровых задач, длительный период реабилитации и постоянный контакт с лечащим врачом оказались наиболее важными для восстановления речевой функции. Статья опубликована в журнале NeuroRehabilitation.
От нейронных сетей до фондовых рынков: как развивают компьютерные науки в нижегородской ВШЭ
Созданная в 2011 году Международная лаборатория алгоритмов и технологий анализа сетевых структур (ЛАТАСС) НИУ ВШЭ в Нижнем Новгороде ведет широкий спектр фундаментальных и прикладных исследований, в том числе совместные проекты с крупными компаниями: Сбером, Яндексом и другими лидерами IT-отрасли. Разработанные учеными Вышки методы не только обогащают науку, но и позволяют улучшить работу транспорта компаний, более успешно вести медицинские и генетические исследования. О работе лаборатории «Вышка.Главное» побеседовала с ее заведующим — профессором Валерием Калягиным.
Ученые выявили когнитивные механизмы биполярного расстройства
Международная команда исследователей с участием ученых из НИУ ВШЭ экспериментально показала, что люди, страдающие биполярным расстройством, считают мир более нестабильным, чем он есть на самом деле, и из-за этого чаще принимают нерациональные решения. Ученые предполагают, что полученные результаты позволят в будущем разработать более точные методы диагностики и терапии биполярного аффективного расстройства. Статья опубликована в журнале Translational Psychiatry.
Гражданская идентичность помогает россиянам поддерживать психологическое здоровье в условиях санкций
Исследователи НИУ ВШЭ выяснили, что осознание себя частью страны может психологически помогать в трудные периоды, особенно, если человек склонен переосмысливать происходящее или обращаться к духовным и культурным ценностям. Переосмысление, в том числе, способно несколько снизить уровень депрессии. Исследование опубликовано в Journal of Community Psychology.
Когда мысли становятся движением: как нейроинтерфейсы меняют медицину и жизнь
В начале XXI века человек все чаще становится не просто наблюдателем, а активным участником технологической революции. Среди достижений, способных изменить судьбы миллионов людей, особое место занимают нейроинтерфейсы — системы, связывающие мозг с внешними устройствами. Именно они стали центральной темой весенней Международной школы «Нейроинтерфейсы нового поколения», прошедшей в стенах НИУ ВШЭ.
«У науки нет национальных границ»
Иностранные ученые успешно продолжают работу в лабораториях Вышки, сочетая фундаментальные и прикладные исследования, позволяющие достичь значимых результатов. О деятельности Лаборатории алгоритмов и технологий анализа сетевых структур в НИУ ВШЭ — Нижний Новгород новостная служба «Вышка.Главное» побеседовала с ее научным руководителем — профессором Паносом Пардалосом.
Ученые ВШЭ рассказали, как определить важные для речевой функции области мозга при операциях
Сотрудники Центра языка и мозга НИУ ВШЭ провели школу по трактографии — методу, который позволяет «увидеть» важнейшие связи в мозге и помогает хирургам избежать повреждений критически важных для речевой функции областей во время операции. Участниками курса стали нейрохирурги и радиологи из Москвы и других регионов страны, интересующиеся методами предоперационного картирования речи.
«Огромное счастье — возможность обсудить свои научные идеи с заинтересованными людьми»
Созданная в нижегородском кампусе Вышки Международная лаборатория динамических систем и приложений ведет глубокие теоретические изыскания и прикладные исследования, среди которых изучение океанических волн, пересоединений солнечной короны, вулканических явлений и устойчивости судов. Ее ученые, за последние 5 лет выигравшие более 20 значимых научных грантов, активно сотрудничают с российскими и зарубежными коллегами из Китая, Испании, США, Великобритании, Бразилии и других стран. О работе лаборатории новостная служба «Вышка.Главное» побеседовала с ее заведующей, профессором Ольгой Починкой.
Лингвисты НИУ ВШЭ выяснили, как билингвы используют конструкции с числительными в русском языке
Исследователи ВШЭ выделили более 4000 примеров устной русской речи билингвов из семи регионов России и выяснили: большинство нестандартных форм в конструкциях с числительными связано не только с их родным языком, но и с тем, как часто выражение встречается в повседневной речи. Например, фразы «два часа» или «пять километров» почти всегда совпадают с литературным вариантом, а вот менее привычные выражения, особенно с числительными от двух до четырех, а также с собирательными формами вроде «двое» или «трое», часто звучат иначе. Исследование опубликовано в журнале International Journal of Bilingualism.
Первый цифровой тест для оценки навыков чтения у взрослых доступен на RuStore
Центр языка и мозга НИУ ВШЭ разработал первый стандартизированный инструмент для оценки навыков чтения на русском языке у взрослых — тест «ЛексиМетр-В». Теперь он доступен в цифровом формате на платформе RuStore. Это приложение позволяет быстро и эффективно диагностировать нарушения чтения, включая дислексию, у людей в возрасте от 18 лет и старше.