http://www.w3.org/1999/xlink http://www.w3.org/1999/xlink

Статус проекта: проект не получил поддержки

Создание онлайн машинного переводчика карельского языка с использованием технологий искусственного интеллекта

  • Конкурс Второй конкурсный отбор 2023 года
  • Грантовое направление Содействие осуществлению мер по возрождению, сохранению и свободному развитию национальной культуры карелов, вепсов и финнов, проживающих на территории Республики Карелия
  • Номер заявки Р10-23-2-000014
  • Дата подачи 20.09.2023
  • Запрашиваемая сумма 1 998 100,00
  • Cофинансирование 1 823 860,00
  • Общая сумма расходов на реализацию проекта  3 821 960,00
  • Сроки реализации 01.12.2023 - 30.11.2024
  • Организация АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ПО РЕАЛИЗАЦИИ РЕГИОНАЛЬНО-ОРИЕНТИРОВАННЫХ СОЦИАЛЬНЫХ ПРОЕКТОВ "СЕВЕРНЫЕ ИНИЦИАТИВЫ"
  • ИНН 1001342231
  • ОГРН 1191001005634

Краткое описание

Согласно классификации РАН, в стране говорят на 133 языках России. Карельский язык за последние 20 лет показал самый значительный спад - минус 74% в числе владеющих к 2002 году. Так, согласно Всероссийской переписи населения 2020, численность карел сократилась до 32422 (составляла 93 344 в 2010 году), а численность носителей языка теперь составляет 13 872 человек (52 880 в 2010 году). При этом, медианный возраст носителя - самый высокий среди всех языков республик и составляет 64 года. Неудивительно, что карельский язык включен в Красную книгу исчезающих языков ЮНЕСКО.
Ученые сходятся во мнении, что преподавание языков в школе не гарантирует возрождение языка и желания изучать и сохранять родной язык и культуру. При крайне малом количестве часов для изучения родного языка в школе, отсутствии преемственности, в условиях преимущественно русскоязычной среды, родной язык присутствует в жизни школьников лишь временно и имеет символичный оттенок. Решение существующих проблем только образовательной системе не под силу. Государство, при всей его мощи, способно лишь обеспечить средства сохранения и возрождения языков, однако, оно бессильно что-либо сделать без поддержки самих языковых сообществ, т.е. групп людей, которые говорят или чьи предки говорили на том или ином языке. Без мер эффективной поддержки существующие негативные тенденции языковых процессов могут ускориться, рискуя превратиться уже в необратимые.
Считается, что одной из наиболее эффективных форм поддержки языка считается метод «языкового гнезда», разработанный в с. Ведлозеро, Карелия - это участник проекта. "Языковое гнездо" предполагает, что ребенок-дошкольник находится в дневное время под присмотром взрослого, с ним общаются только на карельском языке, таким образом, и младшее поколение приобщается к общению на карельском языке, и язык возрождается.
Однако перечисленных инструментов для ревитализации языка недостаточно. С развитием технологий IT и искусственного интеллекта становится возможным сохранить и даже приумножить культурное наследие народов России и Карелии. Так, ханты и манси к конференциям ООН подключаются напрямую из своих ИТ-стойбищ. Еще одним успешным примером ревитализации языка стал онлайн машинный переводчик с якутского языка, созданный Яндексом.
Разработанный в рамках проекта онлайн машинный переводчик карельского языка будет иметь долгосрочный эффект для сохранения этого коренного языка для нашего региона, включенного в Красную книгу исчезающих языков ЮНЕСКО. Переводчик будет размещаться на ресурсе https://www.translate.ru/ компании Промт, которая находится в реестре отечественных ПО. Проект ориентирован на несколько целевых групп - школьников Республики Карелия, студентов ПетрГУ, органы власти, нацеленные на сохранение языков и культур коренных народов, а также на желающих познакомиться с карельским языком.

Цель

  1. Разработка доступных и понятных инструментов изучения карельского языка для сохранения языкового наследия коренного народа Карелии

Задачи

  1. Информационная кампания проекта и организационная подготовка мероприятий
  2. Подготовка корпуса параллельных текстов (карельский-русский) объемом 100 000 сегментов в формате tmx.
  3. Создание нейронных моделей перевода (карельский-русский, русский-карельский) на основе корпуса параллельных текстов.
  4. Внедрение новых нейронных моделей на сервисе онлайн-перевода PROMT.One.
  5. Апробация онлайн машинного переводчика в школах Карелии и со студентами ПетрГУ
  6. Подведение итогов проекта и анализ его результатов

Обоснование социальной значимости

Проблема касается людей, интересующихся изучением, сохранением и использованием карельского языка, а также тех, кому требуется перевод с карельского языка на другие языки и обратно (студенты, школьники, органы власти). Примерное количество представителей на конкретной территории реализации проекта - 500 человек.
Проблема целевой группы, которую решает проект "Создание онлайн машинного переводчика карельского языка с использованием технологий искусственного интеллекта", заключается в ограниченном доступе к переводу с карельского языка на другие языки и обратно. В настоящее время существует нехватка качественных онлайн-инструментов для перевода с карельского языка, что создает сложности при обучении.
Данная проблема ведет к исчезновению карельского языка (как следствие - к обеднению карельской культуры), а также к социальной изоляции карельскоговорящих групп. Создание онлайн машинного переводчика карельского языка с использованием технологий искусственного интеллекта имеет большую социальную значимость. Такой инструмент позволит людям легче изучить карельский язык. Это, в свою очередь, содействует сохранению и развитию карельского языка и культуры. Благодаря использованию технологий искусственного интеллекта, переводчик может обеспечить более точные и качественные переводы, а также улучшиться с каждым использованием благодаря обучению на основе больших объемов данных. Такой проект может стать важным инструментом для поддержки и развития карельской языковой среды.
Результаты опроса коренных народов Карелии показали, что представители народов пытаются сохранить свой язык (48,2% общаются каждый день, 17% респондентов не общаются на родном языке, 11,5% общаются менее одного раза в месяц, 15,8% - общаются несколько раз в неделю), однако существует нехватка качественных инструментов для изучения, распространения и сохранения языка. Опрос коренных народов Карелии проводился в рамках проекта ПетрГУ «Разработка экспертно-аналитического контента портала “Финно-угорский мир”» (руководитель - д.полит.н. Питухина М.А.)
Карельский язык за 20 лет показал значительный спад - минус 74% в числе владеющих к 2002 году. Так, согласно Всероссийской переписи населения 2020 (https://rosstat.gov.ru/vpn/2020/Tom5_Nacionalnyj_sostav_i_vladenie_yazykami), численность карел сократилась до 32 422 (93 344 в 2010 году), а численность носителей карельского составляет теперь 13 872 (52 880 в 2010 году).
Карельский язык включен в Красную книгу исчезающих языков ЮНЕСКО (https://en.wal.unesco.org/languages/karelian).
"Эксперты уверены, что обучение языкам народов Севера невозможно без цифровизации. (https://tass.ru/obschestvo/13653345/amp).
"Исследование Ассоциации преподавателей родного языка и литературы коренных малочисленных народов Севера, Сибири и Дальнего Востока, показало, что изучать свои этнические языки хотели бы больше 90% респондентов. Не заинтересованными в изучении оказались только около 9–10% респондентов.", "Чтобы избежать их (прим. - языков) полного исчезновения, необходимо оцифровывать сами языки" (https://iz.ru/1241783/evgeniia-priemskaia/dar-rechi-kto-sokhraniaet-iazyki-korennykh-narodov).
"Дети на карельском языке почти не разговаривают: всего 0,5% детей до 9 лет его знают." (https://gubdaily.ru/news/karelskij-yazyk-umiraet-bystree-vsex-v-rossii/).
"Процесс воссоздания карельского языка у нас сейчас может происходить за счет поддержания русско-карельского двуязычия детей... Современное двуязычие детей может сложиться путем разработки специальных программ в образовательных учреждениях и родительской поддержки. Например, языковые гнезда, языковое погружение, двуязычные школьные программы, интенсивные языковые курсы." (https://stolicaonego.ru/analytics/karelskij-jazyk-nashe-obschee-nasledstvo/).

География проекта

Республика Карелия (Пряжинский национальный район, г. Петрозаводск), Москва (ФАДН, Минвостокразвития России) , Санкт-Петербург (PROMT)

Целевые группы

  1. Носители карельского языка (жители Республики Карелия, Ленинградской области, Тверской области, 20-50 лет)
  2. Органы власти, ответственные за сохранение языкового наследия народов (ФАДН России, Министерство образования и спорта Республики Карелии, Министерство национальной и региональной политики Карелии)
  3. Студенты ПетрГУ, изучающие карельский язык (кафедра прибалтийско-финской филологии Института филологии ПетрГУ, 18-21 лет)
  4. Школьники, изучающие карельский язык (СОШ финно- угорская школа имени Элиаса Леннрота в г.Петрозаводске и Ведлозерская средняя школа Пряжинского района, 10-11 классы, 16-18 лет)
  5. Желающие познакомиться с карельским языком (любознательные инициативные жители Республики Карелия, 20-50 лет, кто любит свою малую Родину и свой край)

Контактная информация

Респ Карелия, г Петрозаводск, р-н Северная Промзона, Шуйское шоссе, д 16, кв 21