Когда машины научатся понимать узбекский язык?

Отсутствие узбекского языка в меню или интерфейсе иностранной техники, оборудования или программы вызывает определенный дискомфорт у местных пользователей. Не всегда можно разобраться в хитроумных режимах и функциях, заложенных производителем, даже если прилагаемая инструкция написана на твоем родном языке. Сложнее вдвойне, когда она на незнакомом или малознакомом языке.

Узбекским потребителям хорошо знакома эта проблема. Производители техники и софта сконцентрировались на девяти самых распространенных в мире языках – китайском, испанском, английском, хинди, арабском, бенгальском, португальском, русском и японском. На их региональную политику влияют и объемы продаж в каждой конкретной стране. К примеру, бенгальский язык занимает шестое место в мире по количеству носителей, но большинство цифровой продукции на него не локализуется.

Чтобы преодолеть языковой барьер производители техники и софта придумали универсальную систему символов. Каждая компания пытается сделать меню своих систем интуитивным, чтобы в них смогли разобраться люди, не знающие конкретного языка. Для этого им достаточно будет понимать универсальные символы. Принцип работает, пока потребитель не сталкивается со специфическими операциями.

К примеру, сегодня во всех супермаркетах Ташкента используются «умные» весы. Потребитель может самостоятельно взвесить покупку, ввести ее код, а весы посчитают сумму и распечатают ценник. Процедура очень проста, пока не доходит до распечатки ценника. Для этого нет универсального символа, да и знакомых слов на английском здесь не найдешь. Цвет кнопок тоже ни о чем не говорит. Только из-за этого потребителям раз за разом приходится звать продавца для взвешивания продуктов.

С языковым барьером сталкиваются и местные министерства, предприятия, цеха и заводы при покупке иностранного оборудования и техники. Некоторым даже приходится организовывать краткосрочные языковые курсы для своих сотрудников. Такие меры просто необходимы, если сотруднику предстоит эксплуатировать дорогостоящую иностранную технику или сложные программы.

Своим положением в языковом рейтинге недовольны и итальянцы. Недавно жителей Апеннинского полуострова возмутило, что последние, готовящиеся к релизу компьютерные игры никто не планирует переводить на их родной язык. Они пригрозили, что если подобное отношение продолжится, то они перестанут покупать игровые новинки.

Свое отношение к языковой политике игровых компаний не раз высказывали и русскоязычные пользователи онлайн-сервиса цифрового распространения компьютерных игр и программ Steam.

25 августа 2021 года на консолях Xbox, PlayStation и персональных компьютерах вышла игра Psychonauts 2. Игру перевели на французский, итальянский, немецкий, испанский, бразильский и португальский языки. Отсутствие локализации возмутило русскоязычных и китайских игроков, и они начали занижать рейтинг Psychonauts 2 на Metacritic. 27 августа 2021 года рейтинг игры на агрегаторе упал до 3,7 балла из 10, но к 29 числу вырос до 4,3 балла. При этом негативные отзывы об отсутствии поддержки русского языка пока не удалили. Стоит отметить, что Psychonauts 2 – это неплохая игра с увлекательным геймплеем.

Psychonauts 2

Проблему локализации может решить машинный перевод, но и здесь не все так просто. Эта технология появилась более двадцати лет назад и все эти годы совершенствовалась. Сейчас в нее интегрируют возможности искусственного интеллекта и машинное обучение. Лидерами в этой сфере можно считать компании Google и «Яндекс». Они постоянно проводят исследования, и их языковые базы больше, чем у кого-либо.

Летом 2021 года «Яндекс» протестировал свою технологию машинного перевода видео. После успешных испытаний поисковик открыл технологию для массового использования. Теперь каждый может посмотреть с русской озвучкой практически любой англоязычный ролик.

Яндекс перевод

За последние десять лет разработчики действительно сильно продвинулись вперед в машинном переводе. Практически любой грамотно составленный текст на языках стран Европы можно перевести на русский через сервисы Google и «Яндекс». Полученный текст практически не будет нуждаться в редактировании, настолько хорошо машины научились понимать европейские языки. Что касается узбекского, здесь все не так радужно. Невозможно найти электронные устройства или сервисы, которые корректно распознают и воспринимают узбекскую речь и язык в целом. Даже последние технические решения от «Яндекс» или Google не всегда отличают узбекский язык от других родственных ему, а качество машинного перевода оставляет желать лучшего.

Онлайн-переводчики начали переводить с узбекского относительно недавно. Первоначально они воспринимали только тексты на латинице, кириллица была добавлена позже. При этом они адекватно переводят только отдельные слова и словосочетания. Когда нужно перевести целые предложения или большой объем текста, возникают проблемы. Машина просто игнорирует непонятные ей предложения и выбрасывает их из конечного текста. Переводчик может и вовсе перепутать языки и начать перевод с таджикского.

Поэтому ПРООН в Узбекистане на базе краудсорсингового проекта Mozilla Common Voice запустило инициативу UzbekVoice.ai – открытую базу узбекской речи, используемую для машинного обучения. Это должно устранить нехватку голосовых данных на узбекском языке, которая мешает развитию локальных стартапов и инновационных проектов.

Чтобы принять участие в проекте, пользователям, говорящим по-узбекски, необходимо отправить свой голос в языковую базу Mozilla Common Voice. Она будет использоваться, чтобы научить алгоритмы искусственного интеллекта понимать узбекскую речь и расширять ее применение.

Проблема языковой локализации некуда не денется, если не принимать соответствующих мер. Производители будут экономить на переводе, а машины так и не научатся грамотно воспринимать узбекский язык.

Добавить комментарий

Ваш адрес email не будет опубликован.

Top.Mail.Ru