Агентство Лангуст [переход на главную] Langust
Яндекс.Метрика

01/08/2019 Translate-баттл: могут ли онлайн-переводчики передавать стиль текста?
Впервые опубликовано на сайте «Системный Блокъ»

На сайте «Системный Блокъ» была опубликована статья о качестве машинного перевода.

Ниже материалы статьи приведены полностью.

«Мой мозг застрял в черепе», «He was introduced to the wells», «филиал исследований» и другие приключения онлайн-перевода

Фраза «Старый добрый Гугл-транслейт» уже стала поговоркой XXI века. При этом люди необязательно говорят именно об американской технологии: многие пользуются переводчиком от Яндекса, а кое-кто искренне уверен, что лучше сервиса PROMT купить программы компании ПРОМТ ничего не найти. Машинный перевод умнеет на глазах: сейчас мы читаем осмысленные тексты там, где ещё месяц назад был набор словосочетаний, плохо поддающийся пониманию. Однако есть один аспект, который относится не столько к тому, ЧТО написано, сколько к тому, КАК это сделано. Стиль изложения уникален для каждого текста, особенно в художественной и публицистической литературе. Понимают ли эти особенности онлайн-переводчики? Посмотрим на примере сервисов Google Translate, PROMT RBMT, Systran и Яндекс.Переводчик.

Немного теории

Виды машинного перевода

Как мы уже знаем, существует два основных подхода, которые лежат в основе технологии машинного перевода. Первый подход основан на правилах (англ. rule-based), второй - на статистике (англ. statistical-based).

Перевод на основе правил подразумевает использование словаря и грамматики языка-оригинала и языка перевода. Точность перевода по правилам зависит от полноты данных используемых словарей.

Статистический машинный перевод на сегодняшний день является доминирующим.

Принцип его работы заключается в следующем: в память системы загружается большое количество параллельных текстов (то есть тексты с одной и той же информацией, написанной на разных языках), которые в дальнейшем будут являться основой для перевода. Статистическая модель разбирает входные предложения на слова и фразы, перебирает все варианты перевода и оценивает вероятность каждого из них, после чего составляет несколько вариантов перевода предложения целиком и выбирает в качестве результата вариант, в котором фрагменты обладают наибольшим вероятностным весом.

В последние годы практически все сервисы машинного перевода стали использовать так называемый гибридный принцип работы, поскольку теперь работу поддерживают обучаемые нейронные сети.

Оценка

процент ошибок при машинном переводе художественных текстов

Когда мы получаем онлайн-перевод нужного нам текста, то сразу можем сказать, хороший он или плохой. Но экспертам и разработчикам онлайн-сервисов машинного перевода нужны более чёткие критерии оценки, поскольку так они смогут увидеть, в каких аспектах тот или иной сервис «слабоват» и что можно сделать, чтобы его улучшить.

В современном переводоведении машинный перевод можно оценить ручным и автоматическим способами. Разработкой ручной оценки занимался Макото Нагао, который предложил оценивать машинный перевод, основываясь на лингвостилистическом анализе.

Так, шкала оценивания содержит от пяти до одного баллов: перевод получает 1 балл, если понятен смысл предложения, грамматика и стиль не требуют постредактирования; 2 балла ставится, если смысл предложения понятен, но возникают большие проблемы с грамматикой, лексическим наполнением и стилем; 3 балла перевод заслуживает, если понятен общий смысл предложения, но некоторые его части вызывают сомнение ввиду неправильного грамматического строя; при наличии ошибок словоупотребления и стилистики выставляется 4 балла; если же в предложении имеется большое количество грамматических, лексических и стилистических ошибок, смысл предложения с трудом понимается даже после внимательного изучения, перевод оценивается в 5 баллов.

В сравнении с ручным методом автоматическая оценка перевода предполагает очевидные плюсы использования: прежде всего она значительно дешевле, чем проверка экспертами, а кроме того предполагает максимальную объективность оценивания, что весьма труднодостижимо в работе человека.

Самым используемым способом автоматической оценки является эталонное сравнение: для текстового корпуса экспертами подготавливаются образцы, с которыми потом и сравнивают переведённые тексты. Сравнение проводится на основе метрик, набор которых весьма велик. Самыми известными метриками являются BLEU, а также её надстройки METEOR, NIST и WER. Они работают с N-граммами - последовательностями из n-элементов, которые могут быть представлены звуками, буквами, слогами или словами.

процент ошибок при машинном переводе научных текстов

Самой распространённой является программа BLEU. Как мы помним, у этой метрики есть существенный недостаток: она может недостаточно высоко оценить перевод только из-за несовпадения количества слов в структуре или другого, хотя и уместного выбора слов.

Для преодоления недостатков BLEU разработчики создали метрику METEOR, в которой за единицу оценки принимается слово, а также допускается перифраз в тексте перевода и учитывается изменение слов флективным способом. Это позволяет метрике немного приблизиться к качеству ручной оценки машинного перевода. Как надстройка к BLEU была разработана и метрика NIST. Она также вычисляет количество повторения n-грамм, оценивая полноту и точность текста, но при этом придаёт больший вес редким n-граммам и определяет степень информативности в повторяющихся n-граммах. Метрика Word Error Rate (WER) изначально использовалась для оценки работоспособности систем по распознаванию речи, но позже была адаптирована и для работы с машинным переводом. Чтобы с помощью WER получить оценку перевода, необходимо сложить все вставки, удаления и замены, сделанные относительно эталонных предложений, и разделить сумму на длину эталонного предложения. Перевод тем лучше, чем ниже значение WER.

Метрики автоматической оценки сейчас достаточно популярны, однако их существенный недостаток заключается в том, что полученный результат не может быть полностью адекватным, поскольку при такой оценке не ставится задача понимания семантики и стилистики текста, а это может привести к весьма неточному конечному результату.

У всех этих способов оценки есть один большой минус: в них уделяется внимание скорее грамматической стороне текста перевода, в то время как тексты мы различаем благодаря стилю, в котором они написаны. В романе, деловом письме или научно-популярной статье предложения будут написаны по одним грамматическим правилам, но стиль не позволит нам назвать статью романом. И это самая слабая на сегодняшний день сторона машинного перевода. Именно поэтому имеет смысл рассмотреть возможности популярных онлайн-переводчиков по сохранению стилистических особенностей текстов оригинала.

Много практики

Отбор материала
процент ошибок при машинном переводе официально-деловых текстов

Для этого небольшого эксперимента было решено рассмотреть тексты 4 основных функциональных стилей: художественного, научного, официально-делового и публицистического. Для отбора использовался метод свободной выборки, и результатом стал следующий список фрагментов текстов в языковой паре русский-английский:

Для каждого жанра были определены стилистические особенности, нарушение которых предполагается классифицировать как ту или иную стилистическую ошибку. Таким образом, общими особенностями для изучаемых текстовых стилей становятся:

Для художественного стиля:

Для научного стиля:

процент ошибок при машинном переводе публицистичесих текстов

Для официально-делового стиля:

Для публицистического стиля:

Ошибки, соответственно, представляют из себя:

итоговое соотношение всех допущенных ошибок при машинном переводе

В художественном стиле:

В научном стиле:

В официально-деловом стиле:

В публицистическом стиле:

Анализ переводов

Для начала были найдены экспертные (выполненные профессионалами) переводы текстов, отобранных для исследования. Затем они были снова переведены сервисами онлайн-перевода на язык оригинала, и полученный перевод сопоставлялся со своей первоначальной версией, например:

Оригинал:

«The network maps show what is already widely known: If you want to get your ideas out, you can reach a lot of people through the English language. But the maps also show how speakers in disparate languages benefit from being indirectly linked through hub languages large and small. On Twitter, for example, ideas in Filipino can theoretically move to the Korean-speaking sphere through Malay, whereas the most likely path for ideas to go from Turkish to Malayalam (spoken in India by 35 million people) is through English. These networks are revealed in detail at the study's website».

Вариант переводчика PROMT:

«Sometimes networks tell us already widely known facts. For example, not news (грам) that if you want that you were heard (пр.пер), you should use English.(стил) However they also show that carriers of the most different languages sometimes are the indirectly bound through nodal (нев.в) languages -(пункт) large and shallow (нев.в). Let's tell (стил!), into (грам) Twitter the idea stated on (грам)-fillipinski theoretically can pass in koreeyazychny (непер) users in the Malayan (грам), and the most probable way from Turkish to Malayalam (language which in India 35 million people speak (синт)) lies (нев.в) through English. More information can be got (стил) about networks on the research website».

Теперь осталось произвести подсчёт ошибок согласно классификации, составленной ранее на основе жанровых особенностей текстов.

Мы видим, что ни один исследуемый онлайн-сервис не способен на данный момент выполнить перевод, не потеряв в процессе большую часть стилистических особенностей исходного текста. В общей сложности онлайн-переводчики допустили 673 стилистические ошибки, из которых 208 ошибок было допущено сервисом онлайн-перевода PROMT RBMT, 160 сервисом SYSTRAN, 159 сервисом Google и 146 сервисом Яндекс. Есть и хорошие новости: иногда сервисам онлайн-перевода удаётся подобрать перевод, полностью совпадающий с оригинальным текстом, хотя эти случаи на данный момент - исключение из правил.

Что делать?

Пока что единственное, что могут сделать обычные пользователи - исправлять текст непосредственно в окне перевода, а затем использовать по своему усмотрению. Так системы будут накапливать возможные комбинации слов и их сочетаний, и процесс улучшения качества перевода ускорится. Эта функция доступна у Яндекса и Google. К сожалению, PROMT и SYSTRAN такой возможности не предоставляют.

© Анастасия Гарькуша

Впервые опубликовано на сайте «Системный Блокъ»

← Вернуться
хостинг для сайтов © Langust Agency 1999-2019, ссылка на сайт обязательна