Машинный перевод в профессии переводчика

Пелагея, прежде всего, спасибо, что нашли время и согласились ответить на наши вопросы. Вы практикующий переводчик (английский, немецкий), однако я знаю, что кроме непосредственно переводов Вы занимаетесь интересным проектом в сфере машинного перевода. У этого занятия есть много направлений. На сколько мне известно, Вы занимаетесь совершенствованием машинного перевода. 

— Расскажите, пож-та, в чем конкретно заключается Ваша работа?

Александра, благодарю Вас за предложение рассказать об одном из моих проектов, посвященному совершенствованию машинного перевода. Этот процесс можно сравнить с преподаванием. Моя задача – обучить машину с искусственным интеллектом (далее – ИИ). Этот процесс проходит в несколько этапов:

  1. Я прорабатываю определенную информацию (контекст) и предоставляю машине первичный лингвистический анализ, который переводится в машинный код благодаря компьютерным лингвистам и программистам. 
  2. Машина получает данные, считывает их, запоминает информацию (как ученик), а затем выдает результат. 
  3. Я проверяю работу автоматического перевода, совершенствую полученный результат, и вместе с коллегами мы даем ей обновленное задание. 

Так мы работаем до тех пор, пока машина не выдаст «идеальный» результат с точки зрения грамматики, лексики, стилистики и учета восприятия носителей языка. Последнее пока остается самой трудной задачей. 

— Проходили ли Вы какое-либо специализированное обучение по данному направлению?

По образованию я – лингвист, а также практикующий письменный и устный переводчик, а моя диссертация на соискание ученой степени кандидата наук посвящена когнитивным механизмам. Поэтому это как раз те знания, которые необходимы для анализа полученных данных и формулировании новых задач для ИИ. 

Однако мне не хватает знаний компьютерной лингвистики, чтобы чувствовать себя еще более причастной к этому процессу, поэтому планирую пройти обучение в этой сфере. 

У многих, когда слышат о машинном переводе, приходит на ум только Google translate и в воображении всплывают перлы гугл-перевода из интернет-мемов “Перевод всем известного предложения в паре русский – китайский – русский: Саша шел по шоссе и вел сушилку”. Как сейчас обстоят дела с машинным переводом?

Так как я работаю только с английским и немецким языком, не могу точно сказать, как сейчас обстоят дела с китайским :) Что касается английского и немецкого языков, то надо сказать, что google в этом направлении шагнул вперед – в некоторых высказываниях даже учитываются тема-рематические связи. Подача новой и старой информации в разных языках может отличаться, например:

Рус: В аудиторию зашла девушка. («Девушка» – это новая информация (рема), в русском языке она ставится в конец). 

Англ: A girl entered the room. («A girl» стоит в начале, в английском языке рема выносится вперед). 

Поэтому машинный перевод уже далеко не тот, что был раньше, когда вызывал смех в связи с подобными ошибками (в английском и немецком языках точно). 

— Пелагея, Вы используете в работе Google translate , конечно, с пост-редактированием или пока рано говорить о его использовании в работе?

Для перевода технической документации я использую программу SDL Trados – она помогает сэкономить время для перевода похожих текстов, в эту версию уже включен Google translate, и они работают в тандеме. У них абсолютно одинаковый алгоритм работы сейчас – обе сети являются нейронными, они анализирует контекст на количество полученных совпадений и выдают наиболее частотный результат, который был заложен как раз лингвистами и программистами.

— Кто является основным работодателем в сфере машинного перевода в России? Где и как искать подобные вакансии/проекты? Какие требования предъявляют потенциальным кандидатам?

Насколько мне известно, из российских представителей, которые нанимают специалистов не просто для пост-редактирования машинного перевода (как это делают многие бюро переводов), а именно совершенствования алгоритмов и обучения ИИ, являются компания «Яндекс» и «Promt». У них есть своя группа лингвистической экспертизы, которая занимается не только улучшением ИИ, но и переводами в целом. Думаю, надо следить за их вакансиями или отправить свое резюме в соответствующий департамент, возможно, есть стажировки или временные проекты.

Требования к кандидатам – лингвистическое/филологическое образование, знание 2-х языков, навык письменного перевода (устный не будет лишним, так как помимо письменного перевода совершенствуется также голосовой перевод), желательно быть выпускником таких программ как «Фундаментальная и компьютерная лингвистика», «Компьютерная и прикладная лингвистика». 

20 ноября 2020 года в онлайн-формате состоялась ключевая конференция по машинному переводу – Workshop and Machine Translation (WMT20), организованная международной Ассоциацией компьютерной лингвистики (ACL). В мероприятии приняли участие разработчики систем машинного перевода со всего мира. ACL организует практическую часть, которая включает тренировку систем машинного перевода на предложенных материалах, а также оценку качества машинного перевода. Среди заданий практической части – News Translation Task (перевод новостных текстов), Chat Translation Task (перевод обращений в службу техподдержки), MT Robustness (устойчивость систем к новым доменам) и многие другие.

— В рамках этого направления требуется обучить систему машинного перевода на предложенных организаторами новостных текстах и их переводах, а затем перевести тестовые данные с помощью натренированной системы. На конференции многие отметили, что: “Нейросетевой машинный перевод по качеству не уступает переводу, выполненному человеком, а во многих случаях – даже превосходит его с точки зрения точности”. Есть ли метрики оценки качества машинного перевода?

Да, существует два вида оценки качества машинного перевода: экспертная и автоматическая оценка. 

Экспертная оценка включает в себя такие критерии как точность передачи смысла исходного текста, естественность (грамматика и лексика), легкость восприятия текста, стиль. Мы с коллегами сравниваем полученные переводы и упорядочиваем их, создавая иерархию переводов, в которой используются следующие соотношения: «лучше», «хуже», «одинаковое качество». 

Также в некоторых случаях используется шкала Ликерта, согласно которой перевод оценивается по пятибалльной шкале: «1» – перевод не передает содержание оригинального текста» -> «5» – перевод полностью передает содержание оригинального текста. Важно отметить, что здесь важную роль играет не только грамматика и лексика, но и адекватный перевод терминологии и стиль. 

Автоматическая оценка, в свою очередь, представляет собой сложный механизм. Это программа, которая вычисляет совпадения согласно заданным параметрам, этим как раз компьютерные лингвисты занимаются. Используется алгоритм BLEU, который оценивает качество перевода по шкале от 0 до 100. Он сравнивает переводы и ищет совпадения, общие фрагменты. Чем больше совпадений, тем лучше перевод, но, думаю, очевиден тот факт, что этого пока недостаточно для адекватной оценки перевода, и данный алгоритм еще в процессе совершенствования.

— В каких сферах планируют тестировать машинный перевод в первую очередь? Мне кажется, это могут быть сферы, где легко набрать множество шаблонов, допустим, деловая переписка в крупных компаниях, туризм, служба поддержки. Или машинный перевод уже вышел за пределы этих базовых тем?

Вы абсолютно правы, это в первую очередь достаточно однотипные тексты – техническая документация, договоры, некоторые направления в медицине. Прежде всего необходимо обучить ИИ ориентироваться в этих сферах.

— Слышали ли вы о выходе в России  книги, которую за 40 секунд перевел искусственный интеллект — «Яндекс.Переводчик», а обложку нарисовала нейросеть? Это труд  британского экономиста Дэниела Сасскинда «Будущее без работы. Технологии, автоматизация и стоит ли их бояться». Как думаете, что ждет переводчиков (устных и письменных) и как изменится их работа?

Да, эта книга действительно была переведена Яндекс.Переводчиком, однако после этого была проделана серьезная работа редактором, несмотря на то, что некоторые не отредактированные фрагменты текста все таки остались в книге. Отсюда и вытекает вывод – проработка текста после работы ИИ необходима. 

Сложно предположить, как может измениться работа письменных и устных переводчиков. Спрос на человеческий перевод сейчас очень высокий, и это очевидно, ведь главная задача переводчика – передать не просто смысл, но и намерения автора, которые часто могут быть скрыты. 

В любом случае, для обучения ИИ необходимы лингвисты и практикующие переводчики, данную систему необходимо все время обновлять, так как язык – живой организм, он никогда не стоит на месте и все время меняется, обновляется, а языковая картина мира у представителей каждой культуры абсолютно разная. 

— Исходя из того, как быстро меняется реальность в профессии, стоит ли молодому поколению письменных переводчиков проходить дополнительное специализированное обучение редактуре и глубже изучать родной язык? По Вашим наблюдениям, может ли наблюдаться повышенный спрос на редакторов в перспективе?

Да, сейчас уже идет повышенный спрос на редакторов текста. Свой родной язык, безусловно, надо тренировать и развивать языковое чутье, это ведь в самом переводе пригодится. Думаю, курс по редактуре был бы полезен для практикующих переводчиков, так как это поможет им расширить возможности профессии, получить новые проекты, а также более критично оценивать свой письменный перевод. 

Дело в том, что переводчик-редактор – это не просто редактор грамматических ошибок и пунктуации, это связующее звено между оригиналом и переводом, обязательно нейтральное. Его задача – принимать во внимание то, что именно хотел донести автор, и отражено ли это в переводе, не «перетянул» ли на себя одеяло переводчик, и как это избежать. Приходится находить компромисс между двумя сторонами и даже избегать конфликтов между автором, переводчиком и редактором. Всему этому нужно учиться. Особенно это касается перевода, например, художественных текстов, на мой взгляд, это самый сложный вид деятельности, так данный процесс является творческим, и при передаче на другой язык приходится чем-то жертвовать, где-то компенсировать элементы текста, не теряя смысл.

Также сейчас много отечественных исследователей, ученых, которые публикуют свои работы на иностранным языке в разных направлениях (физика, химия, биология, медицина и др.), и для их более эффективной работы нужен лингвист-редактор, который желательно должен владеть навыками перевода и обладать знаниями механизмов и трансформаций, согласно которым перевод осуществляется. Это также является одним из моих проектов, когда проводится полная лингвистическая экспертиза текста с точки зрения грамматики, лексики, пунктуации, стиля, восприятия (даже аудитория, на которую пишет автор исследования, учитывается). Редактор полностью оценивает и прорабатывает текст, и вместе с исследователем они доводят научную работу до максимально высокого уровня. Тут надо отметить, что для адекватной работы необходимо изучить тему исследования полностью, ознакомится с предыдущими работами автора, это  достаточно трудоемкий процесс. 

Поэтому, как мы видим, возможностей для данной профессии много.

— Как вы считаете, готово ли академическое образование к таким стремительным переменам в профессии? Возможно, Вы знаете, делается ли что-то, чтобы успеть за изменениями рынка? 

К сожалению, в академическом образовании сейчас наблюдается множество недостатков в обучении переводу в целом. Это было отмечено на конференции «Перевод и культура: взаимодействие и взаимовлияние» (10-11 октября 2020 г.). Сейчас идут переговоры с Министерством Образования на тему реформы программ по подготовке переводчиков, чтобы не только отвечать потребностям рынка, но и помочь будущим специалистам получить навык как письменного, так и устного перевода и развивать его в нужном русле.

Спасибо за вопросы, была рада на них ответить! :)

______________________________________________________________

Беседовала Александра Херина, руководитель онлайн-школы устного перевода lingvadiary.ru

На вопросы отвечала Пелагея Рыкова, практикующий переводчик (английский, немецкий языки).

Подписывайтесь на Пелагею в Instagram: pelagea.rykova

 

Поделитесь статьей
Поделиться в vk
Поделиться в facebook
Поделиться в telegram
Поделиться в email
Поделиться в whatsapp

Идет набор на весенний сезон обучения. Старт - 15 апреля 2024 г.