Не выкупает иронии: может ли искусственный интеллект переводить художественные тексты?
Будущее без работы?
В начале 2019 года мир всколыхнула новость: впервые в истории с помощью специальной программы удалось перевести целую книгу — и не какую-нибудь, а 800-страничный научный труд. Речь о книге «Глубокое обучение» авторства нескольких американских специалистов по работе с данными. Перевод с английского на французский сделали сотрудники компании Quantmetry на базе немецкой программы-переводчика, опирающейся на искусственный интеллект, DeepL. Заняла работа всего 12 часов.
Чуть больше чем через год ньюсмейкером стал уже отечественный «Яндекс». В конце 2020 в России впервые появилась в продаже книга, полностью переведенная с английского на русский с помощью ИИ. Как это ни иронично, речь о нон-фикшене американца Дэвида Сасскинда «Будущее без работы. Технологии, автоматизация и стоит ли их бояться». С 350-страничной книгой «Яндекс. Переводчик» справился за рекордные 40 секунд. Как рассказал потом журналистам главный редактор издательства Individuum (именно оно выпустило труд) Феликс Сандалов, переводу понадобилась редактура, но в итоге по времени весь процесс занял не больше, чем работа над переводом «среднего качества».
Что же выходит? Машинные переводчики уже «доросли» до того чтобы самостоятельно справляться с большими и сложными текстами, а не только со страницами «Википедии» и подборками мемов на BuzzFeed? Искусственный интеллект вот-вот убьет потребность рынка в «живых» переводчиках, и максимум на что смогут рассчитывать выпускники лингвистических вузов, — это работа редактора, «подчищающего» редкие ошибки за компьютерным разумом?
Если на первый вопрос можно с полной уверенностью ответить утвердительно (автоматические переводчики давно успешно работают с длинными и относительно сложными текстами), то, отвечая на второй, эксперты сегодня проявляют редкое единодушие: несмотря ни на что, профессию переводчика искусственный интеллект не убьет. По крайней мере — в ближайшее время.
Далек от совершенства
«Я запряг ChatGPT, чтобы он перевел мою немецкоязычную книгу Tourismus NEXT на английский язык, — делится своим опытом в статье на Medium исследователь туристического бизнеса из Германии Даниэль Эггер. — Использовал версию 3.5 с сильной функцией перевода и инновационным искусственным интеллектом. Результат показал некоторый потенциал, но все-таки для публикации был слишком сырым. В числе прочего текст изобиловал страдательным залогом и союзом "но", в нем не хватало ссылок на цитаты, а в некоторых местах перевод был неточным, потому что ИИ не понял контекста». Чтобы отредактировать перевод, Эггер воспользовался программой для профессиональной редактуры Grammarly — та рекомендовала внести в 140-страничный текст 1857 правок. Сделав это, автор снова обратился к ChatGPT, чтобы улучшить стиль повествования. В итоге версии 3.5 и 4.0 с заданием справились неважно: одни фразы они чересчур упростили, другие, наоборот, сделали слишком многословными, так что в общей сложности доработка текста заняла у Эггера 50 часов. «Этот опыт показал ограничения в работе искусственного интеллекта и важность человеческого вклада в деле создания точного и безошибочного перевода, — подытоживает автор. — В процессе работы я досконально понял как то, на что на самом деле способен ИИ, так и то, с какими трудностями он сталкивается, когда пытается копировать человеческий язык со всеми его нюансами».
Пример Даниэля Эггера наглядно объясняет, почему ни в России, ни за рубежом перевод книг с помощью искусственного интеллекта до сих пор так и не стал мейнстримом — единичные случаи пока остаются единичными. А ведь в истории немца речь шла о нон-фикшене, что уж говорить о художественных текстах, где смыслов, нюансов и игры слов может быть в разы больше? «Искусственный интеллект способен перевести вашу книгу сразу на несколько языков за несколько секунд или минут, тогда как у человека такая работа займет месяцы, а то и годы, — объясняет реальным и потенциальным клиентам британский писатель и редактор Бен Уоттс, основатель редакторского бюро Watts Editing. — Отсутствие необходимости тратить человеческие ресурсы выливается еще в одно преимущество — автоматический перевод стоит в разы дешевле. Звучит заманчиво, но все же недостатков использования ИИ для перевода больше, чем достоинств». Далее редактор перечисляет слабые места автоматических переводчиков. В числе прочего это, по мнению Уоттса, неточность, нечувствительность к идиомам и культурному контексту. «А кроме того, — продолжает Уоттс. — ИИ не умеет распознавать творческие приемы внутри текста. Язык художественных книг часто бывает сложным, авторы используют стилистические ухищрения. Чтобы их понять и суметь перевести корректно, нужно глубоко понимать текст и тот контекст, в котором он создавался. В противном случае читатели просто не поймут всех нюансов оригинального текста и будут разочарованы».
В 2023 году в портфелях российских издательств по-прежнему нет книг, переведенных с помощью ChatGPT или любого другого машинного переводчика — и, как заявляют инсайдеры индустрии, в ближайшее время такие книги вряд ли появятся. «Для нас очень важно качество переводов, а ИИ пока в этом отношении далек от совершенства», — говорит главный редактор издательства «Альпина. Проза» Татьяна Соловьева.
С коллегой согласна главный редактор нового издательства «Дом историй» переводчица Анастасия Завозова. Она утверждает, что искусственный интеллект пока никак не повлиял ни на издательский рынок, на на рынок художественного перевода. «Слышала от коллег неприятные истории о том, что иногда им присылали сданные переводы, где явно кусками шли остатки гугл-транслейта (это обычно очень заметно и легко вычисляется), но напрямую с таким не сталкивалась, — рассказывает Завозова. — Работа переводчика художественной литературы — это создание нового текста с новым контекстом, всегда работа с нуля, и ты не можешь использовать чужие наработки, потому что от них просто нет толку. Попросить перевести или сформулировать что-то ChatGPT будет бессмысленно: обычно переводчику, особенно если он осознанно берется за перевод художественной книги, важен и интересен не результат, а процесс перевода. Если его убрать из уравнения, работа теряет смысл».
Похожая история и с переводами кино и сериалов. Несмотря на то что IT-специалисты грозятся «перевернуть индустрию кино» и создают — как, например, сотрудники израильского стартапа Al Dubbing — программы, способные одновременно переводить на несколько десятков языков и озвучивать, сами инсайдеры киноиндустрии до сих пор настроены скептически. «Великий спор о том, убьет ли профессию Google Translate, начался и закончился еще до того, как я стала переводчиком — а переводчиком я стала 10 лет назад, — говорит Дарья Фирсова, в послужном списке которой, в числе прочего, работа над сериалами "Друзья", Star Trek и "Шерлок". — Несмотря на то, что за эти годы машинный перевод прошел большой путь, для художественных текстов он по-прежнему не подходит категорически — особенно когда речь идет об аудиовизуальном контенте. Иногда в художественном переводе фразу нужно полностью переписать, потому что на русском та же фраза, гладкая, хорошая, состоит из абсолютно других слов. А в случае с кино нужно еще держать в голове множество параметров — сюжет, персонажи, "укладка". "Укладка" — это синхронизация строк по длине, паузы в нужных местах, вдохи и выдохи, смыкание губ. В случае с английским часто приходится решать, кто к кому на "вы", а кто на "ты". У меня для этого есть специальная таблица, которая, позволяет не забыть, что, скажем, в 14-й серии герои перешли на "ты", потому что поцеловались. Никакой, даже самый мощный ИИ не сможет учесть этих нюансов».
Полезный помощник с хорошим потенциалом
Цели «уничтожить» профессию переводчика не ставят перед собой и сами разработчики ИИ — по крайней мере, пока. И, по крайней мере, российские.
Директор по развитию технологий искусственного интеллекта «Яндекса» Александр Крайнов утверждает, что главная цель программ для перевода — техническая точность. Ни один «искусственный» переводчик не предназначен для того, чтобы превращать исходный текст в художественный — это невозможно сделать без участия человека. «Здесь, помимо хорошего знания непосредственно языка, нужны фантазия, стиль, чувство языка и культурный контекст. Это подтверждается тем, что переводы литературных произведений разных авторов сильно различаются: можно сказать, что каждый перевод, например, одного и того же сонета Шекспира — это отдельное произведение, имеющее самостоятельную ценность», — комментирует Крайнов.
При этом, что будет через несколько десятков лет, точно не знает никто. Возможно, переводческие программы на базе ИИ станут такими мощными, что способны будут заменить людей — но все равно не самых квалифицированных.
Как объясняет Александр Крайнов, современные программы для перевода обучаются преимущественно на так называемых «параллельных корпусах» — больших массивах одинакового текста на разных языках. «Алгоритму "показывают" большое число специально размеченных текстов на исходном и целевом языках. По этим примерам система сама находит в текстах на разных языках закономерности, на которых строится перевод», — рассказывает о процессе обучения нейросети Крайнов.
Как известно, все, что можно обучить — можно усовершенствовать. Главное здесь, как всегда, время, человеческий ресурс и деньги. «Нейросети можно не только обучать, но и "дообучать", — рассказал "Правилам жизни" сотрудник компании по производству программ на базе ИИ, пожелавший остаться анонимным. — То есть можно взять, например, массивы оригиналов и массивы переводов, сделанных Ритой Райт-Ковалевой, и догрузить их в тот же ChatGPT, чтобы он "научился" на этих примерах. В результате он научится ставить следующее слово в предложении примерно как Рита Райт-Ковалева. Просто сейчас это все еще дорого, сложно, у издательств, особенно российских, другие приоритеты».
Уже сейчас некоторые переводчики поручают искусственному интеллекту черновую работу — это позволяет сильно экономить время, а значит, больше зарабатывать. «В качестве вспомогательного элемента ИИ полезен, — говорит Татьяна Соловьева из издательства "Альпина. Проза". — Он, например, может сделать черновой файл перевода для дальнейшей обработки профессиональным переводчиком: это значительно экономит время работы над текстом. Ближайшая аналогия здесь — подготовка для печати интервью журналистом. Можно расшифровывать диктофонную запись вручную, а потом приступать к редактуре, а можно прогнать файл через электронный расшифровщик, поправить неточности и редактировать получившийся черновик».
Не исключено, что с течением времени усовершенствованные программы смогут брать на себя больше — например, полностью переводить несложную жанровую прозу. Переводчица и главред «Дома историй» Анастасия Завозова признается, что допускает такую возможность — правда, в довольно отдаленном будущем и с некоторыми оговорками. «За триллеры, любовные романы, понятные и простые фабульные истории хорошие переводчики берутся редко, там мало интересного в процессе, и у нас есть катастрофическая нехватка переводчиков именно для сегмента простой беллетристики, — объясняет Завозова. — Так что почему бы и нет? Но сложность художественного перевода в том, что это работа, которую не так-то просто поставить на поток – это в принципе работа, которая требует очень много человеческого. И даже если в какой-то момент можно будет использовать нейросети для первичного чернового перевода легких жанровых книг, я не уверена, что при нашей с вами жизни нейросети смогут идеально перевести».
Вопрос лишь в том, согласен ли будет читать «неидеальный» перевод конечный потребитель. Вполне возможно, да. Особенно, если речь будет идти о книге, написанной на «непопулярном» языке, «живых» переводчиков с которого найти сложно. Есть шанс, что через несколько десятков лет мы куда чаще сможем читать авторов, пишущих, например, на суахили или тайском. А раз так, то именно ради этого и стоило бы совершенствовать переводческие программы.