Машинный перевод технических текстов
Карэн Исагулиев
Довольно долго занимаясь техническими переводами "в особо крупных размерах", я накопил определенный опыт, которым и решил поделиться.
ОБЩИЕ СООБРАЖЕНИЯ:
Машина переводит хуже человека.
Точно настроенный машинный перевод облегчает дальнейшую работу переводчику.
Поэтому:
Всю рутинную работу должна делать машина, а не переводчик.
Переводчик обязан отредактировать машинный перевод.
АЛГОРИТМ
Сначала выполняется подготовка исходного текста;
Затем выполняется перевод в программе ProMT;
Затем полученный машинный перевод редактируется вручную.
I. ПОДГОТОВКА ТЕКСТА К МАШИННОМУ ПЕРЕВОДУ
Исходный англоязычный текст переносится в документ Word копированием/вставкой и форматируется вручную следующим образом:
При переносе текста с каждой страницы сразу вставляются в нужные места метки иллюстраций и подрисуночные подписи (напр. "рис. 07-01; Table formatting). Графический файл самой иллюстрации сразу переименовывается в 07-01.tif
Вставлять метки иллюстраций после ухода с ее страницы (например, по окончании переноса текста всей части или всего руководства) гораздо труднее - приходится заново возвращаться на те же страницы и искать соответствующие места в тексте. Переименовывать графические файлы удобнее сразу с помощью программы просмотровщика графики типа ACDSee.
Аналогично - сразу - выстраиваются имеющиеся на исходной странице списки и прочие конструкции - кроме таблиц - которые потерялись при переносе. Таблицы выносятся в отдельный файл и переводятся особо.
Убираются лишние переносы строк (символы "Enter") в середине предложений - если этого не сделать, то при автоматическом переводе части одного разорванного предложения будут переведены как разные предложения.
Добавляются необходимые пробелы (например, в сочетании "Note:It is recommended..."), вставляются опущенные при переносе символы (например, "a" в сочетания "size, nd color", или "o" в "red r green").
В Worde это удобно делать Заменой (CTRL+H) потому что одна ошибка зачастую повторяется в нескольких местах текста.
ДУМАЙТЕ перед тем как запустить Замену по всему тексту!
Рекомендую предварительно проверить Замену с заданными параметрами на отдельном фрагменте текста.
Неверно заданная Замена может непоправимо покорежить весь текст - единственным способом иногда остается выход без сохранения. Поэтому перед Заменой рекомендую сохранить весь документ.
УМНО ДУМАЙТЕ ! И перед заменой думайте и перед тем как вобще что-нибудь сделать.
Но подумав, начинайте действовать - иначе любые размышления теряют смысл.
В командах типа File > New разделитель " > " с окружающим его пробелами заменяется на символ #. Promt не переводит конструкции с символом #. Сами команды переводятся Заменой ПОСЛЕ машинного перевода.
Скопируйте подготовленный текст и вставьте его в окно Promt. Пока не надо запускать процесс перевода.
В окончательном тексте названия всех элементов приложения (диалоговых окон, панелей, кнопок и проч.) приводятся на двух языках - английском и русском. Например: "диалоговое окно Preferences (Параметры)."
Поэтому в окне Promt вручную найдите и обозначьте все названия элементов как "зарезервированные слова".
Чтобы зарезервировать название в исходном тексте Promt, выделите его курсором и выберите команду "Перевод > Зарезервировать" или воспользуйтесь "горячей клавишей" CTRL+F8 или используйте соотв. кнопку в панели Инструментов.
Не увлекайтесь резервированием: некоторые слова встречаются и как названия и как обычный текст.
Пример: Delete может быть и командой и встречаться как обычный текст. Команда пишется с заглавной буквы, но Delete в начале предложения тоже пишется с заглавной.
В этом случае слова-Названия помечаются символом & (содержащие этот символ конструкции Promt не переводит), а слова-обычный текст оставляются без изменений.
Зарезервированное название выделяется зеленым цветом и при машинном переводе не изменяется.
Заметно улучшает качество машинного перевода подключение специальных словарей.
Запустите машинный перевод.
После машинного перевода проверьте в Promt полученный перевод. Найдите незарезервированные Названия, зарезервируйте их и запустите машинный перевод повторно. Попробуйте улучшить качество машинного перевода какими-то дополнительными заменами, резервированием, добавлением спец.символов и проч.
Скопируйте текст машинного перевода и перенесите его в новый файл Word.
Перевод команд (то есть File#New = File (Файл)#New (Новый)) выполняется все той же Заменой (CTRL+H) по всему тексту. Причем удобнее менять по отдельности "File# = File (Файл)#", "#New = #New (Новый)" так как одна и та же конструкция типа File# может встречаться в различных командах.
Word позволяет написать макрос и автоматизировать замену таких элементов.
Рекомендую проверить макрос на фрагменте текста.
Рекомендую записывать каждую замену как отдельный макрос - это позволяет контролировать ход работы и позволяет во-время заметить и исправить ошибку.
НЕ рекомендую объединять несколько замен в один макрос.
Затем текст бегло проверяется. После всех замен символ "#" в командах типа File#New заменяется на символ ">", а символ & заменяется пробелом.
II. РУЧНОЕ РЕДАКТИРОВАНИЕ
Полученный машинный перевод редактируется вручную.
Переводя технический текст, в первую очередь сохраняйте смысл.
Знание предмета облегчит работу и позволит избежать грубых ошибок в изложении.
Пример: команда Set as Home Page (Dreamweaver 4: Site > Set as Home Page) позволяет указать страницу, к которой в первую очередь будет обращаться броузер вместо страницы index.htm.
Буквальный перевод команды "Сделать домашней страницей" вводит пользователя в заблуждение и не передает действительного значения команды так как в русском языке домашней страницей обычно называется персональный - а не корпоративный - сайт.
Смысл важнее всего, жертвуйте буквой в пользу смысла: адекватный перевод Set as Home Page - "Сделать начальной страницей".
Переводите английский смысл русским языком. Текст переведен плохо, если сразу видно, что это перевод. Хороший перевод - правильная русская речь.
Помните: в английском языке логика английская - а не русская. В американском английском - когда как.
Не будете сами уважать свой язык - иностранцы не будут с вами считаться.
Пример: "Имплементация мувиков" - уже не по-английски, еще не по-русски.
Излагайте кратко и внятно - новички запомнят, а специалисты оценят удачную формулировку.
Можешь выразить мысль восемью словами - не трать девятое (слово).
"Слово"- уже лишнее, без него можно обойтись.
Необходимо знать терминологию и точно оперировать ею. Незнание или неправильное использование термина обесценит ваш труд в глазах специалистов.
Пример: Переводя encrypting как "криптование" (вместо "шифрование") вы выказываете неуважение к русскому языку и невежество в области информационной безопасности.
Не перегружайте текст терминологией - это затрудняет понимание и не придает значимости в глазах специалистов. Не прячьтесь за терминами - разберитесь с предметом и опишите его обычным языком.
Не скатывайтесь на жаргон - ваша задача не опускаться до малограмотных и новичков, а поднимать их на свой уровень. Это труднее, но это правильно потому что ведет вверх.
Пример: "таймлайн состоит из фреймов" - это не перевод. На самом деле "временная диаграмма состоит из кадров". (контекст Flash)
Не вводите новые термины без крайней необходимости - уважайте язык и будьте понятны пользователям.
Пример: "Script" переводится как "скрипт" потому что большинство пользователей используют именно этот термин, хотя перевод "сценарий" точно передает значение и является русским словом.
Устойчивость термина в языке можно проверить поиском по Яндексу.
Спросим у Яндекса:
Текст запроса |
Статистика |
Java+скрипт |
Java: 2472937 |
скрипт: 1 095 273 |
Java+сценарий= |
Java: 2223329= |
сценарий: 759 395 |
Перед тем как создать новый термин, попытайтесь все-таки припомнить забытый старый.
Для перевода новых или неустоявшихся понятий (т. е. имеющих несколько вариантов перевода) по возможности используйте русские слова, а не заимствуйте английские. Выбранный для перевода нового понятия термин не должен использоваться для обозначения других понятий в этом же или близких контекстах.
Пример: Термин Instance (в контексте Flash) означает различные варианты исходного символа, получаемые на разных этапах его редактирования.
Это понятие впервые введено в технологии Flash.
При буквальном переводе термина "образец" истинный смысл понятия теряется.
В подобном случае ищите перевод, наиболее точно передающий смысл и понятный читателю.
В "Самоучителе Flash 5" термин Instance переведен как "трансформа" - к сожалению не очень по-русски. Возможен перевод "вариант", но это слишком широко распространенное слово чтобы использовать его как термин.
Основные принципы перевода (в порядке убывания приоритетов):
Точно передавать смысл
Знать и уважать русский язык
Оставаться понятным для читателя
Эти правила не абсолютная истина. Но эти правила появились в результате долгой работы и осознанного к ней отношения.