Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация О нас пишут Награды Читальня Конкурсы Опросы
Автор
Управление

Тёмный уголок

(Около)переводческие мысли из-за шкафа

Подписаться на RSS  |   На главную

(Полу)машинный (полу)перевод. Варианты раскрытия скобок.

Эта запись навеяна недавней публикацией Константина Лакшина про МП и его, машинного перевода, концептуальные ограничения, а также обсуждением NMT в одной из форумных веток. Мой взгляд на машинный перевод можно охарактеризовать как сдержанный оптимизм. Мне доводилось постредактировать как весьма неплохую выдачу МП которую сопровождал весьма дельный глоссарий, так и абсолютно чудовищные порождения движков МП от которых я был готов заплакать мазутными слезами. Вне зависимости от наших желаний машинный перевод займет ту рыночную нишу, которую белковый переводчик занять не сможет ни при каких условиях — перевод текстов циклопических размеров в предельно сжатые сроки, когда качество отходит на двести двадцать второй план. По этому поводу можно долго говорить о падении нравов, называть разработчиков христопродавцами, заказчиков моральными уродами и вообще ламентировать. Это все, конечно, хорошо, но, в краткосрочной перспективе, несколько контрпродуктивно.

В таком сценарии соперничество человека и машины превращается в соревнование по  полетам на дельтаплане между рыбой и страусом, ибо сравниваем мы не всегда сопоставимые сущности.

При всём моем уважении к разработчикам МП и интересе к технологии я не могу согласиться с утверждением, что МП, пусть даже и нейронный (равно как и мозжечковый) сможет приемлемо переводить тексты требующие применения трансформаций (простите) которые невозможно   или очень сложно алгоритмизировать (для RBMT) или для которых  отсутствуют устойчивые соответствия (для SMT). А что же делать с пресловутым «миром за текстом»? Ну, предположим, разработчик движка смог создать хороший набор правил, словари, чистый и релевантный тематике стомиллионный корпус и онтологию. И это всё еще при этом хорошо работает. Я не уверен, что это возможно на данном этапе развития науки и техники, а если и возможно, то очень дорого.

Письменный перевод (про устный даже не хочу думать) штука двунаправленная. Создав текст перевода мы можем его критически осмыслить и скорректировать, сопоставить с некоторым «внутренним эталоном» и опять вернуться к переведенному тексту. МП, по крайней мере пока, так делать не умеет. То есть та самая пресловутая герменевтика, сколько бы её ни было в каждой конкретной ситуации письменного перевода, исчезает, а ведь именно этот герменевтический навык и маркирует разницу между переводчиком плохим и хорошим. Между белковой реализации функции замены слов одного языка на слова другого и тем, кто кое-чего в переводе понимает и знает, что все несколько сложнее. Таким образом, загнав текст в движок МП мы получаем некий текст который может в определенных ситуациях выполнять функцию перевода, но не обязательно переводом являться.

Что же делать? Может быть выход в разумной, ограниченной и постепенной автоматизации? Тем более, что переводчики сами к такой ползучей автоматизации готовы. Я говорю о Lilt и технологиях субсегментного поиска по ТМ.

Начнем с подстановки кусочков сегментов, фактически n-грамм. Именно n-граммы обеспечивают статистическому МП пресловутую «гладкость» и вот если мне предложить не готовое решение, а подсказки в виде кусков сегментов (из ТМ или базы данных движка), то я охотнее соглашусь их использовать, ведь за меня никто не переводит. А проигнорировать два слова и придумать свой вариант всяко легче тем стереть предложение движка и разочаровываться в технологии. И вот если в той же САТ программе эту функцию можно реализовать с определенными ограничениями, то в движке МП больше возможностей как по настройке, так и по учету типа документа, уже подставленных сочетаний, статистики других пользователей (если NDA это допускает)…

И так мы подходим к адаптивному МП. У Lilt мне особенно понравилась следующая штука — перевод есть, он дается с вариантами, но не подставляется сразу в поле для ввода текста.  Иными словами МП имеет «совещательный голос»,  который можно и не слушать, а можно и слушать, если он говорит ерунду.

Иными словами, пока тренировка движков не станет проще, интуитивнее, дешевле — прорыва не будет.

Ещё один важный фактор, искажающий наше представление о состоянии машинного перевода, это то, что большинство утверждений о МП базируются на данных т.н. «high-resource languages». Они хорошо описаны лингвистами, для них есть нормально прописанные грамматики, словари, корпусы и пр. Иными словами, успех движка переводящего с каталанского на испанский не есть победа всей технологии. Это локальный успех. Вот когда будет хороший урду-немецкий движок, вот тогда и поговорим)))

Вот как-то так.


20 Март 2017 John Gower | Комментариев (4)


Переводческие итоги 2016 года

Итак, до конца года осталось всего ничего, вероятность того, что мне 31 числа прилетит экстраординарный заказ-мечта мало отличима от нуля, а значит можно подводить итоги года по трем сегментам своей работы. Открытий тут ни для кого не будет. Так, частное мнение.

  1. Фриланс

В кои-то веки я без приключений оплатил взносы в ПФР и заплатил налоги. В финансовом плане этот год почти повторил первый неполный год фриланса в статусе ИП. Не то чтобы это провал. Объективно, я стал чаще отказываться от того, что мне гипотетически может быть неудобно или лень делать.  То есть, можно было заработать больше раза в два — два с половиной. Но, опять же, у меня несколько иные приоритеты. Было достаточно много интересных проектов, в том числе в так активно обсуждаемых SmartCAT и Memsource. Заказов в Trados Studio почти не было. Вот и думай, стоит ли покупать этот инструмент. Традиционно было много редактуры. Многим не нравится редактировать, а мне как-то даже и в охотку.  Поучаствовал в качестве переводчика в «тендерном» переводе. Это был очень любопытный опыт. Общие выводы: ставки очень низкие, если ты разбираешься в теме — отлично, тебя будут долго уговаривать, но ставку не поднимут.Можно соглашаться, если очень нужны деньги хоть какие-то деньги. Любопытно, что попадавшиеся мне совпадения из ТМ были  ну совсем отвратительного качества. И это при том, что это названия документов и регламентов которые надо было не перевести, а просто взять с официального сайта. Странно. И да, это была не машина.  Прямой заказчик радовал адекватностью и готовностью на повышение цен в 2017 году.  Начал сотрудничать с новыми БП. Пока неплохо, неплательщиков пока нет. Из бюро, с которым я сотрудничаю уже достаточно давно, ушел очень веселый и доброжелательный менеджер. Её будет не хватать. Перед уходом она разослала всем «своим» переводчикам очень теплое прощальное письмо и предложила продолжить общение. Вот интересно, а многие ли фрилансеры поддерживают «внепрофессиональную» связь с менеджерами БП после того, как этот менеджер уходит вообще в другую сферу деятельности. Тут есть этические аспекты? Или это норма и я просто усложняю? По мне, так тут всё хорошо.

2. Бюро переводов

Как начальнику «нанотехнологий» и прочего «производства» мне в этом году пришлось довольно много времени посвятить контролю качества и метрикам. Кое-какие соображения об отдельных переводчиках и их способностях подтвердились. А самое-то главное удалось показать, что выгоднее не столько делать много, сколько делать хорошо. Завершилась миграция на SmartCAT, хотя Deja Vu всё ещё «под парами». На всякий случай. Тяжелее стало работать с заказчиками. Теперь они хотят, чтобы цена была ниже средней по региону. Есть и положительные моменты: один из заказчиков признался, что им делали переводы разные БП, но у нас самое высокое качество, но, увы, и самые высокие из их выборки ставки. То есть, в качество можно и нужно инвестировать. Любопытная ситуация сложилась с немецким. Мало хороших исполнителей которые бы работали в средней ценовой нише.  И это при общем дефиците «немцев» как таковых. Если «средненькие» английские переводчики, вооруженные глоссарием, могут поскрести по сусекам Мультитрана и сварганить что-то относительно приемлемое (опять же, не для любого заказчика), то с «немцами» этот фокус не срабатывает. При этом заказчик к немецкому предъявляет очень жесткие требования.

Много было глоссарной работы. Часть глоссариев я просто причесал, часть сделал с нуля. Было сделано, как мне кажется, правильное решение делать глоссарии сразу многоязычными и с комментариями по оттенкам смысла. Это уже себя оправдало, особенно на юридических текстах. Теперь нужно думать о тендерах.

3. Преподавание

Тут мало нового. Увы, общее сокращение аудиторных часов на язык (как сам по себе, так и на перевод) и еще большее сокращение времени на второй язык оптимизма не внушает. В перспективе в штат будет некого брать. Плюс, отсутствие дисциплины «Введение в профессию»создает у студентов очень странное о ней, профессии, представление. Особенно ярко это проявляется на производственной практике: тексты из «реального мира» и тексты из аудитории — это две большие разницы. Плюс, непривычность к большому количеству работы. Вуз, увы, не учит работать в жестких рамках времени и качества и дает «второй шанс». Многие узнают об этом только на практике и разочаровываются. Плюс, общий недостаток научного кругозора. Это частично исправляется в БП, особенно если есть возможность рассказывать про что-то. Вероятно, на старших курсах надо перераспределять группы, вводить специализацию….. Но это всё wishful thinking.

В целом, этот год был не хуже предыдущего. А дальше — посмотрим!

Вот.

 


30 Декабрь 2016 John Gower | Комментариев (5)


Кузнец своего счастья

Переводил тут на днях руководство по эксплуатации станочка. Китайское изделие, язык документации — английский (как его видят скромные китайские технические писатели).

Всё шло хорошо (матчасть знакома, китайским английским владею на уровне уверенного пользователя), но один абзац был действительно «абзац». Итак, сначала через запятую идут все существительные, затем — глаголы, далее — прилагательные. Предлоги и артикли — бонусом. То ли движок МП сломался на этом предложении, то ли писатель притомился…. И ладно бы был чертеж, но нет. Он не нужен настоящему инженеру.

Текст-то я перевел, контекст и знание матчасти позволили отмести физически невозможные и просто опасные варианты. А вот как редактор будет действовать я уже не представляю. Я ему заранее соболезную.


5 Сентябрь 2016 John Gower | Комментариев (14)


«Шумел камыш…». Частные наблюдения о Translation Forum Russia 2016

Не думал, что именно запись о TFR будет в моём блоге первой, но может быть так оно и лучше – начинать с большого события.

В отличие от многих присутствующих в блогах и форумах ГП переводчиков я не могу назвать себя «закалённым TFRщиком». Астраханская встреча – мой второй выход в национальную профессиональную тусовку.

Если на московский TFR я решился ехать фактически в последний день льготной регистрации, пропустил большую часть неофициальной программы и фактически просто «плыл по течению», ориентируясь на неплохо знакомых мне по форуму Сергея Холодилова и Elmitera, то в этот раз я уже ехал послушать конкретные секции и даже немножко выступить.

В этот раз мой TFR начался уже в дороге: из Москвы я стартовал с уважаемым Сергеем Холодиловым, с которым мы не виделись с последней встречи форума в «Сайгоне» (это такое московское кафе).

Астрахань встретила жарой, отсутствием асфальта в центре города, зарослями камышей на улице Шекспира, дикой придорожной рожью, улицей Джона Рида, унылой как судьба британского коммунистического движения, и практически европейским районом около набережной Волги. Город контрастов. Камыши те же.

В этот раз удалось поучаствовать в квесте. В нашей команде была замечательная переводчица Анастасия из Ульяновска и известные форумлянам Сергей Холодилов и Bookworm. Несмотря на то, что финишировали мы первыми, контрольных точек мы собрали мало, зато сделали это с юмором. Уверен, что у некоторых жителей Астрахани горячий степной ветер всё ещё треплет обрывки шаблонов, разорванных нашими безумными вопросами. Ну а что поделаешь, целый день на жаре-то!

Завершился наш первый день в кафе «Волга», где, предсказуемо, я нашёл весёлый перевод в тексте меню.

Первый рабочий день начался с церемонии открытия в кремле и традиционно очень интересного доклада Константина Дранча о разнице между рынком переводов в РФ и Европе. Есть над чем задуматься.

Я также посетил панельную дискуссию по тендерам, прошедшую на удивление мирно. Тут надо отдать должное модератору, Павлу Дунаеву, который очень хорошо сглаживал многие острые углы.

Любопытной была презентация по онлайн-курсам для переводчиков от ульяновского «Юнитеха» и основам машиностроительной терминологии. Вот бы студентов туда!

Закончился день бокалом вина и очень интересным разговором с командой SmartСАТ, ставшей отдельным от ABBYY бизнесом.

Второй день был для меня самым напряжённым. И главным событием этого дня я считаю так называемый «Технобатл» – соревнование – переводческих технологий – в котором приняли участие STAR Transit, SDL, SmartCAT, Verifika (в форме видеообращения), TransTools в лице разработчика Станислава Охвата и Memsource, который теперь представляет Константин Дранч. Каждый участник должен был представить одну функцию своей системы. Награда присуждалась по итогам решения жюри и зрительского голосования в двух номинациях: «Это будущее!» и «Убедили – попробую!». Необычным для меня стало предложение участвовать в этом мероприятии в качестве члена жюри. В первой номинации победил SmartСАТ, тут мнение жюри полностью совпало с залом, а вот во второй – TransTools, что очень здорово, — кто не пользовался замечательными приложениями Станислава? Я, честно говоря, думал, что вторая премия уйдет «Верифике», но, похоже, что сообщество считает иначе.

Удалось послушать ещё один доклад Константина Дранча о том, как большие данные помогают развивать бизнес. Я сделал для себя несколько полезных выводов. Забавно, что это было в секции маленьких БП. Интересно, а многие ли бюро анализируют свои данные?

Второй день закончился прекрасным вечером в филармонии, где были раскрыты две главные интриги дня: кто победил в битве технологий, и где будет Форум-2017. Официально объявлено, что это Уфа.  Ну что ж, поедем за башкирским мёдом.

А вот в третий день был мой дебют, – я был участником панельной дискуссии про новые модели организации переводческого бизнеса на примере SmartCAT. Было немного странно делиться опытом, хотя мне очень понравилось. Попробую выступить на следующем форуме с полноценным докладом.

Увидел в новом качестве координатора СМИ Ирину Баринову aka B@r_Irina. По-моему, сотрудничество со СМИ в этот раз получилось очень неплохое.

В отличие от московского форума, в этот раз я закрытие не увидел, надо было торопиться домой. Ну нечего, в Уфе наверстаем.

По традиции я опять транслировал конференцию в социальные сети. Команда SmartCAT вообще запустила канал в сервисе Telegram, где оповещала о событиях на своём стенде. Неплохая идея!

В то же время я уезжал со смешанными чувствами. Я понимаю, что мне сравнивать не с чем, но всё же. Да, TFR состоялся. И это хорошо, но вот статистика форумов говорит о некотором угасании интереса к площадке. Не было заметно руководителей СПР, а ведь они недавно провели значимый съезд, а тут как раз можно донести до отрасли свои мысли. Не было некоторых крупных компаний из первой десятки translationrating.ru, к которым традиционно много вопросов.  Стенд развернула только SmartCAT, — остальным разве не интересно? Не нужно? На прошлой конференции стендов было больше. Опять практически не было заказчиков. За всех отдувалась представительница «Роснефти», которая не может повлиять на организацию тендеров, потому что не она придумывает правила. Мало было новых лиц, особенно студенческих. Хотя может быть я просто не заметил.

Вот как-то так. Немножко сумбурно. А всё жара)))


20 Август 2016 John Gower | Комментариев (6)