Программы для переводчиков

Windows и Linux, а также все на тему (не)свободы ПО.
Аватара пользователя
anyr
Неотъемлемая часть форума
Сообщения: 380
Зарегистрирован: 11 апр 2006, 16:25
Откуда: Гомель

Программы для переводчиков

Сообщение anyr »

На днях появилась необходимость перевести пару статей с сохранением форматирования оригинала. Для себя сделал несколько маленьких открытий и вот решил описать результат, может еще кому пригодится, а может меня поправят/дополнят.

Коммерческое платное ПО не рассматривал т.к. для меня это разовая затея и тратить деньги на эти ценли я пока не намерен.

Для перевода текстов с сохранением форматирования существуют программы, поддерживающие технологию памяти перевода (http://goo.gl/24IiG). Эти программы на основе ранее переведенных фрагментов текста предлагаю перевод последующих. Для использования в linux подойдут Написана на java. Поддерживаемые форматы файлов документов: XHTML и HTML, Microsoft Office 2007 XML, OpenOffice.org/StarOffice, XLIFF (Okapi), MediaWiki (Wikipedia), неформатированный текст. Online. Поддерживаемые форматы: txml, txt, doc, docx, rtf, xls, xlsx, ppt, pptx, pdf, htm, html, mif, FrameMaker file, inx, odt, ods, tif, tiff. Внешне функционал WF и OmegaT в основном одинаковы. Необходимость постоянно быть on-line для работы с WF не очень мне подходит и я им не пользовался толком.

Машинный перевод для специализированных текстов пока не всегда хорош, но когда речь идет о большом количестве текста, то заранее переведенные простые фразы очень экономят время. Из систем машинного перевода есть: Имеет ограничение в 3k символов. Имеет ограничение в 10k символов.
  • Google translate
Упоминаний об ограничениях нет. Есть также возможность использовать его в google docs.

В упомянутых выше системах TM можно при переводах использовать файлы TMX с переведенными сегментами от других документов. Если вы изначально пользовались OmegaT то их без труда можно взять в каталоге проекта, а если нет, то aligner'ы вам в помощь. Вы им подсовываете оригинал и перевод, а они сегментируют тексты и составляют пары сегментов оригинал-перевод в виде tmx файлов, которые можно потом дальше использовать. Эта программа имеет варварское ограничение в 50 строк. У меня не влез в это ограничение ни один текст. Размер каждого файла не должен превышать 1Мб. Допустимый формат документов: doc, docx, rtf, txt (только в unicode кодировке), htm, html, ppt, pptx, pps, ppsx, xls, xlsx, pdf. Этот сервис оставил положительное впечатление. Из ограничение - размер файла в 1мб., что для plain text очень много. Поддерживаемые форматы: Microsoft Word, Excel and PowerPoint, Adobe PDF, HTML, XML, Corel WordPerfect, RTF, Lotus WordPro and plain text. Умеет убирать дубликаты и пустые строки. Сопоставленные сегменты не вызывали нареканий. Имеет GUI. Написан на java. Из поддерживаемых форматов только txt. Можно редактировать сегментацию. С сопоставлением оригинал-перевод были трудности, в основном из-за сокращений типа mr., dr. Из-за того, что в переводе эти слова были написаны полностью а в оригинале шли с точкой они получались разными сегментами. Весь текст на перекосяк и вроде можно все отредактировать (join - alt+j; split - alt+s), да только вот функции "отменить изменения" я не нашел и одна маленькая ошибка в большом тексте заставляет править сегментацию заново. Имеет как-бы GUI (от него есть только диалог выбора файла). Из поддерживаемых форматов только txt. Брыкается, если в оригинале и переводе не совпадает количество параграфов. С задачей справился хорошо. Поддерживаемые форматы: txt, doc, docx, rtf, pdf, html. Умеет убирать дубликаты, пустые строки. Есть проблемы с русскими буквами в названиях файлов и каталогов. Результат можно посмотреть в виде электронной таблицы. Справился с задачей хорошо. Это часть функционала wordfast. Поддерживает форматы: doc, docx, rtf, xls, ppt, inx, mif. Результат высылает на почту, ждал результата долго, пришла ошибка и второй раз не пробовал.

Т.е. в итоге берем оригинал, делаем машинный перевод. Выравниваем оригинал-перевод, полученный tmx файл подсовываем к примеру omegat и дальше уже занимаемся переводом.

Ну и конечно словари: Stardict, Goldendict.

dg333
Неотъемлемая часть форума
Сообщения: 296
Зарегистрирован: 10 май 2006, 09:46
Откуда: Менск

Re: Программы для переводчиков

Сообщение dg333 »

Гэта Wordfast Anywhere насамрэч. Існуюць таксама WF Classic (працуе ў MS Word праз Crossover) і WF Pro, зь якімі можна выконваць невялікія праекты без пакупкі ліцэнзіі. А яшчэ — Anaphraseus.
Wordfast aligner:
Спасылка бітая.

А ўвогуле варта пачынаць са старонкі Марка Праяра.
openSUSE 11.3/12.3

dg333
Неотъемлемая часть форума
Сообщения: 296
Зарегистрирован: 10 май 2006, 09:46
Откуда: Менск

Re: Программы для переводчиков

Сообщение dg333 »

LF Aligner
Поддерживаемые форматы: txt, doc, docx, rtf, pdf, html.
ODT таксама падтрымліваецца.
openSUSE 11.3/12.3

Аватара пользователя
anyr
Неотъемлемая часть форума
Сообщения: 380
Зарегистрирован: 11 апр 2006, 16:25
Откуда: Гомель

Re: Программы для переводчиков

Сообщение anyr »

dg333 писал(а):
Гэта Wordfast Anywhere насамрэч. Існуюць таксама WF Classic (працуе ў MS Word праз Crossover) і WF Pro, зь якімі можна выконваць невялікія праекты без пакупкі ліцэнзіі. А яшчэ — Anaphraseus.
Да, я видел wordfast classic (и aтnphraseus - аналог для libre/ooo writer), но первый не использовал по причине, что его надо запускать не совсем в родном окружении, а со вторым у меня что-то не сложились отношения и я никаким образом не мог описать свой личный опыт. Что касается wf pro, то честно говоря не увидел упоминаний о том (http://goo.gl/KMS52), что demo версией можно пользоваться на небольших проектах. Если не трудно напишите есть ли проблемы с установкой wf pro в родном окружении и какие там ограничения для demo.
dg333 писал(а):
Wordfast aligner:
Спасылка бітая.
У меня работает. Видимо потому, что я зарегистрировался на wf anywhere и не вышел из системы.
dg333 писал(а):А ўвогуле варта пачынаць са старонкі Марка Праяра.
Конечно же я был на этом ресурсе. Просто это мой личный опыт, я потратил достаточно много времени перебирая к примеру "ровнялки" и может кто-то этого подвига не повторит. Я в итоге остановился на следующей комбинации:
  • Сохраняю оригинал в plain text
  • Черновой перевод txt в google translate
  • Выравнивание оригинал/перевод в txt в youalign с сохранением в tmx
  • Подсовываю оригинал в odt/doc и полученный из youaling tmx в omegat
При этом мероприятия связанный с доступом к сети занимаю совсем не много времени, а основной работой можно заниматься и без интернета. Мне это пока больше подходит, потому как пока еще есть проблемы со связью при передвижении по республике. А как работаете вы?

dg333
Неотъемлемая часть форума
Сообщения: 296
Зарегистрирован: 10 май 2006, 09:46
Откуда: Менск

Re: Программы для переводчиков

Сообщение dg333 »

есть ли проблемы с установкой wf pro в родном окружении и какие там ограничения для demo.
Для WFP «роднае» асяродзьдзе — гэта насамрэч Java. Праблема хіба ў тым, што WFP сабраны пад 32-бітную JRE, а з 64-бітнай не працуе, і карыстальнікам 64-бітных дыстрыбутываў даводзіцца неяк выкручвацца (ведаю, што рашэньне ёсьць, але падрабязнасьцямі не цікавіўся). Абмежаваньне для незарэгістраванай вэрсіі — гэта аб’ём памяці перакладаў ня болей прыблізна 500 адзінак.
А как работаете вы?
Калі маю праект, які можна прагнаць праз гуглаперакладчык — прыблізна так і працую, адно што раўняю з дапамогай PlusTools (як і Wordfast, працуе ў MS Word/Crossover) або, апошнім часам, LF Aligner. У 80-90% выпадкаў карыстаюся OmegaT, калі-некалі Анафразіем, зрэдку (калі дакумэнт з «цяжкім» фарматаваньнем, або прэзэнтацыя) WF Classic або Pro. Але мне гуглаперакладчык ня вельмі часта дапамагае, эфэктыўней карыстацца папярэдне напрацаваным.
openSUSE 11.3/12.3

Miadzum
Заглянувший
Сообщения: 2
Зарегистрирован: 04 сен 2015, 20:38
Контактная информация:

Re: Программы для переводчиков

Сообщение Miadzum »

Опа, спасибо) нормальный список так то) еще бы кто подсказал пошку для перекодировки фарматов) а то приходиться через винду этим заниматься.

Ответить