Охрана труда:
нормативно-правовые основы и особенности организации
Обучение по оказанию первой помощи пострадавшим
Аккредитация Минтруда (№ 10348)
Подготовьтесь к внеочередной проверке знаний по охране труда и оказанию первой помощи.
Допуск сотрудника к работе без обучения или нарушение порядка его проведения
грозит организации штрафом до 130 000 ₽ (ч. 3 статьи 5.27.1 КоАП РФ).
Повышение квалификации

Свидетельство о регистрации
СМИ: ЭЛ № ФС 77-58841
от 28.07.2014

Почему стоит размещать разработки у нас?
  • Бесплатное свидетельство – подтверждайте авторство без лишних затрат.
  • Доверие профессионалов – нас выбирают тысячи педагогов и экспертов.
  • Подходит для аттестации – дополнительные баллы и документальное подтверждение вашей работы.
Свидетельство о публикации
в СМИ
свидетельство о публикации в СМИ
Дождитесь публикации материала и скачайте свидетельство о публикации в СМИ бесплатно.
Диплом за инновационную
профессиональную
деятельность
Диплом за инновационную профессиональную деятельность
Опубликует не менее 15 материалов в методической библиотеке портала и скачайте документ бесплатно.
10.11.2017

Нит в обучениии ия

Бурдина Елена Викторовна
учитель английского языка
Новые информационные технологии в обучении ИЯ и переводу

Содержимое разработки

Cистема автоматизированного перевода Trados (Традос)

Trados — система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory (TM, накопитель переводов).

Trados GmbH была основана в 1984 году в Штуттгарте. В 1997 году 20 % акций компании были приобретены Microsoft. В 2002 году Trados объединилась с Uniscape Inc., и объединённая компания получила название Trados Inc. со штаб-квартирой в Александрии, Вирджиния. В июне 2005 года компания Trados была приобретена британской SDL International, и в 2006 году был выпущен совместный продукт с Trados SDLX.

Система Trados включает несколько модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm). Последняя версия системы, выпущенная независимой компанией Trados — 7.0.

Принцип работы системы Trados (Традос)

Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объема работы переводчика. Это выявление получило название выравнивания или сопоставления (alignment). Фрагменты, оставшиеся непереведёнными после выравнивания (сопоставления), передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает на однотипных текстах, где повторяемость словосочетаний достаточно высока.

Основные модули системы Trados (Традос)

* Trados Workbench — основной модуль для перевода документов, интегрируется в оболочку Microsoft Word.

* TagEditor — модуль для перевода документов в формате HTML, XML и т. п.

* WinAlign — модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов.

* S-Tagger — модуль для перевода документов в формате FrameMaker и InterLeaf.

* T-Window — модуль для перевода документов в формате PowerPoint.

* MultiTerm — модуль для ведения глоссариев.

* ExtraTerm

Системы автоматизированного перевода и Translation Memory (TM)

Па́мять переводо́в (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы Translation Memory также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

В каждой конкретной системе Translation Memory данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать память переводов, созданную в ТРАДОСе (Trados) и наоборот.

Большинство систем Translation Memory как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Список программных систем Translation memory (памяти переводов)

В соответствии с недавними обзорами использования систем памяти переводов (translation memory) к наиболее популярным системам относятся:

* Deja Vu компании Artil

* OmegaT (бесплатная система, распространяемая по лицензии GNU)

* SDLX

* Trados (Традос), продвигаемая в России компанией Промт

* Metatexis (Метатексис)

* Star Transit

* Wordfast (реализована как набор макросов для MS Word)

Автоматизированный перевод

Автоматизированный перевод (АП, англ. Computer-Aided Translation) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.

Идея Автоматизированного перевода появилась с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам. В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom. В Советском Союзе для создания баз такого рода был создан ВИНИТИ.

В современной форме идея АП была развита в статье Мартина Кея 1980 года, который выдвинул следующий тезис: "by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human" (компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления).

В настоящее время наиболее распространенными способами использования компьютеров при письменном переводе является работа со словарями и глоссариями, памятью переводов (англ. Translation Memory, TM), содержащей примеры ранее переведенных текстов, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что дает сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.

Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например, Swift, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможность появления субтитров по времени, их форматирования на экране, следования видеостандартам и т.п.

При синхронном переводе использование средств автоматизированного перевода по необходимости ограничено. Одним из примеров является использование словарей, загружаемых на КПК. Другим примеров может служить полуавтоматическое извлечение списков терминов при подготовке к синхронному переводу в узкой предметной области.

В узких предметных областях при большом количестве исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тесты и текущая корреспонденция) переводится с использованием Машинного Перевода (МП)/.

OmegaT - система автоматизированного перевода с памятью переводов

OmegaT - система автоматизированного перевода, поддерживающая память переводов, написана на языке Java. Возможности продукта включают сегментацию исходного текста на основе регулярных выражений, использование точных (англ.exact) и неточных (англ.fuzzy) соответствий с уже переведенными фрагментами, использование словарей, поиск контекстов в базах данных переводов и работу с ключевыми словами.

Для работы OmegaT требуется версия Java 1.4, которая доступна для ОС GNU/Linux,Mac OS X и Microsoft Windows,Windows NT.

OmegaT поддержвает разнообразые форматы исходных документов: текстовые файлы (включая Unicode), файлыHTML/XHTML,StarOffice, OpenOffice.org и OpenDocument (ODF), а также файлы DocBook. OmegaT не может работать непосредственно с файлами Microsoft Office (Word, Excel иPowerPoint), для работы с которыми требуется использованиеOpenOffice.org, который может перевести такие файлы в формат OpenDocument, поддерживаемыйOmegaT.

Metatexis (Метатексис) —программаавтоматизацииперевода Computer Aided Translation (CAT) для Microsoft Office

Метатексис (Metatexis) — программаавтоматизацииперевода CAT (Computer Aided Translation). Программа встравивается в Microsoft Word и позволяет создавать свою базу параллельных переводов. Метатексис поддерживает все форматы Microsoft Office (Word, Exсel, Power Point), импорт и экспорт базы переводов в популярные форматы TMX, TM TRADOS, TM Wordfast и другие.

Основные функции Metatexis (Метатексис)

* Работа в Microsoft Word. Нет необходимости изучать новую программу, надо ознакомиться лишь с новыми функциями.

* Перевод любых текстовых документов, которые можно открыть в Microsoft Word.

* Перевод файлов PowerPoint и Excel (только в версии NET/Office).

* Использование TRADOS Workbench (только в версии NET/Office).

* Подключение к серверам Logoport (только в версии NET/Office).

* Простота в использовании: приступить к переводу можно уже через пять минут, не тратя время на изучение документации.

* Сохранение формата. В процессе перевода исходное форматирование документа не претерпевает изменений.

* Легкость переноса: исходный текст, текст перевода и настройки документа хранятся в самом документе и так же легко, как и любой документ, могут быть переданы другому переводчику или на другой компьютер.

* Защита от ошибок. Даже если какие-то единицы перевода будут случайно удалены, автоматические функции восстановления позволят программе продолжать работу.

* Контроль качества. MetaTexis содержит мощные функции оценки качества любого перевода по формальным критериям.

* Управление проектами. Можно создавать проекты, состоящие из нескольких документов.

* Гибкий интерфейс к внешним программам перевода и словарям. К MetaTexis можно подключить любую внешнюю программу.

* Полная настраиваемость. MetaTexis можно настроить в соответствии с желанием пользователя (включая сочетания клавиш, цвета, правила фрагментирования и работы с TM).

* Средство локализации. Встроенная функция локализации позволяет создать собственную версию интерфейса MetaTexis.

* Специальный интерфейс для KudoZ.NET (www.kudoz.net).

База переводов и база терминологии Metatexis (Метатексис)

* Мощные функции нечеткого поиска.

* Результаты поиска сохраняются непосредственно в документе (не надо параллельно запускать дополнительную программу); их можно просматривать после отключения от базы данных.

* Функции сравнения показывают различия между фрагментами оригинала в документе и фрагментами, полученными из базы данных.

* Ядро базы данных в настоящее время построено на Microsoft Access, но легко можно задействовать другие серверы баз данных.

* Импортиэкспорт:форматы TMX, TM TRADOS, TM Wordfast, Access, текстовыйформат, Personal Translator, T1 Professional.

* Пакетная обработка.

* Обратный поиск.

Статистика и индекс Metatexis (Метатексис)

* Индекс и конкорданс. Составление полного индекса документа с удобным доступом к контексту каждого слова.

* Полная статистика. Подробные сведения о количестве слов, сегментов, затраченном времени и размере оплаты. Все статистические данные можно сохранить.

* Статистика документа. Определение количества переведенных, непереведенных и ожидающих проверки предложений и слов, а также времени работы.

* Статистика проекта: статистические данные по всем документам в проекте.

* Статистика переводчика: число переведенных слов и затраченное время.

* Статистика фрагмента: подсчет времени работы над сегментом каждого переводчика; вычисление количества слов; сохранение истории перевода.

* Статистика стоимости: определяется на основе количества слов исходного текста, перевода или времени. Вычисляются также взвешенные показатели с учетом базы переводов.

Импорт и экспорт данных в Metatexis (Метатексис)

* Импорт и экспорт документов TRADOS.

* Импорт и экспорт форматов баз данных (TMX, TM TRADOS, TM Wordfast, Access, текстовый формат, Personal Translator, T1 Professional).

* Функции импорта и экспорта настраиваются с помощью эффективного, но простого в изучении командного языка.

Средство выстраивания баз переводов Metatexis (Метатексис)

* Можно работать в двух режимах выстраивания:

- прямо в документах, подобно тому, как обычно происходит работа в MetaTexis;

- в диалоговом окне с более простым интерфейсом.

* В базе переводов сохраняется форматирование.

* В результате выстраивания создается база данных для MetaTexis и многих других форматов (см. функцию "Импорт и экспорт").

Системы машинного перевода

В отличии от систем Автоматизированного перевода, системы Машинного Перевода производят перевод текстов в автоматическом режиме без участия человека.

Формы организации взаимодействия ЭВМ и человека при машинном переводе

* С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.

* С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.

* С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.

* Смешанные системы (например, одновременно с пред- и постредактированием).

* Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.

* Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.

В англоязычной терминологии различаются терминыmachine translation (MT, полностью автоматический перевод) и machine-aided или machine-assistedtranslation (MAT, автоматизированный перевод); если же надо обозначить и то, и другое, пишутM(A)T.

История машинного перевода

Мысль использовать ЭВМ для перевода была высказана в 1946 году, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.

К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

* MARK (в Департаменте иностранной техники ВВС США);

* GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

Тем не менее, в ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини- и персональных компьютеров, а с ними всё более сложных словарных, поисковых и т. п. систем, ориентированных на работу с естественноязыковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Впрочем, мечты, с которыми род людской взялся полвека назад за задачу машинного перевода, в значительной мере остаются мечтами: высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода: по оценкам конца 1980-х, до пяти раз.

В настоящее время существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания Systran. В России большой вклад в развитие машинного перевода внесла группа под руководством проф. Р. Г. Пиотровского (Российский государственный педагогический университет им. Герцена, Санкт-Петербург).

Качество перевода

Качество перевода зависит от тематики и стиля исходного текста. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бродящих по Интернету шуток. Из пространных примеров наиболее известен текст «Гуртовщики Мыши» (перевод компьютерной документации программой Poliglossum на основе медицинского, коммерческого и юридического словарей); из кратких — фраза «My cathas given birthto four kittens,two yellow, onewhite and oneblack», которую программа ПРОМТ превращает в «Мой кот родил четырёх котят, два жёлтых цвета, одно белое и одного афроамериканца».

Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Та же программа ПРОМТ превращает «bra-ketnotation» в «примечание Кети лифчика», «Lie algebra» — в «алгебру Лжи», «eccentricityvector» — в «вектор оригинальности» и т. п.

Системы Машинного перевода

On-line сервисы машинного перевода

Сервис перевода текстов Google Translate

Online Система машинного перевода BabelFish (Systran) на портале Altavista

Online-переводчик компании ПРОМТ

Online Языковые инструменты комапании Google (перевод текста, сайтов)

Online-переводчикInterTran (перевод между 29 языками)

translation.langenberg.com (страница с вызовом online-переводчиков различных производителей и иных лингвистических программ)

Адрес публикации: https://www.prodlenka.org/metodicheskie-razrabotki/279055-nit-v-obucheniii-ija

Свидетельство участника экспертной комиссии
Рецензия на методическую разработку
Опубликуйте материал и закажите рецензию на методическую разработку.
Также вас может заинтересовать
Свидетельство участника экспертной комиссии
Свидетельство участника экспертной комиссии
Оставляйте комментарии к работам коллег и получите документ
БЕСПЛАТНО!
У вас недостаточно прав для добавления комментариев.

Чтобы оставлять комментарии, вам необходимо авторизоваться на сайте. Если у вас еще нет учетной записи на нашем сайте, предлагаем зарегистрироваться. Это займет не более 5 минут.

 

Для скачивания материалов с сайта необходимо авторизоваться на сайте (войти под своим логином и паролем)

Если Вы не регистрировались ранее, Вы можете зарегистрироваться.
После авторизации/регистрации на сайте Вы сможете скачивать необходимый в работе материал.

Рекомендуем Вам курсы повышения квалификации и переподготовки