Категории гистерезисного базиса (внутреуниверситетская)

Модератор: Хакер

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Категории гистерезисного базиса (внутреуниверситетская)

Сообщение Хакер » 02.09.2011 (Пт) 17:52

Я понимаю, что машинный перевод — это машинный перевод, и нет ничего особенно в том, что переводчик ставит нелепые варианты перевода слов. То есть можно простить переводчикам перевод bootlog.txt как «сапогполено.txt».

Но переводчик Microsoft имеет совершенно уникальную логику вставки непонятно откуда взявшихся слов в переводимые предложения. Причём предпочтение, как я понял, отдаёт научным терминам :)

Вот пример перевода:
Изображение

Или вот:
Изображение

Или даже вот:
Изображение

Можно построить предположение, что дело заключается в ЖЖ-коментах. Но на самом деле, нет, на ЖЖ-пост это тоже распространяется:
Изображение

Тогда можно предположить, что дело в самом ЖЖ, что его страницы содержат что-то, что сводит с ума переводчик. Собственно, сам переводчик мне не нужен, я отлично перевожу сам, а MS-транслятор использую в роли анонимайзера для чтения ЖЖ, потому что ЖЖ у нас опять забанили (надеюсь местное ГБ не читает мой блог). Но нет, ЖЖ не причём, вот попытка перевести пост с этого форума:
Изображение


Начнём с того, что при переводе Eng→Rus нет вообще никакого смысла трогать Rus-текст. Но переводчик его трогает, хотя трогает не весь текст, а только некоторые фрагменты. Что характерно, тот фрагмент, в который будет исковеркан, переводится в UPPERCASE. Почему так происходит? Может быть какой-то уволенный сотрудник MS в отместку вставил в ядро перевода такую функциональность, а перевод в верхний регистр добавил, чтобы месть не осталась незамеченной? Шутка, конечно.

В общем, можно выделить такие правила перевода:
  • ю → ГИСТЕРЕЗИСНОЙ
  • можно → БАЗИС
  • из → ИЗО
  • них → СТРАНЫ-ПОТРЕБИТЕЛИ
  • как → ВНУТРЕУНИВЕРСИТЕТСКИЕ
  • кто → МЕСТОИМЕНИЯ
  • у → ГОД
Слово «КАТЕГОРЯМ» же вообще вставляется просто так, а не взамен какого-либо другого.

Неправда ли, выбор не поддаётся никакой логике связь между оригиналом и чудо-переводом?
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

Proxy
Профессор VB наук
Профессор VB наук
Аватара пользователя
 
Сообщения: 2941
Зарегистрирован: 31.08.2007 (Пт) 4:41

Re: Категории гистерезисного базиса (внутреуниверситетская)

Сообщение Proxy » 02.09.2011 (Пт) 18:21

В какой-нибудь таблице, скормленной переводчику метаданные забыли соответствующие дать, съехали поля — появились страшные ассоциации. Не могу что-то более правдоподобное придумать. Ну а таблица из какого-то текста сгенерирована с помощью какого-то работоспособного переводчика. Просто как-то сильно складно смотрится что эти слова могли следовать друг-за-другом в обучающем тексте. Предлог — Существительное, вполне себе адекватное словосочетание, т.е. на один столбец ошиблись. Или просто из базы получает слова криво где-то.
Follow the white rabbit.

ger_kar
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1957
Зарегистрирован: 19.05.2011 (Чт) 19:23
Откуда: Кыргызстан, Иссык-Куль, г. Каракол

Re: Категории гистерезисного базиса (внутреуниверситетская)

Сообщение ger_kar » 07.10.2011 (Пт) 11:04

Хакер писал(а):а MS-транслятор использую в роли анонимайзера для чтения ЖЖ, потому что ЖЖ у нас опять забанили

Читал, читал, пять раз прочитал, нифига не понял, что за волшебная константа ;) ЖЖ.

А по поводу машинного перевода много бывает приколов, особенно когда китайцы начинают переводить. Никогда не забуду китайский шедевр с надписью на упаковке тюбика: ЗАВОЕВАТЕЛЬ ВОНИ!!! и чуть более мелким шрифтом ниже - Средство от вонючего вкуса ног. Я от смеха аж прослезился. А еще помниться первый машинный перевод, который я делал сам в далеком 2000 используя переводчик Стилус. Так вот при попытке перевода текста из файла справки, я получил текст: "Возьмите напильник из папки щели ...", тоже долго ржал и потеряв сразу доверие к машинному переводу в дальнейшем использовал этот переводчик исключительно для смеха. Делал так: Загонял русский текст, переводил его на английский, а потом обратно, но что получалось при этом читать без смеха было просто невозможно.
Бороться и искать, найти и перепрятать

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Категории гистерезисного базиса (внутреуниверситетская)

Сообщение Хакер » 07.10.2011 (Пт) 11:09

ger_kar писал(а):Читал, читал, пять раз прочитал, нифига не понял, что за волшебная константа

Что?
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

ger_kar
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1957
Зарегистрирован: 19.05.2011 (Чт) 19:23
Откуда: Кыргызстан, Иссык-Куль, г. Каракол

Re: Категории гистерезисного базиса (внутреуниверситетская)

Сообщение ger_kar » 07.10.2011 (Пт) 11:29

Вот именно что? Я например так и не понял, что означает ЖЖ и я просто сравнил твою непонятную аббревиатуру с так называемыми "волшебными константами" в коде, на которые ты всегда ругаешься :)
Бороться и искать, найти и перепрятать

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Категории гистерезисного базиса (внутреуниверситетская)

Сообщение Хакер » 07.10.2011 (Пт) 11:47

ger_kar писал(а):Я например так и не понял, что означает ЖЖ

:shock: :shock: :shock:
http://yandex.kz/yandsearch?text=ЖЖ
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

ger_kar
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1957
Зарегистрирован: 19.05.2011 (Чт) 19:23
Откуда: Кыргызстан, Иссык-Куль, г. Каракол

Re: Категории гистерезисного базиса (внутреуниверситетская)

Сообщение ger_kar » 07.10.2011 (Пт) 12:43

Надо-же оказывается живой журнал :).
Но во первых я первый раз про таковой узнал, и тем. более бы сам не догадался, что же это за такое ЖЖ.
Как говориться не знал, да еще и забыл :) . Теперь понятно.
Бороться и искать, найти и перепрятать


Вернуться в Мой блог

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2

    TopList