08:59

Оригинал взят у в Искусственный интеллект: искусственней некуда
Google Translation более правильно было бы называть Google Replacements, потому что именно таков принцип его действия.
Обычный переводчик-человек действует так: он мысленно ставит себя на место говорящего в той же или аналогичной ситуации и, обращаясь к аналогу слушающего, выдаёт аналог нужной реплики. Компьютер же обращается к своему глоссарию (да-да, глоссарию, не, ни разу не словарю), находит ячейку, парную к данной, выгребает то, что в этой ячейке находится, и швыряет пред светлые очи запрашивающего, и делает это очень быстро – гораздо быстрее, чем если бы человек, слюнявя палец, листал разговорник. Если текста много, он делает механические сшивки между содержимым разных ячеек. Но от скорости осуществления этой дури она не перестаёт быть маразмом.
Когда переводчику, допустим, мексиканского сериала нужно перевести на русский реплику уголовного авторитета, обращающегося к своей «шестёрке», он представляет себе русского уголовного авторитета и его «шестёрку» (по книгам, по кино, по чьим-нибудь рассказам, по личным воспоминаниям, если вдруг они у него есть) в аналогичной (максимально близкой) ситуации и выдаёт нужную реплику. Но мы, люди, делаем это очень быстро, да, дорогой компьютер, очень-очень быстро, настолько быстро, что не всегда сами успеваем заметить и зафиксировать этот этап работы воображения. И да, дорогая машина, тебе для этого понадобится очень много... памяти.

Принципы машинного перевода не должны быть машинными, точно так же, как принципы обучения тупых учеников не должны быть тупыми.

читать дальше



@темы: Вавилон-18, история бытовой техники

Комментарии
04.09.2020 в 09:45

Машинный перевод сейчас работает совершенно не так, если что. Сзади там нейросеть, обученная именно что на контексте, естественно не ситуативном, словарном, но весьма большом, и это не словарь никакой, и не соседние ячейки (откуда автор это взял вообще? из куска алгоритма оценки лексической дистанции, что ли?), это система обработки входящих данных. Да, результат не имеет и не будет иметь художественной ценности, но смысл машинного перевода вообще не в художественной ценности :)
ЗЫ: "вот вам и вода" гугл транслейт переводит как "So much for water", и имхо это лучшее что можно вообще требовать от нейросети.
04.09.2020 в 10:43

Кому нужен будет такой запарный и медленный переводчик?
смысл машинного перевода вообще не в художественной ценности
+10000000
04.09.2020 в 12:17

Эээ. Перевожу большие объёмы текстов гуглом и яндексом. Где-то гугл ближе, где-то яндекс, но, в целом, смысл улавливается и даже иногда переводят сложные обороты, меняя их на другие, но подходящие конструкции в русском языке. Конечно, редактировать приходится, но такие тонкости, о которых говорит автор, это для художественного перевода, совсем другой функции.