Агентство Лангуст [переход на главную]

26/07/2010 Трудности перевода у Google
Впервые опубликовано на сайте журнала Forbes.ru

На сайте журнала Forbes.ru была опубликована заметка о недостатках статистического машинного перевода.

Ниже материал заметки приведён полностью.

Какими бы мощными не были компьютеры, это вряд ли поможет решить проблему автоматического перевода. Так считает руководитель Google Translate

Спросите любого программиста купить книги по разработке программного обеспечения, что будет, если компьютеры станут в тысячу раз быстрее. Скорее всего, вы услышите в ответ, что дополнительной мощности всегда можно найти применение.

GeekBrains

Но задайте тот же вопрос Францу Джозефу Очу, - и он пожмёт плечами. Даже на машине с мощностью в тысячу раз большей, чем у сегодняшнего компьютера, его программа не начнёт работать значительно лучше. Серьёзное признание, учитывая то, что Оч отвечает за одну из самых удивительных программ в мире: он возглавляет проект Google Translate.

Google Translate - это бесплатная программа, которая переводит с языка на язык почти так же быстро, как Google отвечает на запрос поиска. Забейте туда адрес страницы испанской газеты, и где-то за секунду текст будет переведён на английский. В базе Google Translate несколько десятков языков. Когда видишь такое в первый раз, вспоминаешь мечты научных фантастов об исчезновении языковых барьеров.

По крайней мере, такое впечатление получает новый пользователь. Но если пользоваться программой подольше, понимаешь, что программа далека от идеала. Иногда Google Translate переводит идеально точно, особенно несложные предложения с языков с простой структурой, вроде испанского. Но порой, она может и совершенно сбить с толку.

Вот, например, предложение из репортажа о Чемпионате мира по футболу купить книги по спортивным играм с мячом из одной мадридской газеты: «Переходя Швейцарии, Испании в настоящее время в руках видео…»

Программа развивается благодаря прогрессу статистического машинного перевода. Этот метод основан не на разборе предложений, которому учат в начальной школе, а на сравнении множества фраз с уже существующими переводами (для решения этой задачи Google загрузил кипы переведённых текстов, вроде документации ООН). Программисты выжали из метода практически всё возможное и не могут существенно улучшить работу программы, даже на более мощном оборудовании.

Другими словами, пользователи Google Translate в 2020 году будут находить несуразности и непоследовательности так же часто, как и сегодня. Компьютер, который переводит не хуже человека (что само по себе может служить хорошим определением настоящего искусственного интеллекта), появится ещё очень не скоро. Google Translate регулярно улучшают, но слишком медленно. «Траектория, по которой мы движемся, похоже, никогда не достигнет искусственного интеллекта», - говорит Оч.

И это касается не только машинного перевода. Такое же положение практически во всех сложных областях, где работают компьютеры: язык, зрение, робототехника и даже поиск, на котором держится интернет. Компьютеры стали удивительно полезными, но всё равно до мечты о машине с интеллектом, неотличимым от человеческого, ещё очень и очень далеко.

Появится ли когда-нибудь такой компьютер? Оч испытывает определённый оптимизм. Он верит, что должен произойти некий прорыв, пусть пока и не ясно, какой. Что необходимо, по его словам, так это компьютерные программы, способные к обучению. Кроме того, программистам нужно придумать, как синтезировать умения разных программ. В настоящий момент компьютер может играть в «Кто хочет стать миллионером», но ничего не знать о шахматах купить различные игры для всей семьи. И ни компьютер-эрудит, ни компьютер-шахматист не имеют никакого представления о том, как летает по полю футбольный мяч. А чтобы изящно переводить, компьютер должен знать понемногу о многом.

В Кремниевой долине обитают инженеры двух мастей. Одни - и их большинство - несмотря на доказательства обратного верят, что компьютеры развиваются очень быстро, и не за горами время, когда у нас появится реальная версия компьютера с искусственным интеллектом, HALа из «Космической одиссеи» купить фантастические фильмы. Некоторые из них являются коллегами Оча в Google. В этих кругах распространено убеждение, что компьютеры всё больше становятся похожи на людей, и уже через несколько десятилетий мы сможем загружать в них наше сознание и таким образом жить вечно.

Другие инженеры понимают, что поверхностные сравнения компьютеров и людей не отдают должного сложности ни тех, ни других. К этой категории относится Джозеф Оч.

Догадайтесь, кто из них пишет более полезные программы?

© Ли Гомес

Впервые опубликовано на сайте журнала Forbes.ru

← Вернуться
хостинг для сайтов © Langust Agency 1999-2024, ссылка на сайт обязательна