Агентство Лангуст [переход на главную]

О недостатках статистического машинного перевода смотрите здесь!

23/08/2005 Google лидирует в тестах машинного перевода
Впервые опубликовано на сайте ZDNet.ru

На сайте ZDNet.ru была опубликована заметка о первенстве поисковой системы Google в машинном переводе.

Ниже материал заметки приведён полностью.

Поисковый гигант хочет сделать Web более интернациональным и добился некоторых успехов в продвижении к этой амбициозной цели: в испытаниях, организованных правительством США, его программное обеспечение машинного перевода победило конкурентов от IBM и академической науки.

Google показала лучшие результаты в тестах на перевод с арабского и китайского языков на английский, предложенных Национальным институтом естественных наук и технологии (NIST). Каждый тест включал перевод 100 заметок информационных агентств France Presse и Синьхуа, вышедших с 1 декабря 2004 года по 24 января 2005 года. Результаты были опубликованы в начале августа.

Традиционно машинный перевод считается синонимом ломаного английского, однако увеличение обрабатывающей мощности и большое количество образцов позволило ученым повысить точность этих систем. Например, молодая компания Language Weaver создала ПО, переводящее передачи телеканала Эль-Джазира. Исследования на эту тему проводятся в Институте лингвистики Карнеги-Меллонского университета (CMU) и в других университетах. (Ни Language Weaver, ни CMU не участвовали в последних тестах.)

Машинный перевод Google несовершенен, но значительно опережает конкурентов. По шкале от нуля до единицы программное обеспечение компании набрало 0,5137 в тестах на перевод с арабского и 0,3531 - с китайского. Второй результат показал Институт информатики Университета Южной Калифорнии (0,4657 в тестах на перевод с арабского и 0,3073 - с китайского). IBM получила 0,4646 по арабскому языку купить учебники и пособия по арабскому языку и 0,2571 по китайскому.

В числе других участников испытаний были Эдинбургский университет и Харбинский технологический институт. NIST отмечает, что большая часть представленных программ разработана научно-исследовательскими институтами.

Google, вероятно, помогло гигантское хранилище исходного материала. В общем случае программное обеспечение машинного перевода работает тем лучше, чем больше данных находится в его распоряжении. А Google, благодаря своей поисковой системе, накопила миллиарды переведенных веб-страниц.

Подобно Yahoo и другим, в поисках новых заказчиков Google обращается к развивающимся странам. Компания предлагает на своем сайте некоторые инструменты машинного перевода и несколько редакций на иностранных языках.

© Майкл Канеллос

Впервые опубликовано на сайте ZDNet.ru

← Вернуться
хостинг для сайтов © Langust Agency 1999-2024, ссылка на сайт обязательна