❄🎄❄ самый большой выбор подарков к Новому году ❄🎄❄
О недостатках статистического машинного перевода смотрите здесь!
23/08/2005 Google лидирует в тестах машинного перевода
Впервые опубликовано на сайте ZDNet.ru
На сайте ZDNet.ru была опубликована заметка о первенстве поисковой системы Google в машинном переводе.
Ниже материал заметки приведён полностью.
Поисковый гигант хочет сделать Web более интернациональным и добился некоторых успехов в продвижении к этой амбициозной цели: в испытаниях, организованных правительством США, его программное обеспечение машинного перевода победило конкурентов от IBM и академической науки.
Google показала лучшие результаты в тестах на перевод с арабского и китайского языков на английский, предложенных Национальным институтом естественных наук и технологии (NIST). Каждый тест включал перевод 100 заметок информационных агентств France Presse и Синьхуа, вышедших с 1 декабря 2004 года по 24 января 2005 года. Результаты были опубликованы в начале августа.
Традиционно машинный перевод считается синонимом ломаного английского, однако увеличение обрабатывающей мощности и большое количество образцов позволило ученым повысить точность этих систем. Например, молодая компания Language Weaver создала ПО, переводящее передачи телеканала Эль-Джазира. Исследования на эту тему проводятся в Институте лингвистики Карнеги-Меллонского университета (CMU) и в других университетах. (Ни Language Weaver, ни CMU не участвовали в последних тестах.)
Машинный перевод Google несовершенен, но значительно опережает конкурентов. По шкале от нуля до единицы программное обеспечение компании набрало 0,5137 в тестах на перевод с арабского и 0,3531 - с китайского. Второй результат показал Институт информатики Университета Южной Калифорнии (0,4657 в тестах на перевод с арабского и 0,3073 - с китайского). IBM получила 0,4646 по арабскому языку и 0,2571 по китайскому.
В числе других участников испытаний были Эдинбургский университет и Харбинский технологический институт. NIST отмечает, что большая часть представленных программ разработана научно-исследовательскими институтами.
Google, вероятно, помогло гигантское хранилище исходного материала. В общем случае программное обеспечение машинного перевода работает тем лучше, чем больше данных находится в его распоряжении. А Google, благодаря своей поисковой системе, накопила миллиарды переведенных веб-страниц.
Подобно Yahoo и другим, в поисках новых заказчиков Google обращается к развивающимся странам. Компания предлагает на своем сайте некоторые инструменты машинного перевода и несколько редакций на иностранных языках.
© Майкл Канеллос
Впервые опубликовано на сайте ZDNet.ru