Пентагон приступил к созданию системы, которая позволит обеспечить войска мгновенным и адекватным переводом речи на разных языках в боевых условиях. Языки «вероятного противника», наряду с английским, – китайский и арабский.
Пентагон создает суперкомпьютер, который позволит из огромных массивов перехваченных разговоров и обменов данными на самых разных языках мира вычленять информацию, которая может иметь отношение к шпионажу против США, и тут же переводить ее на английский. По мнению экспертов, данный проект в области лингвистики не имеет прецедентов.
Агентство передовых оборонных проектов США DARPA выделило на это сумму, оцениваемую в $50 млн на ближайшие два года. Согласно имеющейся информации, контракты на разработку оборудования получили компании IBM, SRI и BBN. Тем не менее, официальный представитель DARPA отказалась подтвердить информацию и о сумме контрактов, и об участвующих в работах компаниях.
Если усилия разработчиков увенчаются успехом, машина впервые сможет не просто распознавать речь, произносимую на различных языках, но и тут же корректно переводить ее на английский, а затем самостоятельно вычленять из «мусора» информацию, свидетельствующую о скрытом шпионаже или иной противоправной деятельности.
Проект получил название GALE (Global Autonomous Language Exploitation, глобальная система автоматической обработки языков), которое подчеркивает значимость и цель — превращение циклопических объемов данных в виде записей разговоров на разных языках, телефонных переговоров, интернет-сообщений и т.д. в обработанную информацию, пригодную для использования аналитиками спецслужб, шпионах и войсками на поле боя.
В настоящее время, сообщает Red Herring, США рассматривают в качестве одного из основных препятствий с борьбе с исламским терроризмом и в войнах в арабских странах вообще невозможность в сколь-нибудь разумные сроки «разгрести» и быстро перевести те чудовищные объемы информации, которые удается получить.
"По мнению DARPA, проект GALE способен стать «Святым Граалем» лингвистических технологий, полагает Джон Макгоул (John Makhoul), сотрудник компании BBC, принимающий участие в работах по проекту GALE. В настоящее время, по его словам, лучшие программы распознавания речи при работе в конкретной среде, такой, как телевизионное вещание, позволяют правильно определять девять слов из десяти. DARPA хочет добиться 95% успешного перевода. Кроме того, программа должна обрабатывать радиовещание, телевидение, диалоги в ток-шоу, новостные сообщения и информацию из новостных выпусков, сетевых дневников, а также телефонных переговоров. Языки «вероятного противника» — английский, китайский и арабский. В настоящее время, по мнению экспертов, точность перевода текста системами автоматического перевода составляет около 80%.
В настоящее время ПО для распознавания текста и автоматического перевода уже используется — в частности, в системах обработки вызовов и в ряде межнациональных корпораций. Пентагон хочет, чтобы проект GALE позволил бы «вывести» эти системы из просторных кондиционированных помещений, создав неприхотливую систему, пригодную к быстрому развертыванию в полевых условиях.