UNL - Universal Networking Language
Ссылки UNL-центр русского языка Более подробная информация о проекте доступна на сайте Фонда UNDL
UNL - Universal Networking Language

В ИНТЕРНЕТ - ПОВЕРХ ЯЗЫКОВЫХ БАРЬЕРОВ

Хотелось бы рассказать читателям дайджеста об одном обширном международном проекте, который осуществляется с 1996 года под эгидой ООН. С распространением общедоступных средств массовой коммуникации и, прежде всего, Интернета особую остроту приобрела проблема языкового барьера. После того, как временные и пространственные барьеры были успешно преодолены, остался единственный фактор, принципиально ограничивающий свободу обмена информацией. Это тот факт, что люди продолжают говорить и думать на разных языках. Несмотря на очевидные удобства, которые возникли бы, если бы люди в глобальном масштабе перешли на английский язык как универсальный язык межнационального общения, этого перехода не произошло и в обозримой перспективе не произойдет. Напротив, в мире нарастают тенденции защиты национальной идентичности и культурной автономии, которые препятствуют превращению английского языка в настоящий язык-посредник наподобие лингва франка. В силу этого и других обстоятельств проблема языкового барьера была осознана как одна из глобальных проблем человечества, и Университет ООН организовал проект, направленный на ее решение или, по крайней мере, смягчение. Идея проекта состоит в следующем.
Разработан специальный формальный язык для записи значений – UNL, Universal Networking Language (автор языка – известный специалист по машинному переводу, разработчик системы ATLAS – лучшей системы японско-английского перевода, Хироси Учида). Для каждого из естественных языков, участвующих в проекте, должны быть разработаны две процедуры – конверсия, то есть преобразование текстов данного языка в UNL-представление, и деконверсия, представляющая собой обратное преобразование. Совокупность этих двух процедур образует UNL-сервер для данного языка. UNL-серверы для разных языков объединяются в UNL-сеть, включенную в Интернет. Владельцы Интернет-ресурсов, заинтересованные в том, чтобы эти ресурсы были доступны людям поверх языковых барьеров, переводят их на UNL. На основе UNL можно осуществлять не только конверсию и деконверсию текстов, но и такие процедуры, как информационный поиск, извлечение информации из текстов, автоматическая индексация и т.п. Пользователь, обнаруживший в сети интересующую его информацию на языке UNL, обращается к соответствующему UNL-серверу, который возвращает текст на нужном естественном языке.
Проект обладает рядом особенностей, принципиально отличающих его от традиционных систем машинного перевода, в том числе и использующих язык-посредник. Прежде всего, UNL претендует на то, чтобы быть языком представления значений широкого профиля. UNL-представление текста может создаваться, храниться и обрабатываться независимо от задачи порождения текста на естественном языке. Получение текста на том или ином естественном языке – особая задача, которая может быть отложена до того момента, когда конечному пользователю это понадобится. Отсюда вытекает, что процедура конверсии может не быть полностью автоматической. Она мыслится как интерактивный и итеративный процесс, в котором компьютер взаимодействует с человеком-экспертом. Благодаря этому можно будет добиться полного различения всех неоднозначностей и, как следствие, более высокого качества последующей обработки и, в частности, порождения. Имеет смысл постараться и один раз качественно подготовить UNL-представление для текста, чтобы обеспечить его адекватное порождение на всех рабочих языках.
Вся деятельность по UNL координируется Фондом UNDL (Женева) и Университетом ООН (Токио). Имеется UNL-Центр во главе с Хироси Учидой и несколько локальных UNL-центров, каждый из которых отвечает за конкретный естественный язык. На сегодняшний день программа охватывает следующие языки: английский, арабский, индонезийский, итальянский, испанский, китайский, корейский, португальский, русский, тайский, французский, хинди и японский. Для большинства из них имеются модули деконверсии, а для некоторых – и конверсии.
UNL-модули для русского языка разрабатываются в ИППИ РАН на основе системы ЭТАП-3. Совместно с компанией STAR (Санкт-Петербург) ИППИ образовал UNL-центр русского языка, на сайте которого (www.unl.ru) можно тестировать модуль русской деконверсии.
Более подробная информация о проекте доступна на сайте Фонда UNDL: www.undl.org.
И. М. Богуславский, ИППИ РАН


ДИАЛОГ



Хостинг от uCoz