"Распределенные онтологии" сделают интернет "умнее"

Многозначность слов естественных языков - большая головная боль для специалистов в области компьютерной техники и интернета. Стремительный рост последнего, а также отсутствие надежных поисковых стандартов приводят к большим проблемам при поиске нужной информации. Поэтому усилия многих ученых сейчас направлены на кардинальное обновление Всемирной паутины, превращение ее из "сети гиперссылок" в "сеть смыслов" или, как назвал ее Тим Бернерс-Ли, в "Семантическую паутину". Возможно, подход, развиваемый Джеффом Хефлиным (Jeff Heflin: cse.lehigh.edu/~heflin) из Университета Лехая, приблизит ее появление.

Этот подход получил название "распределенных онтологий". Обычно под онтологией понимают теорию о различных видах сущностей, выразимых с помощью языковых средств. В компьютерных науках онтология отражает знания о мире и позволяет находить ответы даже на явно не выраженные запросы. Но Сеть столь обширна и разнообразна, что отражение ее в рамках какой-то одной онтологии требует слишком больших усилий по стандартизации. Ведь может быть и так, что искомая информация вообще не находится на одной веб-странице. Поисковые машины в "Семантической паутине" должны уметь обходить эти трудности и, например, объединять различные информационные фрагменты с различных сайтов для получения максимально полного ответа на запрос.

Хефлин совместно с другими экспертами из рабочей группы, сформированной World Wide Web Consortium (W3C), разработал специальный язык веб-онтологии (Web Ontology Language), аббревиатуру для которого слегка подкорректировали в OWL ради созвучия со словом owl, что по-английски означает "сова", а она, как известно, символизирует мудрость. Однако все еще остается неясным, как правильно комбинировать различные онтологии, особенно если они противоречат друг другу. Хефлин ищет способы такой разбивки Сети на онтологии, которые давали бы наилучшие результаты по поисковым запросам. Чтобы стимулировать эти работы, Национальный фонд науки США выделил 500 тысяч долларов на ближайшие 5 лет.

Пресс-релиз: www3.lehigh.edu/engineering/news/heflincareerawards.asp.

Сергей САНЬКО

 
Версия для печатиВерсия для печати

Номер: 

43 за 2004 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!