"Младший брат" IBM Watson занялся анализом патентов

В "КВ" уже публиковалась информация о самообучаемом компьютере-эрудите IBM Watson, который способен отвечать на вопросы, разбираясь в массиве неструктурированных данных. Он проявил себя с лучшей стороны, выиграв несколько раундов викторины Jeopardy ("Своя игра") у чемпионов этой игры.

Затем Watson пошёл в медицину: начал анализировать издания из национальной медицинской базы PubMed и десятки учебников. К маю 2011 года он освоил программу колледжа и первого курса университета, то есть смог правильно отвечать на вопросы экзаменов, которые сдают студенты-медики. По прогнозу разработчиков, через три-пять лет Watson будет готов для первых пилотных тестов по лечению реальных пациентов, а через 8-10 лет такие компьютеры могут найти широкое применение в больницах в качестве диагностического инструмента. Первый контракт на коммерческое использование Watson уже заключён с медицинской компанией WellPoint.

Врач-диагност - не единственная профессия, где людям трудно тягаться с автоматизированными системами анализа массива неструктурированных данных. Есть ещё одна профессия, пусть и не такая почётная. Это юрист, специалист по патентному праву.

IBM разработала систему Strategic IP Insight Platform (SIIP), которую предлагают купить крупным корпорациям для анализа и управления портфелем интеллектуальной собственности (ИС). Система осуществляет дата-майнинг в базе патентов, анализирует архивы информацию по теме, чтобы владелец ИС мог проанализировать и обнаружить "проблемы" в своей или чужой патентной базе.

SIIP применили для создания базы, содержащей записи о медицинских патентах, а также биомедицинские журналы и информацию о фармацевтических препаратах. Предполагается, что эта база поможет в разработке новых лекарств.

 

Из каждой статьи/патента/описания система SIIP извлекла названия химических препаратов, диаграммы, имена учёных-изобретателей и другие ключевые слова. К данному моменту обработано 2,5 млн названий препаратов, 4,7 млн патентов и 11 млн журнальных статей с 1976 по 2000 годы. Часть собранной информации IBM пожертвовала в открытый справочник препаратов PubChem.

SIIP создана на базе тех же технологий, что и Watson. Напомним, что Watson - сервер POWER7, для обработки информации используются Apache Hadoop, Apache UIMA и другие программы, созданные разработчиками IBM.

Анатолий АЛИЗАР

Версия для печатиВерсия для печати

Регион: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!