"ОПК" объединила вузы и компании для работы над искусственным интеллектом

На конференции "ИТ на службе оборонно-промышленного комплекса", которая проходит в эти дни в г.Иннополис (Республика Татарстан), входящая в Ростех "Объединенная приборостроительная корпорация" объявила о старте масштабного исследовательского проекта в области искусственного интеллекта и семантического анализа данных с участием более 30 российских компаний, образовательных и научных организаций. В его рамках участники получили бесплатный доступ к уникальной разработке - недавно анонсированному лингвистическому процессору Ontosminer, с помощью которого исследователи будут развивать технологии интеллектуального анализа текстов в самых различных сферах – от мониторинга СМИ до обработки научных данных и бизнес-аналитики.

Наряду с корпорацией организатором проекта выступает российская компания-разработчик интеллектуального программного обеспечения "Авикомп Сервисез". Проект реализуется при поддержке компании "Т-Платформы", которая предоставила для размещения лингвистического процессора высокопроизводительный сервер, позволяющий работать с большими объемами информации.

"Создание искусственного интеллекта является одним из основных трендов развития ИТ-технологий во всем мире. Неоднократно высказывалось мнение, что технологии искусственного интеллекта гораздо опаснее, чем существующие виды вооружений, - говорит директор департамента инновационного развития "Объединенной приборостроительной корпорации" Александр Калинин. - Главные конкуренты России в этой области на государственном уровне - США и Китай, на корпоративном – Google, Facebook, Apple и Baidu, осуществляющие масштабное инвестирование подобных проектов. В США это направление финансируются из бюджетов DARPA, IARPA, In-Q-Tel и еще около двадцати специализированных венчурных фондов. В нашей стране эти технологии только начинают развиваться, но процесс их развития набирает обороты".

Российская система семантического анализа данных базируется на последних достижениях в области машинного обучения и технологий Big Data. Обрабатывая массивы данных, компьютер учится понимать морфологию, синтаксис языка, семантику слов и целых текстов. На основе этих "знаний" вычислительная машина осуществляет поиск необходимых пользователю новостей, статей, документов, справок итд в интернет-источниках и различных информационных хранилищах. В отличие от традиционных поисковых систем Ontosminer находит нужные сведения не по отдельным тегам (ключевым словам), а по смыслу целого документа, заданного в качестве запроса. Изучив весь объем данных и сформировав необходимую подборку, лингвистический процессор способен автоматически составить краткий аналитический отчет с описанием сути вопроса или события.

"Это умная система, способная без участия человека решать самые серьезные аналитические и прикладные задачи в разных сферах деятельности - в бизнесе, госуправлении, силовых ведомствах, здравоохранении, образовании, науке и т.д., - комментирует Александр Калинин. – Например, лингвистический процессор позволяет вести мониторинг новостей СМИ и социальных сетей, систематизировать документооборот в крупных организациях, на его основе возможна интеграция разноформатных баз данных. С помощью этого продукта можно анализировать большие объемы юридической, медицинской, технической информации. Специализация системы варьируется путем целенаправленного обучения вычислительной машины определенным "знаниям"".

Среди участников проекта - Высшая школа экономики, Вычислительный центр РАН, Научно-исследовательский и испытательный центр биометрической техники МГТУ им.Баумана, Научно-техническое общество нефтяников и газовиков имени И.М.Губкина, Тихоокеанский госуниверситет, Ярославский государственный университет, Волгоградский государственный технический университет, Центральный НИИ экономики, информатики и систем управления, редакции нескольких федеральных СМИ, ряд других организаций, государственных и частных компаний, работающих в сфере информационных услуг, разработки ПО, энергетики, юриспруденции.

"За подобными технологиями будущее. На их основе, например, можно строить робототехнику или автоматизированные системы типа "умный дом", где вычислительная машина сама анализирует данные с различных устройств и принимает нужные решения, - комментирует Александр Калинин. – Развитие собственных семантических технологий в России только набирает обороты, и мы пытаемся сконцентрировать усилия различных исследовательских команд, энтузиастов, желающих работать в этом направлении. Сейчас через лингвистический процессор пропущены десятки миллионов документов – в основном, публикаций СМИ. Цифра выглядит внушительно, но пока это достаточно скромная база "знаний". Этот показатель должен постоянно и кратно расти за счет ввода в систему новых данных из различных областей, что позволит дальше наращивать и совершенствовать ее аналитические способности. Именно эту задачу призван решить наш проект при участии многочисленных партнеров, которым открыт доступ к нашей системе. Этот опыт, на наш взгляд, может дать бесценный результат с точки зрения апробации и развития отечественных платформ анализа больших данных".
Источник информации
Пресс-служба ОАО "Объединенная приборостроительная корпорация"
Опубликовано 28.05.2015