ОПК запускает первую в стране систему интеллектуального анализа текстов

Ростех Объединенная приборостроительная корпорация и российская компания "Авикомп Сервисез" объявили о выводе на рынок совместного проекта – лингвистического процессора Ontosminer. Программа способна проводить мониторинг СМИ, анализировать большие массивы данных, различную статистическую, научно-техническую, правовую, медицинскую и иную информацию, а также систематизировать документы.

В качестве эксперимента разработчики открыли доступ к тестовой версии Ontosminer для российских студентов, научных сотрудников и исследовательских коллективов.

"Это еще одна ступень на пути к созданию искусственного интеллекта. Мы научили машину понимать и анализировать письменную речь, извлекать из нее необходимые факты и смыслы, – прокомментировал создание процессора директор департамента инновационного развития ОПК Александр Калинин, слова которого приводятся в сообщении компании. – Сегодня общеизвестно: 85 процентов информации содержится не в базах данных, а в текстах, и задача дня – научиться эту информацию находить. Над созданием подобных систем активно работают крупнейшие зарубежные компании, такие как Google и Facebook. В России это, без преувеличения, первая собственная разработка такого уровня".

В отличие от традиционных поисковых систем в качестве запроса здесь выступает не отдельное слово, а целый документ, например отрывок текста или статья, после загрузки которого система выдает все, что есть на заданную тему в информационном пространстве. В ходе выполнения задачи Ontosminer не просто механически ищет ключевые слова, а ориентируется именно на смысл текстов, что значительно повышает результативность и качество отработки запроса. По итогам анализа всего массива информации комплекс способен автоматически сформулировать краткое резюме, где изложена суть события, ситуации или проблемы.

Лингвистические процессоры являются центральным компонентом и наиболее охраняемым know-how систем интеллектуального анализа. Ранее их создание требовало усилий больших команд лингвистов, которые вручную составляли правила разбора документов, создавали словари и сложные схемы семантических связей между словами, затем это все переводилось на язык машин. Как отмечают разработчики, Ontosminer выводит возможности текстового анализа на новый уровень. Система построена на принципах машинного обучения, когда помощь лингвистов больше не требуется – компьютер, обрабатывая большое количество текстов, "учит" себя сам понимать их смысл. В настоящий момент в "голове" у лингвистического процессора – десятки миллионов документов. В перспективе этот показатель будет увеличен до нескольких сотен миллионов, что сделает его возможности еще более впечатляющими.

По словам Александра Калинина, эта технология в перспективе может быть применена для анализа изображений и звука: машина получит возможность "видеть" и "слышать".

Одним из участников проекта выступает Высшая школа экономики. Ученые вуза – математики и лингвисты – принимали непосредственное участие в создании нового программного продукта.
Источник информации
Пресс-служба ОАО "Объединенная приборостроительная корпорация"
Компании
Опубликовано 17.04.2015