23.10.2024 Новости, Бизнес-практикум, Консалтинг и системная интеграция, Менеджмент, ОС и разработка приложений
Дмитрий Романов
По оценкам аналитиков Gartner, 80-90% данных, хранящихся в организациях, — неструктурированные. Это электронные письма, изображения и другие файлы разных форматов, для обработки которых в автоматизированном режиме требуются специальные технологии. Управляющий директор «Преферентум» компании SL Soft (ГК Softline) Дмитрий Романов — о том, как интеллектуальные инструменты помогают собирать, обрабатывать и анализировать эти данные, в том числе для передачи в BI-системы, повышая скорость и качество управленческих решений. Роль и место текстовой аналитики в ИТ-инфраструктуре Как крупные, так и небольшие организации в своей деятельности постоянно сталкиваются с различными документами, поступающими из внешних источников или формируемыми внутренними службами и системами. Примерно в 80% случаев это неструктурированные текстовые файлы, но даже если это изображения или аудио, — для компании в подавляющем большинстве случаев важен содержащийся в них текст. Быстрая и качественная обработка этих документов, индексирование, извлечение из них полезной информации и последующая бизнес-аналитика (BI) — задачи, напрямую влияющие на эффективность бизнеса. Среди главных трудностей при внедрении BI-решений в организации — низкое качество управления данными и отсутствие автоматизации их ведения в источниках. Специфика работы с неструктурированными данными связана с их огромными объемами, разнообразием типов и форматов, отсутствием четкой типовой структуры. Кроме того, их трудно агрегировать, так как ...
читать далее.