08.04.2025 НовостиКомпания Content AI, российский разработчик решений для интеллектуальной обработки информации, представила новую версию IDP-платформы ContentCapture с возможностью атрибутивного распознавания документов с использованием больших языковых моделей (LLM). ContentCapture 14.8 интегрируется с российскими большими языковыми моделями YandexGPT и GigaChat. Совместное использование OCR-технологий и LLM внутри платформы обеспечивает высокоточное извлечение данных из неструктурированных документов, таких как технические инструкции и регламенты, а также из документов с вариативной структурой расположения данных: договоров, претензий, уставов, протоколов, доверенностей и резюме. После предварительного обучения ContentCapture в связке с LLM достигает точности извлечения отдельных полей из неструктурированных документов до 98%. Новые функциональные возможности IDP-платформы востребованы для автоматизации работы вспомогательных подразделений, таких как бухгалтерия, HR, юридический блок, отдел продаж, служба поддержки клиентов и производственные подразделения. Интеграция с облачной моделью позволяет заказчикам снизить стоимость обработки документов, особенно в условиях ограниченной инфраструктуры. В будущих релизах планируется реализация совместного использования ContentCapture с локальными языковыми моделями для работы в закрытом контуре. IDP-платформа ContentCapture — один из флагманских продуктов Content AI. Она обеспечивает потоковую обработку документов любых форматов ...
читать далее.