16.12.2024 Экспертиза, Искусственный интеллект, Открытый код/LinuxАрхитектура Aria
Портал The New Stack представляет пять ведущих вариантов мультимодальных систем искусственного интеллекта с открытым исходным кодом, указывая на их особенности и сферы применения. Мультимодальный ИИ привлекает большое внимание благодаря манящему обещанию универсальности — способности обрабатывать комбинации текста, изображений, аудио и видео. И хотя на рынке уже существует целое созвездие мощных проприетарных мультимодальных систем ИИ, небольшие мультимодальные модели и Open Source-альтернативы также быстро завоевывают позиции, поскольку пользователи продолжают искать более доступные и адаптируемые варианты, а также отдают приоритет прозрачности и сотрудничеству. Ниже представлены некоторых из наиболее популярных Open Source-вариантов. 1. Aria Недавно представленная ИИ-модель Aria от компании Rhymes AI заявлена как первая в мире мультимодальная Open Source-модель с архитектурой Mixture of Experts (MoE), которая может обрабатывать текст, код, изображения и видео — все в рамках одной архитектуры. Эта универсальная модель относительно мощная по сравнению даже с более крупными моделями, но при этом более эффективная, поскольку в зависимости от задачи она избирательно использует множество подмоделей («мини-экспертов»), каждая из которых специализируется на разных аспектах входных данных или типов задач. Ее архитектура рассчитана на легкое масштабирование, поскольку для решения новых задач можно добавлять новых «экспертов», не перегружая систему. Aria отлично справляется с ...
читать далее.