21.06.2024 Новости, Искусственный интеллект, Итоги и тенденции, Обзоры рынковПродолжение. Начало тут и тут Тренд № 3. Развитие мультимодального ИИ Мультимодальный ИИ — модели ИИ, выполняющие пользовательские операции и обученные на данных из нескольких модальностей (текст, изображения, видео, 3D, речь, звуки, таблицы, графы, код). Мультимодальный ИИ расширяет способы применения больших языковых моделей. Как правило, мультимодальные модели основаны на глубоких нейронных сетях, хотя используются и другие методы машинного обучения, например, скрытые марковские модели или ограниченные машины Больцмана. Унимодальные модели — модели ИИ, которые опираются на один тип данных. Stanford University: новые мультимодальные системы (GPT-4, Gemini, Claude 3) могут генерировать беглый текст на десятках языков, обрабатывать аудио и даже объяснять мемы. Мультимодальные модели предлагают универсальный и комплексный ...
читать далее.