11.02.2025 Экспертиза, Искусственный интеллект
Модели рассуждений включают в себя цепочку мыслей, в которой задействованы дополнительные токены (источник: OpenAI)
Стремительный взлет DeepSeek R-1 привлек внимание к новому типу моделей ИИ, называемых моделями рассуждений (reasoning model, RM). По мере того как приложения генеративного ИИ выходят за рамки разговорных интерфейсов, RM, вероятно, будут расширять свои возможности и применение, сообщает портал BigDATAwire. Модель рассуждений — это тип большой языковой модели (LLM), которая может выполнять сложные задачи рассуждения. Вместо того чтобы быстро генерировать результат, основываясь исключительно на статистической догадке о том, каким должно быть следующее слово в ответе, как это обычно делает LLM, RM тратит время на то, чтобы разбить вопрос на отдельные шаги и проработать «цепочку мыслей», чтобы прийти к более точному ответу. Таким образом, RM гораздо больше похожа на человека в своем подходе. OpenAI представила свои первые RM, получившие название o1, в сентябре 2024 г. Компания объяснила, что использовала методы обучения с подкреплением (RL) для обучения RM, чтобы она могла решать сложные задачи в области математики, естественных наук и кодирования. Модель справилась с задачами по физике, химии и биологии на уровне аспирантов, а по математике и кодированию превзошла способности аспирантов. По мнению OpenAI, по сравнению с более ранними языковыми моделями, RM решают задачи более похожим на человеческий способом. #IMAGE_231626# «Подобно тому, как человек может долго думать, прежде чем ответить на сложный вопрос, o1 использует цепочку мыслей при попытке решить задачу, — поясняет ...
читать далее.