Друзья, всем привет! ИИ захватит планету! Или все-таки нет? Сложно сказать, но развивается история уж очень быстро. Почти все ведущие производители нейросетей либо уже внедрили функцию глубокого исследования, либо уже вот вот. Это новая крайне полезная во многих сферах штука. Шаг вперед от простого бормотания к рассуждениям. И от рассуждений к практическому их применению – deep research.
Я решил протестировать эту функцию в разных нейросетях, которые мне доступны и сделать вывод, что лучше всего использовать, есть ли явный лидер. Про сам инструмент глубокого исследования напишу отдельно. Сегодня лишь сравнение и мое субъективное мнение о том, какая нейросеть лучше для этой задачи.
Критерии исследования
Для того, чтобы сравнить результаты проведения глубокого исследования среди нейросетей я придумал несколько критериев. Они субъективны, тем не менее, позволяют почувствовать отличия. Итак, все по порядку.
Соответствует ли исследование по смыслу и объему той задачи, которую я поставил ИИ.
По сути, получил ли я что хотел? Без деталей на 100% или на 60%. В целом. Если пошел за яблоками, а купил груши – значит нет. Если принес зеленые яблоки, или красные, или может даже червивые – в целом, результат есть. Про качество результата – отдельно.
Особенности
Здесь что-то, что в каждой нейросети мне бросилось в глаза. Или не бросилось. В общем, какие-то фишечки.
Фактология
Если исследование выдумано – это уже не факты, это фантазии. Я специально выбрал тему, которую знаю, которую отслеживаю в СМИ и аналитике (тарифы и экономическая политика Трампа). Поэтому без труда смог бы отделить факты от… выдумок. Никто не отменял галюцинирование нейросетей.
Получил ли я ответ на свой запрос
Другими словами, надо ли мне спрашивать заново? Или я получил ответ, информацию, тезисы, с которыми уже могу работать.
Насыщенность мыслями, вода
Насыщенность мыслями – это нюансы, детали. Хорошая насыщенность – показатель большого количества источников. Вода – это бла бла бла, которое можно сократить или выбросить.
Логика и выводы?
Я проверяю не только фактологию, но и способность ИИ анализировать полученные результаты и собирать их воедино.
Ошибки, бредятина
Здесь все понятно: количество фантазий, неадеквата, странностей. Как же без этого?
Ссылки на источники?
Это важно. Поскольку речь идет про глубокое исследование, хорошо бы понимать, на какие источники опирался тот или иной ИИ при подготовке deep research.
Ну что, поехали?
Глубокое исследование от модели GPT 4.5 open AI
Это первая модель, на которой я протестировал глубокое исследование. Сначала я спросил у нейросети как лучше сформулировать задачу для deep research и получил ответ, что ставить задачу надо максимально масштабно, чтобы нейросеть понимала, в каком направлении искать.
Я попросил провести исследование на тему тарифов Трампа, их влияния, взаимосвязей с экономикой, фондовым рынком. Задача была поставлена так, что мне нужно как можно больше не повторяющейся уникальной фактологии для анализа ситуации. Т.е. нейросеть делает предварительный рисерч, формирует отчет, я его внимательно изучаю, задаю вопросы, получаю дополнительную информацию и использую данные материалы при написании статьи.
Соответствует ли исследование по смыслу и объему той задачи, которую я поставил ИИ.
Результат, который я получил в чат GPT 4.5 в формате deep research меня более чем удовлетворил. Я специально выбрал тематику, которую я сам отслеживаю в новостях. Т.е. я понимаю череду событий, видел их влияние и на фондовый рынок и на ожидания экспертов в разрезе влияния на экономику. У меня и свои мысли есть на этот счет. Другими словами, мне не составило труда оценить то, как нейросеть выполнила свою работу.
Более того, исследования нейросети по заданной тематике подсветили порядка 10 моментов, которые я либо упустил, либо не обратил на них внимание. Но в общей логической взаимосвязи череды событий это довольно интересные события. Т.е. GPT 4.5 погрузился в вопрос сильно глубже, чем я и подсветил незамеченные, но полезные моменты.
Особенности GPT 4.5 в deep research
Работает долго: дольше других. Даже дольше чем Gemini, который перерывает по 200 ссылок!
Перед тем, как начать глубокое исследование GPT задал наводящие вопросы, чтобы его рисерч получился более глубоким и удовлетворил мой запрос. Это круто! Промпт был довольно большой. И уточняющие вопросы (мои ответы) увеличили промпт еще больше. Основательный подход – подумал я!
Эмоциональный интеллект! Вот эта штука, которая сильно отличает нейросеть от Open AI от всех остальных. Ответ, который я получил был, в целом, несколько адаптирован к тому способу общения, формулирования мыслей, который близок именно мне. Было ощущение, что это могут быть и мои мысли… Любопытно, да? Руководство Open Ai на презентации GPT 4.5 говорило об эмоциональной составляющей новой модели. Но я тогда не обратил на это внимание. А вот теперь обратил – и это круто!
Фактология GPT 4.5 в deep research
Я не нашел фактологических ошибок в результатах глубокого исследования модели GPT 4.5. Возможно, некоторым событиям модель от Open AI уделила больше значения, чем сделал бы это я. А что-то, наоборот, осталось менее подсвеченным. Но, в целом, событийный ряд изложен верно.
Получил ли я ответ на свой запрос GPT 4.5 в глубоком исследовании
Да, я получил что хотел. И в части событийного ряда (как развивались события). И в части аналитики этого событийного ряда (мне было интересно, что нейросеть думает о влиянии действий Трампа на некоторые сектора фондового рынка и экономики). Т.е. от ИИ требовалось провести исследование.

На скрине выше одна из табличек, которую подготовила модель GPT 4.5 в рамках проведения глубокого исследования.
Насыщенность мыслями, вода GPT 4.5 в глубоком исследовании
Насыщенность мыслями высокая: по этому параметру GPT 4.5 в лидерах наряду с Gemini от Гугла. Но вода тоже была. Возможно эта эмоциональная штука, которую распиарили Open AI, возможно она послужила причиной, что некоторые схожие мысли (блоки мыслей) подаются в нескольких местах под разным соусом. Процентов 5-10 текста я бы убрал, т.к. он повторяется, просто в другой форме.
По объему исследования GPT 4.5 выдал самый большой результат. Даже если убрать «воду» объем статьи вышел процентов на 25 больше, чем у Gemini.
Логика и выводы GPT 4.5 в глубоком исследовании
Я не нашел какой-то дичи или явной непоследовательности в исследовании от модели Open AI. Упор на те или иные факты и мнения – это дело вкуса. В целом, выводы меня удовлетворили. Через пару дополнительных вопросов к исследованию можно получить у ИИ более расширенный вариант возможных выводов по ситуации. Но даже без этого всего в ответе достаточно.
Важно отметить, что GPT 4.5 в своем глубоком исследовании попытался даже спрогнозировать будущее развитие ситуации (т.е. сгенерировать новые знания), явно не вытекающие из первоисточников. Я убежден в этом, так как ни одна модель не подсветила этих знаний. И если бы они существовали, где-то бы что-то да пролезло. Но нет. Т.е. GPT 4.5 проявил некоторый энтузиазм в вопросе исследования.
Ошибки, бредятина GPT 4.5 в глубоком исследовании
Явных ошибок и бреда я не обнаружил. Разве что были повторы одних и тех же мыслей, но об этом сказано выше.
Ссылки на источники GPT 4.5 в глубоком исследовании
Deep Research от Chat GPT ссылается на источники. Ссылок сильно меньше, чем в Гугл Gemini. Но примерно столько же, сколько и в Гроке Илона Маска.
Особенность ссылочной массы – она, в основном, относится к русскоязычным источникам. Мне показалось, что процентов 70 всех ссылок для исследования, которые подтянул Chat Gpt – это русскоязычные сайты. При том, что само событие (деятельность Дональда Трампа) происходит в англоязычной среде и первоисточники информации это, все же, англоязычные СМИ и аналитические сайты.
Возможно в этом причина, что именно Gemini от Гугла дал более мощную (наверное, в 2 раза) фактологию по проблеме, но об этом дальше.
Общий вывод по GPT 4.5
Классный результат в целом в deep research, глубокий, обоснованный, хорошо структурирован, хорошо подан.
Хотелось бы большего разнообразия источников исследования: возможно это корректируется на уровне промпта.
Глубокое исследование от модели Gemini
Далее – нейросеть от Гугла. Модель из платного пакета 2.5 Pro в режиме Deep research.

Соответствует ли ответ поставленным вопросам?
Да, я получил от Gemini развернутый ответ и он проработал те 6-8 направлений, которые я подсветил как необходимые при постановке задачи для deep research.
Особенности Gemini 2.5 pro
Первое, что бросается в глаза, Gemini использует почти на порядок больше ресурсов для подготовки данных для анализа. Если GPT использовал несколько десятков интернет ресурсов, то Джемини перелопатил под 150. Как следствие, глубокое исследование от гугловского ИИ получилось более насыщенным мелкими деталями. С тоннами ссылок на факты и мнения, которые он положил в основу своего исследования.
Второй момент – внимание Gemini к деталям. Например, если нейросеть ссылается на какое либо специфичное название или объект – она расшифровывает его значание.
Еще одна дополнительная фишка, которая мне прям реально зашла: это возможность создать аудиообзор. Т.е. Вы озадачиваете ИИ провести глубокое исследование, он выдает через 10 минут 15 страниц текста. А дальше Вы нажимаете кнопку и все это озвучивает другая нейросеть, как будто два радиоведущих обсуждают эту тему. И строят разговор по сгенерированному до этого отчету. Круто, реально круто. Можно скинуть себе в смартфон и послушать по дороге. Жаль, пока только на английском.
Фактология Gemini 2.5 pro
В целом мне показалось, что нейросеть Джемини придерживается фактов. Я почитываю новости и понимаю, как развивалась история, как шли события, по которым я попросил сделать глубокое исследование. Так что нейросеть более чем справилась!
Ответила ли нейросеть на мой вопрос Gemini 2.5 pro
Да, я удовлетворен работой, которую проделал Gemini – исследование получилось глубоким, полноценным. Я не нашел каких-то спорных умозаключений. В основном ИИ следовал тому запросу, который я сформировал.
Насыщенность мыслями Gemini 2.5 pro
Я бы сказал, что из всех рассмотренных моделей текст, который выдал Gemini оказался самым аргументированным и глубоким. Возможно это связанно с особенностями самого Гугла, который уже многие годы специализируется на поиске документов и работе с ними. Возможно Gemini унаследовал этот подход копаться в деталях. Это неплохо. Я бы сказал, это конкурентное преимущество перед другими нейросетями.
Логика и выводы Gemini 2.5 pro
Мне не удалось придраться к результатам глубокого исследования Gemini с точки зрения непоследовательности или несвязности рассуждений. Мне показалось, что сгенерированный текст представлял из себя вполне связное полотно смыслов.
Ошибки, бредятина Gemini 2.5 pro
Итак, я заказал исследование у Gemini в той теме, в которой немного разбираюсь. Следовательно я могу отличить, насколько нейросеть заносит в фантазии. Или же ИИ выдает реальный адекват.
В случае с Джемини откровенных ляпов или дезинформации не было. Я почекал факты и в гугле и с помощью своего же здравого смысла. Да, строчки с невнятным текстом, всего несколько. Возможно при генерации что-то пошло не так. В другом случае ИИ пытался построить таблички и, возможно, что-то полетело с разметкой. Но это совсем не критично. Поскольку основную работу нейросеть Гугла выполнила: сделала первичный рисерч и сформировала отчет, который можно прочитать и разобраться в теме.
Ссылки на источники Gemini 2.5 pro
Да, Джемини при генерации глубокого исследования дает ссылки на источники, если речь идет о фактах или мнениях. Пожалуй, по количеству ссылок Джемини превосходит всех остальных.
Выводы по Gemini
Невероятная детализация исследования и тонны проработанных источников.
Полноценное, хорошо структурированное законченное исследование.
Глубокое исследование от модели ГРОК 3
В нейросети Илона маска есть два вида deep research: глубокое и очень глубокое исследование. Я ожидал что более глубокая модель даст более тщательное исследование. Получилось наоборот. Более глубокое исследование дало меньший объем информации чем просто глубокое. Зато Грок проставил ссылки на источники и сделал подборку ключевых цитат из интернета, дав их списком.

Соответствует ли исследование по смыслу и объему той задачи, которую я поставил ИИ.
С определенными нюансами – но да: Грок выполнил подбор источников, систематизировал их, собрал в единый список тезисов и даже попытался сделать какие-то выводы. Поэтому в общем – это действительно похоже на проделанную работу по исследованию тематики.
Особенности глубокого исследования в Grok 3
Пожалуй, основная особенность работы Грока – это скорость: он быстрый. Дает результат за 2-3 минуты. Наводит на мысли 😊
Вторая особенность – это тезисное изложение. У меня был один и тот же промпт для тестирования всех нейросетей. Я их просил сделать, по сути, одну и ту же работу. Но вот способ формирования отчета я не сформулирвоал. Т.е. нейросеть сама выбирала в какой форме мне подать информацию (статья, набор тезисов, набор мыслей, или тезис – расшифровка). Я лишь обозначил свои цели для проведения исследования ИИ: разобраться в той или иной тематике. Та форма, которую выдал Грок мне показалась слабее, нежели чем выбор GPT 4.5 или Gemini.
Фактология глубокого исследования в Grok 3
В целом, Grok верно изложил последовательность событий, но не сильно погружался в детализацию. По объему изложенных фактов Грок сильно уступает Gemini от Гугла и Gpt 4.5 от open AI. Но какой-то минимальный набор фактов и мнений представлен.
Получил ли я ответ на свой запрос в рамках глубокого исследования в Grok 3
В плане получения базовой информации по теме – да. В плане рассуждений и выводов (вторая часть запроса требовала пораскинуть мозгами) – Грок был не так хорош, как Gemini или GPT 4.5
Насыщенность мыслями, вода в Grok 3
Я бы не сказал, что Грок наливал воду. Не больше, чем конкуренты. В плане насыщенности мыслями – Гроку далеко до Джемини. Но из за того, что полученный результат Грок выдал в форме тезисов, а не связного текста, кажется, что по мыслям есть перенасыщение. На самом деле глубины здесь меньше, чем у ведущих конкурентов. Просто форма отображения результатов неоптимальна.
Логика и выводы глубокого исследования в Grok 3
С логикой у Грока похуже, чем у ведущих моделей. Выводы, в основном, заключались в трансляции мнений из изученных источников. Каких-то самостоятельных выводов (новых знаний), Grok как будто бы не сделал.
Ошибки, бредятина глубокого исследования в Grok 3
Сразу бросилось в глаза, что при мотивации тех или иных событий (подборке источников), в одном абзаце Грок ссылается на мнение Василия Пупкина из Запупыринска, Нью Йорк таймс и главу Блэк рок. Т.е. в ценностном ряду мнений все три для Грока имеют примерно одинаковое значение 😊 Это упущение.
Ссылки на источники в Грок 3
В базовом глубоком рисерче ссылок нет. В глубочайшем ссылки проставлены, но сам текст сокращен в несколько раз. И это недостаток. Так как Джемини и GPT 4.5 проставляют ссылки по всему тексту.
Выводы по Грок 3
Базовый рисерч, который сильно уступает лидерам (Gpt 4.5 и Gemini)
Неглубокое исследование от модели Deepseek
Ну что, пришло время протестить китайское чудо! Напомню, что китайцы умудрились сделать вполне годную генеративную модель на пару порядков дешевле!!! чем, в среднем, тратят глобальные конкуренты.
Друзья, я начинаю обзор этой модели не с того, получил ли я ответ на свой вопрос, а с раздела «ошибки и бредятина». Анализ результатов китайского чуда не имеет никакого смысла по той причине, что это просто поток несуществующего бреда. Итак.
Ошибки, бредятина
Серьезные ошибки в фактологии. DeepSeek перепутал все возможные тарифы (кто против кого сколько ввел). В качества важного ответного фактора модель подсветила ответные меры России… против введения тарифов в отношении нее (такого события не было с 2 по 10 апреля). В этот момент я думал, что ошибки в фактологии – это обычное 10%-е галлюцинирование, потому еще фокусировался на сути ошибок.

Некоторые допущения экспертов (например, увеличение объема сделок Китая со странами АСЕАН) выданы как свершившийся факт. Но мы же понимаем, что на такие результаты нужно время. Чтобы детектировать изменения в глобальной торговле на уровне регионов нужно 3-6 и более месяцев. Я все еще верю, что будут факты 😊
После этого DeepSeek выдумал динамику фондовых рынков. Он плюс минус верно посчитал, на какой процент упали рынки. Но нафантазировал, как они восстановились к концу мая (это время еще не наступило, если только у китайской модели нет окна в будущее).
Сильно напутал цифры по росту золота (возможно взял за прошлые периоды).
Придумал несуществующие факты о том, что Морганы и Голдманы фиксируют массовые дефолты… А США переключились на закуп нефти из России, как на основной источник поставок…
Господи, какая жесть! Это сплошной поток несущесвтующей дичи, которой даже в прошлом не было. Этому Дип Сику бы книги писать из разряда второсортной фантастики!
Вывод по Deepseek
Китайское чудо – это бредогенератор в значении близком к 100%. Те 6 миллионов долларов, которые выбросили на его исследование – все это зря. Хайп отменяется. Нейросеть профнепригодна для сколь серьезных исследований. Бормотать может. Важно только помнить, что галлюцинирует.
Глубокое исследование в других нейросетях
Яндекс GPT 5.Итак, отечественный производитель представил свою новую модель. Разработчики сравнивают ее с моделью GPT4o от Open AI (которая вышла год назад). Сравнений с Gemini 2.5 pro и флагманской GPT 4.5 на сайте разрабов нет. Функции deep research я в модели не нашел.

Я для интереса вбил промпт в Яндекс GPT 5, но получил базовый узкий на 10 абзацев ответ. Это некорректно сравнивать с «глубоким исследованием», опция которого внедрена в GPT 4.5, Gemini или Grok.
Я также попробовал вбить промпт просто в поиск Яндекса, чтобы посмотреть, что даст нейропоиск. Но там просто перечисление 7-8 базовых фактов.
В общем, Яндекс пока что не участвует в конкуренции технологии deep research, которая уже внедрена у ведущих производителей нейросетей.
В распиаренном Cloud AI функции deep research также нет. И поскольку нейросетка не выходит в сеть – то на этом тему можно считать закрытой.
Итак, кто же победил: какая нейросеть лучше всех делает глубокое исследование?
Однозначного ответа у меня нет. Явных лидера два: gpt 4.5 от open AI и Gemini pro 2.5 от Гугла. Остальные идут с сильнейшим гэпом.
Сила модели Open AI в том, как она формулирует и делает выводы (анализ собранного материала). Читать интересно, формулировки яркие, неожиданные, местами заставляют задуматься).
Сила модели Gemini pro 2.5 в Гугле! Эти ребята знают толк в поиске и работе с информацией. Нейросеть подтягивает сотни источников, грамотно их приоритезирует. Результат? Очень детальное, глубокое, насыщенное мелочами и нюансами исследование.
В качестве идеи, лайфхака, который я обязательно протестирую – это подготовить глубокое исследование сначала в Gemini, чтобы получить максимально детализированный отчет. А потом попросить Gpt 4.5 провести свое глубокое исследование, но с учетом информации, полученной в результате работы гугловской модели (приложив ее как отдельный файл).
Друзья, свое мнение я высказал: результатами проделанной работы доволен, поскольку нашел хороший, интересный способ прорабатывать фактологию и коллекцию мнений практически любой темы, с которой хочешь разобраться. Надеюсь, статья была полезной, интересной! Мое мнение – нейросети стоит изучать и пользоваться теми преимуществами, которые они создают в умелых руках!
Берегите свое время – инвестируйте с умом!
