dmitrifriend14 дек 2025 в 14:18

Google Gemini 3 Pro впервые обогнал GPT-5: результаты бенчмарков показали нового лидера ИИ-гонки

Простой

11 мин

13K

Блог компании BotHubIT-компанииБудущее здесьИскусственный интеллектНаучно-популярное

Мнение

Комментарии 7

cupraer 14 дек 2025 в 17:40

Как у вас рука-то поднимается писать: «независимые тесты».

dmitrifriend 15 дек 2025 в 08:33

Ну тесты-то известные, но детальные результаты бенчмарков обычно не публикуют. Хотя, кстати, в случае как раз таки «независимых» тестов (в плане того, что их проводят не производители моделей) чаще бывает иначе, например у Math Arena можно посмотреть результаты по каждому отдельному заданию: https://matharena.ai/.

cupraer 15 дек 2025 в 11:25

Знаете, сколько стоят нужные результаты такого теста (точнее, шепот в курилке, что именно подкручивать, и как)? А я знаю.

У Фольксвагена вон тоже были тесты.

SebastianP 14 дек 2025 в 18:17

Выскажу свое дилетантское мнение. GPT-5 - более умный,он первый вникает в суть, а Gemini лучше реализует!

Нейронки обе хороши и нужно их использовать в спарке

есть хобби (астронавигация) . нашел древнюю методичку с 90-ых. Скармливаю нейронкам. Спрашиваю : - тут есть метод 4 по решению задачи, но я его хочу решить с такими вводными данными. Gemini - начинает нести пургу. - а GPT-5 четко впрягается и выдает код. Берешь этот код с скармливаешь Gemini со словами ты тут лоханулась эта задача решается так то и так. Gemini отвечает : -а точно , но тогда этот код можно сделать еще проще ( тип ты тут так решил, а тут можно градиентным спуском и т.д ...) (если бы я знал что такое градиентный спуск - вот такие мы вайб кодеры ...))

И главное это у меня уже второй раз так. Прям GPT первый находит ошибку, но Gemini её лучше исправляет.

alexdmy 15 дек 2025 в 01:07

Согласен, Гугл наконец дотюнил свои продукты до приличного уровня, за пару дней сгенерил мне довольно ёмкий и главное юзабельный POC, Бекенд на python и фронт на html. Фронт меня вообще поразил, т.к. был сделан на чистом JS+html. Я реально аплодировал стоя, получилась прогрессивная апка, без всяких фреймворков, с очень навороченным функционалом. Ушел с чата из-за лимитов - как же они достали, и потому что этот вундеркинд когда приходится работать с несколькими файлами одновременно - тупо теряется. Имейте ввиду - я говорю именно о бесплатном использовании. Гугл, снимаю шляпу, я ваш на веки )))

t0kashi 15 дек 2025 в 01:45

Я уже запутался, кто побеждает-то? Океания или Остазия?

cupraer 15 дек 2025 в 04:41

Какая разница-то? Главное, пролам есть, чем заняться.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий