Обновить

Google Gemini 3 Pro впервые обогнал GPT-5: результаты бенчмарков показали нового лидера ИИ-гонки

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели13K
Всего голосов 12: ↑7 и ↓5+2
Комментарии7

Комментарии 7

Ну тесты-то известные, но детальные результаты бенчмарков обычно не публикуют. Хотя, кстати, в случае как раз таки «независимых» тестов (в плане того, что их проводят не производители моделей) чаще бывает иначе, например у Math Arena можно посмотреть результаты по каждому отдельному заданию: https://matharena.ai/.

Знаете, сколько стоят нужные результаты такого теста (точнее, шепот в курилке, что именно подкручивать, и как)? А я знаю.

У Фольксвагена вон тоже были тесты.

Выскажу свое дилетантское мнение. GPT-5 - более умный,он первый вникает в суть, а Gemini лучше реализует!

Нейронки обе хороши и нужно их использовать в спарке

есть хобби (астронавигация) . нашел древнюю методичку с 90-ых. Скармливаю нейронкам. Спрашиваю : - тут есть метод 4 по решению задачи, но я его хочу решить с такими вводными данными. Gemini - начинает нести пургу. - а GPT-5 четко впрягается и выдает код. Берешь этот код с скармливаешь Gemini со словами ты тут лоханулась эта задача решается так то и так. Gemini отвечает : -а точно , но тогда этот код можно сделать еще проще ( тип ты тут так решил, а тут можно градиентным спуском и т.д ...) (если бы я знал что такое градиентный спуск - вот такие мы вайб кодеры ...))

И главное это у меня уже второй раз так. Прям GPT первый находит ошибку, но Gemini её лучше исправляет.

Согласен, Гугл наконец дотюнил свои продукты до приличного уровня, за пару дней сгенерил мне довольно ёмкий и главное юзабельный POC, Бекенд на python и фронт на html. Фронт меня вообще поразил, т.к. был сделан на чистом JS+html. Я реально аплодировал стоя, получилась прогрессивная апка, без всяких фреймворков, с очень навороченным функционалом. Ушел с чата из-за лимитов - как же они достали, и потому что этот вундеркинд когда приходится работать с несколькими файлами одновременно - тупо теряется. Имейте ввиду - я говорю именно о бесплатном использовании. Гугл, снимаю шляпу, я ваш на веки )))

Я уже запутался, кто побеждает-то? Океания или Остазия?

Какая разница-то? Главное, пролам есть, чем заняться.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
bothub.ru
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
Greg Ewin