Комментарии 7
Как у вас рука-то поднимается писать: «независимые тесты».
Ну тесты-то известные, но детальные результаты бенчмарков обычно не публикуют. Хотя, кстати, в случае как раз таки «независимых» тестов (в плане того, что их проводят не производители моделей) чаще бывает иначе, например у Math Arena можно посмотреть результаты по каждому отдельному заданию: https://matharena.ai/.
Выскажу свое дилетантское мнение. GPT-5 - более умный,он первый вникает в суть, а Gemini лучше реализует!
Нейронки обе хороши и нужно их использовать в спарке
есть хобби (астронавигация) . нашел древнюю методичку с 90-ых. Скармливаю нейронкам. Спрашиваю : - тут есть метод 4 по решению задачи, но я его хочу решить с такими вводными данными. Gemini - начинает нести пургу. - а GPT-5 четко впрягается и выдает код. Берешь этот код с скармливаешь Gemini со словами ты тут лоханулась эта задача решается так то и так. Gemini отвечает : -а точно , но тогда этот код можно сделать еще проще ( тип ты тут так решил, а тут можно градиентным спуском и т.д ...) (если бы я знал что такое градиентный спуск - вот такие мы вайб кодеры ...))
И главное это у меня уже второй раз так. Прям GPT первый находит ошибку, но Gemini её лучше исправляет.
Согласен, Гугл наконец дотюнил свои продукты до приличного уровня, за пару дней сгенерил мне довольно ёмкий и главное юзабельный POC, Бекенд на python и фронт на html. Фронт меня вообще поразил, т.к. был сделан на чистом JS+html. Я реально аплодировал стоя, получилась прогрессивная апка, без всяких фреймворков, с очень навороченным функционалом. Ушел с чата из-за лимитов - как же они достали, и потому что этот вундеркинд когда приходится работать с несколькими файлами одновременно - тупо теряется. Имейте ввиду - я говорю именно о бесплатном использовании. Гугл, снимаю шляпу, я ваш на веки )))
Я уже запутался, кто побеждает-то? Океания или Остазия?
Google Gemini 3 Pro впервые обогнал GPT-5: результаты бенчмарков показали нового лидера ИИ-гонки