Все потоки

Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

smvlx 16 фев в 08:16

Подключаем российские AI-сервисы к OpenClaw: GigaChat, YandexGPT и Yandex 360

Средний

8 мин

8.3K

Искусственный интеллектPython * Яндекс API * Node.JS * Open source *

Из песочницы

Интегрируем российские AI-сервисы (GigaChat от Сбера, YandexGPT и Yandex 360) с OpenClaw — open-source платформой для AI-агентов. Создаём русскоязычных агентов, подключаем CalDAV календарь и Yandex Disk. Все с нуля, с кодом и troubleshooting.

Читать далее

+4

Tezarium 16 фев в 07:16

Автоматизируем чтение Telegram-каналов: LLM, Telethon и грабли на пути к MVP (Claude Code опыт)

7 мин

7K

Из песочницы

Расскажу, как собрал бота для AI-суммаризации Telegram-каналов: архитектура, выбор LLM-провайдера, оптимизация скорости и неочевидные проблемы при деплое на российский VPS.

Читать далее

+7

Dmitriila 16 фев в 02:42

Защита LLM за 3ms: как я построил open-source иммунную систему для AI

Средний

7 мин

10K

Информационная безопасность * Программирование * C * Rust * Python *

Кейс

Recovery Mode

340% рост AI-атак за 2025 год, а защита LLM всё ещё — «закиньте промпт в облако, подождите 200ms». Я построил альтернативу: SENTINEL — open-source стек из C, Rust и Python, который фильтрует jailbreak за <3ms on-premise. Ключевая фича — Micro-Model Swarm: рой из моделей <2000 параметров, который ловит то, что не видят регулярки.

Читать далее

+14

tripolskypetr 15 фев в 21:23

Почему цена на рынке падает одной свечой

Сложный

6 мин

10K

Финансы в ITКриптовалютыИскусственный интеллектTypeScript * Python *

Ретроспектива

⛔ Почему цена на рынке падает одной свечой

В 2026 году «купил и держал» это ставка на то, что выдержишь -40…-70% просадку без эмоционального или маржинального выхода. Рынок стал хрупким: каскады ликвидаций случаются несколько раз в год. Статичный холд больше не работает.

Разбираю математику падения

Читать далее

+8

spbmolot 15 фев в 18:16

Как я написал Telegram-бота для SEO-аудита и не дал ему стать инструментом для атак

Средний

12 мин

10K

Python * Информационная безопасность * Поисковая оптимизация * Программирование *

Из песочницы

Рекомендация по КДПВ:

Практический гайд по созданию Telegram-бота для автоматизированного анализа сайта: broken links, базовый security-check, отчёты. Минимум теории — максимум рабочего кода.

Читать далее

+1

axion-1 15 фев в 16:19

Монотонный стек: описание и примеры применения

Средний

5 мин

8.7K

Python * Алгоритмы * Занимательные задачки

Из песочницы

Всем привет. В этой статье хотел бы рассказать о структуре данных под названием монотонный стек (monotonic stack) и разобрать несколько примеров задач в решении которых он применим.

Статья может быть интересна любителям решать алгоритмические задачи, в особенности тем кто готовится к собеседованию.

Читать далее

+4

Grokir 15 фев в 14:46

T-CTF 2025. Разбор задачи «Капибегущая строка»

Простой

3 мин

7.1K

Из песочницы

Разберём задачу «Капибегущая строка» с соревнований T-CTF 2025, где хакеры взломали освещение жилого дома и использовали его как бегущую строку для того, чтобы сообщить свои требований.

Читать далее

+4

jarkevithwlad 15 фев в 11:31

Тестируем популярные нейронки на одном промпте

Простой

2 мин

7.8K

Python * HTML *

Обзор

Да, всех уже достала тема нейросетей, но для себя решил сделать некоторые тесты и поскольку разным людям они были довольно интересны, решил написать статью, суть простая, хочу сравнить на одном промпте (не самом простом) разные модели, у меня был доступ только к этим:

Gemini 3 Pro
Sonnet 4.5 Thinking
GPT 5.2 Thinking
GLM 5
Qwen 3 Coder Next 80b (IQ4_XS квантование) (локальный запуск через llama.cpp)

Промпт был для всех такой:

Читать далее

+3

IlyaP358 15 фев в 10:20

Как я сделал рабочий pgAdmin4 Desktop для Arch Linux и почему это оказалось сложнее, чем кажется

Средний

3 мин

8.7K

Linux * PostgreSQL * Open source * Python * DevOps *

Из песочницы

pgAdmin4 - де-факто стандартный GUI для PostgreSQL.
И при этом на Arch Linux его Desktop-версия годами находится в полурабочем состоянии.

Я разобрался, почему pgAdmin4 так плохо ложится на Arch, какие подходы стабильно ломаются,
и какой компромиссный, но реально рабочий вариант в итоге получился.

Если вам тоже надоело чинить pgAdmin после каждого обновления Python или Electron - это для вас.

Читать далее

0

avshkol 14 фев в 22:10

Возможно, самый гениальный код на python на сегодня: разбираем 200-строчный microgpt от Андрея Карпаты

Средний

27 мин

35K

Python * Искусственный интеллектИстория ITНаучно-популярное

Обзор

Перевод

Буквально на днях Андрей Карпаты, один из ранних сооснователей OpenAI, покинувший компанию, исследователь нейросетей, опубликовал на Гитхаб фантастическую вещь: чистый (без специализированных библиотек) 200-строчный python-код трансформера, аналога GPT-2, для изучения всеми желающими. И написал в блоге статью для понимания этого кода (и работы трансформеров). Я перевёл статью и комментарии к коду — ведь этот код (я уверен!) войдёт в ИТ-историю...

Присоединяйтесь к этому завораживающему сеансу разоблачения gpt-магии, за считанные годы овладевшей миром!..

Читать далее

+120

enamored_poc 14 фев в 14:14

ИИ (Генеративное) видео без галлюцинаций: пишем CLI-конвейер на Python (Qwen + Manim)

Простой

9 мин

11K

Обзор

ИИ видео не подходят для инженерных задач, так как работают с пикселями и часто «галлюцинируют», искажая математическую логику и текст. Решение проблемы — разделить процесс: LLM должна генерировать не видео, а код (инструкции), а исполнять его должен детерминированный движок (библиотека Manim). Чтобы исключить программные ошибки, применяется цикл Self-Correction: скрипт автоматически скармливает трейсбэки обратно нейросети, заставляя её исправлять код до тех пор, пока он не скомпилируется в математически точную анимацию.

Читать далее

+5

Andrey_Popov30 14 фев в 11:45

Модуль sys в Python: интерфейс между вашим кодом и интерпретатором

Средний

3 мин

9.2K

Python * Программирование *

Обзор

Recovery Mode

Когда мы пишем Python-код, обычно кажется, что программа существует сама по себе. Но на самом деле она постоянно взаимодействует с интерпретатором, операционной системой и окружением выполнения. Модуль sys — это как раз тот слой, через который Python предоставляет доступ к этим деталям.

Понимание sys полезно не только для утилит и CLI-программ, но и для отладки, настройки окружения и анализа поведения приложения.

Читать далее

-2

Dlzxn 14 фев в 10:16

Поиск аномалий: статистика или ML? Выбираем лучшее

Средний

4 мин

5.1K

Big Data * Python * Машинное обучение *

Обзор

Из песочницы

Поиск аномалий под микроскопом: от базовой статистики до робастных моделей с нуля на NumPy В машинном обучении поиск аномалий (Anomaly Detection) часто остается в тени классического обучения с учителем. Однако именно эта «иммунная система» данных спасает миллионы долларов в финтехе, предотвращает катастрофы на производстве и находит критические ошибки в медицинских картах.

В этой статье мы не просто импортируем готовые методы из sklearn. Мы разберем математическую логику трех мощных подходов, напишем их «примитивные» реализации на NumPy/Pandas, чтобы понять механику работы «под капотом», и проверим их в деле на реальном кейсе.

Наш полигон: Credit Card Fraud Detection
Для тестов мы возьмем классический датасет Credit Card Fraud Detection. Это идеальный пример «иголки в стоге сена»: здесь всего 0.17% мошеннических транзакций среди почти 300 тысяч записей. Смогут ли наши рукотворные алгоритмы их найти?

Эволюция методов: от простого к сложному
Мы пройдем путь от элементарной статистики до продвинутого геометрического анализа:

IQR (Interquartile Range): Статистическая классика. Узнаем, как «усы» боксплота помогают находить грубые выбросы.

Isolation Forest: Оригинальный подход, основанный на идее, что аномалию проще всего «изолировать» случайными разрезами пространства.

Elliptic Envelope: Тяжелая артиллерия робастной статистики. Будем строить многомерный эллипс, который игнорирует попытки аномалий исказить его форму.

Читать далее

0

softel 14 фев в 08:01

Небольшой тест LLM‑модели qwen3‑coder‑next:q8_0

3 мин

8.7K

Python * HTML * Контент и копирайтинг * Natural Language Processing * Веб-аналитика *

Обзор

Тест LLM‑модели qwen3‑coder‑next:q8_0: модель успешно построила карту большого форума, собрала все сообщения в JSON и преобразовала их в готовый SQL‑дайджест, показав высокое качество генерации кода, но «залипла» при решении чисто логической задачи.

Читать далее

+1

ddk-0310 13 фев в 11:16

В поисках O(n): как научиться видеть эффективные решения задач

Простой

5 мин

11K

Python * Алгоритмы *

Из песочницы

Привет, Хабр! Эта задача выглядит как разминка для разогрева: найти максимальное произведение двух чисел в массиве. Но именно с неё началось моё знакомство с алгоритмической культурой — на первом же собеседовании я убедился, что «работает» и «работает эффективно» — разные вещи. В статье — три решения: от интуитивного до элегантного, их сравнение и главный вывод: даже простые задачи учат нас думать.

Читать далее

+15

bald_from_bra33ers 13 фев в 10:28

Автоматический анализ GPX-треков: от трека до аналитики

8 мин

6.8K

Python * Big Data *

Из песочницы

Привет, Хабр! Сегодня хочу поделиться интересным проектом, который мы сделали для конкурса. Задача — превратить сырые GPX-треки (треки с GPS-устройств) в структурированные данные с визуализацией, метеорологической и географической аналитикой. Всё это — на Python, с использованием открытых API и библиотек для работы с геоданными.

Читать далее

+3

veriga 13 фев в 09:32

Как мы с моим ботом OpenClaw сделали ему семантическую память на AlloyDB Omni за полчаса

5 мин

10K

Искусственный интеллектPython * SQL *

Роадмэп

История о том, как превратить ИИ-агентаиз «золотой рыбки» с памятью в пределах одной сессии в полноценного цифрового сотрудника с графовым хранилищем знаний.

Читать далее

+3

ph_piter 13 фев в 09:22

Шаблоны проектирования поглощения данных-01: пакетная обработка, потоковая передача и CDC — практическое руководство

11 мин

7.7K

Блог компании Издательский дом «Питер»Big Data * Высоконагруженные системы * Анализ и проектирование систем * Python *

Перевод

Привет, Хаброжители!

От выбора подхода к поглощению данных может зависеть успех или провал работы конвейера данных

Получив опыт создания конвейеров данных, которые ежедневно обрабатывают сотни миллионов записей, я понял, что именно на уровне поглощения данных решается успех или провал большинства проектов в области инженерии данных. Если здесь допустить ошибку, то придется месяцами бороться с проблемами, возникающими c производительностью, качеством данных и недовольством заинтересованных сторон. Если все сделать правильно, то ваш конвейер станет надежной основой для принятия важных бизнес-решений.

Читать далее

+10

Gigantazavr 13 фев в 09:15

Как гуманитарий за 2 месяца с нуля RAG систему построил, или Парсинг PDF по-хардкору

Средний

7 мин

12K

Data Engineering * PDFPython * Искусственный интеллектМашинное обучение *

Из песочницы

Добрый день. Сегодня я расскажу о том, как я за 2 месяца с полного нуля создал доменную RAG систему с корпусом в 20+ книг.

В статье затрону проблемы парсинга данных (особенно PDF документов, с которыми приходилось иметь дело), чанкинга, создания и индексации эмбеддингов, а также самого интересного – ретривера. Расскажу о latency, трейд-оффах, и сложностях реализации подобных систем локально на ноутбуке (хоть и «игровом») без использования API LLM.

Вся система делалась мной самостоятельно без использования LangChain – это чистый пайплайн от Tesseract, Pillow, MuPDF/Fitz до e5-multilingual, FAISS (+bm25, который я затрону в статье) и Qwen3:8B в качестве LLM.

Читать далее

+20

Ykrops 13 фев в 06:03

Как я написал AI-генератор коротких видео (Shorts/Reels) на Python с Clean Architecture

4 мин

4K

Python * Компьютерная анимация *

Из песочницы

Привет, Хабр! 👋

В этой статье я хочу поделиться опытом разработки пет-проекта, который превратился в полноценный инструмент для автоматической генерации коротких видео (Shorts, Reels, TikTok). Идея проста: на входе — тема (например, "История Римской Империи за 1 минуту"), на выходе — готовый видеоролик с озвучкой, субтитрами и сгенерированным видеорядом.

Но вместо того, чтобы накидать "спагетти-код" в одном файле main.py, я решил подойти к задаче как инженер и построить систему на принципах Clean Architecture.

🎯 Зачем?

Генерация видео — это сложный пайплайн:

1. Написать сценарий.

2. Придумать визуальный стиль.

3. Сгенерировать картинки (Midjourney, Flux).

4. Оживить картинки в видео (Kling, Runway, Sora).

5. Озвучить текст (TTS).

6. Собрать всё вместе с субтитрами.

API меняются, модели выходят новые каждую неделю. Сегодня лучший визуал у Flux, завтра у Midjourney v7. Сегодня видео делаем в Runway, завтра в Kling. Жесткая привязка к конкретным API убила бы проект через месяц.

Поэтому Clean Architecture здесь не роскошь, а необходимость.

🏗 Архитектура

Проект разбит на слои, следуя классической "луковой" архитектуре:

1. Domain (Entities): Pydantic-модели, описывающие суть (VideoScript, Scene, Character). Они ничего не знают о внешнем мире.

2. Interfaces: Абстрактные классы (VideoGenerator, ScriptGenerator). Контракты, которые должны соблюдать внешние сервисы.

3. Services (Use Cases): Бизнес-логика. Здесь живут "Агенты": Сценарист, Арт-директор, Режиссер монтажа.

4. Infrastructure: Реализации интерфейсов (API клиентов Comet, Yandex, OpenAI и т.д.).

Читать далее

0

2

3 4 ...