📚

Guides

Guides and tutorials

6/24/2026
PyTorch-модель inpainting — в браузер за один день: как это сделал Claude Code
Как перенести PyTorch-модель inpainting в браузер без сервера: конвертация в ONNX, WebGPU-бэкенд, публикация весов на Hugging Face. Пошаговый гайд.
6/23/2026
GPT-5.6 Pro тихо появился у части пользователей — и уже делает игры одним промптом
OpenAI тихо тестирует GPT-5.6 Pro: симулятор жизни одним промптом, воксельная 3D-графика и встроенный Playwright. Разбираем, что реально изменилось.
6/22/2026
VLA-роботы забывают всё через секунду. Архитектура ELMUR с ICLR 2026 пытается это исправить
Как архитектура ELMUR с ICLR 2026 решает проблему короткой памяти VLA-роботов — и почему увеличить контекст трансформера не получится.
6/21/2026
Отдайте боту лопату, а не руль: как Valkey автоматизировал мейнтенанс в релизе 9.1
Как Valkey отдал бэкпорты и проверку лицензий ИИ-агентам — и не потерял контроль. Практический разбор: что автоматизировать, а что оставить людям.
6/20/2026
Чат с ИИ-персонажем на Python: роутинг моделей, три слоя памяти и борьба с отказами
Как собрать чат с ИИ-персонажем на Python за выходные: OpenRouter, три слоя памяти, обработка отказов модели и синтез речи. Рабочий каркас с кодом.
6/19/2026
Модель на 1.7B параметров бьёт 32B по верности контексту — как запустить OCC-RAG от AIRI
AIRI выпустила OCC-RAG-0.6B и 1.7B — модели для RAG, которые отвечают строго по документам и бьют модели в 6 раз крупнее по faithfulness. Гайд по запуску.
6/18/2026
Симулятор бактерий вместо RPG с мечами: как один разработчик строит игровую петлю вокруг чашки Петри
Разработчик делает мобильную игру Petri Dish Lab — симулятор микробной лаборатории. Как превратить красивую анимацию в настоящую игровую петлю.
6/17/2026
Золотая рыбка, лиса и ChatGPT: три системных бага LLM, которые фольклор описал раньше вас
Specification Gaming, когнитивная атрофия, галлюцинации с апломбом — разбираем три системных бага LLM и учимся их обходить на практике.
6/16/2026
Physical AI в 2026: что происходит в робототехнике после ICRA в Вене
Симуляция вместо реальных данных, VLA-модели и RL поверх имитации — разбираем главные тренды ICRA 2026 из Вены с конкретными работами и именами.
6/15/2026
ChatGPT забыл имя персонажа, которое вы дали три сообщения назад. Вот почему — и что с этим делать
Разбираем, как устроено контекстное окно LLM, почему модель теряет начало диалога и что сделать разработчику, чтобы это не ломало продукт.
6/14/2026
60+ статей про агентную разработку с Хабра: что читать, если хочешь разобраться, а не просто попробовать
Один разработчик каждый день читал Хабр и отобрал 60+ статей про AI-агентов. Собрали лучшее с комментариями — что читать и в каком порядке.
6/13/2026
Anthropic выпустила «лучший киберинструмент» — и отключила его по директиве правительства за 15 минут
Anthropic запустила мощнейшую киберсистему — и за 2 месяца слила данные, зарезала функции и отключила модель по директиве США. Разбираем, что пошло не так.
6/12/2026
«Напиши маркетинговую стратегию» не работает. Вот что работает
Пошаговый воркфлоу: как собрать маркетинговую стратегию с Claude, GPT и Gemini за один сеанс. Реальные промпты, метод Франкенштейна и честно про медиаплан.
6/11/2026
Квантовый слой вместо матричного умножения: строим гибридную нейросеть на CUDA-Q
Как встроить квантовый вычислитель на базе теории Orch-OR в кортикально-спайковую нейросеть с помощью NVIDIA CUDA-Q 0.12. Пошаговый гайд с кодом.
6/10/2026
PLC AI Studio без галлюцинаций: как провести ИИ через вентиляцию, ИТП и пожарку одного объекта
Как PLC AI Studio ведёт ИИ через десятки систем одного объекта: GVL, контракты интерфейсов, ко-симуляция и маршрутные окна пошагово.
6/9/2026
Codex снова забыл про импорты? Даём ему память на SQLite за 20 минут
Устал вставлять одни и те же правила в каждый чат с Codex? Hermes Plugin даёт агенту долговременную память на SQLite без векторных баз и микросервисов.
6/8/2026
Токены съедают бюджет: 12 приёмов, которые реально работают
Три года вайбкодинга — и вот конкретные приёмы: бесплатные модели, раздельные контексты, английский в правилах. Сокращаем счёт за ИИ без потери качества.
6/7/2026
Мозг умеет в многозадачность — но только если вы его к этому приучили
Исследование Джорджтаунского университета доказало: мозг физически перестраивается для параллельной работы. Вот как это использовать на практике.
6/6/2026
Запускаем чужой Python-код без страха: micropython-wasm как настоящая песочница
Как запустить изолированный Python-код через micropython-wasm 0.1a2 — без доступа к файлам, сети и с лимитом памяти. Пошаговый гайд с CLI и примерами.
6/5/2026
От белого текста на белом фоне до нейросетей: 25 лет войны с Яндексом
Как менялось SEO в Яндексе с 1997 по 2026 год: белый текст на белом фоне, ссылочные биржи, поведенческие факторы и нейросети. Разбор с реальными примерами.
6/4/2026
Публичные OCR-лидерборды врут вашему RAG-пайплайну — вот как это проверить
Публичные лидерборды не учитывают русский язык и структуру документов. Разбираем, как Cloud.ru собрал собственный OCR-бенчмарк для RAG-пайплайна — и что из этого вышло.
6/3/2026
Success rate упал с 85% до 72% — и что теперь с этим делать
Success rate упал — но почему? Разбираем 7 покомпонентных evals для AI-агента: retrieval, tool call, state drift, retry и другие. С методами и примерами.
6/2/2026
Четыре LLM, один робот и пневматический пистолет: что случилось, когда ИИ вышел в физический мир
Разработчик подключил четыре LLM к настоящему роботу на Arduino и сравнил поведение. Grok зациклился, GPT скучал, Gemini молчал — вот что вышло.
6/1/2026
Self-hosted AI-хаб вместо подписки на ChatGPT: разбираем Odysseus от PewDiePie
PewDiePie открыл исходники Odysseus — локального AI-хаба с агентом, памятью и почтой. Разбираем архитектуру, установку и подводные камни.
5/31/2026
Формула Anthropic для run-rate revenue: зачем она нужна и как её читать
Anthropic считает run-rate revenue по особой формуле с двумя слагаемыми. Разбираем метод и почему он важен для оценки ИИ-компаний.
5/30/2026
96 ГБ VRAM в обычном корпусе: как собрать домашнюю LLM-машину на четырёх RTX 3090
Как собрать ПК на четырёх RTX 3090/3090 Ti для локального запуска LLM — выбор железа, охлаждение, подключение GPU через M.2 и реальные скорости инференса.
5/29/2026
Агентный пайплайн упал на шаге 4 из 7 — как не запускать всё заново
Агентный пайплайн упал на середине — как не начинать заново? Event Sourcing даёт иммутабельный лог и точечный resume. Разбираем на примере zymi.
5/26/2026
Zero Bug Policy: Как мы сократили бэклог багов с 77 до 18 за 4 недели
Узнайте, как внедрить Zero Bug Policy в B2B финтех. Пошаговый гайд по триажированию и сокращению технического долга без срыва релизов.
5/25/2026
Claude Code: Как не дать документации устареть от кода и перестать терять $50 в месяц на "галлюцинациях"
Ваш AI-помощник перестанет работать, если забыть о документационном долге. Узнайте, как поддерживать внешнюю память Claude и перестать исправлять его ошибки.
5/24/2026
От GitHub Issue до продакшена: Как построить конвейер, который заставит AI-агента менять ваш сайт
Как заставить LLM-агента автоматически преобразовывать тикеты из GitHub Issues в работающие веб-страницы. Пошаговый гайд по пайплайну.
5/23/2026
Nemotron Diffusion: Как перестать ждать и получить LLM-генерацию со скоростью света
Узнайте, как Nemotron-Labs Diffusion ломает последовательный барьер LLM. Практический гайд по внедрению диффузионных моделей для сверхбыстрой генерации текста.
5/22/2026
ИИ заменит разработчиков? Как не стать следующим уволенным и перестроить свою роль в 2026
Анализируем кейсы Anthropic и Klarna: как выжить в эпоху AI-увольнений и перейти от замещения к пересборке ролей.
5/21/2026
Почему ваш AI-сервис падает под нагрузкой: гайд по архитектуре low-latency (vLLM, SGLang, Envoy)
Ваш AI-сервис падает под нагрузкой? Узнайте, как архитектурный подход "inference-bundle" с Envoy и vLLM гарантирует latency <50 мс в продакшене.
5/20/2026
Low-code умер? Как построить AI-продукт, если ваша платформа — монолит
Перестали работать старые low-code платформы. Узнайте, как правильно интегрировать визуальные инструменты с микросервисами и ИИ, чтобы избежать монолита.
5/19/2026
OlmoEarth v1.1: Как построить гео-AI на спутниковых снимках, используя мультинаправленную foundation model
Обзор OlmoEarth v1.1 — мультинаправленной модели для анализа спутниковых снимков. Узнайте, как реализовать геопространственный AI без глубокого ML-бэкграунда.
5/19/2026
Qwen3.6 против Gemma4: Тестирование 6 моделей на реальных багах инфраструктуры
Сравнили 6 топовых моделей (Qwen, Gemma) на реальных багах FastAPI и Nginx. Узнайте, какой AI-агент выбрать для продакшена.
5/19/2026
За гранью текста: как сделать поиск по смыслу, а не по словам
Узнайте, как вывести поиск за рамки простого текста. Комбинация семантики и фильтрации по структурированным полям — ключ к поиску по смыслу. Читайте обзор.
5/18/2026
Связывание эмбеддингов: как это убивает производительность трансформеров?
Связывание эмбеддингов — популярный метод, который может негативно сказаться на обучении моделей. В этой статье мы рассмотрим, как этот подход влияет на трансфо
5/17/2026
Как не писать код: стратегия «Проблема прежде всего» от основателя Stopilot
Хватит погони за кодом! Узнайте, как создать альтернативу Cursor, которая не пишет код, но приносит миллионы. Стратегия для Product/DevOps.
5/14/2026
Прощай, PR: Как ИИ-агенты переписывают правила CI/CD
Узнайте, как искусственный интеллект меняет DevOps. Обзор статьи о трансформации CI/CD из PR-пайплайнов в непрерывный вычислительный цикл.
5/11/2026
Когда LLM перестает быть чатом: Локальный агент для реального DevOps
Узнайте, как запустить локального LLM-агента для реальной диагностики серверов на MacBook. Сравниваем 9B и 35B модели в реальных кейсах!
5/10/2026
EICS: Новая метрика для поиска причинных ошибок в «мозгах» нейросетей
Узнайте, как новая метрика EICS позволяет находить причинные ошибки внутри нейросетей. Поймите, почему внешние методы неопределённости уже не работают.
5/10/2026
Как заставить LLM принимать взвешенные и обоснованные решения: универсальный фреймворк сравнения
В сфере применения больших языковых моделей (LLM) часто сталкиваются с одной фундаментальной проблемой: как заставить ИИ не просто генерировать текст, а выполнять сложные, многокритериальные вычисления и принимать взвеше…

PyTorch-модель inpainting — в браузер за один день: как это сделал Claude Code

GPT-5.6 Pro тихо появился у части пользователей — и уже делает игры одним промптом

VLA-роботы забывают всё через секунду. Архитектура ELMUR с ICLR 2026 пытается это исправить

Отдайте боту лопату, а не руль: как Valkey автоматизировал мейнтенанс в релизе 9.1

Чат с ИИ-персонажем на Python: роутинг моделей, три слоя памяти и борьба с отказами

Модель на 1.7B параметров бьёт 32B по верности контексту — как запустить OCC-RAG от AIRI

Симулятор бактерий вместо RPG с мечами: как один разработчик строит игровую петлю вокруг чашки Петри

Золотая рыбка, лиса и ChatGPT: три системных бага LLM, которые фольклор описал раньше вас

Physical AI в 2026: что происходит в робототехнике после ICRA в Вене

ChatGPT забыл имя персонажа, которое вы дали три сообщения назад. Вот почему — и что с этим делать

60+ статей про агентную разработку с Хабра: что читать, если хочешь разобраться, а не просто попробовать

Anthropic выпустила «лучший киберинструмент» — и отключила его по директиве правительства за 15 минут

«Напиши маркетинговую стратегию» не работает. Вот что работает

Квантовый слой вместо матричного умножения: строим гибридную нейросеть на CUDA-Q

PLC AI Studio без галлюцинаций: как провести ИИ через вентиляцию, ИТП и пожарку одного объекта

Codex снова забыл про импорты? Даём ему память на SQLite за 20 минут

Токены съедают бюджет: 12 приёмов, которые реально работают

Мозг умеет в многозадачность — но только если вы его к этому приучили

Запускаем чужой Python-код без страха: micropython-wasm как настоящая песочница

От белого текста на белом фоне до нейросетей: 25 лет войны с Яндексом

Публичные OCR-лидерборды врут вашему RAG-пайплайну — вот как это проверить

Success rate упал с 85% до 72% — и что теперь с этим делать

Четыре LLM, один робот и пневматический пистолет: что случилось, когда ИИ вышел в физический мир

Self-hosted AI-хаб вместо подписки на ChatGPT: разбираем Odysseus от PewDiePie

Формула Anthropic для run-rate revenue: зачем она нужна и как её читать

96 ГБ VRAM в обычном корпусе: как собрать домашнюю LLM-машину на четырёх RTX 3090

Агентный пайплайн упал на шаге 4 из 7 — как не запускать всё заново

Zero Bug Policy: Как мы сократили бэклог багов с 77 до 18 за 4 недели

Claude Code: Как не дать документации устареть от кода и перестать терять $50 в месяц на "галлюцинациях"

От GitHub Issue до продакшена: Как построить конвейер, который заставит AI-агента менять ваш сайт

Nemotron Diffusion: Как перестать ждать и получить LLM-генерацию со скоростью света

ИИ заменит разработчиков? Как не стать следующим уволенным и перестроить свою роль в 2026

Почему ваш AI-сервис падает под нагрузкой: гайд по архитектуре low-latency (vLLM, SGLang, Envoy)

Low-code умер? Как построить AI-продукт, если ваша платформа — монолит

OlmoEarth v1.1: Как построить гео-AI на спутниковых снимках, используя мультинаправленную foundation model

Qwen3.6 против Gemma4: Тестирование 6 моделей на реальных багах инфраструктуры

За гранью текста: как сделать поиск по смыслу, а не по словам

Связывание эмбеддингов: как это убивает производительность трансформеров?

Как не писать код: стратегия «Проблема прежде всего» от основателя Stopilot

Прощай, PR: Как ИИ-агенты переписывают правила CI/CD

Когда LLM перестает быть чатом: Локальный агент для реального DevOps

EICS: Новая метрика для поиска причинных ошибок в «мозгах» нейросетей

Как заставить LLM принимать взвешенные и обоснованные решения: универсальный фреймворк сравнения