MoneyPrinterTurbo: AI-генерация видео без монтажа

Когда клиент просит «быстро запилить демо-ролик», а в команде нет монтажёра, я теперь открываю MoneyPrinterTurbo. Это не идеальный инструмент, но он закрывает 80% потребностей в создании контента для соцсетей и презентаций.

Как это работает на практике

Проект использует каскад AI-моделей:

LLM (ChatGPT/Claude) генерирует сценарий по промпту
TTS-движок озвучивает текст
Stable Diffusion/DALL·E создаёт кадры
FFmpeg склеивает всё в видео

Мой типичный сценарий использования:

python3 main.py \
  --prompt "Объяснение принципа работы React Server Components" \
  --language ru \
  --voice male_01 \
  --output-dir ./out

Проблемы, с которыми сталкиваешься сразу:

Голоса для русского пока звучат как робот из 90-х
Нужно явно указывать «без интро/аутро» в промпте
Подбор визуалов требует итераций

Под капотом: код и архитектура

Проект написан на Python и использует классический пайплайн обработки медиа. Вот как выглядит ключевая логика генерации:

def generate_video(
    script: str, 
    voice: str, 
    images: List[str]
) -> Video:
    audio = tts_service.render(script, voice)
    clips = [ImageClip(img).set_duration(5) for img in images]
    return concatenate_videoclips(clips).set_audio(audio)

Что мне нравится в архитектуре:

Чёткое разделение ответственности между модулями
Возможность подменить любой компонент (например, использовать ElevenLabs для TTS)
Логирование каждого этапа в консоль

Но есть и технический долг:

Нет кэширования промежуточных результатов
Слабая обработка ошибок при падении API
Жёсткая привязка к FFmpeg CLI

Где это реально полезно

После недели экспериментов я выделил три сценария, где MoneyPrinterTurbo выстреливает:

Быстрые поясняющие ролики для внутреннего использования (онбординг, документация)
Контент для соцсетей — когда нужно запустить серию постов без бюджета
Прототипирование видео-интерфейсов (например, для тестирования UX)

Но для продакшена всё ещё нужен человек:

AI путает термины в технических темах
Нет контроля над композицией кадра
Субтитры генерируются криво для русского

Что попробовать дальше

Если проект вас зацепил, рекомендую форкнуть и доработать под свои нужды. Мои планы:

Интеграция с Whisper для автоматических субтитров
Поддержка локальных LLM через Ollama
Плагин для VSCode/Cursor

Главный вывод: инструменты вроде MoneyPrinterTurbo не заменяют видеографов, но позволяют фронтендерам быстро закрывать смежные задачи. Иногда проще сгенерировать 10 вариантов и выбрать наименее кривой, чем ждать дизайнера.

Попробуй сам: Cursor — AI-редактор для разработчиков.

Источник: https://github.com/harry0703/MoneyPrinterTurbo