> ## Documentation Index
> Fetch the complete documentation index at: https://docs.elumenta.ru/llms.txt
> Use this file to discover all available pages before exploring further.

# Руководство по генерации аудио

> Синтез речи, распознавание речи и генерация музыки с ElevenLabs, OpenAI TTS, MiniMax и MusicGen

Elumenta поддерживает три типа аудио: **синтез речи (TTS)**, **распознавание речи (STT)** и **генерация музыки** — все через единый эндпоинт `/api/v2/generate`.

## Синтез речи (TTS)

```python theme={null}
import requests

response = requests.post(
    "https://elumenta.ru/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "elevenlabs-v2",
        "text": "Добро пожаловать в Elumenta. Ваша AI-платформа для любых задач.",
        "voice_id": "21m00Tcm4TlvDq8ikWAM"
    }
)

audio_url = response.json()["output_url"]
```

## Сравнение TTS моделей

| Слаг               | Название        | Тариф  | Стоимость | Для чего                            |
| ------------------ | --------------- | ------ | --------- | ----------------------------------- |
| `minimax-tts`      | MiniMax TTS     | Basic+ | 1 ткн     | Китайский/английский, большой объём |
| `openai-tts`       | OpenAI TTS      | Basic+ | 3 ткн     | Стандартные голоса                  |
| `openai-tts-hd`    | OpenAI TTS HD   | Basic+ | 6 ткн     | Подкасты, нарратив                  |
| `gpt-4o-mini-tts`  | GPT-4o Mini TTS | Basic+ | 3 ткн     | Естественный разговор               |
| `elevenlabs-flash` | EL Flash        | Basic+ | 18 ткн    | Реальное время, низкая задержка     |
| `elevenlabs-v2`    | EL ML v2        | Basic+ | 35 ткн    | Многоязычный, высшее качество       |

<Tip>
  Для реального времени используйте `elevenlabs-flash`. Для предзаписанного контента — `elevenlabs-v2` или `openai-tts-hd`.
</Tip>

## Распознавание речи (STT)

```python theme={null}
response = requests.post(
    "https://elumenta.ru/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "whisper",
        "audio_url": "https://example.com/audio.mp3",
        "language": "ru"
    }
)

print(response.json()["content"])
```

| Слаг                | Название          | Тариф   | Стоимость |
| ------------------- | ----------------- | ------- | --------- |
| `whisper`           | Whisper STT       | Starter | 2 ткн     |
| `gpt-4o-transcribe` | GPT-4o Transcribe | Basic+  | 2 ткн     |
| `elevenlabs-scribe` | EL Scribe         | Basic+  | 2 ткн     |

## Генерация музыки

Две модели для разных задач:

| Слаг               | Провайдер  | Тариф   | Стоимость | Для чего                                 |
| ------------------ | ---------- | ------- | --------- | ---------------------------------------- |
| `musicgen`         | Replicate  | Starter | 9 ткн     | Быстрые наброски, без подписки           |
| `elevenlabs-music` | ElevenLabs | Basic+  | 58 ткн    | Профессиональное качество, длинные треки |

### MusicGen (Replicate)

```python theme={null}
response = requests.post(
    "https://elumenta.ru/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "musicgen",
        "prompt": "Спокойный lo-fi хип-хоп, треск винила, фортепиано, 80 BPM",
        "duration": 30
    }
)
```

### ElevenLabs Music

```python theme={null}
response = requests.post(
    "https://elumenta.ru/api/v2/generate",
    headers={"Authorization": "Bearer nb_YOUR_API_KEY"},
    json={
        "model": "elevenlabs-music",
        "prompt": "Эпическая оркестровая киномузыка, нарастающее напряжение, полные струнные",
        "duration": 60
    }
)
```

### Советы по промптам

| Элемент     | Примеры                                                                         |
| ----------- | ------------------------------------------------------------------------------- |
| Жанр        | `lo-fi хип-хоп`, `киноркестр`, `электронный хаус`, `акустик фолк`               |
| Инструменты | `фортепиано`, `электрогитара`, `синтезатор`, `скрипка`, `барабаны`              |
| Темп        | `80 BPM`, `быстрый`, `медленный и мелодичный`                                   |
| Настроение  | `энергичный`, `меланхоличный`, `воодушевляющий`, `напряжённый`, `расслабляющий` |
