Wombat AI Wombat AI
/docs

API интеграция

OpenAI-совместимый шлюз: GPT-5, Claude, Gemini, DeepSeek и другие — через один ключ, один счёт и одну рублёвую оплату по СБП.

Обзор

Wombat AI — единый агрегатор популярных AI-моделей с биллингом в рублях через СБП/банковские карты РФ. Один аккаунт, один ключ, одна оплата вместо десятка подписок на OpenAI/Anthropic/Google/etc.

API полностью совместим с OpenAI Chat Completions — то есть код, написанный для OpenAI SDK, работает у нас сменой base_url и api_key.

📌 Главное в одной фразе Берёте ключ sk-kvs-… в кабинете, ставите base_url = https://api.wombatai.app/v1, выбираете модель в формате provider/model — всё.

Быстрый старт

  1. Зарегистрируйтесь на wombatai.app/register — получите 50 ₽ кредитов на тесты.
  2. Пополните баланс любой суммой на /topup (или сразу пользуйтесь стартовыми кредитами).
  3. Подключите Pro (1 990 ₽/мес) на /pricing — без подписки доступен только веб-чат, для API-ключей нужен Pro/Business.
  4. Создайте ключ в кабинете → API-ключи — нажмите СОЗДАТЬ, скопируйте sk-kvs-…. Полный ключ покажется один раз, после — только preview.
  5. Пробный запрос через curl — подставьте свой ключ:
bash
curl https://api.wombatai.app/v1/chat/completions \
 -H "Authorization: Bearer sk-kvs-…" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-4o-mini",
 "messages": [{"role": "user", "content": "Привет!"}]
 }'

Авторизация

Каждый запрос идёт с заголовком Authorization: Bearer sk-kvs-…. Ключ привязан к вашему аккаунту, скидке тарифа и балансу кредитов. Один аккаунт может иметь до 20 активных ключей одновременно — для прода/стейджа/CI разные.

⚠️ Безопасность Никогда не кладите ключ в публичные репозитории, чатах поддержки, скриншотах. Если ключ утёк — отзовите его в кабинете и выпустите новый. SHA-256-хеш ключа на сервере, обнулить нельзя — только отозвать.

Формат ключа

  • Префикс: sk-kvs-
  • Тело: 48 hex-символов (192 бит энтропии)
  • Пример: sk-kvs-f43d0c213c96172d1fdfba9c2b4eb0b49ef7617d615e5cc9

Базовый URL

https://api.wombatai.app/v1

Все эндпоинты — относительно базы. Только HTTPS (TLS 1.2/1.3), HTTP не поддерживаем.

GET   /v1/models

Список моделей, которые Wombat AI умеет проксировать. Используйте id из ответа в поле model при запросе.

Пример запроса

bash
curl https://api.wombatai.app/v1/models \
 -H "Authorization: Bearer sk-kvs-…"

Пример ответа

json
{
 "object": "list",
 "data": [
 {"id": "openai/gpt-5", "object": "model", "owned_by": "openai"},
 {"id": "openai/gpt-4o", "object": "model", "owned_by": "openai"},
 {"id": "openai/gpt-4o-mini", "object": "model", "owned_by": "openai"},
 {"id": "openai/o3", "object": "model", "owned_by": "openai"}
 ]
}

Список расширяется по мере подключения новых провайдеров. Актуальная сетка цен и моделей — на странице тарифов.

POST   /v1/chat/completions

Главный эндпоинт: текстовая и мультимодальная генерация. Полностью повторяет OpenAI Chat Completions API.

Параметры тела

ПараметрТипОписание
modelstringИдентификатор в формате provider/model, напр. openai/gpt-4o-mini. Если не из списка /v1/models — 400.
messagesarrayЛента сообщений. Каждое — {role, content}. role: system / user / assistant.
max_tokensintegerЛимит токенов ответа. Жёсткий верхний предел — 16 384.
temperaturenumber0.0 — детерминированный, 1.0 — баланс, 2.0 — креатив. По умолчанию 1.0.
top_pnumberNucleus sampling 0..1.
streambooleanSSE-стрим ответа. soon для веб-чата, в API уже работает.
response_formatobjectJSON-mode: {"type": "json_object"} (на совместимых моделях).
toolsarrayFunction calling — передаётся в апстрим как есть.

Заголовки

  • Authorization: Bearer sk-kvs-… — обязательно.
  • X-Request-Id — необязательный идемпотентный ключ. Повторный запрос с тем же ID не дублирует биллинг и возвращает кешированный ответ (10 мин).

Пример

bash
curl https://api.wombatai.app/v1/chat/completions \
 -H "Authorization: Bearer sk-kvs-…" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-4o-mini",
 "messages": [
 {"role": "system", "content": "Отвечай по-русски."},
 {"role": "user", "content": "Что такое СБП в двух словах?"}
 ],
 "max_tokens": 100
 }'

Структура ответа

json
{
 "id": "chatcmpl-…",
 "object": "chat.completion",
 "created": 1782111712,
 "model": "gpt-4o-mini-2024-07-18",
 "choices": [{
 "index": 0,
 "message": {"role": "assistant", "content": "СБП — Система быстрых платежей…"},
 "finish_reason": "stop"
 }],
 "usage": {
 "prompt_tokens": 24,
 "completion_tokens": 42,
 "total_tokens": 66
 }
}

Vision: картинки в запросах

Vision-модели принимают изображения через массив content в OpenAI-формате. Поддерживается data:-base64 и https://-URL.

Vision-модели: GPT-5, GPT-5 mini, GPT-4o, GPT-4o mini, o3, o3 mini, Claude Opus 4, Claude Sonnet 4, Claude Haiku 4.5, Gemini 2.5 Pro, Gemini 2.5 Flash, Grok 4.

Лимиты

  • Размер: до 2 МБ оригинала на картинку (≈2.7 МБ base64).
  • Количество: до 10 картинок на запрос.
  • Форматы: JPEG, PNG, WebP, GIF.

Пример с картинкой

bash
curl https://api.wombatai.app/v1/chat/completions \
 -H "Authorization: Bearer sk-kvs-…" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-4o-mini",
 "messages": [{
 "role": "user",
 "content": [
 {"type": "text", "text": "Что на картинке?"},
 {"type": "image_url", "image_url": {"url": "https://example.com/photo.jpg"}}
 ]
 }],
 "max_tokens": 100
 }'

В JSON ответа — обычное choices[0].message.content с текстом описания.

Коды ошибок

HTTPtypeЧто значит
400invalid_request_errorНевалидный body или модель не из списка /v1/models.
401authentication_errorНет/неверный/отозванный API-ключ.
402insufficient_quotaБаланс кредитов не покрывает запрос. Пополните на /topup.
422invalid_request_errorКартинка слишком большая, лимит 10 файлов, vision-only-модели, и т.п.
429rate_limit_exceededПревышен RPM. См. rate-limits.
502server_errorАпстрим-провайдер вернул ошибку. Повторите через 5 сек.
503server_errorСервис временно недоступен (БД, конфигурация). Обычно проходит само за минуту.

Тело ошибки всегда:

json
{
 "error": {
 "message": "Insufficient credits. Top up via СБП.",
 "type": "insufficient_quota"
 }
}

Rate-limits

ТарифRPMRPD
Free60
Lite60
Pro600
Business600по запросу выше

Каждый ответ содержит заголовки:

  • x-ratelimit-limit — текущий лимит RPM
  • x-ratelimit-remaining — сколько запросов осталось в окне
  • x-ratelimit-reset — секунд до сброса окна

При 429 — пауза до x-ratelimit-reset сек и повтор. Реализуйте экспоненциальный backoff.

Стоимость

Стоимость каждого запроса = себестоимость у провайдера × наша наценка 20% × скидка вашего тарифа. Подробная сетка цен по моделям — на /pricing.

Курс провайдеров пересчитывается ежедневно по ЦБ РФ. Скидки:

  • Free / Lite: 0% / 10%
  • Pro: −20%
  • Business: −30%

В каждом ответе usage.prompt_tokens/completion_tokens позволяют посчитать стоимость локально. Реальное списание — атомарное, сразу после ответа.

SDK и инструменты

Поскольку API совместим с OpenAI, работают любые библиотеки и инструменты, поддерживающие OpenAI: openai (Python/Node.js/Go), LangChain, LlamaIndex, Vercel AI SDK, Cursor, Continue.dev, Cline, ChatBox, BoltAI, Raycast AI, Open WebUI и десятки других.

Для большинства из них достаточно прописать:

  • Custom endpoint / Base URL: https://api.wombatai.app/v1
  • API key: sk-kvs-…
  • Model: openai/gpt-4o (или любая из /v1/models)

Скачать готовые коллекции

Cursor / Continue.dev

json
{
 "models": [{
 "title": "GPT-4o via Wombat AI",
 "provider": "openai",
 "model": "openai/gpt-4o",
 "apiBase": "https://api.wombatai.app/v1",
 "apiKey": "sk-kvs-…"
 }]
}

LangChain (Python)

python
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
 model="openai/gpt-4o",
 base_url="https://api.wombatai.app/v1",
 api_key="sk-kvs-…",
)
print(llm.invoke("Hello!").content)

Помощь

Нашли баг или не работает интеграция — напишите на support@wombatai.app или через /support. Включите id запроса (заголовок x-request-id в ответе) и фрагмент кода — отвечаем в рабочие часы за 1–4 часа.