API-документация

Обзор

Wombat AI — единый агрегатор популярных AI-моделей с биллингом в рублях через СБП/банковские карты РФ. Один аккаунт, один ключ, одна оплата вместо десятка подписок на OpenAI/Anthropic/Google/etc.

API полностью совместим с OpenAI Chat Completions — то есть код, написанный для OpenAI SDK, работает у нас сменой base_url и api_key.

📌 Главное в одной фразе Берёте ключ sk-kvs-… в кабинете, ставите base_url = https://api.wombatai.app/v1, выбираете модель в формате provider/model — всё.

Быстрый старт

Зарегистрируйтесь на wombatai.app/register — получите 50 ₽ кредитов на тесты.
Пополните баланс любой суммой на /topup (или сразу пользуйтесь стартовыми кредитами).
Подключите Pro (1 990 ₽/мес) на /pricing — без подписки доступен только веб-чат, для API-ключей нужен Pro/Business.
Создайте ключ в кабинете → API-ключи — нажмите СОЗДАТЬ, скопируйте sk-kvs-…. Полный ключ покажется один раз, после — только preview.
Пробный запрос через curl — подставьте свой ключ:

bash

curl https://api.wombatai.app/v1/chat/completions \
 -H "Authorization: Bearer sk-kvs-…" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-4o-mini",
 "messages": [{"role": "user", "content": "Привет!"}]
 }'

Авторизация

Каждый запрос идёт с заголовком Authorization: Bearer sk-kvs-…. Ключ привязан к вашему аккаунту, скидке тарифа и балансу кредитов. Один аккаунт может иметь до 20 активных ключей одновременно — для прода/стейджа/CI разные.

⚠️ Безопасность Никогда не кладите ключ в публичные репозитории, чатах поддержки, скриншотах. Если ключ утёк — отзовите его в кабинете и выпустите новый. SHA-256-хеш ключа на сервере, обнулить нельзя — только отозвать.

Формат ключа

Префикс: sk-kvs-
Тело: 48 hex-символов (192 бит энтропии)
Пример: sk-kvs-f43d0c213c96172d1fdfba9c2b4eb0b49ef7617d615e5cc9

Базовый URL

https://api.wombatai.app/v1

Все эндпоинты — относительно базы. Только HTTPS (TLS 1.2/1.3), HTTP не поддерживаем.

GET /v1/models

Список моделей, которые Wombat AI умеет проксировать. Используйте id из ответа в поле model при запросе.

Пример запроса

bash

curl https://api.wombatai.app/v1/models \
 -H "Authorization: Bearer sk-kvs-…"

python

from openai import OpenAI

client = OpenAI(
 base_url="https://api.wombatai.app/v1",
 api_key="sk-kvs-…",
)
print([m.id for m in client.models.list().data])

javascript

import OpenAI from "openai";

const client = new OpenAI({
 baseURL: "https://api.wombatai.app/v1",
 apiKey: "sk-kvs-…",
});

const list = await client.models.list();
console.log(list.data.map(m => m.id));

Пример ответа

json

{
 "object": "list",
 "data": [
 {"id": "openai/gpt-5", "object": "model", "owned_by": "openai"},
 {"id": "openai/gpt-4o", "object": "model", "owned_by": "openai"},
 {"id": "openai/gpt-4o-mini", "object": "model", "owned_by": "openai"},
 {"id": "openai/o3", "object": "model", "owned_by": "openai"}
 ]
}

Список расширяется по мере подключения новых провайдеров. Актуальная сетка цен и моделей — на странице тарифов.

POST /v1/chat/completions

Главный эндпоинт: текстовая и мультимодальная генерация. Полностью повторяет OpenAI Chat Completions API.

Параметры тела

Параметр	Тип	Описание
`model`	string	Идентификатор в формате `provider/model`, напр. `openai/gpt-4o-mini`. Если не из списка `/v1/models` — 400.
`messages`	array	Лента сообщений. Каждое — `{role, content}`. role: `system` / `user` / `assistant`.
`max_tokens`	integer	Лимит токенов ответа. Жёсткий верхний предел — 16 384.
`temperature`	number	0.0 — детерминированный, 1.0 — баланс, 2.0 — креатив. По умолчанию 1.0.
`top_p`	number	Nucleus sampling 0..1.
`stream`	boolean	SSE-стрим ответа. soon для веб-чата, в API уже работает.
`response_format`	object	JSON-mode: `{"type": "json_object"}` (на совместимых моделях).
`tools`	array	Function calling — передаётся в апстрим как есть.

Заголовки

Authorization: Bearer sk-kvs-… — обязательно.
X-Request-Id — необязательный идемпотентный ключ. Повторный запрос с тем же ID не дублирует биллинг и возвращает кешированный ответ (10 мин).

Пример

bash

curl https://api.wombatai.app/v1/chat/completions \
 -H "Authorization: Bearer sk-kvs-…" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-4o-mini",
 "messages": [
 {"role": "system", "content": "Отвечай по-русски."},
 {"role": "user", "content": "Что такое СБП в двух словах?"}
 ],
 "max_tokens": 100
 }'

python

from openai import OpenAI

client = OpenAI(
 base_url="https://api.wombatai.app/v1",
 api_key="sk-kvs-…",
)

resp = client.chat.completions.create(
 model="openai/gpt-4o-mini",
 messages=[
 {"role": "system", "content": "Отвечай по-русски."},
 {"role": "user", "content": "Что такое СБП в двух словах?"},
 ],
 max_tokens=100,
)
print(resp.choices[0].message.content)

javascript

import OpenAI from "openai";

const client = new OpenAI({
 baseURL: "https://api.wombatai.app/v1",
 apiKey: "sk-kvs-…",
});

const resp = await client.chat.completions.create({
 model: "openai/gpt-4o-mini",
 messages: [
 { role: "system", content: "Отвечай по-русски." },
 { role: "user", content: "Что такое СБП в двух словах?" },
 ],
 max_tokens: 100,
});
console.log(resp.choices[0].message.content);

javascript

const resp = await fetch("https://api.wombatai.app/v1/chat/completions", {
 method: "POST",
 headers: {
 "Authorization": "Bearer sk-kvs-…",
 "Content-Type": "application/json",
 },
 body: JSON.stringify({
 model: "openai/gpt-4o-mini",
 messages: [{ role: "user", content: "Hello!" }],
 max_tokens: 50,
 }),
});
const data = await resp.json();
console.log(data.choices[0].message.content);

Структура ответа

json

{
 "id": "chatcmpl-…",
 "object": "chat.completion",
 "created": 1782111712,
 "model": "gpt-4o-mini-2024-07-18",
 "choices": [{
 "index": 0,
 "message": {"role": "assistant", "content": "СБП — Система быстрых платежей…"},
 "finish_reason": "stop"
 }],
 "usage": {
 "prompt_tokens": 24,
 "completion_tokens": 42,
 "total_tokens": 66
 }
}

Vision: картинки в запросах

Vision-модели принимают изображения через массив content в OpenAI-формате. Поддерживается data:-base64 и https://-URL.

Vision-модели: GPT-5, GPT-5 mini, GPT-4o, GPT-4o mini, o3, o3 mini, Claude Opus 4, Claude Sonnet 4, Claude Haiku 4.5, Gemini 2.5 Pro, Gemini 2.5 Flash, Grok 4.

Лимиты

Размер: до 2 МБ оригинала на картинку (≈2.7 МБ base64).
Количество: до 10 картинок на запрос.
Форматы: JPEG, PNG, WebP, GIF.

Пример с картинкой

bash

curl https://api.wombatai.app/v1/chat/completions \
 -H "Authorization: Bearer sk-kvs-…" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "openai/gpt-4o-mini",
 "messages": [{
 "role": "user",
 "content": [
 {"type": "text", "text": "Что на картинке?"},
 {"type": "image_url", "image_url": {"url": "https://example.com/photo.jpg"}}
 ]
 }],
 "max_tokens": 100
 }'

В JSON ответа — обычное choices[0].message.content с текстом описания.

Коды ошибок

HTTP	type	Что значит
400	invalid_request_error	Невалидный body или модель не из списка `/v1/models`.
401	authentication_error	Нет/неверный/отозванный API-ключ.
402	insufficient_quota	Баланс кредитов не покрывает запрос. Пополните на /topup.
422	invalid_request_error	Картинка слишком большая, лимит 10 файлов, vision-only-модели, и т.п.
429	rate_limit_exceeded	Превышен RPM. См. rate-limits.
502	server_error	Апстрим-провайдер вернул ошибку. Повторите через 5 сек.
503	server_error	Сервис временно недоступен (БД, конфигурация). Обычно проходит само за минуту.

Тело ошибки всегда:

json

{
 "error": {
 "message": "Insufficient credits. Top up via СБП.",
 "type": "insufficient_quota"
 }
}

Rate-limits

Тариф	RPM	RPD
Free	60	—
Lite	60	—
Pro	600	—
Business	600	по запросу выше

Каждый ответ содержит заголовки:

x-ratelimit-limit — текущий лимит RPM
x-ratelimit-remaining — сколько запросов осталось в окне
x-ratelimit-reset — секунд до сброса окна

При 429 — пауза до x-ratelimit-reset сек и повтор. Реализуйте экспоненциальный backoff.

Стоимость

Стоимость каждого запроса = себестоимость у провайдера × наша наценка 20% × скидка вашего тарифа. Подробная сетка цен по моделям — на /pricing.

Курс провайдеров пересчитывается ежедневно по ЦБ РФ. Скидки:

Free / Lite: 0% / 10%
Pro: −20%
Business: −30%

В каждом ответе usage.prompt_tokens/completion_tokens позволяют посчитать стоимость локально. Реальное списание — атомарное, сразу после ответа.

SDK и инструменты

Поскольку API совместим с OpenAI, работают любые библиотеки и инструменты, поддерживающие OpenAI: openai (Python/Node.js/Go), LangChain, LlamaIndex, Vercel AI SDK, Cursor, Continue.dev, Cline, ChatBox, BoltAI, Raycast AI, Open WebUI и десятки других.

Для большинства из них достаточно прописать:

Custom endpoint / Base URL: https://api.wombatai.app/v1
API key: sk-kvs-…
Model: openai/gpt-4o (или любая из /v1/models)

Скачать готовые коллекции

▤ Postman v2.1

Импортируйте в Postman или Insomnia — все эндпоинты с примерами тел и заголовков.

▤ OpenAPI 3.0

Сгенерируйте клиент на любом языке через openapi-generator/swagger-codegen.

Cursor / Continue.dev

json

{
 "models": [{
 "title": "GPT-4o via Wombat AI",
 "provider": "openai",
 "model": "openai/gpt-4o",
 "apiBase": "https://api.wombatai.app/v1",
 "apiKey": "sk-kvs-…"
 }]
}

LangChain (Python)

python

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
 model="openai/gpt-4o",
 base_url="https://api.wombatai.app/v1",
 api_key="sk-kvs-…",
)
print(llm.invoke("Hello!").content)

Помощь

Нашли баг или не работает интеграция — напишите на support@wombatai.app или через /support. Включите id запроса (заголовок x-request-id в ответе) и фрагмент кода — отвечаем в рабочие часы за 1–4 часа.

API интеграция

Обзор

Быстрый старт

Авторизация

Формат ключа

Базовый URL

GET /v1/models

Пример запроса

Пример ответа

POST /v1/chat/completions

Параметры тела

Заголовки

Пример

Структура ответа

Vision: картинки в запросах

Лимиты

Пример с картинкой

Коды ошибок

Rate-limits

Стоимость

SDK и инструменты

Скачать готовые коллекции

Cursor / Continue.dev

LangChain (Python)

Помощь