Модели и ценыЧатВопросы

Qwen: Qwen3 8Bgenerative

qwen
qwen/qwen3-8b
Попробовать в чате
Откроется чат с этой моделью

Описание

Qwen3-8B is a dense 8.2B parameter causal language model from the Qwen3 series, designed for both reasoning-heavy tasks and efficient dialogue. It supports seamless switching between "thinking" mode for math,...

Возможности

toolsjsonreason

Модальности

Вход
text
Выход
text

Характеристики

Контекст
131 072 ток.
Тип
generative
Выпущена
апрель 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="qwen/qwen3-8b",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
messagesarrayобязательный
Список сообщений диалога (роль + содержимое).
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
presence_penaltynumber
Штраф за присутствие, −2…2.
seedinteger
Фиксация для воспроизводимости.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.
toolsarray
Описание функций для tool-calling.
tool_choicestring | object
Управление выбором инструмента: «auto», «none» или конкретный.
reasoningobject
Настройки рассуждения: усилие, бюджет токенов, видимость.
include_reasoningboolean
Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод9,01
Вывод35,04