Qwen: Qwen3.6 Max Previewgenerative

qwen

qwen/qwen3.6-max-preview

Откроется чат с этой моделью

Описание

Qwen3.6-Max-Preview is a proprietary frontier model from Alibaba Cloud built on a sparse mixture-of-experts architecture with approximately 1 trillion total parameters. It is optimized for agentic coding, tool use, and...

Возможности

toolsjsonreason

Модальности

Вход

text

Выход

text

Характеристики

Контекст

262 144 ток.

Тип

generative

Выпущена

апрель 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="qwen/qwen3.6-max-preview",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

presence_penaltynumber

Штраф за присутствие, −2…2.

seedinteger

Фиксация для воспроизводимости.

logprobsboolean

Возвращать логарифмы вероятностей токенов.

top_logprobsinteger

Сколько наиболее вероятных токенов возвращать вместе с logprobs.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

reasoningobject

Настройки рассуждения: усилие, бюджет токенов, видимость.

include_reasoningboolean

Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод80,08 ₽

Вывод480,48 ₽

Запись в кэш100,10 ₽