Модели и цены/Qwen: Qwen3 VL 32B Instruct

Qwen: Qwen3 VL 32B Instructgenerative

qwen

qwen/qwen3-vl-32b-instruct

Откроется чат с этой моделью

Описание

Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perception with advanced text...

Возможности

visiontoolsjson

Модальности

Вход

textimage

Выход

text

Характеристики

Контекст

262 144 ток.

Тип

generative

Выпущена

октябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="qwen/qwen3-vl-32b-instruct",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

presence_penaltynumber

Штраф за присутствие, −2…2.

seedinteger

Фиксация для воспроизводимости.

logprobsboolean

Возвращать логарифмы вероятностей токенов.

top_logprobsinteger

Сколько наиболее вероятных токенов возвращать вместе с logprobs.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

Цены ₽ / 1M токенов

Ввод8,01 ₽

Вывод32,03 ₽