Модели и цены/Qwen: Qwen3 VL 8B Thinking

Qwen: Qwen3 VL 8B Thinkinggenerative

qwen

qwen/qwen3-vl-8b-thinking

Откроется чат с этой моделью

Описание

Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences. It integrates enhanced multimodal alignment and...

Возможности

visiontoolsjsonreason

Модальности

Вход

imagetext

Выход

text

Характеристики

Контекст

256K ток.

Тип

generative

Выпущена

октябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="qwen/qwen3-vl-8b-thinking",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

presence_penaltynumber

Штраф за присутствие, −2…2.

seedinteger

Фиксация для воспроизводимости.

logprobsboolean

Возвращать логарифмы вероятностей токенов.

top_logprobsinteger

Сколько наиболее вероятных токенов возвращать вместе с logprobs.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

reasoningobject

Настройки рассуждения: усилие, бюджет токенов, видимость.

include_reasoningboolean

Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод9,01 ₽

Вывод105,11 ₽