Модели и ценыЧатВопросы
Модели и цены/Qwen: Qwen3 Embedding 4B

Qwen: Qwen3 Embedding 4Bembedding

qwen
qwen/qwen3-embedding-4b

Описание

The Qwen3 Embedding model series is the latest proprietary model of the Qwen family, specifically designed for text embedding and ranking tasks. This series inherits the exceptional multilingual capabilities, long-text...

Возможности

json

Модальности

Вход
text
Выход
embeddings

Характеристики

Контекст
32 768 ток.
Тип
embedding
Выпущена
октябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.embeddings.create(
    model="qwen/qwen3-embedding-4b",
    input="Текст для векторизации",
)
print(resp.data[0].embedding[:8])

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
inputstring | string[]обязательный
Текст или массив текстов для векторизации.
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
seedinteger
Фиксация для воспроизводимости.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.

Цены ₽ / 1M токенов

Ввод1,54
Вывод0