Модели и ценыЧатВопросы
Модели и цены/Qwen: Qwen3 Embedding 8B

Qwen: Qwen3 Embedding 8Bembedding

qwen
qwen/qwen3-embedding-8b

Описание

The Qwen3 Embedding model series is the latest proprietary model of the Qwen family, specifically designed for text embedding and ranking tasks. This series inherits the exceptional multilingual capabilities, long-text...

Возможности

json

Модальности

Вход
text
Выход
embeddings

Характеристики

Контекст
32K ток.
Тип
embedding
Выпущена
октябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.embeddings.create(
    model="qwen/qwen3-embedding-8b",
    input="Текст для векторизации",
)
print(resp.data[0].embedding[:8])

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
inputstring | string[]обязательный
Текст или массив текстов для векторизации.
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
seedinteger
Фиксация для воспроизводимости.
logit_biasobject
Смещения вероятностей отдельных токенов.
logprobsboolean
Возвращать логарифмы вероятностей токенов.
top_logprobsinteger
Сколько наиболее вероятных токенов возвращать вместе с logprobs.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.

Цены ₽ / 1M токенов

Ввод0,77
Вывод0