Модели и ценыЧатВопросы
Модели и цены/Sentence Transformers: all-MiniLM-L12-v2

Sentence Transformers: all-MiniLM-L12-v2embedding

sentence-transformers
sentence-transformers/all-minilm-l12-v2

Описание

The all-MiniLM-L12-v2 embedding model maps sentences and short paragraphs into a 384-dimensional dense vector space, producing efficient and high-quality semantic embeddings optimized for tasks such as semantic search, clustering, and...

Возможности

json

Модальности

Вход
text
Выход
embeddings

Характеристики

Контекст
8 192 ток.
Тип
embedding
Выпущена
ноябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.embeddings.create(
    model="sentence-transformers/all-minilm-l12-v2",
    input="Текст для векторизации",
)
print(resp.data[0].embedding[:8])

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
inputstring | string[]обязательный
Текст или массив текстов для векторизации.
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
seedinteger
Фиксация для воспроизводимости.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.

Цены ₽ / 1M токенов

Ввод0,39
Вывод0