Модели и ценыЧатВопросы
Модели и цены/Thenlper: GTE-Large

Thenlper: GTE-Largeembedding

thenlper
thenlper/gte-large

Описание

The gte-large embedding model converts English sentences, paragraphs and moderate-length documents into a 1024-dimensional dense vector space, delivering high-quality semantic embeddings optimized for information retrieval, semantic textual similarity, reranking and...

Возможности

json

Модальности

Вход
text
Выход
embeddings

Характеристики

Контекст
8 192 ток.
Тип
embedding
Выпущена
ноябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.embeddings.create(
    model="thenlper/gte-large",
    input="Текст для векторизации",
)
print(resp.data[0].embedding[:8])

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
inputstring | string[]обязательный
Текст или массив текстов для векторизации.
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
seedinteger
Фиксация для воспроизводимости.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.

Цены ₽ / 1M токенов

Ввод0,77
Вывод0