Модели и ценыЧатВопросы
Модели и цены/NVIDIA: Llama Nemotron Embed VL 1B V2 (free)

NVIDIA: Llama Nemotron Embed VL 1B V2 (free)embedding

nvidia
nvidia/llama-nemotron-embed-vl-1b-v2:free

Описание

The Llama Nemotron Embed VL 1B V2 embedding model is optimized for multimodal question-answering retrieval. The model can embed 'documents' in the form of image, text, or image and text...

Возможности

vision

Модальности

Вход
textimage
Выход
embeddings

Характеристики

Контекст
131 072 ток.
Тип
embedding
Выпущена
февраль 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.embeddings.create(
    model="nvidia/llama-nemotron-embed-vl-1b-v2:free",
    input="Текст для векторизации",
)
print(resp.data[0].embedding[:8])

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
inputstring | string[]обязательный
Текст или массив текстов для векторизации.
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
seedinteger
Фиксация для воспроизводимости.

Цены

Генерация медиа (аудио/изображения) тарифицируется по фактической стоимости провайдера — итоговая цена хода видна в чате сразу после ответа.