Модели и цены/NVIDIA: Llama Nemotron Embed VL 1B V2 (free)

NVIDIA: Llama Nemotron Embed VL 1B V2 (free)embedding

nvidia

nvidia/llama-nemotron-embed-vl-1b-v2:free

Описание

The Llama Nemotron Embed VL 1B V2 embedding model is optimized for multimodal question-answering retrieval. The model can embed 'documents' in the form of image, text, or image and text...

Возможности

vision

Модальности

Вход

textimage

Выход

embeddings

Характеристики

Контекст

131 072 ток.

Тип

embedding

Выпущена

февраль 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.embeddings.create(
    model="nvidia/llama-nemotron-embed-vl-1b-v2:free",
    input="Текст для векторизации",
)
print(resp.data[0].embedding[:8])

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

inputstring | string[]обязательный

Текст или массив текстов для векторизации.

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

seedinteger

Фиксация для воспроизводимости.

Цены

Генерация медиа (аудио/изображения) тарифицируется по фактической стоимости провайдера — итоговая цена хода видна в чате сразу после ответа.