Модели и ценыЧатВопросы
Модели и цены/NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5generative

nvidia
nvidia/llama-3.3-nemotron-super-49b-v1.5
Попробовать в чате
Откроется чат с этой моделью

Описание

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

Возможности

toolsjsonreason

Модальности

Вход
text
Выход
text

Характеристики

Контекст
131 072 ток.
Тип
generative
Выпущена
октябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="nvidia/llama-3.3-nemotron-super-49b-v1.5",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
messagesarrayобязательный
Список сообщений диалога (роль + содержимое).
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
seedinteger
Фиксация для воспроизводимости.
logit_biasobject
Смещения вероятностей отдельных токенов.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.
toolsarray
Описание функций для tool-calling.
tool_choicestring | object
Управление выбором инструмента: «auto», «none» или конкретный.
reasoningobject
Настройки рассуждения: усилие, бюджет токенов, видимость.
include_reasoningboolean
Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод30,80
Вывод30,80