Модели и ценыЧатВопросы
Модели и цены/NVIDIA: Nemotron 3 Ultra (free)

NVIDIA: Nemotron 3 Ultra (free)generative

nvidia
nvidia/nemotron-3-ultra-550b-a55b:free
Попробовать в чате
Откроется чат с этой моделью

Описание

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

Возможности

toolsreason

Модальности

Вход
text
Выход
text

Характеристики

Контекст
1M ток.
Тип
generative
Выпущена
июнь 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="nvidia/nemotron-3-ultra-550b-a55b:free",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
messagesarrayобязательный
Список сообщений диалога (роль + содержимое).
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
seedinteger
Фиксация для воспроизводимости.
toolsarray
Описание функций для tool-calling.
tool_choicestring | object
Управление выбором инструмента: «auto», «none» или конкретный.
reasoningobject
Настройки рассуждения: усилие, бюджет токенов, видимость.
include_reasoningboolean
Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод0
Вывод0