Модели и ценыЧатВопросы
Модели и цены/Google: Gemma 3n 4B

Google: Gemma 3n 4Bgenerative

google
google/gemma-3n-e4b-it
Попробовать в чате
Откроется чат с этой моделью

Описание

Gemma 3n E4B-it is optimized for efficient execution on mobile and low-resource devices, such as phones, laptops, and tablets. It supports multimodal inputs—including text, visual data, and audio—enabling diverse tasks...

Возможности

json

Модальности

Вход
text
Выход
text

Характеристики

Контекст
32 768 ток.
Тип
generative
Выпущена
май 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="google/gemma-3n-e4b-it",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
messagesarrayобязательный
Список сообщений диалога (роль + содержимое).
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
logit_biasobject
Смещения вероятностей отдельных токенов.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.
structured_outputsboolean
Строгий вывод по JSON-схеме (json_schema в response_format).

Цены ₽ / 1M токенов

Ввод4,62
Вывод9,24