Google: Gemma 3 12Bgenerative

google

google/gemma-3-12b-it

Откроется чат с этой моделью

Описание

Gemma 3 introduces multimodality, supporting vision-language input and text outputs. It handles context windows up to 128k tokens, understands over 140 languages, and offers improved math, reasoning, and chat capabilities,...

Возможности

visiontoolsjson

Модальности

Вход

textimage

Выход

text

Характеристики

Контекст

131 072 ток.

Тип

generative

Выпущена

март 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="google/gemma-3-12b-it",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

top_kinteger

Ограничение сэмплирования top-K токенами.

min_pnumber

Минимальная вероятность токена относительно самого вероятного.

stopstring | string[]

Стоп-последовательности.

frequency_penaltynumber

Штраф за повторы, −2…2.

presence_penaltynumber

Штраф за присутствие, −2…2.

repetition_penaltynumber

Штраф за повторение токенов.

seedinteger

Фиксация для воспроизводимости.

logit_biasobject

Смещения вероятностей отдельных токенов.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

Цены ₽ / 1M токенов

Ввод3,85 ₽

Вывод11,55 ₽