Модели и цены/Google: Gemini 3.1 Flash Lite

Google: Gemini 3.1 Flash Litegenerative

google

google/gemini-3.1-flash-lite

Откроется чат с этой моделью

Описание

Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads. It supports text, image, video, audio, and PDF inputs, and is designed for lightweight agentic...

Возможности

visiontoolsjsonreasonaudio

Модальности

Вход

textimagevideofileaudio

Выход

text

Характеристики

Контекст

1.048576M ток.

Тип

generative

Выпущена

май 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="google/gemini-3.1-flash-lite",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

stopstring | string[]

Стоп-последовательности.

seedinteger

Фиксация для воспроизводимости.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

reasoningobject

Настройки рассуждения: усилие, бюджет токенов, видимость.

include_reasoningboolean

Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод19,25 ₽

Вывод115,50 ₽

Чтение из кэша1,93 ₽

Запись в кэш6,42 ₽

Рассуждения115,50 ₽

Аудио-вход38,50 ₽

За изображение0,0000193 ₽