Модели и ценыЧатВопросы
Модели и цены/Google: Gemini 2.5 Flash Lite Preview 09-2025

Google: Gemini 2.5 Flash Lite Preview 09-2025generative

google
google/gemini-2.5-flash-lite-preview-09-2025
Попробовать в чате
Откроется чат с этой моделью

Описание

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance...

Возможности

visiontoolsjsonreasonaudio

Модальности

Вход
textimagefileaudiovideo
Выход
text

Характеристики

Контекст
1.048576M ток.
Тип
generative
Выпущена
сентябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="google/gemini-2.5-flash-lite-preview-09-2025",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
messagesarrayобязательный
Список сообщений диалога (роль + содержимое).
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
stopstring | string[]
Стоп-последовательности.
seedinteger
Фиксация для воспроизводимости.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.
structured_outputsboolean
Строгий вывод по JSON-схеме (json_schema в response_format).
toolsarray
Описание функций для tool-calling.
tool_choicestring | object
Управление выбором инструмента: «auto», «none» или конкретный.
reasoningobject
Настройки рассуждения: усилие, бюджет токенов, видимость.
include_reasoningboolean
Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод7,70
Вывод30,80
Чтение из кэша0,77
Запись в кэш6,42
Рассуждения30,80
Аудио-вход23,10
За изображение0,0000077