Модели и ценыЧатВопросы

Z.ai: GLM 5.2generativenew

z-ai
z-ai/glm-5.2
Попробовать в чате
Откроется чат с этой моделью

Описание

GLM 5.2 is a large-scale reasoning model from Z.ai. It supports text input and output with a 1M-token context window, and is suited for long-horizon agent workflows, project-level software engineering,...

Возможности

toolsjsonreason

Модальности

Вход
text
Выход
text

Характеристики

Контекст
1.048576M ток.
Тип
generative
Выпущена
июнь 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный
Идентификатор модели.
messagesarrayобязательный
Список сообщений диалога (роль + содержимое).
temperaturenumber
Случайность вывода, 0–2. По умолчанию 1.
max_tokensinteger
Максимум токенов в ответе.
top_pnumber
Nucleus-сэмплирование, 0–1.
top_kinteger
Ограничение сэмплирования top-K токенами.
min_pnumber
Минимальная вероятность токена относительно самого вероятного.
stopstring | string[]
Стоп-последовательности.
frequency_penaltynumber
Штраф за повторы, −2…2.
presence_penaltynumber
Штраф за присутствие, −2…2.
repetition_penaltynumber
Штраф за повторение токенов.
seedinteger
Фиксация для воспроизводимости.
logit_biasobject
Смещения вероятностей отдельных токенов.
logprobsboolean
Возвращать логарифмы вероятностей токенов.
top_logprobsinteger
Сколько наиболее вероятных токенов возвращать вместе с logprobs.
response_formatobject
{ "type": "json_object" } — гарантированный JSON.
structured_outputsboolean
Строгий вывод по JSON-схеме (json_schema в response_format).
toolsarray
Описание функций для tool-calling.
tool_choicestring | object
Управление выбором инструмента: «auto», «none» или конкретный.
parallel_tool_callsboolean
Разрешить параллельный вызов нескольких инструментов.
reasoningobject
Настройки рассуждения: усилие, бюджет токенов, видимость.
reasoning_effortstring
«low» / «medium» / «high» — глубина рассуждения.
include_reasoningboolean
Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод53,90
Вывод169,40
Чтение из кэша10,01