Z.ai: GLM 5.2generativenew

z-ai

z-ai/glm-5.2

Откроется чат с этой моделью

Описание

GLM 5.2 is a large-scale reasoning model from Z.ai. It supports text input and output with a 1M-token context window, and is suited for long-horizon agent workflows, project-level software engineering,...

Возможности

toolsjsonreason

Модальности

Вход

text

Выход

text

Характеристики

Контекст

1.048576M ток.

Тип

generative

Выпущена

июнь 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="z-ai/glm-5.2",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

top_kinteger

Ограничение сэмплирования top-K токенами.

min_pnumber

Минимальная вероятность токена относительно самого вероятного.

stopstring | string[]

Стоп-последовательности.

frequency_penaltynumber

Штраф за повторы, −2…2.

presence_penaltynumber

Штраф за присутствие, −2…2.

repetition_penaltynumber

Штраф за повторение токенов.

seedinteger

Фиксация для воспроизводимости.

logit_biasobject

Смещения вероятностей отдельных токенов.

logprobsboolean

Возвращать логарифмы вероятностей токенов.

top_logprobsinteger

Сколько наиболее вероятных токенов возвращать вместе с logprobs.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

parallel_tool_callsboolean

Разрешить параллельный вызов нескольких инструментов.

reasoningobject

Настройки рассуждения: усилие, бюджет токенов, видимость.

reasoning_effortstring

«low» / «medium» / «high» — глубина рассуждения.

include_reasoningboolean

Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод53,90 ₽

Вывод169,40 ₽

Чтение из кэша10,01 ₽