Z.ai: GLM 4.6generative

z-ai

z-ai/glm-4.6

Откроется чат с этой моделью

Описание

Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex...

Возможности

toolsjsonreason

Модальности

Вход

text

Выход

text

Характеристики

Контекст

202 752 ток.

Тип

generative

Выпущена

сентябрь 2025 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="z-ai/glm-4.6",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

top_kinteger

Ограничение сэмплирования top-K токенами.

min_pnumber

Минимальная вероятность токена относительно самого вероятного.

stopstring | string[]

Стоп-последовательности.

frequency_penaltynumber

Штраф за повторы, −2…2.

presence_penaltynumber

Штраф за присутствие, −2…2.

repetition_penaltynumber

Штраф за повторение токенов.

seedinteger

Фиксация для воспроизводимости.

logit_biasobject

Смещения вероятностей отдельных токенов.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

reasoningobject

Настройки рассуждения: усилие, бюджет токенов, видимость.

include_reasoningboolean

Включать цепочку рассуждений в ответ.

Цены ₽ / 1M токенов

Ввод33,11 ₽

Вывод133,98 ₽

Чтение из кэша6,16 ₽