Модели и цены/inclusionAI: Ling-2.6-flash

inclusionAI: Ling-2.6-flashgenerative

inclusionai

inclusionai/ling-2.6-flash

Откроется чат с этой моделью

Описание

Ling-2.6-flash is an instant (instruct) model from inclusionAI with 104B total parameters and 7.4B active parameters, designed for real-world agents that require fast responses, strong execution, and high token efficiency....

Возможности

toolsjson

Модальности

Вход

text

Выход

text

Характеристики

Контекст

262 144 ток.

Тип

generative

Выпущена

апрель 2026 г.

API и примеры кода

from openai import OpenAI

client = OpenAI(
    base_url="https://infergate.ru/api/v1",
    api_key="ig-•••",
)

resp = client.chat.completions.create(
    model="inclusionai/ling-2.6-flash",
    messages=[{"role": "user", "content": "Привет!"}],
)
print(resp.choices[0].message.content)

Поддерживаемые параметры запроса

modelstringобязательный

Идентификатор модели.

messagesarrayобязательный

Список сообщений диалога (роль + содержимое).

temperaturenumber

Случайность вывода, 0–2. По умолчанию 1.

max_tokensinteger

Максимум токенов в ответе.

top_pnumber

Nucleus-сэмплирование, 0–1.

top_kinteger

Ограничение сэмплирования top-K токенами.

stopstring | string[]

Стоп-последовательности.

frequency_penaltynumber

Штраф за повторы, −2…2.

presence_penaltynumber

Штраф за присутствие, −2…2.

repetition_penaltynumber

Штраф за повторение токенов.

seedinteger

Фиксация для воспроизводимости.

logprobsboolean

Возвращать логарифмы вероятностей токенов.

top_logprobsinteger

Сколько наиболее вероятных токенов возвращать вместе с logprobs.

response_formatobject

{ "type": "json_object" } — гарантированный JSON.

structured_outputsboolean

Строгий вывод по JSON-схеме (json_schema в response_format).

toolsarray

Описание функций для tool-calling.

tool_choicestring | object

Управление выбором инструмента: «auto», «none» или конкретный.

Цены ₽ / 1M токенов

Ввод0,77 ₽

Вывод2,31 ₽

Чтение из кэша0,15 ₽