Параметры модели - ClickHouse Documentation

Параметры модели определяют, какую модель использует агент и как она генерирует ответы. На вкладке Конструктор агентов нажмите Выбрать модель в разделе Модель. Откроется окно Параметры модели.

Провайдер и модель

Провайдер — выберите провайдера LLM.
Модель — выберите конкретную модель этого провайдера. У разных моделей разные сильные стороны: крупные модели лучше подходят для задач, требующих сложного планирования, а более быстрые небольшие модели — для простых запросов.

И Провайдер, и Модель обязательны. Остальная часть панели настраивается в зависимости от возможностей выбранной модели.

Контекст и ограничения вывода

Максимум токенов контекста — ограничивает общий объём контекста, который агент отправляет модели. Оставьте System, чтобы использовать значение модели по умолчанию. Уменьшите значение, чтобы снизить стоимость; увеличьте — для агентов, которым нужно обрабатывать большие объёмы входных данных.
Максимум выходных токенов — ограничивает размер ответа агента. System использует значение модели по умолчанию. Установите меньшее значение, если ответы слишком длинные, и большее — если они обрываются.
Лимит токенов файла — ограничивает, сколько токенов один загруженный файл добавляет к контексту. Полезно, когда пользователи прикрепляют большие файлы и вы не хотите, чтобы они вытесняли остальную часть диалога.

Сэмплирование

Temperature — уровень случайности. Более высокие значения (0.7–1.0) = более случайный результат, тогда как более низкие (0.0–0.3) = более сфокусированный и детерминированный. Мы рекомендуем изменять либо этот параметр, либо Top P, но не оба сразу.
Top P — nucleus-сэмплирование. Меняет то, как модель выбирает токены на выходе.
Top K — ограничивает сэмплирование K наиболее вероятными токенами на каждом шаге. Поддерживается некоторыми провайдерами; управляет детерминированностью иначе, чем temperature.

Если вы не настраиваете модель под конкретное поведение, оставьте ползунки близко к значениям по умолчанию: небольшие изменения редко дают заметный эффект, а большие могут ухудшить качество вывода.

Параметры рассуждения

Доступно для моделей с поддержкой расширенного рассуждения. Точный набор параметров зависит от провайдера.

Thinking - этот параметр включает и отключает режим расширенного рассуждения модели. Когда он включен, модель генерирует внутренние thinking-токены перед финальным ответом; это обычно повышает точность на сложных задачах, но увеличивает задержку и расход токенов.
Thinking Budget - задает бюджет токенов для фазы Thinking. Когда модель израсходует это количество токенов, она прекращает Thinking и выдает ответ.
Effort - общий уровень интенсивности рассуждения (Auto, low, medium, high). Используется моделями рассуждения, которые не позволяют напрямую задать бюджет thinking-токенов.
Thought Visibility - этот параметр определяет, будет ли Thinking модели показан пользователю прямо в тексте, скрыт в свернутом виде или полностью убран.

Поведение диалога

Повторно отправлять файлы — если включено, файлы, прикреплённые в предыдущих сообщениях, будут повторно отправляться при каждом следующем ходе, чтобы модель не теряла их из виду. Отключите эту опцию, чтобы сэкономить токены, если диалог короткий или модель по ходу уже делает сводку файлов.
Использовать кэширование промптов — если провайдер поддерживает эту функцию, кэширует повторно используемые части промпта, чтобы снизить стоимость и задержки в диалогах, где инструкции и описания инструментов повторяются от хода к ходу.
Веб-поиск — включает нативный Веб-поиск провайдера в поддерживаемых моделях. Это отличается от инструмента веб-поиска, который работает как один из инструментов агента, а не как возможность провайдера.

Сброс

Сброс параметров модели внизу панели возвращает все поля к системным значениям по умолчанию. Используйте этот вариант, если вы уже достаточно поэкспериментировали и хотите начать с чистого листа.

​Провайдер и модель

​Контекст и ограничения вывода

​Сэмплирование

​Параметры рассуждения

​Поведение диалога

​Сброс