psychology
Класс модели
Компактный
8-13B · Edge / локально
★ REC
Оптимальный
26-35B · баланс
Продвинутый
70-100B · NLU, договоры
Максимальный
200B+ · reasoning
translate
+ KAZ-LLM 8B (казахский)
tune
Точность
⚡ FP4
×0.55
✨ FP8
×1.05
🎯 FP16
×2.0
group
Пользователи и нагрузка
10
Пилот
50
Департ.
100
Компания
500+
Enterprise
Профиль нагрузки
🔥 Пик
85%
🏢 Бизнес
50%
🌙 24/7
25%
description
Размер документов
📄 Короткие
до 10 стр
📑 Средние
до 40 стр
📚 Огромные
до 200 стр
archive
Вес архива
10 ГБ
100 ГБ
1 ТБ
10 ТБ
search
Сложность поиска
🔍 Простой
RAG, векторы
🕸️ Связи
RAG + графы
settings
Деплой и регион
Форма поставки
🏢 On-prem
☁️ Cloud
🔀 Hybrid
Режим (on-prem)
🚀 Пилот
🏭 Прод
🏦 Банк
Регион
🇰🇿 KZ
+12%
🌍 СНГ
🌐 Intl
Интеграции (доп. работы)
CRM
+$6K
СЭД
+$12K
АБС
+$18K
ERP
+$27K
verified
Динамический расчёт
Спецификация
description
Сделать описание + КП
developer_board
Спецификация оборудования
memory
CPU
—
—
data_array
RAM
—
—
hard_drive
Storage
—
—
developer_board
GPU
—
—
psychology
Подходящие модели для этой конфигурации
—
Выберите параметры для расчёта...
functions
Детали расчёта
Формулы ТЗ v2
VRAM под веса
—
VRAM под KV-cache
—
Активных сессий
—
Контекст / сессию
—
Итого VRAM нужно
—
weights + KV + AUX(6GB)
Итого VRAM есть
—
Утилизация GPU
—
vram_needed / vram_provided
payments
CAPEX клиента (±20%)
GPU
—
Платформа
—
HA / Логистика
—
Итого
—
cloud
Аренда GPU (помесячно)
Аренда / мес
—
12 месяцев
—
24 месяца
—
36 месяцев
—
Breakeven vs покупка
—
Рекомендуемые KZ-провайдеры
—
engineering
Работы NewCo + Managed
🚀 Пилот
4–6 нед
—
🏭 Deploy
3–5 мес
—
Интеграции:
🥉 Bronze
—
🥈 Silver
—
🥇 Gold
—
💡 Рекомендация:
—
Описание проекта + КП
close
content_copy
Скопировать
download
Скачать .md
Made on
Tilda