Що означає фільтр «для обчислення ШІ» в каталозі готових ПК

Каталоги готових ПК ще два роки тому ділилися на три рубрики: «для ігор», «для роботи», «для мультимедіа». У 2026-му поруч з ними з’явилася четверта — «для обчислення ШІ»

Що означає фільтр «для обчислення ШІ» в каталозі готових ПК

Каталоги готових ПК ще два роки тому ділилися на три рубрики: «для ігор», «для роботи», «для мультимедіа». У 2026-му поруч з ними з’явилася четверта — «для обчислення ШІ». Локальний AI вийшов з ентузіастського хобі у самостійну купівельну категорію з власною логікою конфігурації.

На сторінці, де представлено комп’ютери під різні задачі, у новій рубриці п’ять варіацій EVOLVE на Ryzen 9 9950X3D з RTX 5090 і одна ARM-машина з принципово іншою архітектурою. Розберімось, під який сценарій зібрана кожна позиція і як обрати збірку під конкретну модель.

Чому категорія взагалі з’явилася

За локальною збіркою стоїть проста економіка. Промпти не залишають машину, генерувати можна без тарифних лімітів, тоді як cloud-інференс 70-мільярдної моделі коштує активному користувачу 300–800 доларів на місяць. Тобто придбання топової RTX 5090 окупається за рік активної роботи — і саме цей сценарій ритейлер виносить в окрему рубрику.

Стеля VRAM і реальні розміри моделей

Розрахунок VRAM простий: число параметрів моделі × байт на параметр. FP16 — два байти, INT4 — пів байта. Q4 став стандартом локального запуску.

«Вага» популярних моделей при Q4:

  • Llama 3.1 8B — близько 5 ГБ;
  • Qwen 2.5 32B — близько 20 ГБ;
  • Llama 3.3 70B — від 35 до 38 ГБ.

RTX 5090 з 32 ГБ закриває діапазон 8B–32B. Llama 3.3 70B туди вже не вміщується, а при offload шарів у системну RAM швидкість падає з 45 токенів за секунду до 1–2 — нижче за швидкість читання людини.

Топ каталогу: EVOLVE і GIGABYTE AI Top Atom

Топова x86-позиція у фільтрі — EVOLVE Lightning Powered_by MSI. 9950X3D з 128 МБ L3 буферує активні шари при offload, 128 ГБ DDR5 дають простір для самого offload. RTX 5090 з GDDR7 виходить на 1 792 ГБ/с — інференс memory-bandwidth-bound, тому пропускна здатність переходить у tokens/sec майже лінійно.

GIGABYTE AI Top Atom працює за іншим принципом. ARM-чип ділить з Blackwell 128 ГБ уніфікованої пам’яті, тому модель до 200 мільярдів параметрів може бути в одному адресному просторі без PCIe-offload. Архітектура знімає питання, вміститься чи ні.

Серйозне AI/ML training з ECC RAM — це окремий клас workstation на Threadripper PRO 9000WX, який живе у власній категорії. Для локального inference у споживчому форматі рубрика влаштована раціонально: одна людина, короткі сесії, ECC не критична.

Як читати цей фільтр

Рубрика «для обчислення ШІ» закриває два сценарії. Для популярних моделей до 32 мільярдів параметрів — Llama 3.1, Qwen 2.5, Mistral — топові x86-збірки працюють без компромісів. Для 70B+ у тій же рубриці є GIGABYTE AI Top Atom з 128 ГБ уніфікованої пам’яті, що знімає offload як проблему. Питання при виборі — не «що найдорожче», а який розмір моделі планується запускати локально.

КОМЕНТАРІ
Багато символів. Скоротіть на
Залишилось символів 1000
Заповніть форму, або
Заповніть форму або