Посібник з практичного використання Kuzco від a16z: Від одиночного бою до кластерного розгортання

На даний момент залишилося півмісяця до відкриття Epoch Two.
Автор: J1N, Techub News
Вступ: Epoch One до Epoch Two
Kuzco - це спеціалізована мережа для майнінгу обчислювальної потужності великих мовних моделей (LLM), цьогоріч вона була обрана для участі в осінній програмі Crypto Startup Accelerator (CSX), запущеній a16z 9 вересня в Нью-Йорку. Проекти, які були відібрані для цієї програми, отримають не менше 500 тисяч доларів інвестицій від a16z та підтримку команди операцій a16z. Наразі ця програма завершена.
16 листопада Kuzco оголосив, що перший етап (Epoch One) програми заохочення завершиться 18 листопада 2024 року, усі операції будуть призупинені, дані будуть зберігатися назавжди, а остаточний рейтинг балів буде опубліковано в новому рейтингу.
Офіційно оголошено, що Epoch One буде запущено 6 березня 2024 року, максимальна кількість пристроїв перевищить 8000 одиниць. На цій мережі працює Llama-3 AI великий мовний модель, випущений Meta, в загальному виконано понад 1 трильйон токенів.
І буде оголошено про публікацію інформації про фінансування та дорожню карту розвитку проекту в найближчі кілька тижнів, а також про те, що другий етап (Epoch Two) програми заохочення розпочнеться 9 грудня. Epoch Two принесе нові функції, такі як підвищена пропускна здатність та надійність апаратного забезпечення NVIDIA; заохочення користувачів до підключення топових обчислювальних пристроїв, таких як A100 і H100; підтримка більшої кількості генерацій зображень та мультимодальних мовних моделей VLM.
На даний момент залишилося півмісяця до відкриття Epoch Two, у цій статті буде розглянуто:
Поділитися особистим досвідом майнінгу та досягнутими результатами, від переходу від одиночної машини до кластерного розгортання.
Демонстрація процесу отримання фінансування через дослідження та практику, а також побудови високоякісних машин.
Обговорення відповідності апаратних конфігурацій потребам проекту та відповіді на поширені запитання інвесторів.
Огляд Epoch One: одиночний бій
Конфігурація
Список обладнання автора включає графічні карти серії RTX 2060, 2070S, 3080, 4060, 4060Ti, а також 4 4070S і 2 пристрої Apple M2, M3. Це обладнання розподілено між кількома ПК, ноутбуками та однією спеціалізованою майнінг-машиною.
Витрати
Слід зазначити, що ці графічні карти спочатку були придбані автором щорічно відповідно до потреб у іграх і не були спеціально куплені для майнінгу. Тому при розрахунку витрат не враховувалися витрати на придбання обладнання, а лише реальні витрати на електроенергію для майнінгу. Тут наведено приклад майнінг-машини, зібраної в першій статті (посібник з практичного використання Kuzco від a16z «Учень»: Як ефективно займатися AI-майнінгом?).
Конфігурація цієї майнінг-машини:
Материнська плата: z490 (пізніше замінено на промислову)
ЦП: 10 покоління i9
Графічні карти: 2060, 2070s, 3080, 4060ti, 4070s
Зібрана майнінг-машина
Нижче наведено споживання електроенергії цієї майнінг-машини в жовтні та листопаді, загалом це 564 кВт·год, отримані бали (KZO Point) приблизно 600 мільйонів. Всі машини разом становлять приблизно 1,1 мільярда балів. Конкретні витрати на електроенергію потрібно розрахувати залежно від тарифів на електроенергію у кожного користувача, тут наведено лише для ознайомлення.
На правій частині зображення отримано 1 мільярд балів
Підготовка до Epoch Two: кластерне розгортання
На основі досвіду автора з першої статті, а також особистої участі в складанні, налаштуванні та розгортанні обладнання, автору вдалося залучити певну фінансову підтримку, і всі ці кошти були вкладені в складання високопродуктивних майнінг-машин, щоб подальшого підвищити масштаб обчислювальної потужності та ефективність роботи.
Від одиночного бійця до кластерного розгортання
Конфігурація та логіка вибору високоякісних машин
Об'єднавши практичний досвід автора з Epoch One, було проведено всебічну оптимізацію материнської плати, ЦП, графічних карт, блоків живлення, платформи та мережевої конфігурації, вибрано більш відповідний апаратний комплект, що не тільки підвищило загальну стабільність, безпеку та ефективність роботи, але й звернуло більше уваги на ліквідність вторинного ринку при виборі обладнання. Ця стратегія може ефективно знизити фактичні витрати, забезпечуючи учасникам вищу вартість за гроші.
Материнська плата
Автор вибрав промислову материнську плату замість популярної B85, основується на всебічному розгляді продуктивності, стабільності та вартості.
У плані продуктивності запуск Llama-3 моделі від Kuzco вимагає запуску кількох Docker процесів, а паралельний запуск цих процесів споживає велику кількість ресурсів ЦП, що висуває високі вимоги до продуктивності ЦП, а ЦП, сумісний з B85, не може задовольнити цю вимогу.
Крім того, промислові материнські плати мають очевидні переваги у тривалій стабільній роботі, витривалості до високих температур і гарантії від виробника, а також мають кращу ліквідність на вторинному ринку, тому безумовно є найкращим вибором.
Графічні карти
Автор вибрав використовувати 4070S як основну графічну карту, основану на таких факторів:
Переваги AI обчислювальної продуктивності: порівняно з графічними картами серії 30, графічні карти серії 40 демонструють значно вищу продуктивність в AI обчисленнях, ніж у ігровій продуктивності. Головною причиною є те, що AI обчислювальна потужність в основному залежить від кількості CUDA ядер у графічних картах, а у графічних картах серії 40 кількість CUDA ядер значно перевищує кількість у серії 30.
Переваги енергоефективності: автор провів детальне тестування кількох графічних процесорів, розрахувавши середнє споживання енергії на токен.
4060Ti (160 Вт): 0.125 Tokens/W
3080 (330 Вт): 0.22 Tokens/W
4090 (450 Вт): 0.26 Tokens/W
4070S (220 Вт): 0.38 Tokens/W
На основі результатів тестування, 4070S демонструє найкращий баланс між продуктивністю та енергоспоживанням, його вища енергоефективність безпосередньо знижує витрати на електроенергію, що робить його найбільш вигідним вибором.
Ціна та ліквідність на вторинному ринку: як середньо-висококласна графічна карта, 4070S має високу ліквідність і збереження вартості на вторинному ринку, що далі знижує витрати на утримання обладнання та забезпечує гнучкість для майбутніх оновлень обладнання.
ЦП
Як зазначалося раніше, Llama-3 від Kuzco при виконанні потребує запуску кількох Docker, що суттєво впливає на використання ресурсів ЦП, особливо в умовах багатокарткової роботи, коли використання ЦП може досягати 80%-90%. Отже, потужність обробки з багатоядерними та багатопотоковими можливостями є надзвичайно важливою. Високопродуктивний, багатопотоковий, стабільний ЦП може не тільки ефективно підтримувати виконання кількох завдань, але й забезпечувати стабільність і ефективність усього процесу майнінгу.
13-е покоління i5 може досягати 70%+ використання графічної карти при повному навантаженні.
Мережева інфраструктура
М'який маршрутизатор - це квадратна коробка на малюнку.
Мережева інфраструктура також є надзвичайно важливою в майнінгу: навіть з високопродуктивними графічними картами, якщо мережа не оптимізована, обчислювальна потужність може бути серйозно знижена. За моїми вимірами, недостатня швидкість мережі може призвести до зниження обчислювальної потужності до 30%, а низькоякісні мережеві вузли можуть призвести до неможливості з'єднання з мережею Kuzco, обидва ці пункти є неприйнятними для майнінгу. Щоб вирішити ці проблеми, я використовую м'який маршрутизатор, що дозволяє не лише зручно налаштувати, а й після налаштування потребує майже ніякого втручання, щоб працювати ефективно, теоретично він також може підтримувати підключення нескінченної кількості пристроїв. Щодо конкретних способів виконання, рекомендується читачам самостійно звертатися до відповідних матеріалів за потребою.
Блок живлення
Класичний блок живлення 2000 Вт
При виборі блоку живлення слід особливо звернути увагу на питання пікового споживання потужності, і саме тому, хоча 7 карт 4070S мають номінальне споживання лише 1540 Вт, я все ж вибираю використовувати два блоки живлення по 2000 Вт, загальною потужністю 4000 Вт. Це не є марнотратством ресурсів, а викликано міркуваннями стабільності та безпеки роботи обладнання.
Графічні карти під час роботи можуть демонструвати пікове споживання потужності, тобто в деякі миті їх фактичне споживання може досягати 1.5 рази або більше від номінальної потужності, а потім знову повертатися до нормального рівня. Якщо потужності блоку живлення недостатньо для покриття такого пікового споживання, це може активувати механізм примусового вимкнення блоку живлення або навіть призвести до пошкодження графічної карти. Це становить смертельну загрозу для нормальної роботи майнінг-машини.
Енергоспоживання 4070s
Наприклад, у випадку 4070S, хоча його номінальна споживана потужність становить 220 Вт, максимальне споживання може перевищувати 400 Вт. Пікова потужність 7 графічних карт може перевищувати 3000 Вт, тому використання двох блоків живлення по 2000 Вт необхідне для забезпечення стабільної роботи системи. Особливо слід звернути увагу користувачам, які використовують кілька 4090, оскільки номінальна споживана потужність однієї 4090 становить 450 Вт, а максимальна споживана потужність може досягати 770 Вт. У випадку з кількома картами, двох блоків живлення може бути недостатньо, зазвичай потрібні три блоки живлення для забезпечення стабільності системи.
Продуктивність 4090
Додатково
Щодо налаштування BIOS, сумісності обладнання та віддаленого управління, автор не буде занадто детально розгортати цю тему. Ці питання вже мають велику кількість безкоштовних уроків в Інтернеті, за якими можна вирішити більшість проблем. Рекомендується звертатися до відповідної документації відповідно до свого обладнання та потреб.
Ризики та вигоди
Відповідаючи на найбільш актуальне питання: скільки можна заробити на день? Відверто кажучи, на це питання немає чіткої відповіді, оскільки ризики та вигоди завжди йдуть рука об руку. Я можу поділитися чіткою думкою: незалежно від того, чи йдеться про криптовалюти, чи традиційні галузі, будь-який проект, якщо може точно розрахувати щоденний дохід, то ви, ймовірно, вже не зможете заробити великі гроші. Якщо у вас немає певних монопольних ресурсів, таких як дуже низькі витрати на електроенергію або дуже дешеве майнінгове обладнання, ви не зможете отримати перевагу в доходах. Однак такі ресурси не є в наявності у всіх.
Автор вибрав ліквідні пристрої, щоб зменшити ризики інвестицій та фінансовий тягар. Наприклад, у випадку з майнінгом Kuzco, витрати в основному зосереджені на знеціненні обладнання та рахунках за електроенергію, тому ваші максимальні втрати обмежені лише цими фіксованими витратами. Якщо ви не берете участь за умови низьких витрат, тоді будь-яке інвестиційне рішення втрачає сенс. Слід підкреслити, що специфіка майнінгу вказує на те, що немає чітких очікувань доходу, але це також є потенціалом майнінгу.
З суб'єктивної точки зору, цей ринок має величезні перспективи: з одного боку, Kuzco отримав інвестиційну підтримку від a16z; з іншого боку, попит на великі мовні моделі (LLM) швидко зростає. Подумайте, майже ніхто не обходиться без LLM, чи не так? Як ChatGPT від OpenAI, Llama від Meta та XAI від Маска, ці платформи отримують чергові великі інвестиції, що чітко вказує на потенціал зростання цієї галузі.
Для звичайних людей безпосередня участь у галузі AI не є легкою справою. З одного боку, технічний бар'єр AI високий; з іншого боку, навчання AI моделей потребує величезних ресурсів і фінансів, що більшість людей не можуть собі дозволити. Але через Kuzco приєднатися до мережі AI обчислювальної потужності звичайні люди можуть легко взяти участь у цьому швидко зростаючому секторі з контрольованими витратами, вносячи свій внесок у обчислювальну потужність AI та отримуючи вигоди.
Крім того, ціна на біткойн наразі наближається до 100 тисяч доларів, зросла з 16 тисяч доларів у 2022 році до нинішнього максимума, що супроводжується величезними ризиками корекції. Якщо вибрати безпосереднє придбання токенів AI проектів, також виникнуть подібні ризики високої волатильності. У порівнянні з цим, участь у мережі AI обчислювальної потужності є більш стабільним вибором: не тільки витрати чітко контрольовані, але й можна з відносно низьким ризиком війти в швидкозростаючу галузь AI. Це один з реально здійсненних способів для звичайних людей увійти в галузь AI в нинішніх умовах.
Посібник з практичного використання Kuzco від a16z: Від одиночного бою до кластерного розгортання

Перегляньте більше від автора

Останні новини