撰文Jeff Amico

çŒ–èŻ‘ïŒšæ·±æœź TechFlow

ćŒ•èš€

ćœšæ–°ć† ç–«æƒ…æœŸé—ŽïŒŒFolding@home ć–ćŸ—äș†äž€äžȘé‡ć€§é‡Œçš‹çą‘ă€‚èŻ„ç ”ç©¶éĄčç›źèŽ·ćŸ—äș† 2.4 exaFLOPS çš„èźĄçź—èƒœćŠ›ïŒŒç”±ć…šçƒ 200 äž‡ć°ćż—æ„żè€…èźŸć€‡æäŸ›ă€‚èż™ä»ŁèĄšäș†ćœ“æ—¶äž–ç•ŒäžŠæœ€ć€§è¶…çș§èźĄçź—æœș的捁äș”ć€ć€„ç†èƒœćŠ›ïŒŒäœżç§‘ć­Šćź¶èƒœć€Ÿć€§è§„æšĄæšĄæ‹Ÿ COVID è›‹ç™œèŽšćŠšæ€ă€‚ä»–ä»Źçš„ć·„äœœæŽšćŠšäș†æˆ‘仏ćŻčç—…æŻ’ćŠć…¶ç—…ç†æœșćˆ¶çš„ç†è§ŁïŒŒć°€ć…¶æ˜Żćœšç–«æƒ…ćˆæœŸă€‚

æ·±ćșŠç ”ç©¶ïŒšćŠ ćŻ†æż€ćŠ±äŒ—ç­č侀äžȘAIæšĄćž‹ïŒŒæ˜ŻćŠćŻèĄŒïŒŸ

Folding@home ç”šæˆ·çš„ć…šçƒćˆ†ćžƒïŒŒ2021

Folding@home ćŸșäșŽćż—æ„żèźĄçź—çš„æ‚ äč…掆ćČéĄčç›źé€šèż‡äŒ—ćŒ…èźĄçź—è”„æșæ„è§Łć†łć€§è§„æšĄé—źéą˜ă€‚èż™äžȘæƒłæł•ćœš 1990 ćčŽä»Łçš„ SETI@home äž­ćŸ—ćˆ°äș†ćčżæł›ć…łæłšïŒŒèŻ„éĄčç›źæ±‡é›†äș†è¶…èż‡ 500 äž‡ć°ćż—æ„żè€…èźĄçź—æœșä»„ćŻ»æ‰Ÿć€–æ˜Ÿç”Ÿć‘œă€‚æ­€ćŽïŒŒèż™äž€ç†ćż”ć·Čèą«ćș”甚äșŽć€šäžȘéą†ćŸŸïŒŒćŒ…æ‹Źć€©äœ“ç‰©ç†ć­Šă€ćˆ†ć­ç”Ÿç‰©ć­Šă€æ•°ć­Šă€ćŻ†ç ć­Šć’Œæžžæˆă€‚ćœšæŻç§æƒ…ć†”äž‹ïŒŒé›†äœ“ćŠ›é‡ćąžćŒșäș†ć•äžȘéĄčç›źçš„èƒœćŠ›ïŒŒèżœèżœè¶…ć‡șäș†ä»–ä»Źć•ç‹Źèƒœć€ŸćźžçŽ°çš„èŒƒć›Žă€‚èż™æŽšćŠšäș†èż›æ­„ïŒŒäœżç ”ç©¶èƒœć€Ÿä»„æ›ŽćŒ€æ”Ÿć’Œćˆäœœçš„æ–čćŒèż›èĄŒă€‚

èźžć€šäșșæƒłçŸ„é“æˆ‘ä»Źæ˜ŻćŠćŻä»„ć°†èż™äž€äŒ—ćŒ…æšĄćž‹ćș”甚äșŽæ·±ćșŠć­Šäč ă€‚æąć„èŻèŻŽïŒŒæˆ‘ä»ŹèƒœćŠćœšć€§äŒ—äž­èź­ç»ƒäž€äžȘć€§ćž‹ç„žç»çœ‘ç»œïŒŸć‰æČżæšĄćž‹èź­ç»ƒæ˜Żäșș类掆ćČäžŠèźĄçź—æœ€ćŻ†é›†çš„ä»»ćŠĄäč‹äž€ă€‚äžŽèźžć€š @home éĄčç›źäž€æ ·ïŒŒç›źć‰çš„æˆæœŹè¶…ć‡șäș†ćȘæœ‰æœ€ć€§ć‚äžŽè€…æ‰èƒœæ‰żæ‹…çš„èŒƒć›Žă€‚èż™ćŻèƒœäŒšé˜»çąæœȘæ„çš„èż›ć±•ïŒŒć› äžșæˆ‘ä»ŹäŸè”–äșŽè¶Šæ„è¶Šć°‘çš„ć…Źćžæ„ćŻ»æ‰Ÿæ–°çš„çȘç Žă€‚èż™äčŸć°†æˆ‘仏的 AI çł»ç»Ÿçš„æŽ§ćˆ¶æƒé›†äž­ćœšć°‘æ•°äșșæ‰‹äž­ă€‚æ— èźș䜠ćŻčèż™éĄčæŠ€æœŻçš„çœ‹æł•ćŠ‚äœ•ïŒŒèż™éƒœæ˜Żäž€äžȘć€ŒćŸ—ć…łæłšçš„æœȘæ„ă€‚

ć€§ć€šæ•°æ‰čèŻ„è€…é©łæ–„äș†ćŽ»äž­ćżƒćŒ–èź­ç»ƒçš„æƒłæł•ïŒŒèź€äžșäžŽćœ“ć‰çš„èź­ç»ƒæŠ€æœŻäžć…Œćźčă€‚ç„¶è€ŒïŒŒèż™ç§è§‚ç‚čć·Čç»è¶Šæ„è¶Šèż‡æ—¶ă€‚æ–°çš„æŠ€æœŻć·Č经ć‡șçŽ°ïŒŒèƒœć€Ÿć‡ć°‘èŠ‚ç‚čé—Žçš„é€šäżĄéœ€æ±‚ïŒŒä»Žè€Œć…èźžćœšçœ‘ç»œèżžæŽ„äžäœłçš„èźŸć€‡äžŠé«˜æ•ˆèź­ç»ƒă€‚èż™äș›æŠ€æœŻćŒ…æ‹Ź DiLoCo 、 SWARM Parallelism 、 lo-fi ć’ŒćŒ‚æž„çŽŻćąƒäž­ćŸșçĄ€æšĄćž‹çš„ćˆ†æ•Łèź­ç»ƒç­‰ć€šäžȘæŠ€æœŻă€‚ć…¶äž­èźžć€šć…·æœ‰ćźč错性ćč¶æ”ŻæŒćŒ‚æž„èźĄçź—ă€‚èż˜æœ‰äž€äș›æ–°æž¶æž„äž“äžșćŽ»äž­ćżƒćŒ–çœ‘ç»œèźŸèźĄïŒŒćŒ…æ‹Ź DiPaCo ć’ŒćŽ»äž­ćżƒćŒ–æ··ćˆäž“ćź¶æšĄćž‹ă€‚

æˆ‘ä»Źèż˜çœ‹ćˆ°ć„ç§ćŠ ćŻ†ćŽŸèŻ­ćŒ€ć§‹æˆç†ŸïŒŒäœżćŸ—çœ‘ç»œèƒœć€Ÿćœšć…šçƒèŒƒć›Žć†…ćè°ƒè”„æșă€‚èż™äș›æŠ€æœŻæ”ŻæŒæ•°ć­—èŽ§ćžă€è·šćąƒæ”Żä»˜ć’Œéą„æ”‹ćž‚ćœș等ćș”甚ćœșæ™Żă€‚äžŽæ—©æœŸçš„ćż—æ„żéĄčç›źäžćŒïŒŒèż™äș›çœ‘ç»œèƒœć€Ÿæ±‡èšæƒŠäșșçš„èźĄçź—èƒœćŠ›ïŒŒé€šćžžæŻ”ç›źć‰èźŸæƒłçš„æœ€ć€§äș‘èź­ç»ƒé›†çŸ€ć€§ć‡ äžȘ数量çș§ă€‚

èż™äș›èŠçŽ ć…±ćŒæž„成äș†æ–°çš„æšĄćž‹èź­ç»ƒèŒƒćŒă€‚èż™ç§èŒƒćŒć……ćˆ†ćˆ©ç”šć…šçƒçš„èźĄçź—è”„æșïŒŒćŒ…æ‹ŹćŠ‚æžœèżžæŽ„ćœšäž€è”·ćŻä»„äœżç”šçš„ć€§é‡èŸčçŒ˜èźŸć€‡ă€‚èż™ć°†é€šèż‡ćŒ•ć…„æ–°çš„ç«žäș‰æœșćˆ¶æ„é™äœŽć€§ć€šæ•°èź­ç»ƒć·„äœœèŽŸèœœçš„æˆæœŹă€‚ćźƒèż˜ćŻä»„è§Łé”æ–°çš„èź­ç»ƒćœąćŒïŒŒäœżćŸ—æšĄćž‹ćŒ€ć‘ć˜ćŸ—ćäœœć’ŒæšĄć—ćŒ–ïŒŒè€Œäžæ˜Żć­€ç«‹ć’Œć•äž€çš„æ–čćŒă€‚æšĄćž‹ćŻä»„ä»Žć€§äŒ—äž­èŽ·ć–èźĄçź—ć’Œæ•°æźïŒŒćźžæ—¶ć­Šäč ă€‚äžȘäșșćŻä»„æ‹„æœ‰ä»–ä»Źæ‰€ćˆ›ć»șæšĄćž‹çš„äž€éƒšćˆ†ă€‚ç ”ç©¶äșș摘äčŸćŻä»„é‡æ–°ć…ŹćŒ€ćˆ†äș«æ–°éą–çš„ç ”ç©¶æˆæžœïŒŒæ— éœ€é€šèż‡èŽ§ćžćŒ–ä»–ä»Źçš„ć‘çŽ°æ„ćŒ„èĄ„é«˜æ˜‚çš„èźĄçź—éą„çź—ă€‚

æœŹæŠ„ć‘Šè€ƒćŻŸäș†ć€§ćž‹æšĄćž‹èź­ç»ƒçš„çŽ°çŠ¶ćŠç›žć…łæˆæœŹă€‚ćźƒć›žéĄŸäș†ä»„ćŸ€çš„ćˆ†ćžƒćŒèźĄçź—ćŠȘ抛——从 SETI 戰 Folding 憍戰 BOINC——仄歀äžșç”æ„ŸæŽąçŽąæ›żä»Łè·ŻćŸ„ă€‚æŠ„ć‘Šèźšèźșäș†ćŽ»äž­ćżƒćŒ–èź­ç»ƒçš„ćŽ†ćČ挑战ćč¶èœŹć‘ćŻèƒœæœ‰ćŠ©äșŽć…‹æœèż™äș›æŒ‘战的最新çȘç Žă€‚æœ€ćŽïŒŒćźƒæ€»ç»“äș†æœȘ杄的æœșé‡äžŽæŒ‘æˆ˜ă€‚

才æČżæšĄćž‹èź­ç»ƒçš„çŽ°çŠ¶

才æČżæšĄćž‹èź­ç»ƒçš„æˆæœŹćŻčéžć€§ćž‹ć‚äžŽè€…è€Œèš€ć·Čç»äžćŻæ‰żć—ă€‚èż™äžȘè¶‹ćŠżćč¶äžæ–°éČœïŒŒäœ†æ čæźćźžé™…æƒ…ć†”ïŒŒæƒ…ć†”æ­Łćœšć˜ćŸ—æ›ŽćŠ äž„é‡ïŒŒć› äžș才æȿ漞éȘŒćź€äžæ–­æŒ‘æˆ˜æ‰©ć±•ć‡èźŸă€‚æźæŠ„道OpenAI 今ćčŽćœšèź­ç»ƒæ–čéąèŠ±èŽčè¶…èż‡ 30 äșżçŸŽć…ƒă€‚Anthropic éą„æ”‹ćˆ° 2025 ćčŽïŒŒæˆ‘ä»Źć°†ćŒ€ć§‹èż›èĄŒ 100 äșżçŸŽć…ƒçš„èź­ç»ƒïŒŒè€Œ 1000 äșżçŸŽć…ƒçš„æšĄćž‹äčŸäžäŒšć€Șèżœă€‚

æ·±ćșŠç ”ç©¶ïŒšćŠ ćŻ†æż€ćŠ±äŒ—ç­č侀äžȘAIæšĄćž‹ïŒŒæ˜ŻćŠćŻèĄŒïŒŸ

èż™äž€è¶‹ćŠżćŻŒè‡ŽèĄŒäžšçš„é›†äž­ćŒ–ïŒŒć› äžșćȘæœ‰ć°‘æ•°ć‡ ćź¶ć…Źćžèƒœć€Ÿæ‰żæ‹…ć‚äžŽçš„èŽčç”šă€‚èż™ćŒ•ć‘äș†æœȘæ„çš„æ žćżƒæ”żç­–é—źéą˜â€”â€”æˆ‘ä»Źæ˜ŻćŠèƒœæŽ„ć—æ‰€æœ‰éą†ć…ˆçš„ AI çł»ç»Ÿç”±äž€äž€ćź¶ć…ŹćžæŽ§ćˆ¶çš„ć±€éąïŒŸèż™äčŸé™ćˆ¶äș†èż›ć±•é€ŸćșŠïŒŒèż™äž€ç‚čćœšç ”ç©¶ç€ŸćŒșäž­æ˜Ÿè€Œæ˜“è§ïŒŒć› äžșèŸƒć°çš„ćźžéȘŒćź€æ— æł•æ‰żæ‹…æ‰©ć±•ćźžéȘŒæ‰€éœ€çš„èźĄçź—è”„æșă€‚èĄŒäžšéą†ćŻŒè€…ä»ŹäčŸć€šæŹĄæćˆ°èż™äž€ç‚č

Meta 的 Joe SpisakïŒšèŠçœŸæ­Łç†è§Ł [æšĄćž‹] æž¶æž„çš„èƒœćŠ›ïŒŒäœ ćż…éĄ»ćœšè§„æšĄäžŠèż›èĄŒæŽąçŽąïŒŒæˆ‘èź€äžșèż™æ­Łæ˜Żćœ“ć‰ç”Ÿæ€çł»ç»Ÿäž­æ‰€çŒșć€±çš„ă€‚ćŠ‚æžœäœ çœ‹çœ‹ć­ŠæœŻç•Œâ€”â€”ć­ŠæœŻç•Œæœ‰ćŸˆć€šæ°ć‡ș的äșșæ‰ïŒŒäœ†ä»–ä»ŹçŒșäčèźĄçź—蔄æșçš„èźżé—źïŒŒèż™ć°±æˆäș†äž€äžȘé—źéą˜ïŒŒć› äžșä»–ä»Źæœ‰èż™äș›äŒŸć€§çš„æƒłæł•ïŒŒćŽæČĄæœ‰çœŸæ­Łä»„æ‰€éœ€æ°ŽćčłćźžçŽ°èż™äș›æƒłæł•çš„é€”ćŸ„ă€‚

Together 的 Max RyabininćŻčæ˜‚èŽ”çĄŹä»¶çš„éœ€æ±‚ç»™ç ”ç©¶ç€ŸćŒșćžŠæ„äș†ćŸˆć€§ćŽ‹ćŠ›ă€‚ć€§ć€šæ•°ç ”ç©¶äșșć‘˜æ— æł•ć‚äžŽć€§ćž‹ç„žç»çœ‘ç»œćŒ€ć‘ïŒŒć› äžșèż›èĄŒćż…èŠçš„ćźžéȘŒćŻčä»–ä»Źè€Œèš€æˆæœŹèż‡é«˜ă€‚ćŠ‚æžœæˆ‘ä»Źç»§ç»­é€šèż‡æ‰©ć€§æšĄćž‹è§„æšĄæ„ćąžćŠ ć…¶ć€§ć°ïŒŒæœ€ç»ˆèƒœć€Ÿèż›èĄŒç«ž

Google 的 Francois CholletïŒšæˆ‘ä»ŹçŸ„é“ć€§èŻ­èš€æšĄćž‹ (LLMs) 氚æœȘ漞现通甹äșșć·„æ™ș胜 (AGI)ă€‚äžŽæ­€ćŒæ—¶ïŒŒæœ AGI ć‘ć±•çš„èż›ć±•ć·Čç»ćœæ»žă€‚æˆ‘ä»Źćœšć€§èŻ­èš€æšĄćž‹äžŠæ‰€éąäžŽçš„ć±€é™æ€§äžŽäș”ćčŽć‰éąäžŽçš„ć±€é™æ€§ćźŒć…šç›žćŒă€‚æˆ‘ä»Źéœ€èŠæ–°çš„æƒłæł•ć’ŒçȘç Žă€‚æˆ‘èź€äžș例侀äžȘçȘç ŽćŸˆćŻèƒœæ„è‡Șć€–éƒšć›ąé˜ŸïŒŒè€Œæ‰€æœ‰ć€§ćž‹ćźžéȘŒćź€ćˆ™ćż™äșŽèź­ç»ƒæ›Žć€§çš„ć€§èŻ­èš€æšĄćž‹ă€‚ 侀äș›äșșćŻčèż™äș›æ‹…ćż§æŒæ€€ç–‘æ€ćșŠïŒŒèź€äžș祏件æ”čèż›ć’Œäș‘èźĄçź—è”„æœŹæ”Żć‡șć°†è§Łć†łèż™äžȘé—źéą˜ă€‚äœ†èż™äŒŒäčŽäžć€Ș现漞。侀æ–čéąïŒŒćˆ°æœŹććčŽæœ«ïŒŒæ–°äž€ä»Ł Nvidia èŠŻç‰‡çš„ FLOP æ•°é‡ć°†ć€§ćč…ćąžćŠ ïŒŒćŻèƒœèŸŸćˆ°ä»Šć€© H100 的 10 ć€ă€‚èż™ć°†äœżæŻ FLOP 的价栌䞋降 80-90%ă€‚ćŒæ ·ïŒŒéą„èźĄćˆ°æœŹććčŽæœ«ïŒŒæ€» FLOP 䟛ćș”氆湞抠çșŠ 20 ć€ïŒŒćŒæ—¶æ”čć–„çœ‘ç»œć’Œç›žć…łćŸșçĄ€èźŸæ–œă€‚æ‰€æœ‰èż™äș›éƒœć°†æé«˜æŻçŸŽć…ƒçš„èź­ç»ƒæ•ˆçŽ‡ă€‚

æ·±ćșŠç ”ç©¶ïŒšćŠ ćŻ†æż€ćŠ±äŒ—ç­č侀äžȘAIæšĄćž‹ïŒŒæ˜ŻćŠćŻèĄŒïŒŸ

杄æșïŒšSemiAnalysis AI Cloud TCO æšĄćž‹

äžŽæ­€ćŒæ—¶ïŒŒæ€» FLOP 需求äčŸć°†ć€§ćč…äžŠć‡ïŒŒć› äžș漞éȘŒćź€ćžŒæœ›èż›äž€æ­„æ‰©ć€§è§„æšĄă€‚ćŠ‚æžœæŒç»­ććčŽçš„èź­ç»ƒèźĄçź—è¶‹ćŠżäżæŒäžć˜ïŒŒćˆ° 2030 ćčŽć‰æČżèź­ç»ƒçš„ FLOPs éą„èźĄć°†èŸŸćˆ°çșŠ 2e29ă€‚èż›èĄŒèż™ç§è§„æšĄçš„èź­ç»ƒć€§çșŠéœ€èŠ 2000 侇äžȘ H100 等效 GPUïŒŒäŸæźćœ“ć‰çš„èź­ç»ƒèżèĄŒæ—¶é—Žć’Œćˆ©ç”šçŽ‡ă€‚ć‡èźŸèż™äž€éą†ćŸŸä»æœ‰ć€šäžȘ才æȿ漞éȘŒćź€ïŒŒæ€»æ‰€éœ€çš„ FLOPS æ•°é‡ć°†äŒšæ˜Żèż™äžȘæ•°ć­—çš„ć‡ ć€ïŒŒć› äžș敎䜓䟛ćș”ć°†ćœšćźƒä»Źäč‹é—Žćˆ†é…ă€‚EpochAI éą„æ”‹ćˆ°é‚Łæ—¶æˆ‘ä»Źéœ€èŠć€§çșŠ 1 äșżäžȘ H100 等效 GPUçșŠäžș 2024 ćčŽć‡ș莧量的 50 怍。SemiAnalysis äčŸćšć‡șäș†ç±»äŒŒçš„éą„æ”‹ïŒŒèź€äžș才æČżèź­ç»ƒéœ€æ±‚ć’Œ GPU 䟛ćș”ćœšæ­€æœŸé—Žć€§è‡ŽćŒæ­„汞长。

äș§èƒœçŠ¶ć†”ćŻèƒœäŒšć› ć€šç§ćŽŸć› ć˜ćŸ—æ›ŽćŠ çŽ§ćŒ ă€‚äŸ‹ćŠ‚ïŒŒćŠ‚æžœćˆ¶é€ ç“¶éąˆć»¶èżŸäș†éą„èźĄçš„ć‡șèŽ§ć‘šæœŸïŒŒèż™ç§æƒ…ć†”æ˜Żćžžæœ‰çš„äș‹ă€‚æˆ–è€…ćŠ‚æžœæˆ‘ä»ŹæœȘ胜生äș§è¶łć€Ÿçš„胜æșæ„äžșæ•°æźäž­ćżƒäŸ›ç””ă€‚ćˆæˆ–è€…ćŠ‚æžœæˆ‘ä»Źćœšć°†èż™äș›èƒœæșæ„æșèżžæŽ„ćˆ°ç””çœ‘æ–čéąé‡ćˆ°ć›°éšŸă€‚æˆ–è€…ćŠ‚æžœćŻčè”„æœŹæ”Żć‡șçš„æ—„ç›ŠćźĄæŸ„æœ€ç»ˆćŻŒè‡ŽèĄŒäžšçŒ©ć‡è§„æšĄïŒŒç­‰ç­‰ć› çŽ ă€‚ćœšæœ€ć„œçš„æƒ…ć†”äž‹ïŒŒæˆ‘ä»Źćœ“ć‰çš„æ–čæł•ćȘèƒœèź©ć°‘æ•°ć…Źćžç»§ç»­æŽšćŠšç ”ç©¶çš„èż›ć±•ïŒŒè€Œèż™ćŻèƒœèż˜äžć€Ÿă€‚

æ·±ćșŠç ”ç©¶ïŒšćŠ ćŻ†æż€ćŠ±äŒ—ç­č侀äžȘAIæšĄćž‹ïŒŒæ˜ŻćŠćŻèĄŒïŒŸ

æ˜Ÿç„¶ïŒŒæˆ‘ä»Źéœ€èŠäž€ç§æ–°çš„æ–čæł•ă€‚èż™ç§æ–čæł•äžéœ€èŠäžæ–­æ‰©ć±•æ•°æźäž­ćżƒă€è”„æœŹæ”Żć‡șć’Œèƒœæșæ¶ˆè€—æ„ćŻ»æ‰Ÿäž‹äž€äžȘçȘç ŽïŒŒè€Œæ˜Żé«˜æ•ˆćˆ©ç”šæˆ‘ä»ŹçŽ°æœ‰çš„ćŸșçĄ€èźŸæ–œïŒŒèƒœć€Ÿéšç€éœ€æ±‚çš„æłąćŠšç”æŽ»æ‰©ć±•ă€‚èż™ć°†èź©ç ”ç©¶äž­æœ‰æ›Žć€šćźžéȘŒçš„ćŻèƒœïŒŒć› äžșèź­ç»ƒèżèĄŒäžć†éœ€èŠçĄźäżäșżäž‡çŸŽć…ƒèźĄçź—éą„çź—çš„æŠ•è”„ć›žæŠ„ă€‚äž€æ—Šæ‘†è„±èż™äž€é™ćˆ¶ïŒŒæˆ‘ä»ŹćŻä»„è¶…è¶Šćœ“ć‰çš„ć€§èŻ­èš€æšĄćž‹ (LLM) æšĄćŒïŒŒæ­ŁćŠ‚èźžć€šäșșæ‰€èź€äžșçš„ïŒŒćźžçŽ°é€šç”šäșșć·„æ™ș胜 (AGI) æ˜Żćż…èŠçš„ă€‚äžșäș†ç†è§Łèż™ç§æ›żä»Łæ–čæĄˆćŻèƒœć‘ˆçŽ°çš„æ ·ć­ïŒŒæˆ‘ä»ŹćŻä»„ä»Žèż‡ćŽ»çš„ćˆ†ćžƒćŒèźĄçź—ćźžè·”äž­æ±Čć–ç”æ„Ÿă€‚

çŸ€äœ“èźĄçź—ïŒšçź€ćČ

SETI@home 朹 1999 ćčŽæ™źćŠäș†èż™äž€æŠ‚ćż”ïŒŒć…èźžæ•°ç™Ÿäž‡ć‚äžŽè€…ćˆ†æžæ— çșżç””äżĄć·ïŒŒćŻ»æ‰Ÿć€–æ˜Ÿæ™șæ…§ă€‚SETI 从 Arecibo æœ›èżœé•œæ”¶é›†ç””çŁæ•°æźïŒŒć°†ć…¶ćˆ†æˆè‹„ćčČæ‰čæŹĄïŒŒćč¶é€šèż‡äș’è”çœ‘ć‘é€ç»™ç”šæˆ·ă€‚ç”šæˆ·ćœšæ—„ćžžæŽ»ćŠšäž­ćˆ†æžæ•°æźïŒŒćč¶ć°†ç»“æžœć‘é€ć›žă€‚ç”šæˆ·äč‹é—Žæ— éœ€æČŸé€šïŒŒæ‰čæŹĄćŻä»„ç‹Źç«‹ćźĄæ žïŒŒä»Žè€ŒćźžçŽ°é«˜ćșŠçš„ćč¶èĄŒć€„ç†ă€‚ćœšć…¶ć·…ćł°æ—¶ćˆ»ïŒŒSETI@home æ‹„æœ‰è¶…èż‡ 500 äž‡ćć‚äžŽè€…ïŒŒć€„ç†èƒœćŠ›è¶…èż‡ćœ“æ—¶æœ€ć€§çš„è¶…çș§èźĄçź—æœșă€‚ćźƒæœ€ç»ˆäșŽ 2020 ćčŽ 3 æœˆć…łé—­ïŒŒäœ†ćźƒçš„æˆćŠŸæż€ćŠ±äș†éšćŽçš„ćż—æ„żèźĄçź—èżćŠšă€‚

Folding@home 朹 2000 ćčŽć»¶ç»­äș†èż™äž€ç†ćż”ïŒŒćˆ©ç”šèŸčçŒ˜èźĄçź—æšĄæ‹Ÿé˜żć°”èŒšæ”·é»˜ç—…ă€ç™Œç—‡ć’Œćž•é‡‘æŁźç—…ç­‰ç–Ÿç—…äž­çš„è›‹ç™œèŽšæŠ˜ć ă€‚ćż—æ„żè€…ćœšäžȘäșș甔脑的ç©șé—Čæ—¶é—Žèż›èĄŒè›‹ç™œèŽšæšĄæ‹ŸïŒŒćžźćŠ©ç ”ç©¶äșșć‘˜ç ”ç©¶è›‹ç™œèŽšćŠ‚äœ•é”™èŻŻæŠ˜ć ćč¶ćŻŒè‡Žç–Ÿç—…ă€‚ćœšć…¶ćŽ†ćČçš„äžćŒæ—¶é—Žæź”ïŒŒć…¶èźĄçź—èƒœćŠ›è¶…èż‡äș†ćœ“æ—¶æœ€ć€§çš„è¶…çș§èźĄçź—æœșïŒŒćŒ…æ‹Źćœš 2000 ćčŽä»ŁćŽæœŸć’Œ COVID æœŸé—ŽïŒŒćœ“æ—¶ćźƒæˆäžș第侀äžȘè¶…èż‡äž€ exaFLOPS çš„ćˆ†ćžƒćŒèźĄçź—éĄč盼。è‡Ș成立仄杄Folding 的研究äșș摘ć·Čć‘èĄšè¶…èż‡ 200 çŻ‡ćŒèĄŒèŻ„ćźĄèźșæ–‡ïŒŒæŻäž€çŻ‡éƒœäŸè”–äșŽćż—æ„żè€…çš„èźĄçź—èƒœćŠ›ă€‚

äŒŻć…‹ćˆ©ćŒ€æ”Ÿçœ‘ç»œèźĄçź—ćŸșçĄ€èźŸæ–œ (BOINC) 朹 2002 ćčŽæ™źćŠäș†èż™äž€ç†ćż”提䟛äș†äž€äžȘäŒ—ćŒ…èźĄçź—ćčłć°ïŒŒç”šäșŽć„种研究éĄčç›źă€‚ćźƒæ”ŻæŒ SETI@home 撌 Folding@home 等怚äžȘéĄčç›źïŒŒä»„ćŠćœšć€©äœ“ç‰©ç†ć­Šă€ćˆ†ć­ç”Ÿç‰©ć­Šă€æ•°ć­Šć’ŒćŻ†ç ć­Šç­‰éą†ćŸŸçš„æ–°éĄč盼。戰 2024 ćčŽïŒŒBOINC 戗ć‡șäș† 30 äžȘæ­Łćœšèż›èĄŒçš„éĄčç›źïŒŒä»„ćŠèż‘ 1,000 çŻ‡ć‘èĄšçš„ç§‘ć­Šèźșæ–‡ïŒŒć‡ćˆ©ç”šć…¶èźĄçź—çœ‘ç»œäș§ç”Ÿă€‚

朹科研鱆柟äč‹ć€–ïŒŒćż—æ„żèźĄçź—èą«ç”šäșŽèź­ç»ƒć›ŽæŁ‹ïŒˆLeelaZero、KataGoïŒ‰ć’Œć›œé™…è±ĄæŁ‹ïŒˆStockfish、LeelaChessZeroïŒ‰ç­‰æžžæˆćŒ•æ“Žă€‚LeelaZero é€šèż‡ćż—æ„żèźĄçź—ä»Ž 2017 ćčŽćˆ° 2021 ćčŽèż›èĄŒèź­ç»ƒïŒŒäœżć…¶èƒœć€ŸäžŽè‡Șć·±äž‹æŁ‹è¶…èż‡äž€ćƒäž‡ć±€ïŒŒćˆ›é€ äș†ä»Šć€©æœ€ćŒșçš„ć›ŽæŁ‹ćŒ•æ“Žäč‹äž€ă€‚ç±»äŒŒćœ°ïŒŒStockfish è‡Ș 2013 ćčŽä»„æ„äž€ç›Žćœšćż—æ„żçœ‘ç»œäžŠæŒç»­èź­ç»ƒïŒŒäœżć…¶æˆäžșæœ€ć—æŹąèżŽć’Œæœ€ćŒșć€§çš„ć›œé™…è±ĄæŁ‹ćŒ•æ“Žäč‹äž€ă€‚

慳äșŽæ·±ćșŠć­Šäč çš„挑战

äœ†æ˜Żæˆ‘ä»ŹèƒœćŠć°†èż™äž€æšĄćž‹ćș”甚äșŽæ·±ćșŠć­Šäč ïŒŸæˆ‘ä»Źæ˜ŻćŠćŻä»„氆侖界搄朰的èŸčçŒ˜èźŸć€‡è”çœ‘ïŒŒćˆ›ć»ș侀äžȘäœŽæˆæœŹçš„ć…Źć…±èź­ç»ƒé›†çŸ€ïŒŸæ¶ˆèŽčè€…çĄŹä»¶â€”â€”ä»Žè‹čæžœçŹ”èź°æœŹćˆ° Nvidia æžžæˆæ˜ŸćĄâ€”â€”ćœšæ·±ćșŠć­Šäč æ–čéąçš„æ€§èƒœè¶Šæ„è¶Šć‡șè‰Čă€‚ćœšèźžć€šæƒ…ć†”äž‹ïŒŒèż™äș›èźŸć€‡çš„æ€§èƒœç”šè‡łè¶…èż‡äș†æ•°æźäž­ćżƒæ˜ŸćĄçš„æŻçŸŽć…ƒæ€§èƒœă€‚

æ·±ćșŠç ”ç©¶ïŒšćŠ ćŻ†æż€ćŠ±äŒ—ç­č侀äžȘAIæšĄćž‹ïŒŒæ˜ŻćŠćŻèĄŒïŒŸ

ç„¶è€ŒïŒŒèŠæœ‰æ•ˆćˆ©ç”šèż™äș›è”„æșćœšćˆ†ćžƒćŒçŽŻćąƒäž­ïŒŒæˆ‘ä»Źéœ€èŠć…‹æœć„ç§æŒ‘æˆ˜ă€‚

éŠ–ć…ˆïŒŒćœ“ć‰çš„ćˆ†ćžƒćŒèź­ç»ƒæŠ€æœŻć‡èźŸèŠ‚ç‚čäč‹é—Žć­˜ćœšéą‘çčçš„通俥。

ćœ“ć‰æœ€ć…ˆèż›çš„æšĄćž‹ć·Čç»ć˜ćŸ—ćŠ‚æ­€ćșžć€§ïŒŒä»„è‡łäșŽèź­ç»ƒćż…éĄ»èą«æ‹†ćˆ†ćˆ°æ•°ćƒäžȘ GPU äč‹é—Žă€‚èż™æ˜Żé€šèż‡ć€šç§ćč¶èĄŒćŒ–æŠ€æœŻæ„ćźžçŽ°çš„ïŒŒé€šćžžæ˜ŻćœšćŻç”šçš„ GPU äč‹é—Žæ‹†ćˆ†æšĄćž‹ă€æ•°æźé›†æˆ–ćŒæ—¶æ‹†ćˆ†äž€è€…ă€‚èż™é€šćžžéœ€èŠé«˜ćžŠćźœć’ŒäœŽć»¶èżŸçš„çœ‘ç»œïŒŒćŠćˆ™èŠ‚ç‚č氆é—ČçœźïŒŒç­‰ćŸ…æ•°æźćˆ°æ„ă€‚

äŸ‹ćŠ‚ïŒŒćˆ†ćžƒćŒæ•°æźćč¶èĄŒæŠ€æœŻ (DDP) ć°†æ•°æźé›†ćˆ†é…ćˆ°ć„äžȘ GPU äžŠïŒŒæŻäžȘ GPU ćœšć…¶ç‰čćźšçš„æ•°æźç‰‡æź”äžŠèź­ç»ƒćźŒæ•Žçš„æšĄćž‹ïŒŒç„¶ćŽć…±äș«ć…¶æąŻćșŠæ›Žæ–°ïŒŒä»„ç”Ÿæˆć„äžȘæ­„éȘ€çš„æ–°æšĄćž‹æƒé‡ă€‚èż™éœ€èŠç›žćŻčæœ‰é™çš„é€šäżĄćŒ€é”€ïŒŒć› äžș节ç‚čä»…ćœšæŻæŹĄćć‘äŒ æ’­ćŽć…±äș«æąŻćșŠæ›Žæ–°ïŒŒćč¶äž”é›†äœ“é€šäżĄæ“äœœćŻä»„éƒšćˆ†äžŽèźĄçź—é‡ć ă€‚ç„¶è€ŒïŒŒèż™ç§æ–čæł•ä»…é€‚ç”šäșŽèŸƒć°çš„æšĄćž‹ïŒŒć› äžșćźƒèŠæ±‚æŻäžȘ GPU ćœšć†…ć­˜äž­ć­˜ć‚šæ•ŽäžȘæšĄćž‹çš„æƒé‡ă€æż€æŽ»ć€Œć’ŒäŒ˜ćŒ–ć™šçŠ¶æ€ă€‚äŸ‹ćŠ‚ïŒŒGPT-4 ćœšèź­ç»ƒæ—¶éœ€èŠè¶…èż‡ 10TB çš„ć†…ć­˜ïŒŒè€Œć•äžȘ H100 仅有 80GB。

äžșäș†è§Łć†łèż™äž€é—źéą˜ïŒŒæˆ‘ä»Źèż˜äœżç”šć„ç§æŠ€æœŻćŻčæšĄćž‹èż›èĄŒæ‹†ćˆ†ïŒŒä»„äŸżćœš GPU äč‹é—Žèż›èĄŒćˆ†é…ă€‚äŸ‹ćŠ‚ïŒŒćŒ é‡ćč¶èĄŒæŠ€æœŻ (tensor parallelism) 朹捕äžȘć±‚ć†…æ‹†ćˆ†ć„äžȘæƒé‡ïŒŒäœżćŸ—æŻäžȘ GPU æ‰§èĄŒćż…èŠçš„æ“äœœćč¶ć°†èŸ“ć‡șäŒ é€’ç»™ć…¶ä»–çš„ GPUă€‚èż™é™äœŽäș†æŻäžȘ GPU çš„ć†…ć­˜éœ€æ±‚ïŒŒäœ†éœ€èŠćźƒä»Źäč‹é—Žèż›èĄŒæŒç»­çš„é€šäżĄćŸ€æ„ïŒŒć› æ­€éœ€èŠé«˜ćžŠćźœă€äœŽć»¶èżŸçš„èżžæŽ„ä»„æé«˜æ•ˆçŽ‡ă€‚

攁氎çșżćč¶èĄŒæŠ€æœŻ (pipeline parallelism) ć°†æšĄćž‹çš„ć±‚ćˆ†é…ćˆ°ć„äžȘ GPU äžŠïŒŒæŻäžȘ GPU æ‰§èĄŒć…¶ć·„äœœćč¶äžŽæ”æ°Žçșżäž­çš„䞋䞀äžȘ GPU ć…±äș«æ›Žæ–°ă€‚ć°œçźĄèż™æ‰€éœ€çš„é€šäżĄé‡æŻ”ćŒ é‡ćč¶èĄŒæ›Žć°‘ïŒŒäœ†ćŻèƒœäŒšć‡șçŽ°ă€Œæ°”æłĄă€ïŒˆäŸ‹ćŠ‚ïŒŒç©șé—Čæ—¶é—ŽïŒ‰ïŒŒćœšèż™ç§æƒ…ć†”äž‹ïŒŒäœäșŽæ”æ°ŽçșżćŽéąçš„ GPU äŒšç­‰ćŸ…æ„è‡Ș才靱 GPU çš„äżĄæŻïŒŒä»„äŸżćŒ€ć§‹ć…¶ć·„äœœă€‚

äžșäș†è§Łć†łèż™äș›æŒ‘æˆ˜ïŒŒć‘ć±•ć‡șć„ç§æŠ€æœŻă€‚äŸ‹ćŠ‚ïŒŒZeROïŒˆé›¶ć†—äœ™äŒ˜ćŒ–ć™šïŒ‰æ˜Żäž€ç§ć†…ć­˜äŒ˜ćŒ–æŠ€æœŻïŒŒćźƒé€šèż‡ćąžćŠ é€šäżĄćŒ€é”€æ„ć‡ć°‘ć†…ć­˜äœżç”šïŒŒä»Žè€Œäœżæ›Žć€§çš„æšĄćž‹èƒœć€Ÿćœšç‰čćźšèźŸć€‡äžŠèż›èĄŒèź­ç»ƒă€‚ZeRO é€šèż‡ćœš GPU äč‹é—Žćˆ†ć‰ČæšĄćž‹ć‚æ•°ă€æąŻćșŠć’ŒäŒ˜ćŒ–ć™šçŠ¶æ€æ„é™äœŽć†…ć­˜éœ€æ±‚ïŒŒäœ†äŸè”–äșŽć€§é‡çš„é€šäżĄïŒŒä»„äŸżèźŸć€‡èƒœć€ŸèŽ·ć–ćˆ†ć‰Čçš„æ•°æźă€‚ćźƒæ˜Żæ”èĄŒæŠ€æœŻćŠ‚ćźŒć…šćˆ†ç‰‡æ•°æźćč¶èĄŒ (FSDP) 撌 DeepSpeed 的ćŸș础æ–čæł•ă€‚

èż™äș›æŠ€æœŻé€šćžžćœšć€§æšĄćž‹èź­ç»ƒäž­ç»“ćˆäœżç”šïŒŒä»„æœ€ć€§ćŒ–è”„æșçš„ćˆ©ç”šæ•ˆçŽ‡ïŒŒèż™èą«ç§°äžș 3D ćč¶èĄŒă€‚ćœšèż™ç§é…çœźäž­ïŒŒćŒ é‡ćč¶èĄŒæŠ€æœŻ (tensor parallelism) 通澾甹äșŽćœšć•äžȘæœćŠĄć™šć†…ć°†æƒé‡ćˆ†é…ćˆ°ć„äžȘ GPU äžŠïŒŒć› äžșćœšæŻäžȘèą«ćˆ†ć‰Č的求äč‹é—Žéœ€èŠć€§é‡é€šäżĄă€‚ç„¶ćŽïŒŒæ”æ°Žçșżćč¶èĄŒæŠ€æœŻ (pipeline parallelism) èą«ç”šæ„ćœšäžćŒæœćŠĄć™šäč‹é—ŽïŒˆäœ†ćœšæ•°æźäž­ćżƒçš„ćŒäž€ćČ›ć±żć†…ïŒ‰ćˆ†é…ć±‚ïŒŒć› äžșćźƒæ‰€éœ€çš„é€šäżĄé‡èŸƒć°‘ă€‚æŽ„ç€ïŒŒæ•°æźćč¶èĄŒæŠ€æœŻ (data parallelism) æˆ–ćźŒć…šćˆ†ç‰‡æ•°æźćč¶èĄŒæŠ€æœŻ (FSDP) èą«ç”šæ„ćœšäžćŒæœćŠĄć™šćț汿äč‹é—Žæ‹†ćˆ†æ•°æźé›†ïŒŒć› äžșćźƒćŻä»„é€šèż‡ćŒ‚æ­„ć…±äș«æ›Žæ–°ć’Œ / æˆ–ćŽ‹çŒ©æąŻćșŠæ„适ćș”æ›Žé•żçš„çœ‘ç»œć»¶èżŸă€‚Meta äœżç”šèż™ç§ç»„ćˆæ–čæł•æ„èź­ç»ƒ Llama 3.1ïŒŒćŠ‚äž‹éąçš„ć›Ÿç€ș所ç€ș。

èż™äș›æ–čæł•ç»™ćŽ»äž­ćżƒćŒ–èź­ç»ƒçœ‘ç»œćžŠæ„äș†æ žćżƒæŒ‘æˆ˜ïŒŒèż™äș›çœ‘络䟝蔖äșŽé€šèż‡ïŒˆé€ŸćșŠæ›Žæ…ąäž”æłąćŠšæ›Žć€§çš„ïŒ‰æ¶ˆèŽčçș§äș’è”çœ‘èżžæŽ„çš„èźŸć€‡ă€‚ćœšèż™ç§çŽŻćąƒäž­ïŒŒé€šäżĄæˆæœŹćŸˆćż«ć°±äŒšè¶…èż‡èŸčçŒ˜èźĄçź—ćžŠæ„çš„æ”¶ç›ŠïŒŒć› äžșèźŸć€‡é€šćžžæ˜Żç©șé—Čçš„ïŒŒç­‰ćŸ…æ•°æźćˆ°èŸŸă€‚ä»„äž€äžȘçź€ć•çš„äŸ‹ć­èŻŽæ˜ŽïŒŒćˆ†ćžƒćŒæ•°æźćč¶èĄŒèź­ç»ƒäž€äžȘć…·æœ‰ 10 äșżć‚æ•°çš„ćŠçČŸćșŠæšĄćž‹ïŒŒæŻäžȘ GPU ćœšæŻäžȘäŒ˜ćŒ–æ­„éȘ€äž­éœ€èŠć…±äș« 2GB çš„æ•°æźă€‚ä»„ć…žćž‹çš„äș’è”çœ‘ćžŠćźœïŒˆäŸ‹ćŠ‚ 1 ćƒć…†äœæŻç§’ïŒ‰äžșäŸ‹ïŒŒć‡èźŸèźĄçź—äžŽé€šäżĄäžé‡ć ïŒŒäŒ èŸ“æąŻćșŠæ›Žæ–°è‡łć°‘需芁 16 ç§’ïŒŒćŻŒè‡Žæ˜Ÿè‘—çš„ç©șé—Čă€‚ćƒćŒ é‡ćč¶èĄŒæŠ€æœŻ (tensor parallelism) èż™æ ·çš„æŠ€æœŻïŒˆéœ€èŠæ›Žć€šçš„é€šäżĄïŒ‰ćœ“ç„¶äŒšèĄšçŽ°ćŸ—æ›ŽçłŸă€‚

ć…¶æŹĄïŒŒćœ“ć‰çš„èź­ç»ƒæŠ€æœŻçŒșäčćźčé”™èƒœćŠ›ă€‚ćƒä»»äœ•ćˆ†ćžƒćŒçł»ç»Ÿäž€æ ·ïŒŒéšç€è§„æšĄçš„ćąžćŠ ïŒŒèź­ç»ƒé›†çŸ€ć˜ćŸ—æ›Žćźčæ˜“ć‘ç”Ÿæ•…éšœă€‚ç„¶è€ŒïŒŒèż™äž€é—źéą˜ćœšèź­ç»ƒäž­æ›ŽćŠ äž„é‡ïŒŒć› äžșæˆ‘ä»Źç›źć‰çš„æŠ€æœŻäž»èŠæ˜ŻćŒæ­„çš„ïŒŒèż™æ„ć‘łç€ GPU ćż…éĄ»ććŒć·„äœœä»„ćźŒæˆæšĄćž‹èź­ç»ƒă€‚æˆćƒäžŠäž‡çš„ GPU 侭捕äžȘ GPU çš„æ•…éšœäŒšćŻŒè‡Žæ•ŽäžȘèź­ç»ƒèż‡çš‹ćœæ­ąïŒŒèż«äœżć…¶ä»– GPU ä»Žć€ŽćŒ€ć§‹èź­ç»ƒă€‚ćœšæŸäș›æƒ…憔䞋GPU ćč¶äžäŒšćźŒć…šæ•…éšœïŒŒè€Œæ˜Żç”±äșŽć„ç§ćŽŸć› ć˜ćŸ—èżŸçŒ“ïŒŒèż›è€Œć‡æ…ąé›†çŸ€äž­æˆćƒäžŠäž‡ć…¶ä»– GPU 的速ćșŠă€‚è€ƒè™‘ćˆ°ćœ“ä»Šé›†çŸ€çš„è§„æšĄïŒŒèż™ćŻèƒœæ„ć‘łç€æ•°ćƒäž‡ćˆ°æ•°äșżçŸŽć…ƒçš„éąć€–æˆæœŹă€‚

Meta ćœšä»–ä»Źçš„ Llama èź­ç»ƒèż‡çš‹äž­èŻŠç»†é˜èż°äș†èż™äș›é—źéą˜ïŒŒä»–ä»Źç»ćŽ†äș†è¶…èż‡ 400 æŹĄæ„ć€–äž­æ–­ïŒŒćčłć‡æŻć€©çșŠ 8 æŹĄäž­æ–­ă€‚èż™äș›äž­æ–­äž»èŠćœ’ć› äșŽçĄŹä»¶é—źéą˜ïŒŒäŸ‹ćŠ‚ GPU 或䞻æœșçĄŹä»¶æ•…éšœă€‚èż™ćŻŒè‡Žä»–ä»Źçš„ GPU ćˆ©ç”šçŽ‡ä»…äžș 38-43%。OpenAI 朹 GPT-4 çš„èź­ç»ƒèż‡çš‹äž­èĄšçŽ°æ›Žć·źïŒŒä»…äžș 32-36%ïŒŒèż™äčŸæ˜Żç”±äșŽèź­ç»ƒèż‡çš‹äž­æ•…éšœéą‘çčă€‚

æąć„èŻèŻŽïŒŒć‰æȿ漞éȘŒćź€ä»ŹćœšćźŒć…šäŒ˜ćŒ–çš„çŽŻćąƒäž­ïŒˆćŒ…æ‹ŹćŒèŽšçš„ă€æœ€ć…ˆèż›çš„çĄŹä»¶ă€çœ‘ç»œă€ç””æșć’Œć†·ćŽçł»ç»ŸïŒ‰èż›èĄŒèź­ç»ƒæ—¶ïŒŒä»ç„¶éšŸä»„èŸŸćˆ° 40% çš„ćˆ©ç”šçŽ‡ă€‚èż™äž»èŠćœ’ć› äșŽçĄŹä»¶æ•…éšœć’Œçœ‘ç»œé—źéą˜ïŒŒè€ŒćœšèŸčçŒ˜èź­ç»ƒçŽŻćąƒäž­ïŒŒèż™äș›é—źéą˜äŒšæ›ŽćŠ äž„é‡ïŒŒć› äžșèźŸć€‡ćœšć€„ç†èƒœćŠ›ă€ćžŠćźœă€ć»¶èżŸć’ŒćŻé æ€§æ–čéąć­˜ćœšäžć‡èĄĄă€‚æ›Žäžç”šèŻŽïŒŒćŽ»äž­ćżƒćŒ–çœ‘ç»œæ˜“ć—æ¶æ„èĄŒäžșè€…çš„äŸ”ćźłïŒŒä»–ä»ŹćŻèƒœć‡șäșŽć„ç§ćŽŸć› èŻ•ć›Ÿç Žćæ•Žäœ“éĄčç›źæˆ–ćœšç‰čćźšć·„äœœèŽŸèœœäžŠäœœćŒŠă€‚ćłäœżæ˜ŻçșŻćż—æ„żè€…çœ‘ç»œ SETI@homeäčŸæ›Ÿć‡șçŽ°èż‡äžćŒć‚äžŽè€…çš„äœœćŒŠçŽ°è±Ąă€‚

çŹŹäž‰ïŒŒć‰æČżæšĄćž‹èź­ç»ƒéœ€èŠć€§è§„æšĄçš„èźĄçź—èƒœćŠ›ă€‚è™œç„¶ćƒ SETI 撌 Folding èż™æ ·çš„éĄčç›źèŸŸćˆ°äș†ä»€äșșć°è±Ąæ·±ćˆ»çš„è§„æšĄïŒŒäœ†äžŽćœ“ä»Šć‰æČżèź­ç»ƒæ‰€éœ€çš„èźĄçź—èƒœćŠ›ç›žæŻ”ïŒŒćźƒä»Źç›žćœąè§ç»Œă€‚GPT-4 朹侀äžȘ由 20,000 äžȘ A100 ç»„æˆçš„é›†çŸ€äžŠèź­ç»ƒïŒŒć…¶ćł°ć€Œćžćé‡äžș捊çČŸćșŠçš„ 6.28 ExaFLOPSă€‚èż™æŻ” Folding@home ćœšć…¶ćł°ć€Œæ—¶çš„èźĄçź—èƒœćŠ›ć€šć‡ș侉怍。Llama 405b äœżç”š 16,000 äžȘ H100 èż›èĄŒèź­ç»ƒïŒŒćł°ć€Œćžćé‡äžș 15.8 ExaFLOPSïŒŒæ˜Ż Folding ćł°ć€Œçš„ 7 ć€ă€‚éšç€ć€šäžȘ漞éȘŒćź€èźĄćˆ’æž„ć»șè¶…èż‡ 100,000 äžȘ H100 çš„é›†çŸ€ïŒŒèż™äž€ć·źè·ćȘäŒšèż›äž€æ­„æ‰©ć€§ïŒŒæŻäžȘé›†çŸ€çš„èźĄçź—èƒœćŠ›é«˜èŸŸæƒŠäșș的 99 ExaFLOPS。

æ·±ćșŠç ”ç©¶ïŒšćŠ ćŻ†æż€ćŠ±äŒ—ç­č侀äžȘAIæšĄćž‹ïŒŒæ˜ŻćŠćŻèĄŒïŒŸ

èż™ćŸˆæœ‰é“ç†ïŒŒć› äžș @home éĄčç›źæ˜Żćż—æ„żè€…é©±ćŠšçš„ă€‚èŽĄçŒźè€…æè” äș†ä»–ä»Źçš„ć†…ć­˜ć’Œć€„ç†ć™šć‘šæœŸïŒŒćč¶æ‰żæ‹…äș†ç›žć…łæˆæœŹă€‚èż™è‡Șç„¶é™ćˆ¶äș†ćźƒä»Źç›žćŻčäșŽć•†äžšéĄčç›źçš„è§„æšĄă€‚

æœ€èż‘çš„èż›ć±•

è™œç„¶èż™äș›é—źéą˜ćœšćŽ†ćČäžŠäž€ç›Žć›°æ‰°ç€ćŽ»äž­ćżƒćŒ–èź­ç»ƒć·„äœœïŒŒäœ†ćźƒä»ŹäŒŒäčŽäžć†äžćŻé€Ÿè¶Šă€‚æ–°çš„èź­ç»ƒæŠ€æœŻć·Č经ć‡șçŽ°ïŒŒèƒœć€Ÿć‡ć°‘èŠ‚ç‚čé—Žçš„é€šäżĄéœ€æ±‚ïŒŒä»Žè€Œćœšäș’è”çœ‘èżžæŽ„çš„èźŸć€‡äžŠèż›èĄŒé«˜æ•ˆèź­ç»ƒă€‚èż™äș›æŠ€æœŻćŸˆć€šæșè‡Ș性枋柞éȘŒćź€ïŒŒćźƒä»ŹćžŒæœ›äžșæšĄćž‹èź­ç»ƒćąžćŠ æ›Žć€§çš„è§„æšĄïŒŒć› æ­€éœ€èŠè·šæ•°æźäž­ćżƒçš„é«˜æ•ˆé€šäżĄæŠ€æœŻă€‚æˆ‘ä»Źèż˜çœ‹ćˆ°äș†ćźčé”™èź­ç»ƒæ–čæł•ć’ŒćŠ ćŻ†æż€ćŠ±çł»ç»Ÿçš„èż›ć±•ïŒŒèż™äș›æ–čæł•ćŻä»„æ”ŻæŒæ›Žć€§è§„æšĄçš„èź­ç»ƒćœšèŸčçŒ˜çŽŻćąƒäž­èż›èĄŒă€‚

é«˜æ•ˆé€šäżĄæŠ€æœŻ

DiLoCo æ˜Żè°·æ­Œèż‘æœŸçš„ç ”ç©¶ïŒŒćźƒé€šèż‡ćœšèźŸć€‡é—ŽäŒ é€’æ›Žæ–°çš„æšĄćž‹çŠ¶æ€äč‹ć‰èż›èĄŒæœŹćœ°äŒ˜ćŒ–ïŒŒä»Žè€Œć‡ć°‘äș†é€šäżĄćŒ€é”€ă€‚他仏的æ–čæł•ïŒˆćŸșäșŽæ—©æœŸçš„è”é‚Šć­Šäč ç ”究星ç€șć‡șäžŽäŒ ç»ŸćŒæ­„èź­ç»ƒç›žćœ“çš„æ•ˆæžœïŒŒćŒæ—¶èŠ‚ç‚čäč‹é—Žçš„é€šäżĄé‡é™äœŽäș† 500 ć€ă€‚æ­€ćŽïŒŒèŻ„æ–čæł•ć·Čèą«ć…¶ä»–ç ”ç©¶è€…ć€ćˆ¶ïŒŒćč¶æ‰©ć±•è‡łèź­ç»ƒæ›Žć€§æšĄćž‹ïŒˆè¶…èż‡ 10 äșżäžȘć‚æ•°ïŒ‰ă€‚ćźƒèż˜æ‰©ć±•ćˆ°ćŒ‚æ­„èź­ç»ƒïŒŒèż™æ„ć‘łç€èŠ‚ç‚čćŻä»„ćœšäžćŒæ—¶é—Žć…±äș«æąŻćșŠæ›Žæ–°ïŒŒè€Œäžæ˜Żäž€æŹĄæ€§ć…±äș«æ‰€æœ‰æ›Žæ–°ă€‚èż™æ›Žć„œćœ°é€‚ćș”äș†ć€„ç†èƒœćŠ›ć’Œçœ‘ç»œé€ŸćșŠć„ćŒ‚çš„èŸčçŒ˜çĄŹä»¶ă€‚

ć…¶ä»–æ•°æźćč¶èĄŒæ–čæł•ïŒŒćŠ‚ lo-fi 撌 DisTrOïŒŒæ—šćœšèż›äž€æ­„ć‡ć°‘é€šäżĄæˆæœŹă€‚Lo-fi 提ć‡șäș†ćźŒć…šæœŹćœ°ćŸźè°ƒçš„æ–čæł•ïŒŒèż™æ„ć‘łç€èŠ‚ç‚čç‹Źç«‹èź­ç»ƒïŒŒćȘćœšæœ€ćŽäŒ é€’æƒé‡ă€‚èż™ç§æ–čæł•ćœšćŸźè°ƒè¶…èż‡ 10 äșżć‚æ•°çš„èŻ­èš€æšĄćž‹æ—¶ïŒŒæ€§èƒœäžŽćŸșć‡†ç›žćœ“ïŒŒćŒæ—¶ćźŒć…šæ¶ˆé™€äș†é€šäżĄćŒ€é”€ă€‚ćœšäž€ä»œćˆæ­„æŠ„ć‘Šäž­ïŒŒDisTrO 棰称采甹äș†äž€ç§æ–°ćž‹çš„ćˆ†ćžƒćŒäŒ˜ćŒ–ć™šïŒŒä»–ä»Źèź€äžșćŻä»„ć°†é€šäżĄéœ€æ±‚é™äœŽć››ćˆ°äș”äžȘ数量çș§ïŒŒć°œçźĄèŻ„æ–čæł•ć°šćŸ…çĄźèź€ă€‚

æ–°çš„æšĄćž‹ćč¶èĄŒæ–čæł•äčŸć·Č经ć‡șçŽ°ïŒŒèż™äœżćŸ—ćźžçŽ°æ›Žć€§çš„è§„æšĄæˆäžșćŻèƒœă€‚DiPaCoïŒˆćŒæ ·æ„è‡Șè°·æ­ŒïŒ‰ć°†æšĄćž‹ćˆ’ćˆ†äžș怚äžȘæšĄć—ïŒŒæŻäžȘæšĄć—ćŒ…ć«äžćŒçš„äž“ćź¶æšĄć—ïŒŒä»„äŸżäșŽç‰čćźšä»»ćŠĄçš„èź­ç»ƒă€‚ç„¶ćŽïŒŒèź­ç»ƒæ•°æźé€šèż‡ă€Œè·ŻćŸ„ă€èż›èĄŒćˆ†ç‰‡ïŒŒèż™äș›è·ŻćŸ„æ˜ŻæŻäžȘæ•°æźæ ·æœŹćŻčćș”的䞓柶ćșćˆ—。给柚䞀äžȘćˆ†ç‰‡ïŒŒæŻäžȘć·„äœœè€…ć‡ äčŽćŻä»„ç‹Źç«‹èź­ç»ƒç‰čćźšçš„è·ŻćŸ„ïŒŒé™€äș†ć…±äș«æšĄć—æ‰€éœ€çš„é€šäżĄïŒŒèż™éƒšćˆ†ç”± DiLoCo ć€„ç†ă€‚èż™ç§æž¶æž„ć°†ćäșżć‚æ•°æšĄćž‹çš„èź­ç»ƒæ—¶é—Žć‡ć°‘äș†è¶…èż‡äž€ćŠă€‚

SWARM ćč¶èĄŒæ€§ć’ŒćŒ‚æž„çŽŻćąƒäž­ćŸșçĄ€æšĄćž‹çš„ćŽ»äž­ćżƒćŒ–èź­ç»ƒ (DTFMHE) äčŸæć‡șäș†æšĄćž‹ćč¶èĄŒçš„æ–čæł•ïŒŒä»„ćœšćŒ‚æž„çŽŻćąƒäž­ćźžçŽ°ć€§æšĄćž‹èź­ç»ƒă€‚SWARM ć‘çŽ°ïŒŒéšç€æšĄćž‹è§„æšĄçš„ćąžćŠ ïŒŒçźĄé“ćč¶èĄŒæ€§é€šäżĄçșŠæŸć‡ć°ïŒŒèż™äœżćŸ—ćœšèŸƒäœŽçš„çœ‘ç»œćžŠćźœć’Œæ›Žé«˜çš„ć»¶èżŸäž‹æœ‰æ•ˆèź­ç»ƒæ›Žć€§æšĄćž‹æˆäžșćŻèƒœă€‚äžșäș†ćœšćŒ‚æž„çŽŻćąƒäž­ćș”ç”šèż™äž€ç†ćż”ïŒŒä»–ä»ŹćœšèŠ‚ç‚čäč‹é—Žäœżç”šäžŽæ—¶ă€ŒçźĄé“èżžæŽ„ă€ïŒŒèż™äș›çźĄé“ćŻä»„ćœšæŻæŹĄèż­ä»Łäž­ćźžæ—¶æ›Žæ–°ă€‚èż™ć…èźžèŠ‚ç‚čć°†ć…¶èŸ“ć‡șć‘é€ćˆ°ä»»äœ•äž‹äž€äžȘçźĄé“é˜¶æź”çš„ćŻč等节ç‚čă€‚èż™æ„ć‘łç€ïŒŒćŠ‚æžœæŸäžȘćŻč等节ç‚čæŻ”ć…¶ä»–èŠ‚ç‚čæ›Žćż«ïŒŒæˆ–è€…ä»»äœ•ć‚äžŽè€…æ–­ćŒ€èżžæŽ„ïŒŒèŸ“ć‡șćŻä»„ćŠšæ€é‡æ–°è·Żç”±ïŒŒä»„äżèŻèź­ç»ƒçš„æŒç»­èż›èĄŒïŒŒćȘèŠæŻäžȘé˜¶æź”è‡łć°‘æœ‰äž€äžȘæŽ»è·ƒć‚äžŽè€…ă€‚ä»–ä»Źäœżç”šèż™ç§æ–čæł•ćœšäœŽæˆæœŹçš„ćŒ‚æž„ GPU äžŠèź­ç»ƒäž€äžȘè¶…èż‡ 10 äșżć‚æ•°çš„æšĄćž‹ïŒŒćč¶äž”äș’èżžé€ŸćșŠèŸƒæ…ąïŒˆćŠ‚äž‹ć›Ÿæ‰€ç€șïŒ‰ă€‚

DTFMHE ćŒæ ·æć‡șäș†äž€ç§æ–°éą–çš„è°ƒćșŠçź—æł•ïŒŒä»„揊缡道ćč¶èĄŒć’Œæ•°æźćč¶èĄŒïŒŒä»„朹 3 äžȘ性æŽČçš„èźŸć€‡äžŠèź­ç»ƒć€§ćž‹æšĄćž‹ă€‚ć°œçźĄä»–ä»Źçš„çœ‘ç»œé€ŸćșŠæŻ”æ ‡ć‡† Deepspeed æ…ą 100 ć€ïŒŒäœ†ä»–ä»Źçš„æ–čæł•é€ŸćșŠä»…æŻ”ćœšæ•°æźäž­ćżƒäœżç”šæ ‡ć‡† Deepspeed æ…ą 1.7-3.5 怍。侎 SWARM 类䌌DTFMHE 星ç€șć‡șéšç€æšĄćž‹è§„æšĄćąžć€§ïŒŒé€šäżĄæˆæœŹćŻä»„æœ‰æ•ˆéšè—ïŒŒćłäœżćœšćœ°ç†ćˆ†ćžƒçš„çœ‘ç»œäž­äčŸćŒæ ·é€‚ç”šă€‚èż™äœżćŸ—æˆ‘ä»Źèƒœć€Ÿé€šèż‡ć„ç§æŠ€æœŻć…‹æœèŠ‚ç‚čäč‹é—ŽèŸƒćŒ±çš„èżžæŽ„ïŒŒćŒ…æ‹ŹćąžćŠ éšè—ć±‚çš„ć€§ć°ć’ŒæŻäžȘçźĄé“é˜¶æź”ćąžćŠ æ›Žć€šć±‚ă€‚

故障ćźč错

äžŠèż°èźžć€šæ•°æźćč¶èĄŒæ–čæł•é»˜èź€ć…·æœ‰ćźčé”™èƒœćŠ›ïŒŒć› äžșæŻäžȘ节ç‚čéƒœćœšć†…ć­˜äž­ć­˜ć‚šæ•ŽäžȘæšĄćž‹ă€‚èż™ç§ć†—äœ™é€šćžžæ„ć‘łç€ïŒŒćłäœżć…¶ä»–èŠ‚ç‚čć‡ș现故障节ç‚čä»ç„¶ćŻä»„ç‹Źç«‹ć·„äœœă€‚èż™ćŻčäșŽćŽ»äž­ćżƒćŒ–èź­ç»ƒéžćžžé‡èŠïŒŒć› äžș节ç‚čé€šćžžæ˜ŻäžćŻé çš„ă€ćŒ‚æž„çš„ïŒŒç”šè‡łćŻèƒœć­˜ćœšæ¶æ„èĄŒäžșă€‚ç„¶è€ŒïŒŒćŠ‚ć‰æ‰€èż°ïŒŒçșŻæ•°æźćč¶èĄŒæ–čæł•ä»…é€‚ç”šäșŽèŸƒć°çš„æšĄćž‹ïŒŒć› æ­€æšĄćž‹ć€§ć°ć—ćˆ°çœ‘ç»œäž­æœ€ć°èŠ‚ç‚č憅歘ćźčé‡çš„ćˆ¶çșŠă€‚

äžșäș†è§Łć†łäžŠèż°é—źéą˜ïŒŒäž€äș›äșș提ć‡șäș†é€‚甚äșŽæšĄćž‹ćč¶èĄŒïŒˆæˆ–æ··ćˆćč¶èĄŒïŒ‰èź­ç»ƒçš„ćźčé”™æŠ€æœŻă€‚SWARM é€šèż‡äŒ˜ć…ˆé€‰æ‹©ć»¶èżŸèŸƒäœŽçš„çšłćźšćŻč等节ç‚č杄ćș”ćŻčćŻč等节ç‚č故障ćč¶ćœšć‘ç”Ÿæ•…éšœæ—¶é‡æ–°è·Żç”±çźĄé“é˜¶æź”的任报。慶他æ–čæł•ïŒŒćŠ‚ Oobleck采甚类䌌的æ–čæł•ïŒŒé€šèż‡ćˆ›ć»ș怚äžȘă€ŒçźĄé“æšĄæżă€æ„æäŸ›ć†—äœ™ïŒŒä»„ćș”ćŻčéƒšćˆ†èŠ‚ç‚čæ•…éšœă€‚ć°œçźĄćœšæ•°æźäž­ćżƒèż›èĄŒäș†æ”‹èŻ•ïŒŒOobleck 的æ–čæł•æäŸ›äș†ćŒșć€§çš„ćŻé æ€§äżèŻïŒŒèż™äș›äżèŻćŒæ ·é€‚甚äșŽćŽ»äž­ćżƒćŒ–çŽŻćąƒă€‚

æˆ‘ä»Źèż˜çœ‹ćˆ°äș†äž€äș›æ–°çš„æšĄćž‹æž¶æž„ïŒˆćŠ‚ćŽ»äž­ćżƒćŒ–æ··ćˆäž“ćź¶æšĄćž‹ (Decentralized Mixture of Experts, DMoE)甚äșŽæ”ŻæŒćŽ»äž­ćżƒćŒ–çŽŻćąƒäž­çš„ćźčé”™èź­ç»ƒă€‚äžŽäŒ ç»Ÿçš„äž“ćź¶æ··ćˆæšĄćž‹ç±»äŒŒïŒŒDMoE 由怚äžȘç‹Źç«‹çš„ă€Œäž“ćź¶ă€çœ‘ç»œç»„æˆïŒŒèż™äș›çœ‘ç»œćˆ†ćžƒćœšäž€ç»„ć·„䜜者节ç‚č侊。DMoE äœżç”šćˆ†ćžƒćŒć“ˆćžŒèĄšä»„ćŽ»äž­ćżƒćŒ–æ–čćŒè·ŸèžȘć’Œæ•ŽćˆćŒ‚æ­„æ›Žæ–°ă€‚èŻ„æœșćˆ¶ïŒˆćœš SWARM äž­äčŸäœżç”šïŒ‰ćŻč节ç‚čæ•…éšœć…·æœ‰è‰Żć„œçš„æŠ”æŠ—ćŠ›ïŒŒć› äžșćŠ‚æžœæŸäș›èŠ‚ç‚čć€±èŽ„æˆ–æœȘèƒœćŠæ—¶ć“ćș”ïŒŒćźƒćŻä»„ć°†æŸäș›äž“ćź¶æŽ’é™€ćœšćčłć‡èźĄçź—äč‹ć€–。

è§„æšĄćŒ–

æœ€ćŽïŒŒćƒæŻ”ç‰čćžć’Œä»„ć€ȘćŠæ‰€é‡‡ç”šçš„ćŠ ćŻ†æż€ćŠ±çł»ç»ŸćŻä»„ćžźćŠ©ćźžçŽ°æ‰€éœ€çš„è§„æšĄă€‚èż™äž€äžȘçœ‘ç»œé€šèż‡ć‘èŽĄçŒźè€…æ”Żä»˜äž€ç§ćŻä»„éšç€é‡‡ç”šćąžé•żè€Œćąžć€Œçš„æœŹćœ°è”„äș§æ„äŒ—ćŒ…èźĄçź—ă€‚èż™äžȘèźŸèźĄé€šèż‡ç»™äșˆæ—©æœŸèŽĄçŒźè€…äž°ćŽšć„–ćŠ±æ„æż€ćŠ±ä»–ä»ŹïŒŒćœ“çœ‘ç»œèŸŸćˆ°æœ€ć°ćŻèĄŒè§„æšĄćŽïŒŒèż™äș›ć„–ćŠ±ćŻä»„é€æ­„ć‡ć°‘ă€‚

çĄźćźžïŒŒèż™ç§æœșćˆ¶ć­˜ćœšć„ç§é™·é˜±ïŒŒéœ€èŠéżć…ă€‚ć…¶äž­æœ€äž»èŠçš„é™·é˜±æ˜ŻïŒŒèż‡ćșŠæż€ćŠ±äŸ›ç»™è€ŒæœȘèƒœćžŠæ„ç›žćș”çš„éœ€æ±‚ă€‚æ­€ć€–ïŒŒćŠ‚æžœćŸșçĄ€çœ‘ç»œäžć€ŸćŽ»äž­ćżƒćŒ–ïŒŒèż™ćŻèƒœćŒ•ć‘ç›‘çźĄé—źéą˜ă€‚ç„¶è€ŒïŒŒćœ“èźŸèźĄćŸ—ćœ“æ—¶ïŒŒćŽ»äž­ćżƒćŒ–æż€ćŠ±çł»ç»ŸćŻä»„ćœšèŸƒé•żæ—¶é—Žć†…ćźžçŽ°ćŻè§‚çš„è§„æšĄă€‚

äŸ‹ćŠ‚ïŒŒæŻ”ç‰č极ćčŽç””ćŠ›æ¶ˆè€—çșŠäžș 150 ć€Șç“Šæ—¶ (TWh)ïŒŒèż™æŻ”ç›źć‰æž„æ€äž­çš„æœ€ć€§ AI èź­ç»ƒé›†çŸ€çš„ç””ćŠ›æ¶ˆè€—é«˜ć‡ș䞀äžȘ数量çș§äč‹ć€šïŒˆ100,000 äžȘ H100 ć…šèŽŸè·èżèĄŒäž€ćčŽïŒ‰ă€‚䜜äžșć‚è€ƒïŒŒOpenAI 的 GPT-4 朹 20,000 äžȘ A100 äžŠèż›èĄŒäș†èź­ç»ƒïŒŒMeta 的旗舰 Llama 405B æšĄćž‹ćœš 16,000 äžȘ H100 äžŠèż›èĄŒäș†èź­ç»ƒă€‚ćŒæ ·ïŒŒćœšć…¶é«˜ćł°æœŸïŒŒä»„ć€ȘćŠçš„ç””ćŠ›æ¶ˆè€—ć€§çșŠäžș 70 TWhïŒŒćˆ†æ•Łćœšæ•°ç™Ÿäž‡äžȘ GPU äč‹é—Žă€‚ćłäœżè€ƒè™‘ćˆ°æœȘæ„ć‡ ćčŽ AI æ•°æźäž­ćżƒçš„ćż«é€Ÿćąžé•żïŒŒćƒèż™äș›æż€ćŠ±èźĄçź—çœ‘ç»œä»ć°†ć€šæŹĄè¶…è¶Šć…¶è§„æšĄă€‚

ćœ“ç„¶ïŒŒćč¶éžæ‰€æœ‰èźĄçź—éƒœæ˜ŻćŻæ›żæąçš„ïŒŒèź­ç»ƒç›žćŻčäșŽæŒ–çŸżæœ‰ç‹Źç‰čçš„éœ€æ±‚ïŒŒéœ€èŠè€ƒè™‘ă€‚ć°œçźĄćŠ‚æ­€ïŒŒèż™äș›çœ‘ç»œć±•ç€șäș†é€šèż‡èż™äș›æœșćˆ¶ćŻä»„ćźžçŽ°çš„è§„æšĄă€‚

æœȘæ„çš„é“è·Ż

ć°†èż™äș›éƒšćˆ†è”çł»ćœšäž€è”·ïŒŒæˆ‘ä»ŹćŻä»„çœ‹ćˆ°ć‰èż›çš„æ–°é“è·Żçš„ćŒ€ç«Żă€‚

ćŸˆćż«ïŒŒæ–°çš„èź­ç»ƒæŠ€æœŻć°†äœżæˆ‘ä»Źèƒœć€Ÿè¶…ć‡șæ•°æźäž­ćżƒçš„é™ćˆ¶ïŒŒć› äžșèźŸć€‡äžć†éœ€èŠć…±ćŒæ”Ÿçœźæ‰èƒœć‘æŒ„äœœç”šă€‚èż™ć°†éœ€èŠæ—¶é—ŽïŒŒć› äžșæˆ‘ä»Źćœ“ć‰çš„ćŽ»äž­ćżƒćŒ–èź­ç»ƒæ–čæł•ä»ć€„äșŽèŸƒć°è§„æšĄïŒŒäž»èŠćœš 10 äșżćˆ° 20 äșżäžȘć‚æ•°çš„èŒƒć›Žć†…ïŒŒæŻ”ćƒ GPT-4 èż™æ ·çš„æšĄćž‹ć°ćŸ—ć€šă€‚æˆ‘ä»Źéœ€èŠèż›äž€æ­„çš„çȘç ŽïŒŒä»„朹侍ç‰șç‰Čć…łé”źć±žæ€§ïŒˆćŠ‚é€šäżĄæ•ˆçŽ‡ć’Œćźčé”™èƒœćŠ›ïŒ‰çš„æƒ…ć†”äž‹æć‡èż™äș›æ–čæł•çš„è§„æšĄă€‚æˆ–è€…ïŒŒæˆ‘ä»Źéœ€èŠæ–°çš„æšĄćž‹æž¶æž„ïŒŒèż™äș›æž¶æž„äžŽä»Šć€©çš„ć€§ćž‹ć•äœ“æšĄćž‹æœ‰æ‰€äžćŒâ€”â€”ćŻèƒœæ›Žć°ă€æ›ŽæšĄć—ćŒ–ïŒŒćœšèŸčçŒ˜èźŸć€‡äžŠèżèĄŒïŒŒè€Œéžćœšäș‘ç«Ż

无èźșćŠ‚äœ•ïŒŒćŻä»„ćˆç†ćœ°éą„æœŸćœšèż™äžȘæ–čć‘äžŠäŒšæœ‰èż›äž€æ­„çš„èż›ć±•ă€‚æˆ‘ä»Źćœ“ć‰æ–čæł•çš„æˆæœŹæ˜ŻäžćŻæŒç»­çš„ïŒŒèż™äžșćˆ›æ–°æäŸ›äș†ćŒș烈的澂ćœșćŠšćŠ›ă€‚æˆ‘ä»Źć·Čç»çœ‹ćˆ°èż™äž€è¶‹ćŠżïŒŒćƒ Apple èż™æ ·çš„ćˆ¶é€ ć•†æ­Łćœšæž„ć»ș曎ćŒș性的èŸčçŒ˜èźŸć€‡ïŒŒä»„äŸżćœšæœŹćœ°èżèĄŒæ›Žć€šçš„ć·„äœœèŽŸèœœïŒŒè€Œäžæ˜ŻäŸè”–äș‘ç«Żă€‚æˆ‘ä»Źèż˜çœ‹ćˆ°ćŻčćŒ€æșè§Łć†łæ–čæĄˆçš„æ”ŻæŒäžæ–­ćąžćŠ â€”â€”ç”šè‡łćœšćƒ Meta èż™æ ·çš„ć…Źćžć†…éƒšïŒŒä»„äżƒèż›æ›ŽćŽ»äž­ćżƒćŒ–çš„ç ”ç©¶äžŽćŒ€ć‘ă€‚èż™äș›è¶‹ćŠżéšç€æ—¶é—Žçš„掚移ćȘäŒšćŠ é€Ÿă€‚

äžŽæ­€ćŒæ—¶ïŒŒæˆ‘ä»Źèż˜éœ€èŠæ–°çš„çœ‘ç»œćŸșçĄ€èźŸæ–œæ„èżžæŽ„èŸčçŒ˜èźŸć€‡ïŒŒä»„äŸżèƒœć€Ÿèż™æ ·äœżç”šćźƒä»Źă€‚èż™äș›èźŸć€‡ćŒ…æ‹ŹçŹ”èź°æœŹç””è„‘ă€æžžæˆć°ćŒæœșïŒŒæœ€ç»ˆç”šè‡łćŻèƒœæ˜Żæ‹„æœ‰é«˜æ€§èƒœæ˜ŸćĄć’Œć€§ć†…ć­˜çš„æ‰‹æœșă€‚èż™ć°†äœżæˆ‘ä»Źèƒœć€Ÿæž„ć»ș侀äžȘă€Œć…šçƒé›†çŸ€ă€ïŒŒäœŽæˆæœŹă€ć§‹ç»ˆćœšçșżçš„èźĄçź—èƒœćŠ›ïŒŒćŻä»„ćč¶èĄŒć€„ç†èź­ç»ƒä»»ćŠĄă€‚èż™äčŸæ˜Żäž€äžȘć…·æœ‰æŒ‘æˆ˜æ€§çš„é—źéą˜ïŒŒéœ€èŠćœšć€šäžȘéą†ćŸŸć–ćŸ—èż›ć±•ă€‚

æˆ‘ä»Źéœ€èŠæ›Žć„œçš„è°ƒćșŠæŠ€æœŻæ„ćœšćŒ‚æž„çŽŻćąƒäž­èż›èĄŒèź­ç»ƒă€‚ç›źć‰æČĄæœ‰ä»»äœ•æ–čæł•ćŻä»„è‡Ș抹ćč¶èĄŒćŒ–æšĄćž‹ä»„èŸŸćˆ°äŒ˜ćŒ–ïŒŒç‰čćˆ«æ˜ŻćœšèźŸć€‡ćŻä»„éšæ—¶æ–­ćŒ€æˆ–èżžæŽ„çš„æƒ…ć†”äž‹ă€‚èż™æ˜ŻäŒ˜ćŒ–èź­ç»ƒçš„ć…łé”źäž‹äž€æ­„ïŒŒćŒæ—¶äżç•™ćŸșäșŽèŸčçŒ˜çœ‘ç»œçš„è§„æšĄäŒ˜ćŠżă€‚

æˆ‘ä»Źèż˜ćż…éĄ»ćș”ćŻčćŽ»äž­ćżƒćŒ–çœ‘ç»œçš„äž€èˆŹć€æ‚æ€§ă€‚äžșäș†æœ€ć€§ćŒ–è§„æšĄïŒŒçœ‘ç»œćș”èŻ„构ć»șäžșćŒ€æ”Ÿćèźźâ€”â€”äž€ć„—æ ‡ć‡†ć’ŒæŒ‡ä»€ïŒŒè§„ćźšć‚äžŽè€…äč‹é—Žçš„äș’ćŠšïŒŒć°±ćƒ TCP/IP è€Œæ˜Żç”šäșŽæœș晹歩äč èźĄçź—ă€‚èż™ć°†äœżä»»äœ•é”ćŸȘç‰čćźšè§„èŒƒçš„èźŸć€‡èƒœć€ŸèżžæŽ„ćˆ°çœ‘ç»œïŒŒæ— èźșæ‹„æœ‰è€…ć’Œäœçœźă€‚ćźƒèż˜çĄźäżçœ‘ç»œäżæŒäž­ç«‹ïŒŒć…èźžç”šæˆ·èź­ç»ƒä»–ä»Źć–œæŹąçš„æšĄćž‹ă€‚

è™œç„¶èż™ćźžçŽ°äș†è§„æšĄæœ€ć€§ćŒ–ïŒŒäœ†ćźƒäčŸéœ€èŠäž€äžȘæœșćˆ¶æ„éȘŒèŻæ‰€æœ‰èź­ç»ƒä»»ćŠĄçš„æ­ŁçĄźæ€§ïŒŒè€ŒäžäŸè”–äșŽć•äž€ćźžäœ“ă€‚èż™äž€ç‚čè‡łć…łé‡èŠïŒŒć› äžș歘朹ć›șæœ‰çš„äœœćŒŠèŻ±ć› â€”â€”äŸ‹ćŠ‚ïŒŒćŁ°ç§°è‡Șć·±ćźŒæˆäș†æŸäžȘèź­ç»ƒä»»ćŠĄä»„èŽ·ćŸ—æŠ„é…ŹïŒŒäœ†ćźžé™…äžŠćč¶æČĄæœ‰ćšćˆ°ă€‚è€ƒè™‘ćˆ°äžćŒèźŸć€‡é€šćžžä»„äžćŒæ–čćŒæ‰§èĄŒæœș晹歩äč æ“äœœïŒŒèż™äœżćŸ—äœżç”šæ ‡ć‡†ć€ćˆ¶æŠ€æœŻć˜ćŸ—éšŸä»„éȘŒèŻæ­ŁçĄźæ€§ïŒŒć› æ­€èż™ć°€ć…¶ć…·æœ‰æŒ‘æˆ˜æ€§ă€‚æ­ŁçĄźè§Łć†łèż™äžȘé—źéą˜éœ€èŠćœšćŻ†ç ć­Šć’Œć…¶ä»–ć­Šç§‘äžŠèż›èĄŒæ·±ć…„ç ”ç©¶ă€‚

ćčžèżçš„æ˜ŻïŒŒæˆ‘ä»Źćœšæ‰€æœ‰èż™äș›æ–čéąéƒœç»§ç»­çœ‹ćˆ°èż›ć±•ă€‚äžŽèż‡ćŽ»ć‡ ćčŽç›žæŻ”ïŒŒèż™äș›æŒ‘战䌌äčŽäžć†äžćŻé€Ÿè¶Šă€‚䞎æœșäŒšç›žæŻ”ïŒŒćźƒä»ŹäčŸæ˜ŸćŸ—ç›žćœ“ćŸźć°ă€‚Google ćœšä»–ä»Źçš„ DiPaCo èźș文䞭ćŻčæ­€èż›èĄŒäș†æœ€äœłæ€»ç»“指ć‡șćŽ»äž­ćżƒćŒ–èź­ç»ƒæœ‰æœœćŠ›æ‰“ç Žçš„èŽŸćéŠˆæœșćˆ¶ïŒš

ćˆ†ćžƒćŒèź­ç»ƒæœș晹歩äč æšĄćž‹çš„èż›ć±•ćŻèƒœäżƒèż›ćŸșçĄ€èźŸæ–œçš„çź€ćŒ–ć»șèźŸïŒŒæœ€ç»ˆćŻŒè‡ŽèźĄçź—è”„æșçš„曎ćčżæł›ćŻç”šă€‚ç›źć‰ïŒŒćŸșçĄ€èźŸæ–œæ˜Żć›Žç»•èź­ç»ƒć€§ćž‹ć•äœ“æšĄćž‹çš„æ ‡ć‡†æ–čæł•è€ŒèźŸèźĄçš„ïŒŒćŒæ—¶æœș晹歩äč æšĄćž‹çš„架构äčŸæ—šćœšćˆ©ç”šćœ“ć‰çš„ćŸșçĄ€èźŸæ–œć’Œèź­ç»ƒæ–čæł•ă€‚èż™ç§ćéŠˆćŸȘçŽŻćŻèƒœäœżç€ŸćŒș陷慄䞀äžȘèŻŻćŻŒæ€§çš„ć±€éƒšæœ€ć°ć€ŒïŒŒćłèźĄçź—è”„æșçš„é™ćˆ¶è¶…èż‡äș†ćźžé™…éœ€èŠă€‚

äčŸèźžæœ€ä»€äșșć…Žć„‹çš„æ˜ŻïŒŒç ”ç©¶ç•ŒćŻčè§Łć†łèż™äș›é—źéą˜çš„çƒ­æƒ…æ—„ç›Šé«˜æ¶šă€‚æˆ‘ä»Źćœš Gensyn çš„ć›ąé˜Ÿæ­Łćœšæž„ć»șäžŠèż°çœ‘ç»œćŸșçĄ€èźŸæ–œă€‚ćƒ Hivemind 撌 BigScience èż™æ ·çš„ć›ąé˜Ÿćœšćźžè·”äž­ćș”甚äș†èźžć€šèż™äș›æŠ€æœŻă€‚ćƒ Petals、sahajBERT 撌 Bloom èż™æ ·çš„éĄč盟汕ç€șäș†èż™äș›æŠ€æœŻçš„èƒœćŠ›ïŒŒä»„揊ćŻčćŸșäșŽç€ŸćŒș的æœș晹歩äč æ—„ç›Šćąžé•żçš„ć…Žè¶Łă€‚èż˜æœ‰èźžć€šć…¶ä»–äșșäčŸćœšæŽšćŠšç ”ç©¶èż›ć±•ïŒŒç›źæ ‡æ˜Żć»ș立䞀äžȘæ›ŽćŒ€æ”Ÿă€æ›Žćäœœçš„æšĄćž‹èź­ç»ƒç”Ÿæ€çł»ç»Ÿă€‚ćŠ‚æžœæ‚šćŻčèż™éĄčć·„äœœæ„Ÿć…Žè¶ŁïŒŒèŻ·äžŽæˆ‘ä»Źè”çł»ä»„ć‚äžŽć…¶äž­ă€‚