꒰ꖇļ¼šJeff Amico

ē¼–čƑļ¼šę·±ę½® TechFlow

引č؀

åœØę–°å† ē–«ęƒ…ęœŸé—“ļ¼ŒFolding@home 取得äŗ†äø€äøŖ重大里ē؋ē¢‘怂čÆ„ē ”ē©¶é”¹ē›®čŽ·å¾—äŗ† 2.4 exaFLOPS ēš„č®”ē®—čƒ½åŠ›ļ¼Œē”±å…Øēƒ 200 äø‡å°åæ—ę„æč€…č®¾å¤‡ęä¾›ć€‚čæ™ä»£č”Øäŗ†å½“ę—¶äø–ē•ŒäøŠęœ€å¤§č¶…ēŗ§č®”ē®—ęœŗēš„十äŗ”倍处ē†čƒ½åŠ›ļ¼Œä½æē§‘å­¦å®¶čƒ½å¤Ÿå¤§č§„ęØ”ęØ”ę‹Ÿ COVID 蛋ē™½č“ØåŠØꀁ怂他们ēš„å·„作ęŽØåŠØäŗ†ęˆ‘们åƹē—…ęƒ及其ē—…ē†ęœŗ制ēš„ē†č§£ļ¼Œå°¤å…¶ę˜ÆåœØē–«ęƒ…åˆęœŸć€‚

ę·±åŗ¦ē ”ē©¶ļ¼šåŠ åƆęæ€åŠ±ä¼—ē­¹äø€äøŖAIęؔ型ļ¼Œę˜Æ否åÆč”Œļ¼Ÿ

Folding@home ē”Øꈷēš„å…Øēƒåˆ†åøƒļ¼Œ2021

Folding@home åŸŗäŗŽåæ—ę„æč®”ē®—ēš„ę‚ ä¹…åŽ†å²ļ¼Œé”¹ē›®é€ščæ‡ä¼—åŒ…č®”ē®—资ęŗę„č§£å†³å¤§č§„ęØ”é—®é¢˜ć€‚čæ™äøŖęƒ³ę³•åœØ 1990 幓代ēš„ SETI@home äø­å¾—到äŗ†å¹æę³›å…³ę³Øļ¼ŒčƄ锹ē›®ę±‡é›†äŗ†č¶…čæ‡ 500 äø‡å°åæ—ę„æ者讔ē®—ęœŗ仄åÆ»ę‰¾å¤–ę˜Ÿē”Ÿå‘½ć€‚ę­¤åŽļ¼Œčæ™äø€ē†åæµå·²č¢«åŗ”ē”ØäŗŽå¤šäøŖ领域ļ¼ŒåŒ…ę‹¬å¤©ä½“ē‰©ē†å­¦ć€åˆ†å­ē”Ÿē‰©å­¦ć€ę•°å­¦ć€åƆē å­¦å’Œęøøꈏ怂åœØęƏē§ęƒ…况äø‹ļ¼Œé›†ä½“力量增å¼ŗäŗ†å•äøŖ锹ē›®ēš„čƒ½åŠ›ļ¼Œčæœčæœč¶…å‡ŗäŗ†ä»–们单ē‹¬čƒ½å¤Ÿå®žēŽ°ēš„čŒƒå›“怂čæ™ęŽØåŠØäŗ†čæ›ę­„ļ¼Œä½æē ”ē©¶čƒ½å¤Ÿä»„ę›“å¼€ę”¾å’Œåˆä½œēš„ę–¹å¼čæ›č”Œć€‚

č®ø多äŗŗęƒ³ēŸ„é“ęˆ‘ä»¬ę˜Æ否åÆ仄将čæ™äø€ä¼—包ęؔ型åŗ”ē”ØäŗŽę·±åŗ¦å­¦ä¹ ć€‚ę¢å„čƝčÆ“ļ¼Œęˆ‘ä»¬čƒ½å¦åœØ大众äø­č®­ē»ƒäø€äøŖ大型ē„žē»ē½‘ē»œļ¼Ÿå‰ę²æęØ”åž‹č®­ē»ƒę˜Æäŗŗē±»åŽ†å²äøŠč®”ē®—ęœ€åƆ集ēš„任劔之äø€ć€‚äøŽč®ø多 @home 锹ē›®äø€ę ·ļ¼Œē›®å‰ēš„ęˆęœ¬č¶…å‡ŗäŗ†åŖęœ‰ęœ€å¤§å‚äøŽč€…ę‰čƒ½ę‰æꋅēš„čŒƒå›“怂čæ™åÆčƒ½ä¼šé˜»ē¢ęœŖę„ēš„čæ›å±•ļ¼Œå› äøŗęˆ‘ä»¬ä¾čµ–äŗŽč¶Šę„č¶Šå°‘ēš„å…¬åøę„åÆ»ę‰¾ę–°ēš„ēŖē “怂čæ™ä¹Ÿå°†ęˆ‘们ēš„ AI ē³»ē»Ÿēš„ęŽ§åˆ¶ęƒé›†äø­åœØå°‘ę•°äŗŗꉋäø­ć€‚ę— č®ŗä½ åƹčæ™é”¹ęŠ€ęœÆēš„ēœ‹ę³•å¦‚何ļ¼Œčæ™éƒ½ę˜Æäø€äøŖ值得关ę³Øēš„ęœŖę„ć€‚

å¤§å¤šę•°ę‰¹čÆ„č€…é©³ę–„äŗ†åŽ»äø­åæƒåŒ–č®­ē»ƒēš„ęƒ³ę³•ļ¼Œč®¤äøŗäøŽå½“前ēš„č®­ē»ƒęŠ€ęœÆäøå…¼å®¹ć€‚ē„¶č€Œļ¼Œčæ™ē§č§‚ē‚¹å·²ē»č¶Šę„越čæ‡ę—¶ć€‚ę–°ēš„ꊀęœÆå·²ē»å‡ŗēŽ°ļ¼Œčƒ½å¤Ÿå‡å°‘节ē‚¹é—“ēš„通äæ”éœ€ę±‚ļ¼Œä»Žč€Œå…č®øåœØē½‘ē»œčæžęŽ„äøä½³ēš„č®¾å¤‡äøŠé«˜ę•ˆč®­ē»ƒć€‚čæ™äŗ›ęŠ€ęœÆåŒ…ę‹¬ DiLoCo 态 SWARM Parallelism 态 lo-fi å’Œå¼‚ęž„ēŽÆ境äø­åŸŗē”€ęؔ型ēš„åˆ†ę•£č®­ē»ƒē­‰å¤šäøŖꊀęœÆć€‚å…¶äø­č®øå¤šå…·ęœ‰å®¹é”™ę€§ļ¼Œå¹¶ę”ÆęŒå¼‚ęž„č®”ē®—怂čæ˜ęœ‰äø€äŗ›ę–°ęž¶ęž„äø“äøŗ去äø­åæƒåŒ–ē½‘ē»œč®¾č®”ļ¼ŒåŒ…ꋬ DiPaCo 和去äø­åæƒåŒ–ę··åˆäø“家ęØ”åž‹ć€‚

ęˆ‘ä»¬čæ˜ēœ‹åˆ°å„ē§åŠ åƆ原čÆ­å¼€å§‹ęˆē†Ÿļ¼Œä½æ得ē½‘ē»œčƒ½å¤ŸåœØå…ØēƒčŒƒå›“å†…åč°ƒčµ„ęŗć€‚čæ™äŗ›ęŠ€ęœÆę”ÆęŒę•°å­—č“§åøć€č·Ø境ę”Æä»˜å’Œé¢„ęµ‹åø‚åœŗē­‰åŗ”ē”Øåœŗę™Æ怂äøŽę—©ęœŸēš„åæ—ę„æ锹ē›®äøåŒļ¼Œčæ™äŗ›ē½‘ē»œčƒ½å¤Ÿę±‡čšęƒŠäŗŗēš„č®”ē®—čƒ½åŠ›ļ¼Œé€šåøøęƔē›®å‰č®¾ęƒ³ēš„ęœ€å¤§äŗ‘č®­ē»ƒé›†ē¾¤å¤§å‡ äøŖꕰ量ēŗ§ć€‚

čæ™äŗ›č¦ē“ å…±åŒęž„ęˆäŗ†ę–°ēš„ęØ”åž‹č®­ē»ƒčŒƒå¼ć€‚čæ™ē§čŒƒå¼å……分利ē”Øå…Øēƒēš„č®”ē®—资ęŗļ¼ŒåŒ…ę‹¬å¦‚ęžœčæžęŽ„åœØäø€čµ·åÆ仄ä½æē”Øēš„å¤§é‡č¾¹ē¼˜č®¾å¤‡ć€‚čæ™å°†é€ščæ‡å¼•å…„ꖰēš„ē«žäŗ‰ęœŗåˆ¶ę„é™ä½Žå¤§å¤šę•°č®­ē»ƒå·„ä½œč“Ÿč½½ēš„ęˆęœ¬ć€‚å®ƒčæ˜åÆä»„č§£é”ę–°ēš„č®­ē»ƒå½¢å¼ļ¼Œä½æ得ęؔ型开发变得协作和ęؔ块化ļ¼Œč€Œäøę˜Æå­¤ē«‹å’Œå•äø€ēš„ę–¹å¼ć€‚ęؔ型åÆ仄从大众äø­čŽ·å–č®”ē®—å’Œę•°ę®ļ¼Œå®žę—¶å­¦ä¹ ć€‚äøŖäŗŗåÆä»„ę‹„ęœ‰ä»–ä»¬ę‰€åˆ›å»ŗęؔ型ēš„äø€éƒØåˆ†ć€‚ē ”ē©¶äŗŗ员也åÆä»„é‡ę–°å…¬å¼€åˆ†äŗ«ę–°é¢–ēš„ē ”ē©¶ęˆęžœļ¼Œę— éœ€é€ščæ‡č“§åøåŒ–他们ēš„发ēŽ°ę„å¼„č”„é«˜ę˜‚ēš„č®”ē®—预ē®—怂

ęœ¬ęŠ„å‘Šč€ƒåƟäŗ†å¤§åž‹ęØ”åž‹č®­ē»ƒēš„ēŽ°ēŠ¶åŠē›øå…³ęˆęœ¬ć€‚å®ƒå›žé”¾äŗ†ä»„往ēš„分åøƒå¼č®”ē®—åŠŖ力ā€”ā€”从 SETI 到 Folding 再到 BOINCā€”ā€”仄ꭤäøŗēµę„ŸęŽ¢ē“¢ę›æ代č·Æå¾„ć€‚ęŠ„å‘Šč®Øč®ŗäŗ†åŽ»äø­åæƒåŒ–č®­ē»ƒēš„åŽ†å²ęŒ‘ęˆ˜ļ¼Œå¹¶č½¬å‘åÆčƒ½ęœ‰åŠ©äŗŽå…‹ęœčæ™äŗ›ęŒ‘ęˆ˜ēš„ęœ€ę–°ēŖē “ć€‚ęœ€åŽļ¼Œå®ƒę€»ē»“äŗ†ęœŖę„ēš„ęœŗ遇äøŽęŒ‘ęˆ˜ć€‚

前ę²æęØ”åž‹č®­ē»ƒēš„ēŽ°ēŠ¶

前ę²æęØ”åž‹č®­ē»ƒēš„ęˆęœ¬åƹ非大型参äøŽč€…č€Œč؀已ē»äøåÆę‰æå—ć€‚čæ™äøŖ趋åŠæ并äøę–°é²œļ¼Œä½†ę ¹ę®å®žé™…ęƒ…å†µļ¼Œęƒ…å†µę­£åœØå˜å¾—ę›“åŠ äø„重ļ¼Œå› äøŗ前ę²æ实éŖŒå®¤äøę–­ęŒ‘ęˆ˜ę‰©å±•å‡č®¾ć€‚ę®ęŠ„道ļ¼ŒOpenAI 今幓åœØč®­ē»ƒę–¹é¢čŠ±č“¹č¶…čæ‡ 30 äŗæē¾Žå…ƒć€‚Anthropic é¢„ęµ‹åˆ° 2025 幓ļ¼Œęˆ‘们将开始čæ›č”Œ 100 äŗæē¾Žå…ƒēš„č®­ē»ƒļ¼Œč€Œ 1000 äŗæē¾Žå…ƒēš„ęؔ型也äøä¼šå¤Ŗčæœć€‚

ę·±åŗ¦ē ”ē©¶ļ¼šåŠ åƆęæ€åŠ±ä¼—ē­¹äø€äøŖAIęؔ型ļ¼Œę˜Æ否åÆč”Œļ¼Ÿ

čæ™äø€č¶‹åŠæåÆ¼č‡“č”Œäøšēš„集äø­åŒ–ļ¼Œå› äøŗåŖęœ‰å°‘ę•°å‡ å®¶å…¬åøčƒ½å¤Ÿę‰æę‹…å‚äøŽēš„č“¹ē”Ø怂čæ™å¼•å‘äŗ†ęœŖę„ēš„ę øåæƒę”æē­–问题ā€”ā€”ęˆ‘ä»¬ę˜Æå¦čƒ½ęŽ„å—ę‰€ęœ‰é¢†å…ˆēš„ AI ē³»ē»Ÿē”±äø€äø¤å®¶å…¬åøęŽ§åˆ¶ēš„局面ļ¼Ÿčæ™ä¹Ÿé™åˆ¶äŗ†čæ›å±•é€Ÿåŗ¦ļ¼Œčæ™äø€ē‚¹åœØē ”ē©¶ē¤¾åŒŗäø­ę˜¾č€Œę˜“见ļ¼Œå› äøŗč¾ƒå°ēš„实éŖŒå®¤ę— ę³•ę‰æę‹…ę‰©å±•å®žéŖŒę‰€éœ€ēš„č®”ē®—资ęŗć€‚č”Œäøšé¢†åÆ¼č€…ä»¬ä¹Ÿå¤šę¬”ęåˆ°čæ™äø€ē‚¹ļ¼š

Meta ēš„ Joe Spisakļ¼šč¦ēœŸę­£ē†č§£ [ęؔ型] ꞶꞄēš„čƒ½åŠ›ļ¼Œä½ åæ…é”»åœØ规ęØ”äøŠčæ›č”ŒęŽ¢ē“¢ļ¼Œęˆ‘认äøŗčæ™ę­£ę˜Æ当前ē”Ÿę€ē³»ē»Ÿäø­ę‰€ē¼ŗ失ēš„ć€‚å¦‚ęžœä½ ēœ‹ēœ‹å­¦ęœÆē•Œā€”ā€”å­¦ęœÆē•Œęœ‰å¾ˆå¤šę°å‡ŗēš„äŗŗꉍļ¼Œä½†ä»–们ē¼ŗä¹č®”ē®—资ęŗēš„č®æ问ļ¼Œčæ™å°±ęˆäŗ†äø€äøŖ问题ļ¼Œå› äøŗä»–ä»¬ęœ‰čæ™äŗ›ä¼Ÿå¤§ēš„ęƒ³ę³•ļ¼Œå“ę²”ęœ‰ēœŸę­£ä»„ę‰€éœ€ę°“å¹³å®žēŽ°čæ™äŗ›ęƒ³ę³•ēš„é€”å¾„ć€‚

Together ēš„ Max Ryabininļ¼šåÆ¹ę˜‚č“µē”¬ä»¶ēš„éœ€ę±‚ē»™ē ”ē©¶ē¤¾åŒŗåø¦ę„äŗ†å¾ˆå¤§åŽ‹åŠ›ć€‚å¤§å¤šę•°ē ”ē©¶äŗŗå‘˜ę— ę³•å‚äøŽå¤§åž‹ē„žē»ē½‘ē»œå¼€å‘ļ¼Œå› äøŗčæ›č”Œåæ…要ēš„实éŖŒåÆ¹ä»–ä»¬č€ŒčØ€ęˆęœ¬čæ‡é«˜ć€‚å¦‚ęžœęˆ‘ä»¬ē»§ē»­é€ščæ‡ę‰©å¤§ęØ”åž‹č§„ęØ”ę„å¢žåŠ å…¶å¤§å°ļ¼Œęœ€ē»ˆčƒ½å¤Ÿčæ›č”Œē«ž

Google ēš„ Francois Cholletļ¼šęˆ‘们ēŸ„道大čÆ­č؀ęؔ型 (LLMs) 尚ęœŖ实ēŽ°é€šē”Øäŗŗå·„ę™ŗčƒ½ (AGI)怂äøŽę­¤åŒę—¶ļ¼Œęœ AGI 发展ēš„čæ›å±•å·²ē»åœę»žć€‚ęˆ‘ä»¬åœØ大čÆ­č؀ęؔ型äøŠę‰€é¢äø“ēš„å±€é™ę€§äøŽäŗ”幓前面äø“ēš„å±€é™ę€§å®Œå…Øē›øåŒć€‚ęˆ‘ä»¬éœ€č¦ę–°ēš„ęƒ³ę³•å’ŒēŖē “ć€‚ęˆ‘č®¤äøŗäø‹äø€äøŖēŖē “很åÆčƒ½ę„č‡Ŗ外éƒØ团队ļ¼Œč€Œę‰€ęœ‰å¤§åž‹å®žéŖŒå®¤åˆ™åæ™äŗŽč®­ē»ƒę›“大ēš„大čÆ­č؀ęØ”åž‹ć€‚ äø€äŗ›äŗŗåƹčæ™äŗ›ę‹…åæ§ęŒę€€ē–‘ꀁåŗ¦ļ¼Œč®¤äøŗē”¬ä»¶ę”¹čæ›å’Œäŗ‘č®”ē®—čµ„ęœ¬ę”Æå‡ŗå°†č§£å†³čæ™äøŖé—®é¢˜ć€‚ä½†čæ™ä¼¼ä¹Žäøå¤ŖēŽ°å®žć€‚äø€ę–¹é¢ļ¼Œåˆ°ęœ¬åå¹“ęœ«ļ¼Œę–°äø€ä»£ Nvidia čŠÆē‰‡ēš„ FLOP ę•°é‡å°†å¤§å¹…å¢žåŠ ļ¼ŒåÆčƒ½č¾¾åˆ°ä»Šå¤© H100 ēš„ 10 å€ć€‚čæ™å°†ä½æęƏ FLOP ēš„ä»·ę ¼äø‹é™ 80-90%ć€‚åŒę ·ļ¼Œé¢„č®”åˆ°ęœ¬åå¹“ęœ«ļ¼Œę€» FLOP 供åŗ”将增加ēŗ¦ 20 倍ļ¼ŒåŒę—¶ę”¹å–„ē½‘ē»œå’Œē›ø关åŸŗē”€č®¾ę–½ć€‚ę‰€ęœ‰čæ™äŗ›éƒ½å°†ęé«˜ęƏē¾Žå…ƒēš„č®­ē»ƒę•ˆēŽ‡ć€‚

ę·±åŗ¦ē ”ē©¶ļ¼šåŠ åƆęæ€åŠ±ä¼—ē­¹äø€äøŖAIęؔ型ļ¼Œę˜Æ否åÆč”Œļ¼Ÿ

ę„ęŗļ¼šSemiAnalysis AI Cloud TCO ęؔ型

äøŽę­¤åŒę—¶ļ¼Œę€» FLOP éœ€ę±‚ä¹Ÿå°†å¤§å¹…äøŠå‡ļ¼Œå› äøŗ实éŖŒå®¤åøŒęœ›čæ›äø€ę­„ę‰©å¤§č§„ęØ”ć€‚å¦‚ęžœęŒē»­åå¹“ēš„č®­ē»ƒč®”ē®—趋åŠæäæęŒäøå˜ļ¼Œåˆ° 2030 幓前ę²æč®­ē»ƒēš„ FLOPs é¢„č®”å°†č¾¾åˆ°ēŗ¦ 2e29怂čæ›č”Œčæ™ē§č§„ęØ”ēš„č®­ē»ƒå¤§ēŗ¦éœ€č¦ 2000 äø‡äøŖ H100 ē­‰ę•ˆ GPUļ¼Œä¾ę®å½“前ēš„č®­ē»ƒčæč”Œę—¶é—“和利ē”ØēŽ‡ć€‚å‡č®¾čæ™äø€é¢†åŸŸä»ęœ‰å¤šäøŖ前ę²æ实éŖŒå®¤ļ¼Œę€»ę‰€éœ€ēš„ FLOPS ę•°é‡å°†ä¼šę˜Æčæ™äøŖę•°å­—ēš„几倍ļ¼Œå› äøŗę•“ä½“ä¾›åŗ”å°†åœØå®ƒä»¬ä¹‹é—“åˆ†é…ć€‚EpochAI é¢„ęµ‹åˆ°é‚£ę—¶ęˆ‘ä»¬éœ€č¦å¤§ēŗ¦ 1 äŗæäøŖ H100 ē­‰ę•ˆ GPUļ¼Œēŗ¦äøŗ 2024 幓å‡ŗč“§é‡ēš„ 50 å€ć€‚SemiAnalysis 也做å‡ŗäŗ†ē±»ä¼¼ēš„é¢„ęµ‹ļ¼Œč®¤äøŗ前ę²æč®­ē»ƒéœ€ę±‚å’Œ GPU 供åŗ”åœØę­¤ęœŸé—“å¤§č‡“åŒę­„å¢žé•æ怂

äŗ§čƒ½ēŠ¶å†µåÆčƒ½ä¼šå› å¤šē§åŽŸå› å˜å¾—ꛓ加ē“§å¼ ć€‚例如ļ¼Œå¦‚ęžœåˆ¶é€ ē“¶é¢ˆå»¶čæŸäŗ†é¢„č®”ēš„å‡ŗ蓧å‘Øꜟļ¼Œčæ™ē§ęƒ…况ę˜Æåøø꜉ēš„äŗ‹ć€‚ęˆ–č€…å¦‚ęžœęˆ‘ä»¬ęœŖčƒ½ē”Ÿäŗ§č¶³å¤Ÿēš„čƒ½ęŗę„äøŗę•°ę®äø­åæƒä¾›ē”µć€‚åˆęˆ–č€…å¦‚ęžœęˆ‘ä»¬åœØ将čæ™äŗ›čƒ½ęŗę„ęŗčæžęŽ„到ē”µē½‘ę–¹é¢é‡åˆ°å›°éš¾ć€‚ęˆ–č€…å¦‚ęžœåÆ¹čµ„ęœ¬ę”Æå‡ŗēš„ę—„ē›Šå®”ęŸ„ęœ€ē»ˆåÆ¼č‡“č”Œäøšē¼©å‡č§„ęØ”ļ¼Œē­‰ē­‰å› ē“ ć€‚åœØęœ€å„½ēš„ęƒ…å†µäø‹ļ¼Œęˆ‘们当前ēš„ę–¹ę³•åŖčƒ½č®©å°‘ę•°å…¬åøē»§ē»­ęŽØåŠØē ”ē©¶ēš„čæ›å±•ļ¼Œč€Œčæ™åÆčƒ½čæ˜äøå¤Ÿć€‚

ę·±åŗ¦ē ”ē©¶ļ¼šåŠ åƆęæ€åŠ±ä¼—ē­¹äø€äøŖAIęؔ型ļ¼Œę˜Æ否åÆč”Œļ¼Ÿ

ę˜¾ē„¶ļ¼Œęˆ‘ä»¬éœ€č¦äø€ē§ę–°ēš„ę–¹ę³•ć€‚čæ™ē§ę–¹ę³•äøéœ€č¦äøę–­ę‰©å±•ę•°ę®äø­åæƒć€čµ„ęœ¬ę”Æå‡ŗå’Œčƒ½ęŗę¶ˆč€—ę„åÆ»ę‰¾äø‹äø€äøŖēŖē “ļ¼Œč€Œę˜Æé«˜ę•ˆåˆ©ē”Øęˆ‘ä»¬ēŽ°ęœ‰ēš„åŸŗē”€č®¾ę–½ļ¼Œčƒ½å¤Ÿéšē€éœ€ę±‚ēš„ę³¢åŠØēµę“»ę‰©å±•ć€‚čæ™å°†č®©ē ”ē©¶äø­ęœ‰ę›“多实éŖŒēš„åÆčƒ½ļ¼Œå› äøŗč®­ē»ƒčæč”Œäøå†éœ€č¦ē”®äæäŗæäø‡ē¾Žå…ƒč®”ē®—预ē®—ēš„ęŠ•čµ„å›žęŠ„怂äø€ę—¦ę‘†č„±čæ™äø€é™åˆ¶ļ¼Œęˆ‘们åÆä»„č¶…č¶Šå½“å‰ēš„大čÆ­č؀ęؔ型 (LLM) ęؔ式ļ¼Œę­£å¦‚č®ø多äŗŗꉀ认äøŗēš„ļ¼Œå®žēŽ°é€šē”Øäŗŗå·„ę™ŗčƒ½ (AGI) ę˜Æåæ…要ēš„怂äøŗäŗ†ē†č§£čæ™ē§ę›æä»£ę–¹ę”ˆåÆčƒ½å‘ˆēŽ°ēš„ę ·å­ļ¼Œęˆ‘们åÆ仄从čæ‡åŽ»ēš„分åøƒå¼č®”ē®—å®žč·µäø­ę±²å–ēµę„Ÿć€‚

ē¾¤ä½“č®”ē®—ļ¼šē®€å²

SETI@home åœØ 1999 å¹“ę™®åŠäŗ†čæ™äø€ę¦‚åæµļ¼Œå…č®øꕰē™¾äø‡å‚äøŽč€…åˆ†ęžę— ēŗæē”µäæ”号ļ¼ŒåÆ»ę‰¾å¤–ę˜Ÿę™ŗꅧ怂SETI 从 Arecibo ꜛčæœé•œę”¶é›†ē”µē£ę•°ę®ļ¼Œå°†å…¶åˆ†ęˆč‹„å¹²ę‰¹ę¬”ļ¼Œå¹¶é€ščæ‡äŗ’联ē½‘发送ē»™ē”Øęˆ·ć€‚ē”ØꈷåœØę—„åøøę“»åŠØäø­åˆ†ęžę•°ę®ļ¼Œå¹¶å°†ē»“ęžœå‘é€å›žć€‚ē”Øęˆ·ä¹‹é—“ę— éœ€ę²Ÿé€šļ¼Œę‰¹ę¬”åÆ仄ē‹¬ē«‹å®”ę øļ¼Œä»Žč€Œå®žēŽ°é«˜åŗ¦ēš„å¹¶č”Œå¤„ē†ć€‚åœØå…¶å·…å³°ę—¶åˆ»ļ¼ŒSETI@home ę‹„ęœ‰č¶…čæ‡ 500 äø‡åå‚äøŽč€…ļ¼Œå¤„ē†čƒ½åŠ›č¶…čæ‡å½“ę—¶ęœ€å¤§ēš„超ēŗ§č®”ē®—ęœŗć€‚å®ƒęœ€ē»ˆäŗŽ 2020 幓 3 ęœˆå…³é—­ļ¼Œä½†å®ƒēš„ęˆåŠŸęæ€åŠ±äŗ†éšåŽēš„åæ—ę„æč®”ē®—čæåŠØ怂

Folding@home åœØ 2000 幓延ē»­äŗ†čæ™äø€ē†åæµļ¼Œåˆ©ē”Øč¾¹ē¼˜č®”ē®—ęØ”ę‹Ÿé˜æ尔čŒØ굷默ē—…态ē™Œē—‡å’Œåø•é‡‘ę£®ē—…ē­‰ē–¾ē—…äø­ēš„蛋ē™½č“ØęŠ˜å ć€‚åæ—ę„æ者åœØäøŖäŗŗē”µč„‘ēš„ē©ŗé—²ę—¶é—“čæ›č”Œč›‹ē™½č“ØęØ”ę‹Ÿļ¼Œåø®åŠ©ē ”ē©¶äŗŗ员ē ”ē©¶č›‹ē™½č“Ø如何错čÆÆęŠ˜å å¹¶åÆ¼č‡“ē–¾ē—…怂åœØ其历史ēš„äøåŒę—¶é—“ꮵļ¼Œå…¶č®”ē®—čƒ½åŠ›č¶…čæ‡äŗ†å½“ę—¶ęœ€å¤§ēš„超ēŗ§č®”ē®—ęœŗļ¼ŒåŒ…ꋬåœØ 2000 å¹“ä»£åŽęœŸå’Œ COVID ęœŸé—“ļ¼Œå½“ę—¶å®ƒęˆäøŗē¬¬äø€äøŖ超čæ‡äø€ exaFLOPS ēš„分åøƒå¼č®”ē®—锹ē›®ć€‚č‡Ŗꈐē«‹ä»„ę„ļ¼ŒFolding ēš„ē ”ē©¶äŗŗ员已发č”Ø超čæ‡ 200 ēÆ‡åŒč”ŒčÆ„å®”č®ŗꖇļ¼ŒęƏäø€ēÆ‡éƒ½ä¾čµ–äŗŽåæ—ę„æ者ēš„č®”ē®—čƒ½åŠ›ć€‚

ä¼Æå…‹åˆ©å¼€ę”¾ē½‘ē»œč®”ē®—åŸŗē”€č®¾ę–½ (BOINC) åœØ 2002 å¹“ę™®åŠäŗ†čæ™äø€ē†åæµļ¼Œęä¾›äŗ†äø€äøŖä¼—åŒ…č®”ē®—平台ļ¼Œē”ØäŗŽå„ē§ē ”ē©¶é”¹ē›®ć€‚它ę”Æꌁ SETI@home 和 Folding@home ē­‰å¤šäøŖ锹ē›®ļ¼Œä»„及åœØ天体ē‰©ē†å­¦ć€åˆ†å­ē”Ÿē‰©å­¦ć€ę•°å­¦å’ŒåƆē å­¦ē­‰é¢†åŸŸēš„ę–°é”¹ē›®ć€‚到 2024 幓ļ¼ŒBOINC 列å‡ŗäŗ† 30 äøŖę­£åœØčæ›č”Œēš„锹ē›®ļ¼Œä»„及čæ‘ 1,000 ēƇ发č”Øēš„ē§‘å­¦č®ŗꖇļ¼Œå‡åˆ©ē”Øå…¶č®”ē®—ē½‘ē»œäŗ§ē”Ÿć€‚

åœØē§‘ē ”领域之外ļ¼Œåæ—ę„æč®”ē®—č¢«ē”ØäŗŽč®­ē»ƒå›“ę£‹ļ¼ˆLeelaZero态KataGoļ¼‰å’Œå›½é™…č±”ę£‹ļ¼ˆStockfish态LeelaChessZeroļ¼‰ē­‰ęøøęˆå¼•ę“Žć€‚LeelaZero 通čæ‡åæ—ę„æč®”ē®—从 2017 幓到 2021 幓čæ›č”Œč®­ē»ƒļ¼Œä½æå…¶čƒ½å¤ŸäøŽč‡Ŗå·±äø‹ę£‹č¶…čæ‡äø€åƒäø‡å±€ļ¼Œåˆ›é€ äŗ†ä»Šå¤©ęœ€å¼ŗēš„å›“ę£‹å¼•ę“Žä¹‹äø€ć€‚ē±»ä¼¼åœ°ļ¼ŒStockfish č‡Ŗ 2013 å¹“ä»„ę„äø€ē›“åœØåæ—ę„æē½‘ē»œäøŠęŒē»­č®­ē»ƒļ¼Œä½æå…¶ęˆäøŗęœ€å—ę¬¢čæŽå’Œęœ€å¼ŗ大ēš„å›½é™…č±”ę£‹å¼•ę“Žä¹‹äø€ć€‚

关äŗŽę·±åŗ¦å­¦ä¹ ēš„ęŒ‘ęˆ˜

但ę˜Æęˆ‘ä»¬čƒ½å¦å°†čæ™äø€ęؔ型åŗ”ē”ØäŗŽę·±åŗ¦å­¦ä¹ ļ¼Ÿęˆ‘们ę˜Æ否åÆ仄将äø–ē•Œå„地ēš„č¾¹ē¼˜č®¾å¤‡č”ē½‘ļ¼Œåˆ›å»ŗäø€äøŖä½Žęˆęœ¬ēš„å…¬å…±č®­ē»ƒé›†ē¾¤ļ¼Ÿę¶ˆč“¹č€…ē”¬ä»¶ā€”ā€”ä»Žč‹¹ęžœē¬”č®°ęœ¬åˆ° Nvidia ęøøęˆę˜¾å”ā€”ā€”åœØę·±åŗ¦å­¦ä¹ ę–¹é¢ēš„ę€§čƒ½č¶Šę„越å‡ŗč‰²ć€‚åœØč®øå¤šęƒ…å†µäø‹ļ¼Œčæ™äŗ›č®¾å¤‡ēš„ę€§čƒ½ē”šč‡³č¶…čæ‡äŗ†ę•°ę®äø­åæƒę˜¾å”ēš„ęƏē¾Žå…ƒę€§čƒ½ć€‚

ę·±åŗ¦ē ”ē©¶ļ¼šåŠ åƆęæ€åŠ±ä¼—ē­¹äø€äøŖAIęؔ型ļ¼Œę˜Æ否åÆč”Œļ¼Ÿ

ē„¶č€Œļ¼Œč¦ęœ‰ę•ˆåˆ©ē”Øčæ™äŗ›čµ„ęŗåœØ分åøƒå¼ēŽÆ境äø­ļ¼Œęˆ‘ä»¬éœ€č¦å…‹ęœå„ē§ęŒ‘ęˆ˜ć€‚

首先ļ¼Œå½“前ēš„分åøƒå¼č®­ē»ƒęŠ€ęœÆå‡č®¾čŠ‚ē‚¹ä¹‹é—“存åœØ频ē¹ēš„通äæ”怂

å½“å‰ęœ€å…ˆčæ›ēš„ęؔ型已ē»å˜å¾—å¦‚ę­¤åŗžå¤§ļ¼Œä»„č‡³äŗŽč®­ē»ƒåæ…é”»č¢«ę‹†åˆ†åˆ°ę•°åƒäøŖ GPU ä¹‹é—“ć€‚čæ™ę˜Æ通čæ‡å¤šē§å¹¶č”ŒåŒ–ꊀęœÆę„å®žēŽ°ēš„ļ¼Œé€šåøøę˜ÆåœØåÆē”Øēš„ GPU ä¹‹é—“ę‹†åˆ†ęØ”åž‹ć€ę•°ę®é›†ęˆ–åŒę—¶ę‹†åˆ†äø¤č€…怂čæ™é€šåøøéœ€č¦é«˜åø¦å®½å’Œä½Žå»¶čæŸēš„ē½‘ē»œļ¼Œå¦åˆ™čŠ‚ē‚¹å°†é—²ē½®ļ¼Œē­‰å¾…ę•°ę®åˆ°ę„怂

例如ļ¼Œåˆ†åøƒå¼ę•°ę®å¹¶č”ŒęŠ€ęœÆ (DDP) å°†ę•°ę®é›†åˆ†é…åˆ°å„äøŖ GPU äøŠļ¼ŒęƏäøŖ GPU åœØ其ē‰¹å®šēš„ę•°ę®ē‰‡ę®µäøŠč®­ē»ƒå®Œę•“ēš„ęؔ型ļ¼Œē„¶åŽå…±äŗ«å…¶ę¢Æåŗ¦ę›“ꖰļ¼Œä»„ē”Ÿęˆå„äøŖę­„éŖ¤ēš„ę–°ęØ”åž‹ęƒé‡ć€‚čæ™éœ€č¦ē›øåÆ¹ęœ‰é™ēš„通äæ”开销ļ¼Œå› äøŗ节ē‚¹ä»…åœØęÆę¬”åå‘ä¼ ę’­åŽå…±äŗ«ę¢Æåŗ¦ę›“ꖰļ¼Œå¹¶äø”集体通äæ”ę“ä½œåÆ仄éƒØ分äøŽč®”ē®—é‡å ć€‚ē„¶č€Œļ¼Œčæ™ē§ę–¹ę³•ä»…适ē”ØäŗŽč¾ƒå°ēš„ęؔ型ļ¼Œå› äøŗå®ƒč¦ę±‚ęƏäøŖ GPU åœØ内存äø­å­˜å‚Øę•“äøŖęؔ型ēš„ęƒé‡ć€ęæ€ę“»å€¼å’Œä¼˜åŒ–å™ØēŠ¶ę€ć€‚例如ļ¼ŒGPT-4 åœØč®­ē»ƒę—¶éœ€č¦č¶…čæ‡ 10TB ēš„内存ļ¼Œč€Œå•äøŖ H100 ä»…ęœ‰ 80GB怂

äøŗäŗ†č§£å†³čæ™äø€é—®é¢˜ļ¼Œęˆ‘们čæ˜ä½æē”Ø各ē§ęŠ€ęœÆåƹęؔ型čæ›č”Œę‹†åˆ†ļ¼Œä»„ä¾æåœØ GPU 之闓čæ›č”Œåˆ†é…ć€‚例如ļ¼Œå¼ é‡å¹¶č”ŒęŠ€ęœÆ (tensor parallelism) åœØ单äøŖå±‚å†…ę‹†åˆ†å„äøŖꝃ重ļ¼Œä½æ得ęƏäøŖ GPU ę‰§č”Œåæ…要ēš„ę“ä½œå¹¶å°†č¾“å‡ŗ传递ē»™å…¶ä»–ēš„ GPU怂čæ™é™ä½Žäŗ†ęƏäøŖ GPU ēš„å†…å­˜éœ€ę±‚ļ¼Œä½†éœ€č¦å®ƒä»¬ä¹‹é—“čæ›č”ŒęŒē»­ēš„通äæ”å¾€ę„ļ¼Œå› ę­¤éœ€č¦é«˜åø¦å®½ć€ä½Žå»¶čæŸēš„čæžęŽ„ä»„ęé«˜ę•ˆēŽ‡ć€‚

굁갓ēŗæå¹¶č”ŒęŠ€ęœÆ (pipeline parallelism) 将ęؔ型ēš„层分配到各äøŖ GPU äøŠļ¼ŒęƏäøŖ GPU ę‰§č”Œå…¶å·„ä½œå¹¶äøŽęµę°“ēŗæäø­ēš„äø‹äø€äøŖ GPU 共äŗ«ę›“ę–°ć€‚å°½ē®”čæ™ę‰€éœ€ēš„通äæ”量ęÆ”å¼ é‡å¹¶č”Œę›“å°‘ļ¼Œä½†åÆčƒ½ä¼šå‡ŗēŽ°ć€Œę°”ę³”怍ļ¼ˆä¾‹å¦‚ļ¼Œē©ŗé—²ę—¶é—“ļ¼‰ļ¼ŒåœØčæ™ē§ęƒ…况äø‹ļ¼Œä½äŗŽęµę°“ēŗæ后面ēš„ GPU 会ē­‰å¾…ę„č‡Ŗ前面 GPU ēš„äæ”ęÆļ¼Œä»„ä¾æå¼€å§‹å…¶å·„ä½œć€‚

äøŗäŗ†č§£å†³čæ™äŗ›ęŒ‘ęˆ˜ļ¼Œå‘展å‡ŗ各ē§ęŠ€ęœÆć€‚ä¾‹å¦‚ļ¼ŒZeROļ¼ˆé›¶å†—余优化å™Øļ¼‰ę˜Æäø€ē§å†…å­˜ä¼˜åŒ–ęŠ€ęœÆļ¼Œå®ƒé€ščæ‡å¢žåŠ é€šäæ”å¼€é”€ę„å‡å°‘å†…å­˜ä½æē”Øļ¼Œä»Žč€Œä½æę›“å¤§ēš„ęØ”åž‹čƒ½å¤ŸåœØē‰¹å®šč®¾å¤‡äøŠčæ›č”Œč®­ē»ƒć€‚ZeRO 通čæ‡åœØ GPU 之闓分割ęØ”åž‹å‚ę•°ć€ę¢Æåŗ¦å’Œä¼˜åŒ–å™ØēŠ¶ę€ę„é™ä½Žå†…å­˜éœ€ę±‚ļ¼Œä½†ä¾čµ–äŗŽå¤§é‡ēš„通äæ”ļ¼Œä»„ä¾æč®¾å¤‡čƒ½å¤ŸčŽ·å–åˆ†å‰²ēš„ę•°ę®ć€‚å®ƒę˜Æęµč”ŒęŠ€ęœÆ如完å…Ø分ē‰‡ę•°ę®å¹¶č”Œ (FSDP) 和 DeepSpeed ēš„åŸŗē”€ę–¹ę³•ć€‚

čæ™äŗ›ęŠ€ęœÆ通åøøåœØ大ęØ”åž‹č®­ē»ƒäø­ē»“合ä½æē”Øļ¼Œä»„ęœ€å¤§åŒ–čµ„ęŗēš„利ē”ØꕈēŽ‡ļ¼Œčæ™č¢«ē§°äøŗ 3D å¹¶č”Œć€‚åœØčæ™ē§é…ē½®äø­ļ¼Œå¼ é‡å¹¶č”ŒęŠ€ęœÆ (tensor parallelism) 通åøøē”ØäŗŽåœØ单äøŖęœåŠ”å™Øå†…å°†ęƒé‡åˆ†é…åˆ°å„äøŖ GPU äøŠļ¼Œå› äøŗåœØęƏäøŖč¢«åˆ†å‰²ēš„å±‚ä¹‹é—“éœ€č¦å¤§é‡é€šäæ”怂ē„¶åŽļ¼Œęµę°“ēŗæå¹¶č”ŒęŠ€ęœÆ (pipeline parallelism) č¢«ē”Øę„åœØäøåŒęœåŠ”å™Ø之闓ļ¼ˆä½†åœØę•°ę®äø­åæƒēš„同äø€å²›å±æ内ļ¼‰åˆ†é…å±‚ļ¼Œå› äøŗå®ƒę‰€éœ€ēš„通äæ”é‡č¾ƒå°‘ć€‚ęŽ„ē€ļ¼Œę•°ę®å¹¶č”ŒęŠ€ęœÆ (data parallelism) ęˆ–å®Œå…Ø分ē‰‡ę•°ę®å¹¶č”ŒęŠ€ęœÆ (FSDP) č¢«ē”Øę„åœØäøåŒęœåŠ”å™Ø岛å±æä¹‹é—“ę‹†åˆ†ę•°ę®é›†ļ¼Œå› äøŗ它åÆ仄通čæ‡å¼‚ę­„共äŗ«ę›“ę–°å’Œ / ęˆ–åŽ‹ē¼©ę¢Æåŗ¦ę„适åŗ”ꛓé•æēš„ē½‘ē»œå»¶čæŸć€‚Meta ä½æē”Øčæ™ē§ē»„åˆę–¹ę³•ę„č®­ē»ƒ Llama 3.1ļ¼Œå¦‚äø‹é¢ēš„图ē¤ŗꉀē¤ŗ怂

čæ™äŗ›ę–¹ę³•ē»™åŽ»äø­åæƒåŒ–č®­ē»ƒē½‘ē»œåø¦ę„äŗ†ę øåæƒęŒ‘ęˆ˜ļ¼Œčæ™äŗ›ē½‘ē»œä¾čµ–äŗŽé€ščæ‡ļ¼ˆé€Ÿåŗ¦ę›“ę…¢äø”ę³¢åŠØę›“å¤§ēš„ļ¼‰ę¶ˆč“¹ēŗ§äŗ’联ē½‘čæžęŽ„ēš„č®¾å¤‡ć€‚åœØčæ™ē§ēŽÆ境äø­ļ¼Œé€šäæ”ęˆęœ¬å¾ˆåæ«å°±ä¼šč¶…čæ‡č¾¹ē¼˜č®”ē®—åø¦ę„ēš„ꔶē›Šļ¼Œå› äøŗč®¾å¤‡é€šåøøę˜Æē©ŗ闲ēš„ļ¼Œē­‰å¾…ę•°ę®åˆ°č¾¾ć€‚ä»„äø€äøŖē®€å•ēš„例子čÆ“ę˜Žļ¼Œåˆ†åøƒå¼ę•°ę®å¹¶č”Œč®­ē»ƒäø€äøŖå…·ęœ‰ 10 äŗæå‚ę•°ēš„半ē²¾åŗ¦ęؔ型ļ¼ŒęƏäøŖ GPU åœØęƏäøŖä¼˜åŒ–ę­„éŖ¤äø­éœ€č¦å…±äŗ« 2GB ēš„ę•°ę®ć€‚ä»„å…ø型ēš„äŗ’联ē½‘åø¦å®½ļ¼ˆä¾‹å¦‚ 1 千兆位ęƏē§’ļ¼‰äøŗ例ļ¼Œå‡č®¾č®”ē®—äøŽé€šäæ”äøé‡å ļ¼Œä¼ č¾“ę¢Æåŗ¦ę›“ę–°č‡³å°‘éœ€č¦ 16 ē§’ļ¼ŒåÆ¼č‡“ę˜¾č‘—ēš„ē©ŗé—²ć€‚åƒå¼ é‡å¹¶č”ŒęŠ€ęœÆ (tensor parallelism) čæ™ę ·ēš„ꊀęœÆļ¼ˆéœ€č¦ę›“多ēš„通äæ”ļ¼‰å½“ē„¶ä¼šč”ØēŽ°å¾—ꛓē³Ÿć€‚

å…¶ę¬”ļ¼Œå½“前ēš„č®­ē»ƒęŠ€ęœÆē¼ŗä¹å®¹é”™čƒ½åŠ›ć€‚åƒä»»ä½•åˆ†åøƒå¼ē³»ē»Ÿäø€ę ·ļ¼Œéšē€č§„ęØ”ēš„增加ļ¼Œč®­ē»ƒé›†ē¾¤å˜å¾—ę›“å®¹ę˜“å‘ē”Ÿę•…éšœć€‚ē„¶č€Œļ¼Œčæ™äø€é—®é¢˜åœØč®­ē»ƒäø­ę›“加äø„重ļ¼Œå› äøŗęˆ‘ä»¬ē›®å‰ēš„ꊀęœÆäø»č¦ę˜ÆåŒę­„ēš„ļ¼Œčæ™ę„å‘³ē€ GPU åæ…é”»ååŒå·„ä½œä»„å®ŒęˆęØ”åž‹č®­ē»ƒć€‚ęˆåƒäøŠäø‡ēš„ GPU äø­å•äøŖ GPU ēš„ę•…éšœä¼šåÆ¼č‡“ę•“äøŖč®­ē»ƒčæ‡ēØ‹åœę­¢ļ¼Œčæ«ä½æ其他 GPU ä»Žå¤“å¼€å§‹č®­ē»ƒć€‚åœØꟐäŗ›ęƒ…况äø‹ļ¼ŒGPU 并äøä¼šå®Œå…Øꕅ障ļ¼Œč€Œę˜Æē”±äŗŽå„ē§åŽŸå› å˜å¾—čæŸē¼“ļ¼Œčæ›č€Œå‡ę…¢é›†ē¾¤äø­ęˆåƒäøŠäø‡å…¶ä»– GPU ēš„速åŗ¦ć€‚č€ƒč™‘åˆ°å½“ä»Šé›†ē¾¤ēš„规ęØ”ļ¼Œčæ™åÆčƒ½ę„å‘³ē€ę•°åƒäø‡åˆ°ę•°äŗæē¾Žå…ƒēš„é¢å¤–ęˆęœ¬ć€‚

Meta åœØ他们ēš„ Llama č®­ē»ƒčæ‡ē؋äø­čƦē»†é˜čæ°äŗ†čæ™äŗ›é—®é¢˜ļ¼Œä»–们ē»åŽ†äŗ†č¶…čæ‡ 400 ę¬”ę„å¤–äø­ę–­ļ¼Œå¹³å‡ęƏ天ēŗ¦ 8 ꬔäø­ę–­ć€‚čæ™äŗ›äø­ę–­äø»č¦å½’å› äŗŽē”¬ä»¶é—®é¢˜ļ¼Œä¾‹å¦‚ GPU ꈖäø»ęœŗē”¬ä»¶ę•…éšœć€‚čæ™åÆ¼č‡“ä»–ä»¬ēš„ GPU 利ē”ØēŽ‡ä»…äøŗ 38-43%怂OpenAI åœØ GPT-4 ēš„č®­ē»ƒčæ‡ē؋äø­č”ØēŽ°ę›“å·®ļ¼Œä»…äøŗ 32-36%ļ¼Œčæ™ä¹Ÿę˜Æē”±äŗŽč®­ē»ƒčæ‡ē؋äø­ę•…障频ē¹ć€‚

ę¢å„čƝčÆ“ļ¼Œå‰ę²æ实éŖŒå®¤ä»¬åœØ完å…Ø优化ēš„ēŽÆ境äø­ļ¼ˆåŒ…ę‹¬åŒč“Øēš„ć€ęœ€å…ˆčæ›ēš„ē”¬ä»¶ć€ē½‘ē»œć€ē”µęŗå’Œå†·å“ē³»ē»Ÿļ¼‰čæ›č”Œč®­ē»ƒę—¶ļ¼Œä»ē„¶éš¾ä»„č¾¾åˆ° 40% ēš„利ē”ØēŽ‡ć€‚čæ™äø»č¦å½’å› äŗŽē”¬ä»¶ę•…障和ē½‘ē»œé—®é¢˜ļ¼Œč€ŒåœØč¾¹ē¼˜č®­ē»ƒēŽÆ境äø­ļ¼Œčæ™äŗ›é—®é¢˜ä¼šę›“加äø„重ļ¼Œå› äøŗč®¾å¤‡åœØ处ē†čƒ½åŠ›ć€åø¦å®½ć€å»¶čæŸå’ŒåÆé ę€§ę–¹é¢å­˜åœØäøå‡č””怂ꛓäøē”ØčÆ“ļ¼ŒåŽ»äø­åæƒåŒ–ē½‘ē»œę˜“å—ę¶ę„č”Œäøŗ者ēš„侵害ļ¼Œä»–们åÆčƒ½å‡ŗäŗŽå„ē§åŽŸå› čƕ图ē “åę•“ä½“é”¹ē›®ęˆ–åœØē‰¹å®šå·„ä½œč“Ÿč½½äøŠä½œå¼Šć€‚即ä½æę˜ÆēŗÆåæ—ę„æ者ē½‘ē»œ SETI@homeļ¼Œä¹Ÿę›¾å‡ŗēŽ°čæ‡äøåŒå‚äøŽč€…ēš„作弊ēŽ°č±”怂

ē¬¬äø‰ļ¼Œå‰ę²æęØ”åž‹č®­ē»ƒéœ€č¦å¤§č§„ęØ”ēš„č®”ē®—čƒ½åŠ›ć€‚č™½ē„¶åƒ SETI 和 Folding čæ™ę ·ēš„锹ē›®č¾¾åˆ°äŗ†ä»¤äŗŗå°č±”ę·±åˆ»ēš„规ęØ”ļ¼Œä½†äøŽå½“今前ę²æč®­ē»ƒę‰€éœ€ēš„č®”ē®—čƒ½åŠ›ē›øęƔļ¼Œå®ƒä»¬ē›øå½¢č§ē»Œć€‚GPT-4 åœØäø€äøŖē”± 20,000 äøŖ A100 ē»„ęˆēš„集ē¾¤äøŠč®­ē»ƒļ¼Œå…¶å³°å€¼åžåé‡äøŗ半ē²¾åŗ¦ēš„ 6.28 ExaFLOPS怂čæ™ęƔ Folding@home åœØå…¶å³°å€¼ę—¶ēš„č®”ē®—čƒ½åŠ›å¤šå‡ŗäø‰å€ć€‚Llama 405b ä½æē”Ø 16,000 äøŖ H100 čæ›č”Œč®­ē»ƒļ¼Œå³°å€¼åžåé‡äøŗ 15.8 ExaFLOPSļ¼Œę˜Æ Folding 峰值ēš„ 7 å€ć€‚éšē€å¤šäøŖ实éŖŒå®¤č®”åˆ’ęž„å»ŗ超čæ‡ 100,000 äøŖ H100 ēš„集ē¾¤ļ¼Œčæ™äø€å·®č·åŖ会čæ›äø€ę­„ę‰©å¤§ļ¼ŒęƏäøŖ集ē¾¤ēš„č®”ē®—čƒ½åŠ›é«˜č¾¾ęƒŠäŗŗēš„ 99 ExaFLOPS怂

ę·±åŗ¦ē ”ē©¶ļ¼šåŠ åƆęæ€åŠ±ä¼—ē­¹äø€äøŖAIęؔ型ļ¼Œę˜Æ否åÆč”Œļ¼Ÿ

čæ™å¾ˆęœ‰é“ē†ļ¼Œå› äøŗ @home 锹ē›®ę˜Æåæ—ę„æ者驱åŠØēš„怂蓔ēŒ®č€…ęčµ äŗ†ä»–们ēš„内存和处ē†å™Øå‘Øꜟļ¼Œå¹¶ę‰æꋅäŗ†ē›øå…³ęˆęœ¬ć€‚čæ™č‡Ŗē„¶é™åˆ¶äŗ†å®ƒä»¬ē›øåƹäŗŽå•†äøšé”¹ē›®ēš„规ęØ”ć€‚

꜀čæ‘ēš„čæ›å±•

č™½ē„¶čæ™äŗ›é—®é¢˜åœØ历史äøŠäø€ē›“å›°ę‰°ē€åŽ»äø­åæƒåŒ–č®­ē»ƒå·„作ļ¼Œä½†å®ƒä»¬ä¼¼ä¹Žäøå†äøåÆé€¾č¶Šć€‚ę–°ēš„č®­ē»ƒęŠ€ęœÆå·²ē»å‡ŗēŽ°ļ¼Œčƒ½å¤Ÿå‡å°‘节ē‚¹é—“ēš„通äæ”éœ€ę±‚ļ¼Œä»Žč€ŒåœØäŗ’联ē½‘čæžęŽ„ēš„č®¾å¤‡äøŠčæ›č”Œé«˜ę•ˆč®­ē»ƒć€‚čæ™äŗ›ęŠ€ęœÆ很多ęŗč‡Ŗ大型实éŖŒå®¤ļ¼Œå®ƒä»¬åøŒęœ›äøŗęØ”åž‹č®­ē»ƒå¢žåŠ ę›“大ēš„规ęØ”ļ¼Œå› ę­¤éœ€č¦č·Øę•°ę®äø­åæƒēš„é«˜ę•ˆé€šäæ”ꊀęœÆć€‚ęˆ‘ä»¬čæ˜ēœ‹åˆ°äŗ†å®¹é”™č®­ē»ƒę–¹ę³•å’ŒåŠ åƆęæ€åŠ±ē³»ē»Ÿēš„čæ›å±•ļ¼Œčæ™äŗ›ę–¹ę³•åÆ仄ę”ÆęŒę›“å¤§č§„ęØ”ēš„č®­ē»ƒåœØč¾¹ē¼˜ēŽÆ境äø­čæ›č”Œć€‚

é«˜ę•ˆé€šäæ”ꊀęœÆ

DiLoCo ę˜Æč°·ę­Œčæ‘ęœŸēš„ē ”ē©¶ļ¼Œå®ƒé€ščæ‡åœØč®¾å¤‡é—“ä¼ é€’ę›“ę–°ēš„ęؔ型ēŠ¶ę€ä¹‹å‰čæ›č”Œęœ¬åœ°ä¼˜åŒ–ļ¼Œä»Žč€Œå‡å°‘äŗ†é€šäæ”å¼€é”€ć€‚ä»–ä»¬ēš„ę–¹ę³•ļ¼ˆåŸŗäŗŽę—©ęœŸēš„č”é‚¦å­¦ä¹ ē ”ē©¶ļ¼‰ę˜¾ē¤ŗå‡ŗäøŽä¼ ē»ŸåŒę­„č®­ē»ƒē›ø当ēš„ę•ˆęžœļ¼ŒåŒę—¶čŠ‚ē‚¹ä¹‹é—“ēš„通äæ”量降低äŗ† 500 å€ć€‚ę­¤åŽļ¼ŒčÆ„ę–¹ę³•å·²č¢«å…¶ä»–ē ”ē©¶č€…复制ļ¼Œå¹¶ę‰©å±•č‡³č®­ē»ƒę›“大ęؔ型ļ¼ˆč¶…čæ‡ 10 äŗæäøŖå‚ę•°ļ¼‰ć€‚它čæ˜ę‰©å±•åˆ°å¼‚ę­„č®­ē»ƒļ¼Œčæ™ę„å‘³ē€čŠ‚ē‚¹åÆ仄åœØäøåŒę—¶é—“共äŗ«ę¢Æåŗ¦ę›“ꖰļ¼Œč€Œäøę˜Æäø€ę¬”ę€§å…±äŗ«ę‰€ęœ‰ę›“ꖰ怂čæ™ę›“儽地适åŗ”äŗ†å¤„ē†čƒ½åŠ›å’Œē½‘ē»œé€Ÿåŗ¦å„异ēš„č¾¹ē¼˜ē”¬ä»¶ć€‚

å…¶ä»–ę•°ę®å¹¶č”Œę–¹ę³•ļ¼Œå¦‚ lo-fi 和 DisTrOļ¼Œę—ØåœØčæ›äø€ę­„减少通äæ”ęˆęœ¬ć€‚Lo-fi ꏐå‡ŗäŗ†å®Œå…Øęœ¬åœ°å¾®č°ƒēš„ę–¹ę³•ļ¼Œčæ™ę„å‘³ē€čŠ‚ē‚¹ē‹¬ē«‹č®­ē»ƒļ¼ŒåŖåœØęœ€åŽä¼ é€’ęƒé‡ć€‚čæ™ē§ę–¹ę³•åœØå¾®č°ƒč¶…čæ‡ 10 äŗæå‚ę•°ēš„čÆ­č؀ęØ”åž‹ę—¶ļ¼Œę€§čƒ½äøŽåŸŗ准ē›ø当ļ¼ŒåŒę—¶å®Œå…Øę¶ˆé™¤äŗ†é€šäæ”å¼€é”€ć€‚åœØäø€ä»½åˆę­„ęŠ„å‘Šäø­ļ¼ŒDisTrO 声ē§°é‡‡ē”Øäŗ†äø€ē§ę–°åž‹ēš„分åøƒå¼ä¼˜åŒ–å™Øļ¼Œä»–们认äøŗåÆ仄将通äæ”éœ€ę±‚é™ä½Žå››åˆ°äŗ”äøŖꕰ量ēŗ§ļ¼Œå°½ē®”čÆ„ę–¹ę³•å°šå¾…ē”®č®¤ć€‚

ꖰēš„ęØ”åž‹å¹¶č”Œę–¹ę³•ä¹Ÿå·²ē»å‡ŗēŽ°ļ¼Œčæ™ä½æ得实ēŽ°ę›“大ēš„规ęØ”ęˆäøŗåÆčƒ½ć€‚DiPaCoļ¼ˆåŒę ·ę„č‡Ŗč°·ę­Œļ¼‰å°†ęؔ型划分äøŗ多äøŖęؔ块ļ¼ŒęƏäøŖęؔ块包含äøåŒēš„äø“家ęؔ块ļ¼Œä»„ä¾æäŗŽē‰¹å®šä»»åŠ”ēš„č®­ē»ƒć€‚ē„¶åŽļ¼Œč®­ē»ƒę•°ę®é€ščæ‡ć€Œč·Æå¾„ć€čæ›č”Œåˆ†ē‰‡ļ¼Œčæ™äŗ›č·Æ径ę˜ÆęƏäøŖę•°ę®ę ·ęœ¬åƹåŗ”ēš„äø“家åŗåˆ—怂ē»™å®šäø€äøŖ分ē‰‡ļ¼ŒęƏäøŖå·„ä½œč€…å‡ ä¹ŽåÆ仄ē‹¬ē«‹č®­ē»ƒē‰¹å®šēš„č·Æ径ļ¼Œé™¤äŗ†å…±äŗ«ęØ”å—ę‰€éœ€ēš„通äæ”ļ¼Œčæ™éƒØ分ē”± DiLoCo 处ē†ć€‚čæ™ē§ęž¶ęž„将十äŗæå‚ę•°ęؔ型ēš„č®­ē»ƒę—¶é—“减少äŗ†č¶…čæ‡äø€åŠć€‚

SWARM å¹¶č”Œę€§å’Œå¼‚ęž„ēŽÆ境äø­åŸŗē”€ęؔ型ēš„去äø­åæƒåŒ–č®­ē»ƒ (DTFMHE) ä¹Ÿęå‡ŗäŗ†ęØ”åž‹å¹¶č”Œēš„ę–¹ę³•ļ¼Œä»„åœØå¼‚ęž„ēŽÆ境äø­å®žēŽ°å¤§ęØ”åž‹č®­ē»ƒć€‚SWARM 发ēŽ°ļ¼Œéšē€ęØ”åž‹č§„ęØ”ēš„增加ļ¼Œē®”é“å¹¶č”Œę€§é€šäæ”ēŗ¦ęŸå‡å°ļ¼Œčæ™ä½æ得åœØč¾ƒä½Žēš„ē½‘ē»œåø¦å®½å’Œę›“高ēš„延čæŸäø‹ęœ‰ę•ˆč®­ē»ƒę›“大ęØ”åž‹ęˆäøŗåÆčƒ½ć€‚äøŗäŗ†åœØå¼‚ęž„ēŽÆ境äø­åŗ”ē”Øčæ™äø€ē†åæµļ¼Œä»–们åœØ节ē‚¹ä¹‹é—“ä½æē”Øäø“ę—¶ć€Œē®”道čæžęŽ„怍ļ¼Œčæ™äŗ›ē®”道åÆ仄åœØęÆę¬”čæ­ä»£äø­å®žę—¶ę›“ꖰ怂čæ™å…č®ø节ē‚¹å°†å…¶č¾“å‡ŗ发送到任何äø‹äø€äøŖē®”é“é˜¶ę®µēš„åƹē­‰čŠ‚ē‚¹ć€‚čæ™ę„å‘³ē€ļ¼Œå¦‚ęžœęŸäøŖåƹē­‰čŠ‚ē‚¹ęÆ”å…¶ä»–čŠ‚ē‚¹ę›“åæ«ļ¼Œęˆ–č€…ä»»ä½•å‚äøŽč€…ę–­å¼€čæžęŽ„ļ¼Œč¾“å‡ŗåÆ仄åŠØꀁ重ꖰč·Æē”±ļ¼Œä»„äæčÆč®­ē»ƒēš„ęŒē»­čæ›č”Œļ¼ŒåŖ要ęƏäøŖé˜¶ę®µč‡³å°‘ęœ‰äø€äøŖę“»č·ƒå‚äøŽč€…怂他们ä½æē”Øčæ™ē§ę–¹ę³•åœØä½Žęˆęœ¬ēš„å¼‚ęž„ GPU äøŠč®­ē»ƒäø€äøŖ超čæ‡ 10 äŗæå‚ę•°ēš„ęؔ型ļ¼Œå¹¶äø”äŗ’čæžé€Ÿåŗ¦č¾ƒę…¢ļ¼ˆå¦‚äø‹å›¾ę‰€ē¤ŗļ¼‰ć€‚

DTFMHE åŒę ·ęå‡ŗäŗ†äø€ē§ę–°é¢–ēš„č°ƒåŗ¦ē®—ę³•ļ¼Œä»„及ē®”é“å¹¶č”Œå’Œę•°ę®å¹¶č”Œļ¼Œä»„åœØ 3 äøŖå¤§ę“²ēš„č®¾å¤‡äøŠč®­ē»ƒå¤§åž‹ęØ”åž‹ć€‚å°½ē®”他们ēš„ē½‘ē»œé€Ÿåŗ¦ęÆ”ę ‡å‡† Deepspeed ę…¢ 100 倍ļ¼Œä½†ä»–们ēš„ę–¹ę³•é€Ÿåŗ¦ä»…ęƔåœØę•°ę®äø­åæƒä½æē”Øę ‡å‡† Deepspeed ę…¢ 1.7-3.5 å€ć€‚äøŽ SWARM ē±»ä¼¼ļ¼ŒDTFMHE ę˜¾ē¤ŗå‡ŗ随ē€ęØ”åž‹č§„ęؔ增大ļ¼Œé€šäæ”ęˆęœ¬åÆä»„ęœ‰ę•ˆéšč—ļ¼Œå³ä½æåœØ地ē†åˆ†åøƒēš„ē½‘ē»œäø­ä¹ŸåŒę ·é€‚ē”Ø怂čæ™ä½æå¾—ęˆ‘ä»¬čƒ½å¤Ÿé€ščæ‡å„ē§ęŠ€ęœÆå…‹ęœčŠ‚ē‚¹ä¹‹é—“č¾ƒå¼±ēš„čæžęŽ„ļ¼ŒåŒ…ę‹¬å¢žåŠ éšč—å±‚ēš„大小和ęƏäøŖē®”é“é˜¶ę®µå¢žåŠ ę›“å¤šå±‚ć€‚

ę•…éšœå®¹é”™

äøŠčæ°č®øå¤šę•°ę®å¹¶č”Œę–¹ę³•é»˜č®¤å…·ęœ‰å®¹é”™čƒ½åŠ›ļ¼Œå› äøŗęƏäøŖ节ē‚¹éƒ½åœØ内存äø­å­˜å‚Øę•“äøŖęØ”åž‹ć€‚čæ™ē§å†—余通åøøę„å‘³ē€ļ¼Œå³ä½æå…¶ä»–čŠ‚ē‚¹å‡ŗēŽ°ę•…éšœļ¼ŒčŠ‚ē‚¹ä»ē„¶åÆ仄ē‹¬ē«‹å·„ä½œć€‚čæ™åƹäŗŽåŽ»äø­åæƒåŒ–č®­ē»ƒéžåøøé‡č¦ļ¼Œå› äøŗ节ē‚¹é€šåøøę˜ÆäøåÆ靠ēš„ć€å¼‚ęž„ēš„ļ¼Œē”šč‡³åÆčƒ½å­˜åœØę¶ę„č”Œäøŗ怂ē„¶č€Œļ¼Œå¦‚å‰ę‰€čæ°ļ¼ŒēŗÆę•°ę®å¹¶č”Œę–¹ę³•ä»…é€‚ē”ØäŗŽč¾ƒå°ēš„ęؔ型ļ¼Œå› ę­¤ęؔ型大小受到ē½‘ē»œäø­ęœ€å°čŠ‚ē‚¹å†…存容量ēš„制ēŗ¦ć€‚

äøŗäŗ†č§£å†³äøŠčæ°é—®é¢˜ļ¼Œäø€äŗ›äŗŗꏐå‡ŗäŗ†é€‚ē”ØäŗŽęØ”åž‹å¹¶č”Œļ¼ˆęˆ–ę··åˆå¹¶č”Œļ¼‰č®­ē»ƒēš„å®¹é”™ęŠ€ęœÆ怂SWARM 通čæ‡ä¼˜å…ˆé€‰ę‹©å»¶čæŸč¾ƒä½Žēš„ēس定åƹē­‰čŠ‚ē‚¹ę„åŗ”åƹåƹē­‰čŠ‚ē‚¹ę•…éšœļ¼Œå¹¶åœØ发ē”Ÿę•…éšœę—¶é‡ę–°č·Æē”±ē®”é“é˜¶ę®µēš„ä»»åŠ”ć€‚å…¶ä»–ę–¹ę³•ļ¼Œå¦‚ Oobleckļ¼Œé‡‡ē”Øē±»ä¼¼ēš„ę–¹ę³•ļ¼Œé€ščæ‡åˆ›å»ŗ多äøŖ怌ē®”道ęØ”ęæć€ę„ęä¾›å†—ä½™ļ¼Œä»„åŗ”åƹéƒØåˆ†čŠ‚ē‚¹ę•…éšœć€‚å°½ē®”åœØę•°ę®äø­åæƒčæ›č”Œäŗ†ęµ‹čƕļ¼ŒOobleck ēš„ę–¹ę³•ęä¾›äŗ†å¼ŗ大ēš„åÆ靠ꀧäæčƁļ¼Œčæ™äŗ›äæčÆåŒę ·é€‚ē”ØäŗŽåŽ»äø­åæƒåŒ–ēŽÆå¢ƒć€‚

ęˆ‘ä»¬čæ˜ēœ‹åˆ°äŗ†äø€äŗ›ę–°ēš„ęØ”åž‹ęž¶ęž„ļ¼ˆå¦‚去äø­åæƒåŒ–ę··åˆäø“家ęؔ型 (Decentralized Mixture of Experts, DMoE)ļ¼‰ļ¼Œē”ØäŗŽę”ÆęŒåŽ»äø­åæƒåŒ–ēŽÆ境äø­ēš„å®¹é”™č®­ē»ƒć€‚äøŽä¼ ē»Ÿēš„äø“å®¶ę··åˆęؔ型ē±»ä¼¼ļ¼ŒDMoE ē”±å¤šäøŖē‹¬ē«‹ēš„ć€Œäø“å®¶ć€ē½‘ē»œē»„ęˆļ¼Œčæ™äŗ›ē½‘ē»œåˆ†åøƒåœØäø€ē»„å·„ä½œč€…čŠ‚ē‚¹äøŠć€‚DMoE ä½æē”Ø分åøƒå¼å“ˆåøŒč”Ø仄去äø­åæƒåŒ–ę–¹å¼č·ŸčøŖå’Œę•“åˆå¼‚ę­„ę›“ę–°ć€‚čÆ„ęœŗ制ļ¼ˆåœØ SWARM äø­ä¹Ÿä½æē”Øļ¼‰åÆ¹čŠ‚ē‚¹ę•…éšœå…·ęœ‰č‰Æ儽ēš„ęŠµęŠ—åŠ›ļ¼Œå› äøŗå¦‚ęžœęŸäŗ›čŠ‚ē‚¹å¤±č“„ꈖęœŖčƒ½åŠę—¶å“åŗ”ļ¼Œå®ƒåÆä»„å°†ęŸäŗ›äø“å®¶ęŽ’é™¤åœØå¹³å‡č®”ē®—ä¹‹å¤–ć€‚

规ęؔ化

ęœ€åŽļ¼ŒåƒęƔē‰¹åøå’Œä»„å¤ŖåŠę‰€é‡‡ē”Øēš„加åƆęæ€åŠ±ē³»ē»ŸåÆ仄åø®åŠ©å®žēŽ°ę‰€éœ€ēš„规ęØ”ć€‚čæ™äø¤äøŖē½‘ē»œé€ščæ‡å‘č“”ēŒ®č€…ę”Æ付äø€ē§åÆ仄随ē€é‡‡ē”Ø增é•æč€Œå¢žå€¼ēš„ęœ¬åœ°čµ„äŗ§ę„ä¼—åŒ…č®”ē®—怂čæ™äøŖč®¾č®”é€ščæ‡ē»™äŗˆę—©ęœŸč“”ēŒ®č€…äø°åŽšå„–åŠ±ę„ęæ€åŠ±ä»–们ļ¼Œå½“ē½‘ē»œč¾¾åˆ°ęœ€å°åÆč”Œč§„ęؔ后ļ¼Œčæ™äŗ›å„–励åÆä»„é€ę­„å‡å°‘ć€‚

ē”®å®žļ¼Œčæ™ē§ęœŗ制存åœØ各ē§é™·é˜±ļ¼Œéœ€č¦éæå…ć€‚å…¶äø­ęœ€äø»č¦ēš„陷阱ę˜Æļ¼Œčæ‡åŗ¦ęæ€åŠ±ä¾›ē»™č€ŒęœŖčƒ½åø¦ę„ē›øåŗ”ēš„éœ€ę±‚ć€‚ę­¤å¤–ļ¼Œå¦‚ęžœåŸŗē”€ē½‘ē»œäøå¤ŸåŽ»äø­åæƒåŒ–ļ¼Œčæ™åÆčƒ½å¼•å‘ē›‘ē®”é—®é¢˜ć€‚ē„¶č€Œļ¼Œå½“č®¾č®”å¾—å½“ę—¶ļ¼ŒåŽ»äø­åæƒåŒ–ęæ€åŠ±ē³»ē»ŸåÆ仄åœØč¾ƒé•æę—¶é—“å†…å®žēŽ°åÆ观ēš„规ęØ”ć€‚

例如ļ¼ŒęƔē‰¹åøå¹“ē”µåŠ›ę¶ˆč€—ēŗ¦äøŗ 150 å¤Ŗē“¦ę—¶ (TWh)ļ¼Œčæ™ęƔē›®å‰ęž„ę€äø­ēš„ęœ€å¤§ AI č®­ē»ƒé›†ē¾¤ēš„ē”µåŠ›ę¶ˆč€—高å‡ŗäø¤äøŖꕰ量ēŗ§ä¹‹å¤šļ¼ˆ100,000 äøŖ H100 å…Øč“Ÿč·čæč”Œäø€å¹“ļ¼‰ć€‚作äøŗå‚č€ƒļ¼ŒOpenAI ēš„ GPT-4 åœØ 20,000 äøŖ A100 äøŠčæ›č”Œäŗ†č®­ē»ƒļ¼ŒMeta ēš„ę——čˆ° Llama 405B ęؔ型åœØ 16,000 äøŖ H100 äøŠčæ›č”Œäŗ†č®­ē»ƒć€‚åŒę ·ļ¼ŒåœØå…¶é«˜å³°ęœŸļ¼Œä»„å¤Ŗ坊ēš„ē”µåŠ›ę¶ˆč€—大ēŗ¦äøŗ 70 TWhļ¼Œåˆ†ę•£åœØꕰē™¾äø‡äøŖ GPU ä¹‹é—“ć€‚å³ä½æč€ƒč™‘åˆ°ęœŖę„å‡ å¹“ AI ę•°ę®äø­åæƒēš„åæ«é€Ÿå¢žé•æļ¼Œåƒčæ™äŗ›ęæ€åŠ±č®”ē®—ē½‘ē»œä»å°†å¤šę¬”č¶…č¶Šå…¶č§„ęØ”ć€‚

当ē„¶ļ¼Œå¹¶éžę‰€ęœ‰č®”ē®—都ę˜ÆåÆę›æę¢ēš„ļ¼Œč®­ē»ƒē›øåƹäŗŽęŒ–ēŸæ꜉ē‹¬ē‰¹ēš„éœ€ę±‚ļ¼Œéœ€č¦č€ƒč™‘ć€‚å°½ē®”å¦‚ę­¤ļ¼Œčæ™äŗ›ē½‘ē»œå±•ē¤ŗäŗ†é€ščæ‡čæ™äŗ›ęœŗ制åÆ仄实ēŽ°ēš„规ęØ”ć€‚

ęœŖę„ēš„道č·Æ

将čæ™äŗ›éƒØåˆ†č”ē³»åœØäø€čµ·ļ¼Œęˆ‘们åÆ仄ēœ‹åˆ°å‰čæ›ēš„ꖰ道č·Æēš„å¼€ē«Æ怂

很åæ«ļ¼Œę–°ēš„č®­ē»ƒęŠ€ęœÆ将ä½æęˆ‘ä»¬čƒ½å¤Ÿč¶…å‡ŗę•°ę®äø­åæƒēš„限制ļ¼Œå› äøŗč®¾å¤‡äøå†éœ€č¦å…±åŒę”¾ē½®ę‰čƒ½å‘ęŒ„作ē”Ø怂čæ™å°†éœ€č¦ę—¶é—“ļ¼Œå› äøŗęˆ‘ä»¬å½“å‰ēš„去äø­åæƒåŒ–č®­ē»ƒę–¹ę³•ä»å¤„äŗŽč¾ƒå°č§„ęØ”ļ¼Œäø»č¦åœØ 10 äŗæ到 20 äŗæäøŖå‚ę•°ēš„čŒƒå›“内ļ¼ŒęƔ像 GPT-4 čæ™ę ·ēš„ęØ”åž‹å°å¾—å¤šć€‚ęˆ‘ä»¬éœ€č¦čæ›äø€ę­„ēš„ēŖē “ļ¼Œä»„åœØäøē‰ŗē‰²å…³é”®å±žę€§ļ¼ˆå¦‚通äæ”ꕈēŽ‡å’Œå®¹é”™čƒ½åŠ›ļ¼‰ēš„ęƒ…å†µäø‹ęå‡čæ™äŗ›ę–¹ę³•ēš„规ęØ”ć€‚ęˆ–č€…ļ¼Œęˆ‘ä»¬éœ€č¦ę–°ēš„ęØ”åž‹ęž¶ęž„ļ¼Œčæ™äŗ›ęž¶ęž„äøŽä»Šå¤©ēš„大型单体ęØ”åž‹ęœ‰ę‰€äøåŒā€”ā€”åÆčƒ½ę›“å°ć€ę›“ęؔ块化ļ¼ŒåœØč¾¹ē¼˜č®¾å¤‡äøŠčæč”Œļ¼Œč€ŒéžåœØäŗ‘ē«Æ

ꗠč®ŗ如何ļ¼ŒåÆ仄合ē†åœ°é¢„ęœŸåœØčæ™äøŖę–¹å‘äøŠä¼šęœ‰čæ›äø€ę­„ēš„čæ›å±•ć€‚ęˆ‘ä»¬å½“å‰ę–¹ę³•ēš„ęˆęœ¬ę˜ÆäøåÆꌁē»­ēš„ļ¼Œčæ™äøŗåˆ›ę–°ęä¾›äŗ†å¼ŗēƒˆēš„åø‚åœŗåŠØåŠ›ć€‚ęˆ‘ä»¬å·²ē»ēœ‹åˆ°čæ™äø€č¶‹åŠæļ¼Œåƒ Apple čæ™ę ·ēš„åˆ¶é€ å•†ę­£åœØꞄå»ŗꛓå¼ŗ大ēš„č¾¹ē¼˜č®¾å¤‡ļ¼Œä»„ä¾æåœØęœ¬åœ°čæč”Œę›“多ēš„å·„ä½œč“Ÿč½½ļ¼Œč€Œäøę˜Æä¾čµ–äŗ‘ē«Æć€‚ęˆ‘ä»¬čæ˜ēœ‹åˆ°åƹ开ęŗč§£å†³ę–¹ę”ˆēš„ę”Æꌁäøę–­å¢žåŠ ā€”ā€”ē”šč‡³åœØ像 Meta čæ™ę ·ēš„å…¬åø内éƒØļ¼Œä»„äæƒčæ›ę›“去äø­åæƒåŒ–ēš„ē ”ē©¶äøŽå¼€å‘怂čæ™äŗ›č¶‹åŠæ随ē€ę—¶é—“ēš„ęŽØē§»åŖä¼šåŠ é€Ÿć€‚

äøŽę­¤åŒę—¶ļ¼Œęˆ‘们čæ˜éœ€č¦ę–°ēš„ē½‘ē»œåŸŗē”€č®¾ę–½ę„čæžęŽ„č¾¹ē¼˜č®¾å¤‡ļ¼Œä»„ä¾æčƒ½å¤Ÿčæ™ę ·ä½æē”Øå®ƒä»¬ć€‚čæ™äŗ›č®¾å¤‡åŒ…ꋬē¬”č®°ęœ¬ē”µč„‘态ęøøęˆå°å¼ęœŗļ¼Œęœ€ē»ˆē”šč‡³åÆčƒ½ę˜Æę‹„ęœ‰é«˜ę€§čƒ½ę˜¾å”å’Œå¤§å†…å­˜ēš„ꉋęœŗ怂čæ™å°†ä½æęˆ‘ä»¬čƒ½å¤Ÿęž„å»ŗäø€äøŖ怌å…Øēƒé›†ē¾¤ć€ļ¼Œä½Žęˆęœ¬ć€å§‹ē»ˆåœØēŗæēš„č®”ē®—čƒ½åŠ›ļ¼ŒåÆä»„å¹¶č”Œå¤„ē†č®­ē»ƒä»»åŠ”怂čæ™ä¹Ÿę˜Æäø€äøŖå…·ęœ‰ęŒ‘ęˆ˜ę€§ēš„问题ļ¼Œéœ€č¦åœØ多äøŖ领域取得čæ›å±•ć€‚

ęˆ‘ä»¬éœ€č¦ę›“å„½ēš„č°ƒåŗ¦ęŠ€ęœÆę„åœØå¼‚ęž„ēŽÆ境äø­čæ›č”Œč®­ē»ƒć€‚ē›®å‰ę²”ęœ‰ä»»ä½•ę–¹ę³•åÆ仄č‡ŖåŠØå¹¶č”ŒåŒ–ęØ”åž‹ä»„č¾¾åˆ°ä¼˜åŒ–ļ¼Œē‰¹åˆ«ę˜ÆåœØč®¾å¤‡åÆä»„éšę—¶ę–­å¼€ęˆ–čæžęŽ„ēš„ęƒ…å†µäø‹ć€‚čæ™ę˜Æä¼˜åŒ–č®­ē»ƒēš„关键äø‹äø€ę­„ļ¼ŒåŒę—¶äæē•™åŸŗäŗŽč¾¹ē¼˜ē½‘ē»œēš„规ęؔ优åŠæ怂

ęˆ‘ä»¬čæ˜åæ…é”»åŗ”åƹ去äø­åæƒåŒ–ē½‘ē»œēš„äø€čˆ¬å¤ę‚ꀧ怂äøŗäŗ†ęœ€å¤§åŒ–规ęØ”ļ¼Œē½‘ē»œåŗ”čÆ„ęž„å»ŗäøŗå¼€ę”¾åč®®ā€”ā€”äø€å„—ę ‡å‡†å’ŒęŒ‡ä»¤ļ¼Œč§„定参äøŽč€…之闓ēš„äŗ’åŠØļ¼Œå°±åƒ TCP/IP 而ę˜Æē”ØäŗŽęœŗå™Øå­¦ä¹ č®”ē®—怂čæ™å°†ä½æ任何遵å¾Ŗē‰¹å®šč§„čŒƒēš„č®¾å¤‡čƒ½å¤ŸčæžęŽ„到ē½‘ē»œļ¼Œę— č®ŗę‹„ęœ‰č€…å’Œä½ē½®ć€‚它čæ˜ē”®äæē½‘ē»œäæęŒäø­ē«‹ļ¼Œå…č®øē”Øꈷ训ē»ƒä»–ä»¬å–œę¬¢ēš„ęØ”åž‹ć€‚

č™½ē„¶čæ™å®žēŽ°äŗ†č§„ęØ”ęœ€å¤§åŒ–ļ¼Œä½†å®ƒä¹Ÿéœ€č¦äø€äøŖęœŗåˆ¶ę„éŖŒčÆę‰€ęœ‰č®­ē»ƒä»»åŠ”ēš„ę­£ē”®ę€§ļ¼Œč€Œäøä¾čµ–äŗŽå•äø€å®žä½“怂čæ™äø€ē‚¹č‡³å…³é‡č¦ļ¼Œå› äøŗ存åœØå›ŗ꜉ēš„作弊čƱ因ā€”ā€”例如ļ¼Œå£°ē§°č‡Ŗå·±å®Œęˆäŗ†ęŸäøŖč®­ē»ƒä»»åŠ”ä»„čŽ·å¾—ęŠ„é…¬ļ¼Œä½†å®žé™…äøŠå¹¶ę²”ęœ‰åšåˆ°ć€‚č€ƒč™‘åˆ°äøåŒč®¾å¤‡é€šåøø仄äøåŒę–¹å¼ę‰§č”Œęœŗå™Øå­¦ä¹ ę“ä½œļ¼Œčæ™ä½æ得ä½æē”Øę ‡å‡†å¤åˆ¶ęŠ€ęœÆ变得难仄éŖŒčÆę­£ē”®ę€§ļ¼Œå› ę­¤čæ™å°¤å…¶å…·ęœ‰ęŒ‘ęˆ˜ę€§ć€‚ę­£ē”®č§£å†³čæ™äøŖé—®é¢˜éœ€č¦åœØåƆē å­¦å’Œå…¶ä»–å­¦ē§‘äøŠčæ›č”Œę·±å…„ē ”ē©¶ć€‚

å¹øčæēš„ę˜Æļ¼Œęˆ‘们åœØꉀ꜉čæ™äŗ›ę–¹é¢éƒ½ē»§ē»­ēœ‹åˆ°čæ›å±•ć€‚äøŽčæ‡åŽ»å‡ å¹“ē›øęƔļ¼Œčæ™äŗ›ęŒ‘ęˆ˜ä¼¼ä¹Žäøå†äøåÆé€¾č¶Šć€‚äøŽęœŗ会ē›øęƔļ¼Œå®ƒä»¬ä¹Ÿę˜¾å¾—ē›øå½“å¾®å°ć€‚Google åœØ他们ēš„ DiPaCo č®ŗꖇäø­åÆ¹ę­¤čæ›č”Œäŗ†ęœ€ä½³ę€»ē»“ļ¼ŒęŒ‡å‡ŗ去äø­åæƒåŒ–č®­ē»ƒęœ‰ę½œåŠ›ę‰“ē “ēš„č“Ÿåé¦ˆęœŗ制ļ¼š

分åøƒå¼č®­ē»ƒęœŗå™Ø学习ęؔ型ēš„čæ›å±•åÆčƒ½äæƒčæ›åŸŗē”€č®¾ę–½ēš„ē®€åŒ–å»ŗč®¾ļ¼Œęœ€ē»ˆåÆ¼č‡“č®”ē®—资ęŗēš„ꛓå¹æę³›åÆē”Ø怂ē›®å‰ļ¼ŒåŸŗē”€č®¾ę–½ę˜Æ囓ē»•č®­ē»ƒå¤§åž‹å•ä½“ęؔ型ēš„ę ‡å‡†ę–¹ę³•č€Œč®¾č®”ēš„ļ¼ŒåŒę—¶ęœŗå™Ø学习ęؔ型ēš„ęž¶ęž„ä¹Ÿę—ØåœØ利ē”Ø当前ēš„åŸŗē”€č®¾ę–½å’Œč®­ē»ƒę–¹ę³•ć€‚čæ™ē§åé¦ˆå¾ŖēŽÆåÆčƒ½ä½æē¤¾åŒŗé™·å…„äø€äøŖčÆÆåÆ¼ę€§ēš„å±€éƒØęœ€å°å€¼ļ¼Œå³č®”ē®—资ęŗēš„é™åˆ¶č¶…čæ‡äŗ†å®žé™…éœ€č¦ć€‚

也č®øęœ€ä»¤äŗŗå…“å„‹ēš„ę˜Æļ¼Œē ”ē©¶ē•ŒåÆ¹č§£å†³čæ™äŗ›é—®é¢˜ēš„ēƒ­ęƒ…ę—„ē›Šé«˜ę¶Øć€‚ęˆ‘ä»¬åœØ Gensyn ēš„å›¢é˜Ÿę­£åœØꞄå»ŗäøŠčæ°ē½‘ē»œåŸŗē”€č®¾ę–½ć€‚像 Hivemind 和 BigScience čæ™ę ·ēš„团队åœØå®žč·µäø­åŗ”ē”Øäŗ†č®ø多čæ™äŗ›ęŠ€ęœÆć€‚åƒ Petals态sahajBERT 和 Bloom čæ™ę ·ēš„锹ē›®å±•ē¤ŗäŗ†čæ™äŗ›ęŠ€ęœÆēš„čƒ½åŠ›ļ¼Œä»„及åƹåŸŗäŗŽē¤¾åŒŗēš„ęœŗå™Øå­¦ä¹ ę—„ē›Šå¢žé•æēš„å…“č¶£ć€‚čæ˜ęœ‰č®ø多其他äŗŗ也åœØęŽØåŠØē ”ē©¶čæ›å±•ļ¼Œē›®ę ‡ę˜Æå»ŗē«‹äø€äøŖę›“å¼€ę”¾ć€ę›“åä½œēš„ęØ”åž‹č®­ē»ƒē”Ÿę€ē³»ē»Ÿć€‚å¦‚ęžœę‚Øåƹčæ™é”¹å·„ä½œę„Ÿå…“č¶£ļ¼ŒčÆ·äøŽęˆ‘们联ē³»ä»„参äøŽå…¶äø­ć€‚