💻 CPU эргэн ирлээ. 🤖 Агент AI-д GPU-ээс илүү CPU хэрэгтэй 🔥
AI-ийн дэд бүтцэд 🏗️ суурь өөрчлөлт гарч, “bottleneck” буюу хязгаарлагч хүчин зүйл (системийн бүх үйл явцыг удаашруулдаг хамгийн ачаалал ихтэй хэсэг) өөр тийшээ шилжиж байна 🔄. Сүүлийн хоёр жилийн турш AI-ийн цар хүрээг тэлэх томьёо маш энгийн байлаа: зүгээр л аль болох олон GPU (хиймэл оюун ухааны хүнд тооцооллыг нэгэн зэрэг хийдэг чип) худалдаж авах 🛒💳.
Гэвч бид зүгээр нэг асуултад хариулдаг энгийн чатботоос “Агент AI” буюу Agentic AI (зөвхөн хариулах биш, бие даан шийдвэр гаргаж, олон алхамт даалгавруудыг гүйцэтгэдэг ухаалаг туслах) руу шилжихийн хэрээр дата төвүүдэд тавигдах шаардлага хурдацтай өөрчлөгдөж байна ⚡
Технологийн салбар одоо x86, Arm (чип хэрхэн мэдээлэл боловсруулахыг зааж өгдөг ялгаатай суурь загварууд) болон тусгай зориулалтын цахиур зэрэг бүгд өндөр эрэлттэй байгаа олон-архитектурын эрин үед хөл тавилаа 🚀. “Зүгээр л илүү олон GPU ав” гэх хуучин хандлага өөрчлөгдөж, системийг бүхэлд нь хэрхэн ухаалаг угсрах вэ гэдэг нарийн өрсөлдөөн болж хувирсан бөгөөд энэхүү шинэ тулааны жинхэнэ “од” нь серверийн CPU (бүх үйлдэл, мэдээллийн урсгалыг зохион байгуулж, удирдан чиглүүлдэг компьютерын гол тархи) болж байна 🌟🧠.
Макро чиг хандлага: Агентууд яг одоо юу хийж чаддаг болсон бэ, мөн тэдэнд яагаад CPU хэрэгтэй вэ? 🤯🚀
Ердөө хоёрхон жилийн өмнө хиймэл оюун ухаан бидэнд шүлэг бичиж, асуултад хариулах төдийд л бид гайхан шагширч байлаа. Чатботын эрин үед хиймэл оюун ухаан нь зөвхөн “текст үүсгэгч” байсан бөгөөд GPU (График боловсруулах нэгж) гол ажлыг буюу хүнд тооцооллыг хийдэг байв. Харин CPU (Төв боловсруулах нэгж) зөвхөн оролт гаралтыг удирдах зэрэг хөнгөн үүрэгтэй байлаа.
Гэвч бид энгийн чатботоос “Агент AI” (Agentic AI) руу шилжиж, энэ хуучин загвар бүрэн эвдэгдэж байна. Өнөөдөр AI нь таны өмнөөс хулгана, гар хөдөлгөж, бие даан шийдвэр гаргадаг “Дижитал Ажилтан” (Digital Worker) болон хувирчээ 💼✨. Агентууд нь зөвхөн хариу бичих бус, бие даан вебээс хайлт хийх, Python код ажиллуулах, контейнэр удирдах, гадаад API дуудах зэрэг цогц бөгөөд нэгэн зэрэг бус (asynchronous) даалгавруудыг гүйцэтгэдэг.
Одоогийн Агент AI ямар гайхалтай түвшинд хүрснийг дараах бодит жишээнүүдээс харж болно:
🔍 Perplexity Computer: Хэдэн жилийн өмнө бид Perplexity-г зүгээр л ухаалаг хайлтын систем гэж хардаг байв. Харин одоо тэрээр бүрэн хэмжээний судалгааны ажилтан болсон 🕵️♂️. Та түүнд “Сүүлийн 5 жилийн хагас дамжуулагчийн зах зээлийн тайланг нэгтгээд, Excel дээр санхүүгийн модель үүсгэ” гэж хэлэхэд тэрээр бие даан олон веб цонх нээж, PDF файлууд уншин, тоо баримтуудыг хооронд нь тулгаж, эцсийн үр дүнг хүснэгтээр гаргаж өгч чадна 📊.
🦾 OpenClaw болон NVIDIA-ийн стратегийн түншлэл: OpenClaw нь компьютерын дэлгэц дээрх үйлдлүүдийг яг л хүн шиг хийх чадвартай (Computer Use) агентуудыг хөгжүүлж байгаа бөгөөд NVIDIA-ийн хүчирхэг дэд бүтэцтэй хоршсоноор нарийн төвөгтэй програмуудыг бие даан нээж, Python код бичин ажиллуулж, алдаа гарвал өөрөө дебаг (debug) хийж засаж чаддаг болсон 💻🔧.
Хэрвээ саяхан хэн нэгэн танд “Миний AI туслах өглөө өөрөө сэрээд, интернэтээс өчигдрийн хөрөнгийн биржийн тайлангуудыг уншиж, Python дээр дата анализ хийгээд, миний өмнөөс имэйлээр үр дүнг нь явуулчихсан” гэж хэлсэн бол та хэтрүүлэг гэж бодох байсан байх 🎬🍿. Гэтэл өнөөдөр энэ нь бодит байдал болжээ.
Гэхдээ энэ бүхэнтэй CPU ямар хамаатай гэж? 🧠⚙️
Энэхүү шинэ ажлын урсгалд GPU “бодох” үйлдлийг хийдэг бол, CPU гарсан шийдвэрийг бодит үйлдэл болгож “хийх, гүйцэтгэх” үйлдлийг хариуцдаг. Агент AI-ийн үед CPU-ийн ачаалал яагаад огцом нэмэгдэж байгааг дараах хоёр гол хүчин зүйлээр тайлбарлаж болно:
🛠️ Удирдлага болон багаж хэрэгслийн ашиглалт (Orchestration & Tool Use): Агентуудын ажил нь “Хэрэв А болбол Б-г хий, үгүй бол В рүү шилж” гэх мэт дараалсан, салаалсан логик шаарддаг бөгөөд энэ нь CPU-ийн хамгийн сайн хийж чаддаг үндсэн үүрэг юм. CPU нь удирдлагын шийдвэрийг хурдан гаргах шаардлагатай байдаг. Одоогийн зарим агент ажлын ачаалалд, өгөгдөл боловсруулахад зарцуулж буй нийт хугацааны буюу хоцрогдлын (latency) 50-90%-ийг зөвхөн CPU талын боловсруулалт эзэлж байна. Өөрөөр хэлбэл, GPU хариугаа бодоод бэлэн болчихсон байхад CPU бусад үйлдлээ (интернетээс мэдээлэл татах, код унших гэх мэт) хийж дуусгахыг хүлээж гацдаг системтэй болсон.
🧱 VRAM-ийн хана (The VRAM Wall буюу Санах ойн хязгаар): AI-ийн нэг дор уншиж, санаж чадах мэдээллийн хэмжээ буюу “контекст цонх” 1 сая токен хүртэл тэлж байна. Үүнийг дагаад AI өмнө нь бодсон зүйлсээ дахин бодохгүйн тулд түр хадгалдаг ой санамж болох KV cache (Key-Value cache)-ийн хэмжээ 200GB-аас давж эхэллээ. Гэтэл хамгийн хүчирхэг GPU хүртэл ердөө 80GB орчим VRAM-тай байдаг тул багтахгүй хальж, “хана мөргөдөг”. Иймд илүү гарсан өгөгдлийг компьютерын ерөнхий санах ой (System RAM) руу шилжүүлж, CPU дээр хадгалахаас өөр аргагүй болж байна. Энэ үед CPU-ийн санах ойн багтаамж болон өгөгдлийг GPU руу хэр хурдан дамжуулах чадвар буюу холболтын хурд (interconnect bandwidth) асар их ач холбогдолтой болжээ.
Энэхүү шилжилт нь зах зээлд урьд өмнө байгаагүй эрэлтийг бий болгож байна. Агент ажлын ачааллаас үүдэлтэй серверийн CPU-ийн орлого AMD дээр огцом өссөн бол, Intel серверийн CPU-ийн нийлүүлэлт “туйлын хязгаарлагдмал” байгааг хүлээн зөвшөөрсөн. Мөн NVIDIA болон Arm (шинэ AGI CPU-ээрээ) энэхүү гацааг шийдвэрлэхийн тулд өөрсдийн CPU шийдлээ эрчимтэй түрэмгийгээр зах зээлд нэвтрүүлж эхлээд байна.
💥 Цахиурын хувьсгал: Arm яагаад “Төслийн зураг”-аас “Барилгачин” болж хувирав? 🏗️
Дэлхий ертөнц өөрчлөгдөхийн яг өмнө нэгэн онцгой нам гүм байдал үүсдэг. Сан Францискод болсон “Arm Everywhere” арга хэмжээний үеэр Arm компанийн гүйцэтгэх захирал Рене Хаас (Rene Haas) энэхүү 35 жил үргэлжилсэн нам гүм байдлыг эвдлээ. Тэд өнгөрсөн хугацаанд дэлхий даяар 350 тэрбум гаруй чипэнд зөвхөн чипийн “зураг төсөл” гаргаж өгдөг байсан бол, одоо түүхэндээ анх удаагаа өөрсдийн бодит цахиур чипийг (Arm AGI CPU) үйлдвэрлэн, шууд зах зээлд нийлүүлж эхэллээ. Энэ бол NVIDIA тоглоомын GPU-ээс AI хурдасгуур руу шилжсэнээс хойших хагас дамжуулагчийн салбар дахь хамгийн том стратегийн эргэлт юм 🚀.
Энэхүү түүхэн шилжилтийн хамгийн чухал 5 онцлогийг задлан шинжилье:
💸 1. Зөвхөн IP (Оюуны өмч) түрээслэх эриний төгсгөл: Олон арван жилийн турш Arm-ийн эдийн засгийн хөдөлгүүр нь түншүүдийнхээ хийсэн чип бүрээс авах маш бага роялти буюу “центүүд”-ээр тэжээгдэж байв (IP-Only буюу Зөвхөн оюуны өмч лицензлэх загвар). Харин одоо өөрсдөө чип үйлдвэрлэж борлуулах (Merchant silicon буюу Шууд худалдах цахиур) зах зээлд орсноор, зуучилсан цент биш, чип тус бүрээс “доллар” олох асар өндөр ашигтай бизнес загвар руу шилжиж байна.
🚛 2. AI-ийн “Өөрөө буулгагч машин” (Dump Trucks of AI): Агент AI-ийн хувьд GPU нь мэдээлэл боловсруулдаг “хүчирхэг багаж” бол, CPU нь тэрхүү мэдээллийг зөөвөрлөж, цэгцэлж, бодит үйлдэл болгодог “өөрөө буулгагч машин” юм. Шинэ үеийн агент системүүд нь удирдлага, зохицуулалт (Orchestration), тусгаарлагдсан орчны менежмент (Container management), болон Python код ажиллуулах зэрэг маш цогц үйлдлүүдийг хийдэг тул үүнийг дааж гарахын тулд зориулалтын Arm AGI CPU-г бүтээжээ.
⚡ 3. Эрчим хүчний парадокс (300 Ватт / 136 Цөм): Шинэ Arm AGI CPU нь эрчим хүчний хэмнэлтийн жинхэнэ гайхамшиг юм. Хуучин x86 архитектурууд хэт их цахилгаан зарцуулдаг бол, Arm нь 3 нанометрийн технологиор 136 ширхэг Neoverse V3 цөмийг ердөө 300 Ваттын дулаан ялгаруулах хязгаарт (TDP - Thermal Design Power буюу чипийн хэрэглэх эрчим хүчний дээд хязгаар) багтааж чадсан. Мөн 96 эгнээ бүхий PCIe Gen 6 болон CXL 3.0 зэрэг хэт өндөр хурдны холболтуудыг (High-speed interconnects) дэмждэг. Үүний үр дүнд нэг гигаватт AI дата төвийн хүчин чадалд 10 тэрбум доллар хүртэлх хөрөнгийн зардлын (Capex) хэмнэлт гаргана гэж тооцоолжээ.
🤝 4. Програм хангамжийн “Тэг саад” (Zero Barrier) ба Meta-ийн түншлэл: Өмнө нь дата төвүүд Arm руу шилжихэд хамгийн том саад нь бүх кодыг дахин бичих буюу “програм хангамжийн татвар” (Software tax - шинэ архитектур руу шилжихэд гардаг нэмэлт зардал, хүндрэл) байлаа. Гэтэл энэ саад одоо бараг “тэг” болсон. Meta компани 90-хэн хоногийн дотор ердөө 5 инженертэйгээр өөрсдийн системийг Arm руу бүрэн хөрвүүлж чадсан байна. Нууц нь юу вэ? LLM (Том хэлний загвар) нь кодын хөрвүүлэлтийг автоматаар хийж, хүмүүс гараар код бичих шаардлагагүй болжээ. Meta болон OpenAI нь энэхүү шинэ CPU-ийн хамгийн гол стратегийн түншүүд болж байна.
💰 5. 100 Тэрбум долларын бооцоо ба Хос орлогын загвар: Arm-ийн санхүүгийн замнал зах зээл дээр дахин үнэлэгдэж байна. Одоогийн үүлэн тооцооллын роялти бизнес нь 3 тэрбум долларын багтаамжтай зах зээл (TAM - Total Addressable Market буюу нийт хүрч болох зах зээлийн хэмжээ) байсан бол, шууд цахиур зарж эхэлснээр энэ зах зээл 100 тэрбум доллар болж тэлж байна. Хамгийн сонирхолтой нь тэдний зах зээл дэх онцгой давуу тал юм: Хэрэв NVIDIA, AWS зэрэг компаниуд чипээ өөрсдөө хийвэл Arm лицензийн роялти авна. Харин Meta, Cloudflare зэрэг компаниуд бэлэн чип шууд худалдаж авбал Arm цахиурын бүрэн ашгаа (Margin) авна. Тэд зах зээл дээр аль ч тохиолдолд хождог цорын ганц тоглогч боллоо.
⚔️ Олон-Архитектурын дайн: Аваргуудын тулаан ба Стратегиуд
Агент AI нь серверийн CPU-ийн зах зээлийг сэргээгээд зогсохгүй, “Системийн түвшний дайн”-ыг эхлүүллээ. SemiAnalysis зэрэг салбарын шинжээчдийн дүгнэж буйгаар, компаниуд зүгээр ч нэг чипний хурд уралдуулахаа больж, дата төвийг бүхэлд нь хэрхэн удирдах тал дээр өөр өөр архитектурын чиглэлд тэрбум долларын бооцоо тавьж байна. Зах зээлийн гол тоглогчдын стратегиуд дараах байдлаар хуваагдаж байна:
🏰 AMD EPYC Venice (x86) — Экосистемийн хаан ба Прагматик сонголт: AMD нь TSMC-ийн 2 нанометрийн технологид суурилсан Zen 6 архитектураараа уламжлалт байгууллагын (enterprise) зах зээлийг эзэгнэж байна. Тэдний хамгийн том давуу тал бол “Чиплет” (Chiplet) архитектурын өндөр үйлдвэрлэлийн гарц, мөн x86 програм хангамжийн асар том өв юм. Дэлхийн томоохон банкууд, SaaS компаниуд кодоо дахин бичих эрсдэл гаргахгүйгээр шууд хүчин чадлаа нэмэхийг хүсэж байгаа тул AMD серверийн зах зээлийн орлогын ~40%-ийг хэдийнэ гартаа оруулжээ.
🌲 Intel Clearwater Forest (x86) — Үүлэн тооцооллын үр ашиг ба Өндөр нягтрал: Энэ бол Intel-ийн хувь заяаг шийдэх “18A” үйлдвэрлэлийн технологиор бүтээгдсэн, 288 ширхэг E-core (Үр ашигт цөм) бүхий мангас юм. SemiAnalysis-ийн онцолсноор, энэхүү чип нь хүнд тооцоолол гэхээсээ илүү үүлэн технологийн орчинд сая сая хөнгөн даалгаврыг (microservices) нэгэн зэрэг, маш бага эрчим хүчээр гүйцэтгэх зориулалттай. Хэрэв Intel шинэ савлагааны технологийнхоо гарцыг тогтворжуулж чадвал хямд өртөгтэй суурь дэд бүтцийн эрэлт өндөр хэвээр байна.
🌪️ Arm AGI CPU (Custom Arm) — Хараат бус байдал ба Зах зээлийг эвдэгч: Өмнөх хэсэгт дурдсан гайхалтай эрчим хүчний хэмнэлтээс гадна, энэхүү чипийн хамгийн чухал стратегийн үнэ цэн нь “Аврах цагираг” болж байгаад оршино. Томоохон үүлэн үйлчилгээ үзүүлэгчид (Hyperscalers) зөвхөн нэг нийлүүлэгчийн хаалттай экосистемд (Vendor lock-in) орохыг огт хүсэхгүй байгаа. Arm өөрийн цахиурыг шууд нийлүүлж эхэлсэн нь худалдан авагчдад архитектурын эрх чөлөөг олгож, x86-ийн ноёрхлыг өртөг болон эрчим хүчний хэмнэлт гэсэн хоёр фронтоор нэгэн зэрэг цохиж байна.
🐉 NVIDIA Vera (Custom Arm) — Босоо интеграци ба Бүрэн хяналт: GPU-ийн маргаангүй хаан одоо дээд зэрэглэлийн CPU тоглогч болжээ. Тэдний стратеги маш энгийн бөгөөд түрэмгий: NVIDIA дата төвийн тавиурыг бүхэлд нь (Rack-scale) нэг том компьютер болгон зарж байна. Vera CPU нь тэдний дараагийн үеийн Rubin GPU-г хооллохын тулд л төрсөн бөгөөд “Хэрэв чи манай GPU-ийн хүчийг дээд зэргээр сорж ашиглахыг хүсвэл, манай CPU-г заавал давхар авах ёстой” гэсэн бизнесийн хатуу бөгөөд ухаалаг загварыг зах зээлд тулгаж байна.







