2016 оны 3-р сарын 10-ны өдөр Сөүлд болсон нэгэн Go-гийн тоглолт дэлхийн AI-ийн түүхийг үндсэндээ өөрчилсөн гэж хэлж болно.
Тэр өдөр Go-гийн домогт тамирчин И Сэ Доль (Lee Sedol) DeepMind-ийн бүтээсэн AlphaGo-той цуврал тоглолтын хоёр дахь өргөө хийж байлаа. Go бол 2500 гаруй жилийн түүхтэй, шатраас хавьгүй их хувилбартай, хүний зөн совин, стратеги, бүтээлч байдлыг хамгийн дээд хэмжээнд сорьдог тоглоом. Тиймээс олон арван жилийн турш “машин энэ тоглоом дээр ойрын ирээдүйд хүнтэй өрсөлдөж чадахгүй” гэдэг нийтлэг ойлголт түгсэн байв.
Гэтэл AlphaGo эхний өргийг хожив. Харин хоёр дахь тоглолтын дундуур хийсэн алдарт 37 дахь нүүдэл нь бүр ч том цочрол авчирлаа. Мэргэжлийн тайлбарлагчид хүртэл хэсэгтээ юу болж байгааг ойлгоогүй юм. И Сэ Доль хүртэл цочирдон өрөөнөөс гарч түр завсарласан. Эцэст нь тэр нүүдэл алдаа биш, харин 2000 гаруй жилийн турш хүн төрөлхтөн төдийлөн төсөөлөөгүй шинэ стратегийн чиг байсан нь батлагдсан.
Өрнөдийн олон хүн үүнийг “компьютер дахиад л нэг оюуны тоглоомд хүнийг яллаа” гэсэн технологийн дэвшлийн ээлжит нэг мөч гэж харсан. Харин Хятадын эрдэмтэд, бодлого боловсруулагчдын хувьд энэ бол сэрүүлэг дохио болсон. Үүний дараа Хятад AI-ийг үндэсний тэргүүлэх чиглэлээ болгож, 2030 он гэхэд дэлхийд тэргүүлэх зорилгоо ил тод зарлав.
Өнөөдөр DeepSeek, SeeDance 2.0, Doubao зэрэг Хятадын AI хэрэгслүүд дэлхий даяар яригдаж байгаа нь санамсаргүй зүйл биш. Харин асуулт бол АНУ дэвшилтэт AI чипүүдээ хязгаарласаар байхад Хятад яаж ийм хурдан түвшин хүрэв?
Хариулт нь AI-ийг нэг бүтээгдэхүүн гэж харахаа болихоос эхэлнэ.
Агуулгын хүснэгт
- AI бол нэг бүтээгдэхүүн биш, давхаргуудын “стек” юм
- 1. AI-ийн суурь нь чип: Хардвэрын дайнд Хятад яагаад хүнд байдалд оров?
- 2. DeepSeek-ийн жинхэнэ нууц: Хүчтэй чипгүйгээр хүчтэй модель барих ухаан
- 3. AI-ийн жинхэнэ түлш бол дата: Хятад хаана давуу вэ?
- 4. Зөвхөн текст хангалтгүй: Дараагийн тулаан бол multimodal AI
- 5. Яагаад Хятадын супер аппууд AI-д асар том давуу тал өгч байна вэ?
- 6. Хятадын давуу тал бодитой. Гэхдээ тоглоом дуусаагүй
- 7. Дараагийн фронт: AI агентууд, робот, бас интернэтээс гаднах бодит амьдралын өгөгдөл
- Гол дүгнэлтүүд
- Эцсийн бодол
AI бол нэг бүтээгдэхүүн биш, давхаргуудын “стек” юм
Хүмүүс AI гэхээр ChatGPT шиг текст бичдэг хэрэгсэл, эсвэл бодит мэт харагдах AI видео, эсвэл хүн дүрст роботыг төсөөлдөг. Гэхдээ AI бол нэг технологи биш юм. Энэ бол бие биеэсээ хамааралтай хэд хэдэн давхаргын нийлбэр, цогц.
Энэ өрсөлдөөнийг ойлгохын тулд AI-ийн үндсэн 3 давхаргыг ялгаж харах хэрэгтэй.
- Хардвэрын давхарга буюу чип, дата төв, GPU зэрэг физик дэд бүтэц
- Моделийн давхарга буюу AI-ийн “тархи” болсон суурь модель
- Аппликейшн ба өгөгдлийн давхарга буюу тэр тархийг тэжээдэг дата болон эцсийн хэрэглээний орчин
АНУ, Хятадын AI өрсөлдөөн эдгээр бүх түвшинд зэрэг явагдаж байна.
1. AI-ийн суурь нь чип: Хардвэрын дайнд Хятад яагаад хүнд байдалд оров?
AI-ийн хамгийн доод, хамгийн чухал давхарга бол хардвэр. Энд дата төв, хөргөлтийн систем, сервер, хамгийн гол нь микрочип орно.
Микрочип гэдэг бол үндсэндээ кремнийн (цахиурын) маш жижиг хэсэг дээр олон тэрбум бичил транзистор суурилуулсан бүтэц. Эдгээр транзистор нь цахилгааныг асааж, унтрааж 0 ба 1 гэсэн компьютерт ойлгогдох хэл үүсгэдэг. Кремний онцлог нь зэс шиг үргэлж дамжуулагч ч биш, резин шиг бүрэн тусгаарлагч ч биш. Яг дунд нь байдаг шинж чанартай учир инженерийн шийдэлд түүнийг удирдаж, “асаах” эсвэл “унтраах” боломжтой байдаг.
Орчин үеийн AI-д хамгийн чухал чип бол GPU буюу график боловсруулах нэгж. Анх видео тоглоомын дүрс, сүүдэр, тусгал, 3D орчин боловсруулахад зориулагдсан энэ архитектур нь дараа нь AI-ийн асар их хэмжээний зэрэгцээ (параллель) тооцоололд төгс тохирсон.
Нэг AI модель текстээс видео үүсгэхэд эсвэл асуултад хариулахад хэдэн зуун тэрбум, заримдаа хэдэн их наяд математик үйлдэл маш богино хугацаанд хийгддэг. Үүнийг хийхэд GPU бол хөдөлгүүр нь болно гэсэн үг.
Nvidia, TSMC, бас AI-ийн геополитик
Өнөөдрийн AI ертөнцийн хамгийн чухал тоглогчдын нэг бол Nvidia. Тэд хамгийн дэвшилтэт GPU-ийн архитектурыг зохион бүтээдэг. Гэхдээ Nvidia өөрөө чипээ үйлдвэрлэдэггүй. Тэдний зураг төслийг үндэслэн Тайванийн TSMC (Taiwan Semiconductor Manufacturing Company) үйлдвэрлэдэг.
TSMC бол өнөөдрийн байдлаар дэлхий дээрх хамгийн дэвшилтэт чипийг найдвартай, их хэмжээгээр үйлдвэрлэх чадвартай бараг цорын ганц үйлдвэр. Тэд:
- дэлхийн нийт чип үйлдвэрлэлийн асар том хувийг,
- харин AI-д хэрэглэгдэх хамгийн дээд түвшний чипийн 90-ээс дээш хувийг
хянаж байна.
Энд л гол асуудал эхэлнэ. TSMC нь Тайванийн компани ч гэлээ, үйлдвэрлэлийнхээ үндсэн хэсэгт Америкийн программ, патент, тоног төхөөрөмжид түшиглэдэг. Тиймээс АНУ-ын экспортын хяналтын дагуу Хятад руу дэвшилтэт AI чип нийлүүлэх нь хоригт орж болно. Хэрэв дүрэм зөрчвөл TSMC өөрөө амьдрах хэрэгслээсээ таслагдана.
Тэгвэл Хятад өөрийн TSMC-г босгочихож болохгүй юу? Онолын хувьд мөнгө цацаж болно. Харин бодит байдал дээр энэ нь магадгүй хүн төрөлхтний хамгийн төвөгтэй үйлдвэрлэлийн процесс. Үүнд:
- олон арван жилийн инженерийн туршлага,
- Нидерландын хэдэн зуун сая долларын үнэтэй литографийн машин,
- Японоос ирдэг хэт цэвэр химийн материал,
- маш өндөр түвшний нарийвчлал, найдвартай байдал
шаардлагатай.
Өмнөд Солонгосын Samsung хүртэл асар их хөрөнгө оруулсан ч TSMC-ийн түвшний тогтвортой үйлдвэрлэлд хүрэхэд хэцүү хэвээр байгаа нь энэ салбар хэр өндөр босготойг харуулдаг.
Хятад яагаад “боомилогдсон” мэт болсон бэ?
AlphaGo-гийн дараа Хятад AI-гийн үндэсний стратегиа боловсруулж, Huawei, SMIC зэрэг дотоодын компаниудаа дэмжих замаар чипийн салбарт хүч түрэхээр шийдсэн. Гэвч тэд хэдхэн жилийн дараа дэлхийн хамгийн чухал AI хангамжийн сүлжээнээс ийм том хэмжээнд шахагдана гэж төсөөлөөгүй.
Өөрөөр хэлбэл Хятад хардвэрээ:
- TSMC-ээс шууд авч чадахгүй,
- Nvidia-ийн шилдэг GPU-үүдийг авч чадахгүй,
- тэр чипийг дотооддоо хийхэд хэрэгтэй зарим гол төхөөрөмжийг бусдаас авч чадахгүй болсон.
Ийм нөхцөлд өрнөдийн олон шинжээч “Хятадын AI-ийн мөрөөдөл дууслаа” гэж хэлж байв. Учир нь дата төвийн барилгыг барих амархан. Харин тэр дата төвийг хөдөлгөх жинхэнэ хөдөлгүүр болох чипийг олно гэдэг бол огт өөр асуудал.
Гэхдээ яг энд барууныхан хамгийн том алдаж тэднийг дутуу үнэлсэн. Хятад хардвэрээр биш, программ хангамжийн шийдэл, оновчлолоор дүрмийг өөрчилж эхэлсэн.
2. DeepSeek-ийн жинхэнэ нууц: Хүчтэй чипгүйгээр хүчтэй модель барих ухаан
AI-ийн дараагийн давхарга бол моделийн давхарга. Энэ бол орчин үеийн AI-ийн жинхэнэ тархи байрладаг хэсэг.
ChatGPT бол өөрөө модель биш. Энэ бол хэрэглэгчийн харьцдаг интерфэйс. Түүний цаана ажиллаж байгаа “тархи” нь тэр суурь модель юм. Орчин үеийн томоохон AI үйлчилгээ бүр ийм суурь модель дээр тогтдог.
Transformer: Орчин үеийн AI-ийн хөдөлгүүр
2017 онд Америкийн судлаачид Transformer гэх архитектурыг танилцуулснаар бүх зүйл өөрчлөгдсөн. Үүнээс өмнөх AI-ууд текстийг хүн шиг зүүнээс баруун тийш, нэг нэг үгээр нь уншдаг байсан. Урт өгүүлбэр таармагц эхний контекстоосоо төөрдөг байв.
Transformer-ийн давуу тал нь:
- их хэмжээний текстийг нэгэн зэрэг харж чаддаг
- өгүүлбэр доторх ойлголтуудын хоорондын математик холбоог зурдаг
- урт контекстийг алдахгүй барьж чаддаг
Ингээд энэ архитектурыг интернетийн асар их текст өгөгдөл дээр сургавал LLM буюу large language model бий болдог. Гаднаас нь харахад энэ нь зүгээр “дараагийн үгийг таах” тоглоом шиг. Гэхдээ асар их өгөгдөл, контекст, давталттай хослохоор логик, физик, хэл найруулга, кодчилол, математик зэргийг баримжаалж чаддаг тархи шиг ажиллаж эхэлдэг.
Асуудал нь ийм том Transformer модель сургахад асар олон тооны дэвшилтэт GPU хэрэгтэй. Харин Хятад яг тэр тал дээр сул байсан.
DeepSeek юу өөр хийсэн бэ?
DeepSeek хамгийн сүүлийн үеийн чип ашиглан “хар хүчээр” дайрах боломжгүй учраас өөр замаар явсан. Хуучин загварын, сул чадалтай чипийг яаж илүү сайн шахаж болох вэ?
Энд тэд хоёр том алхам хийсэн юм.
Нэгдүгээрт: Mixture of Experts-ийг туйлд нь хүргэсэн
Mixture of Experts буюу MoE гэдэг нь нэг том модель дотроо олон жижиг, төрөлжсөн “мэргэжилтэн” хэсэгтэй байна гэсэн үг. Хуучин dense модельд асуулт асуух болгонд тархи бүхлээрээ ажилладаг байсан. Энэ нь маш их тооцоолол шаардана.
MoE бол үүнийг өөрчилсөн. Асуултын төрлөөс шалтгаалаад зөвхөн хэрэгтэй хэсгийг идэвхжүүлнэ.
Америкийн компаниуд ч энэ аргыг ашигласан. Гэхдээ DeepSeek үүнийг бүр өндөр нарийвчилсан түвшинд аваачсан. Тэд моделоо 256 жижиг мэргэжилтэн болгон хуваасан. Асуулт ирэхэд чиглүүлэгч систем маш хурдан шийдэж, зөвхөн 8 орчим хэсгийг асааж ажиллуулна. Үлдсэн хэсэг унтаастай хэвээр үлдэнэ.
Үр дүн нь тодорхой:
- GPU-ийн ачаалал буурна
- санах ойн хэрэглээ багасна
- ажиллуулах өртөг эрс хямдарна
Хоёрдугаарт: Санах ойг шахсан MLA
AI урт яриа, төвөгтэй даалгавар дээр ажиллахдаа өмнөх контекстыг санаж байх ёстой. Инженерийн хэлээр үүнийг key-value cache гэдэг. Энгийнээр хэлбэл AI-ийн богино хугацааны санах ой.
DeepSeek үүнийг хэмнэхийн тулд Multi-head Latent Attention буюу MLA гэх шинэ арга гаргасан. Энэ нь AI-ийн богино хугацааны санах ойг маш өндөр түвшинд шахаж, санах ойн эзэлхүүнийг 90-ээс дээш хувиар бууруулсан гэж тайлбарлаж болно.
Ингэснээр модель контекстоосоо төөрөхгүй мөртлөө маш бага нөөцөөр ажиллах боломжтой болсон.
Тэд Nvidia-ийн “автомат хурдны хайрцаг”-ийг ч тойрсон
Ихэнх AI компаниуд Nvidia-ийн CUDA хэмээх стандарт программ орчинд найдаж ажилладаг. Энэ нь хялбар, тогтвортой, өргөн хэрэглээтэй. Гэхдээ DeepSeek илүү гүн рүү орсон. Тэд CUDA орчны доторх илүү доод түвшний PTX код ашиглан чипүүдийн хоорондын харилцаа, тооцооллын урсгалыг маш нарийн оновчилсон.
Өөрөөр хэлбэл бусад нь автомат машин барьж байхад DeepSeek механик араагаар нарийн тохиргоо хийж явсан гэсэн үг.
Америкийн компаниуд ингэж чадахгүй байсан уу? Чадна. Гэхдээ тэдэнд тийм шаардлага бага. Хамгийн сүүлийн үеийн GPU-үүдэд, бараг хязгааргүй төсөвт найдаж болох үед “илүү олон чип худалдаад авчих” нь сар сараар шахаж бага түвшний код оновчлохоос хурдан, хямд тусдаг.
DeepSeek-д тийм тансаг сонголт байгаагүй. Тиймээс тэд оновчлол дээр бүх хүчээ хаясан.
Яагаад DeepSeek-ийн өртөг ийм бага байсан бэ?
Эдгээр аргачлалын ачаар DeepSeek дэлхийн түвшний модель бүтээх өртгөө маш сайн багасгаж чадсан гэж гэдэг. Томоохон америк модельд хэдэн зуун сая доллар зарцуулж байхад DeepSeek хэдхэн сая долларын хүрээнд сургалтаа хийсэн гэсэн зураг харагддаг.
Энд мөн хамгийн сонирхолтой нь зөвхөн архитектурын тухай яриа биш юм. Deepseek моделээ нээлттэй болгосон.
OpenAI шиг хаалттай загварын оронд DeepSeek-ийн модель олон нийтэд нээлттэй болсон учраас судлаач, гарааны компани, хөгжүүлэгчид:
- дотор нь юу байгааг судлах,
- өөрсдөө авч ажиллуулах,
- сайжруулах,
- өөрийн зорилгод тааруулж тохируулах
боломжтой болсон.
Энэ нь DeepSeek-ийг зүгээр нэг бүтээгдэхүүн биш, платформ болгосон гэсэн үг. Нэг компанийн хурдад хязгаарлагдах биш, олон мянган гаднын инженерийн параллель туршилт түүний хөгжлийг урагшлуулж эхэлсэн.
3. AI-ийн жинхэнэ түлш бол дата: Хятад хаана давуу вэ?
Хэдий хардвэр чухал, модель чухал ч AI түүгээр дуусахгүй. Модель бол хоосон тархи. Түүнийг амилуулдаг зүйл бол өгөгдөл.
AI нь өөрөө дэлхийг таньж мэдэж чадахгүй. Түүнд мэдлэг, хэл, логик, хэв маяг, зан төлөв бүгдийг өгөгдлөөр суулгадаг. Тиймээс AI өрсөлдөөний хамгийн том асуултын нэг бол “хэн хамгийн ухаантай инженерүүдтэй вэ?” гэхээс гадна “хэн хамгийн сайн дата ашиглаж байна вэ?” гэсэн асуулт юм.
Reinforcement learning: DeepSeek мөнгө муутайдаа ухаантай болсон уу?
Барууны AI компаниуд олон жил ажиллаж өндөр чанартай сургалтын дата үүсгэхийн тулд асар их зардал гаргасан. Хуульч, инженер, судлаач, математикч зэрэг мэргэжилтнүүдийг ажиллуулж тэднээр сайн жишээ, зөв тайлбар, шат дараалсан бодолт бүхий “сургалтын материал” бүтээлгэдэг байсан.
Энэ арга үр дүнтэй. Гэхдээ аймшигтай өндөр үнэтэй.
DeepSeek үүнээс илүү хүчтэй reinforcement learning-нд тулгуурласан. Өөрөөр хэлбэл модель өөрөө олон боломжит хариулт гаргана. Дараа нь үнэлгээний систем аль нь зөв, ашигтай, логиктой байсныг урамшуулна. Бурууг нь торгоно. Ингэж давтсаар модель амжилттай хариулт гаргах арга барилаа өөрөө сайжруулдаг.
Америкийн компаниуд reinforcement learning ашигладаггүй юу? Ашигладаг. Гэхдээ ихэвчлэн хүний бэлтгэсэн үнэтэй дата дээр түүнийг нэмж ашигладаг. Учир нь тэдэнд AI-аа анхнаасаа илүү аюулгүй, хяналттай, эелдэг, арилжааны хэрэглээнд бэлэн байлгах шаардлага байсан.
DeepSeek харин зардал мөнгөний шахалтад орж reinforcement learning-ийг илүү эрт, илүү хүчтэй ашигласан.
Гэхдээ нэг том асуудал гарсан
Тэдний модель логик, математик, код дээрээ маш хүчтэй болсон. Харин хүмүүстэй ойлгомжтой харилцах чадвар дээр доголдож эхэлсэн. DeepSeek-ийн инженерүүдийн тайлбарласнаар модельд “language mixing” гэх асуудал гарсан. Өөрөөр хэлбэл модель англи, хятад хоёр хэл холилдсон, эвгүй, уншихад төвөгтэй хэлбэрээр “бодож” эхэлсэн.
Нэг ёсондоо суут математикч мөртлөө энгийн хүнтэй ярихдаа бувтнадаг хүн шиг болсон гэсэн үг.
Иймээс DeepSeek-д эцэстээ бага хэмжээгээр ч гэсэн хүний шошголж бэлтгэсэн дата оруулж, түүнд хариултаа хүмүүст ойлгомжтой форматлах чадвар заах шаардлагатай болсон. Гэсэн ч Deepseek нэг маш чухал зүйлийг баталсан юм.
Дэлхийн түвшний reasoning engine-ийг асар бага зардлаар босгох боломжтой.
4. Зөвхөн текст хангалтгүй: Дараагийн тулааан бол multimodal AI
Өнөөдөр хүмүүс ChatGPT, Claude, Gemini зэрэг модель нь “сайн ч гэлээ хүссэнд хүрэхгүй байна” гэж гомдоллох болсон. Энэ нь хүний хүлээлт дандаа өсч байдагтай холбоотой. Гэхдээ үүнд өөр нэг том шалтгаан бий.
Бодит ертөнц зөвхөн текстээр хязгаарлагддаггүй.
Нар жаргах агшин, ус цацрах физик, хүний нүүрний хөдөлгөөн, алхах хэмнэл, орчны дуу авиаг гэх мэтийг зөвхөн текстээр бүрэн ойлгуулах боломжгүй. Үүний тулд:
- зураг,
- дуу,
- видео
хэрэгтэй.
Үүнийг нийтэд нь multimodal data гэж нэрлэдэг. Хэлний модель нь харанхуй өрөөнд сууж ном уншиж байгаа тархи, multimodal модель нь нүд, чихтэй болсон тархи гэсэн үг.
АНУ яагаад энд хана мөргөж эхэлсэн бэ?
Америкийн AI компаниудын эхний том амжилт нь нээлттэй интернетийг хуулж, түүний датаг ашигласнаар бий болсон. YouTube, Reddit, X, олон нийтийн вебсайт, нийтлэл, форум, ном, бичвэр гээд боломжтой бүхнийг тэд цуглуулж ашигласан.
Гэвч 2026 он гэхэд өөр нэг асуудал тодорч эхэлсэн. Өндөр чанартай multimodal дата-гийн бэлэн нөөц дуусч байна.
Сайн чанарын дата:
- түүнийг аль хэдийн хуулж авсан,
- ихэвчлэн шавхагдсан,
- тасархай, алаг цоог
- хууль, зохиогчийн эрх, нууцлалын саадтай.
Энэ нөхцөлд компаниуд synthetic data буюу AI өөрөө өөртөө дата үүсгэж өөрийгөө сургах аргагүй байдал руу улам бүр орж эхэлсэн.
5. Хятадын супер аппууд AI-д яагаад асар том давуу тал өгч байна вэ?
Эндээс AI-ийн эцсийн, хамгийн их харагддаг давхарга руу орно. Энэ бол consumer app layer. Өөрөөр хэлбэл хүмүүсийн өдөр тутам ашигладаг апп, платформууд.
Хятадын дижитал экосистемийн гол ялгаа нь супер аппууд болон аварга контент платформууд дээр төвлөрсөнд оршдог. WeChat, Douyin зэрэг платформууд зөвхөн хэрэглээний үйлчилгээ биш. Эдгээр нь асар их хэмжээний бодит зан төлөв, дүрс, дуу, үйлдлийн урсгал үүсгэдэг дата хөдөлгүүрүүд юм.
ByteDance яагаад SeeDance 2.0-оор хүчтэй гарч ирэв?
SeeDance 2.0 нь Хятадын AI видео үүсгэгчдийн нэгэн том брэнд нэр болоод байна. Үүний цаана ByteDance бий. Энэ компанийн хамгийн том давуу тал нь зүгээр л AI модель сайн хийсэндээ биш. Тэд датагаа өөрсдөө эзэмшдэг.
Douyin болон TikTok зэрэг платформууд дээр өдөр бүр хэдэн зуун сая хүн:
- хоол хийх,
- бүжиглэх,
- засвар хийх,
- дрон бичлэг,
- өдөр тутмын влог,
- элдэв хөдөлгөөн, харилцаа, бодит орчны үзэгдэл
бүхий өндөр нягтаршилтай видео байршуулдаг.
Хамгийн чухал нь ByteDance энэ контентыг гаднаас татаж авдаггүй, эх файлаар нь сервер дээрээ хадгалж байдаг. Тэгээд тэр видео бүр нь дагалдах мета өгөгдөлтэй:
- камерын өнцөг
- гэрэлтүүлгийн нөхцөл
- хэрэглэгч хэзээ сонирхлоо алдаж swipe хийсэн мөч
- аль төрлийн дүрс, хөдөлгөөн илүү анхаарал татсан тухай engagement мэдээлэл
Энэ бол AI-д зориулсан төгс, шошголсон, байнга өсөж байдаг multimodal дата-ны уурхай гэсэн үг.
Яагаад SeeDance зарим талаараа Sora-гаас илүү харагдаж байна вэ?
OpenAI-ийн Sora зэрэг америк видео модельд физикийн тогтвортой байдал, дуу дүрсний синк, дүрсний гажуудал зэрэг асуудал байсаар байгаа тухай шүүмжлэл олон гардаг. Харин SeeDance зэрэг Хятадын системүүд зарим тохиолдолд:
- усны цацралтыг илүү бодитоор,
- тусгалыг орчинтой нь тааруулж,
- дуу дүрсийг илүү уялдаатай
гаргаж чаддаг гэж үнэлэгдэж байна.
Үүнийг инженерүүд natural motion synthesis гэх ойлголтоор тайлбарладаг. Өөрөөр хэлбэл AI тухайн хөдөлгөөний физикийн мэдрэмжийг бодит видео урсгалаас маш сайн сурсан байдаг.
Энд давуу тал нь зүгээр “Хятадын инженер сайн” гэдэгт биш. ByteDance шиг компаниудын гар дээр бодит амьдралын, асар чанартай, бүтэцжсэн видео дата байгаа гэдэгт оршино.
Doubao яагаад DeepSeek-ээс ч том болсон бэ?
DeepSeek текст, логик, reasoning талдаа хүчтэй. Гэхдээ зураг, видео тал дээр хязгаарлагдмал. Харин ByteDance-ийн Doubao нь дүрс, дуу, видео, текстийг нэг дор ажиллуулдаг. Үүний ард мөн л ByteDance-ийн дата хөдөлгүүр байна.
Тиймээс Хятадын AI-ийн давуу тал зөвхөн нэг гайхалтай модельд бус, апп, дата, хэрэглээ, модель хоорондын гинжин холбоонд бий болж байна.
6. Хятадын давуу тал бодитой. Гэхдээ энэ тоглоом дуусаагүй
Хятад 1.4 тэрбум хүн амтай, Douyin дангаараа өдөрт 750 саяас давсан идэвхтэй хэрэглэгчтэй орчинд ажиллаж байна. Энэ нь AI-ийн хувьд үнэхээр аймшигтай том дата эргэлт үүсгэнэ.
Гэхдээ энэ нь төгс ялалт гэсэн үг биш.
Хэрэв Хятадын AI модель барууны хотын орчин, барууны соёлын нарийн дохио, барууны хэрэглэгчийн зан төлөвийг яг таг ойлгохыг хүсвэл зөвхөн Хятадын дотоод платформын дата хангалтгүй болно. Тэр үед Хятад ч гэсэн Америкийн компаниудтай адилхан гадаад ертөнцийн өндөр чанартай дата гэх тэр хананд тулна.
Тэгэхээр AI-ийн уралдаан дуусаагүй. Зүгээр л дараагийн шат руугаа орж байна.
7. Дараагийн фронт: AI агентууд, робот, бас Интернэтээс гаднах бодит амьдралын өгөгдөл
Ирээдүйд AI агентууд, физик робот, бодит ертөнцөд ажиллах системүүд гарч ирэх тусам зөвхөн интернетээс авсан дата хангалтгүй болох магадлал өндөр. Хүмүүсийн бодит үйлдэл, харилцаа, орчны мэдрэмж, соёлын ялгаа, амьд яриа, нөхцөл байдалд хариу үзүүлэх чадвар гээд одоо хүртэл бүрэн цуглуулагдаагүй асар их өгөгдөл Интернэтийн гадна байна.
Энэ цэг дээр маш сонирхолтой асуулт гарч ирнэ. Хамгийн үнэ цэнтэй дата нь вэбсайт scrape хийхээс (ухахаас) биш, харин хүмүүстэй бодитоор ярилцах харилцаанаас гарч ирвэл яах вэ?
Жишээ нь олон жилийн турш гудамжны ярилцлага, амьд туршлага, нийгэм соёлын сэдвээр хүмүүсийн жинхэнэ байр суурийг эмхэлж, цуглуулсан өгөгдөл ирээдүйн AI-д ямар үнэ цэнтэй байх бол? Хэрэв AI ирээдүйд хүмүүсийг үнэхээр ойлгох ёстой бол хамгийн чухал өгөгдөл нь зүгээр нийтлэл, форум, хуулбарласан видео биш, харин жинхэнэ хүнтэй хийсэн бодит харилцаа байж мэднэ.
Гол дүгнэлтүүд
Хятадын AI-ийн огцом өсөлтийг ойлгохын тулд нэг том шалтгаан хайх хэрэггүй. Энэ бол хэд хэдэн хүчин зүйлийн огтлолцол.
- AlphaGo Хятадад AI-ийг стратегийн түвшинд авч үзэх хүчтэй дохио болсон
- Хардвэрын хувьд Хятад хязгаарлагдсан ч энэ нь тэднийг оновчлолд түлхсэн
- DeepSeek сул чип дээр хүчтэй модель босгох шинэ инженерчлэлийн жишээ болсон
- Нээлттэй эх нь прогрессыг нэг компаниас салгаж, экосистем болгосон
- Reinforcement learning өртгийг бууруулж, reasoning чадварыг хүчтэй болгосон
- ByteDance, Douyin зэрэг платформууд multimodal дата дээр Хятадад онцгой давуу тал өгч байна
- SeeDance 2.0, Doubao зэрэг хэрэгслүүд энэ давуу талыг эцсийн бүтээгдэхүүн болгож хувиргаж байна
- Гэхдээ Америк ч, Хятад ч эцэстээ шинэ төрлийн дата олох шаардлагатай болно
Эцсийн бодол
Хятадын AI яагаад гэнэт ийм сайн болсон бэ гэсэн асуултын хамгийн товч хариулт бол энэ: тэд хаалттай тулах бүртээ өөр зам гаргасан.
Шилдэг чипийг авч чадахгүй болсон үедээ тэд программ, архитектур, оновчлолоор зүтгэсэн. Өндөр үнэтэй хүний сургалтын датаар өрсөлдөх боломж бага үедээ reinforcement learning-д эртлэн хүчээ төвлөрүүлсэн . Текстэн модель дээр өрсөлдөхөөс цаашлаад өөрсдийн апп экосистемээр дамжуулан видео, дүрс, дууны бодит асар их өгөгдөл дээр суусан.
Тиймээс энэ өрсөлдөөнийг зөвхөн “хэн түрүүлж ChatGPT шиг юм хийв” гэдэг өнцгөөс харах нь хэтэрхий өнгөц. Жинхэнэ тулаан бол:
- хэн чип үйлдвэрлэлийг эзэмшиж байна,
- хэн модель дээр илүү ухаантай инженерчилж байна,
- хэн хамгийн сайн өгөгдөл эзэмшиж байна,
- хэн тэр өгөгдлийг их хэрэглээтэй бүтээгдэхүүн болгож чадах вэ
гэдэг дээр явж байна.
Нэг зүйл тодорхой. Ялагч хараахан тодроогүй л байна. Мөн тоглоомын дүрэм байнга өөрчлөгдөж байна.
Тэгээд магадгүй ирээдүйн хамгийн үнэ цэнтэй AI дата нь серверүүд дээр биш, бодит хүмүүсийн амьд яриа, хөдөлгөөн, шийдвэр, туршлагын ард нуугдсаар байгаа ч юм билүү.
Facebook Comments