Skip to main content

Хиймэл Оюуны Агентууд гэж юу вэ?

9 сарын өмнө
5
(1)

Өнөө цагт хамгийн их анхаарал татаж буй сэдвүүдийн нэг бол Хиймэл оюун (ХО) билээ. Гэсэн ч олон хүн хиймэл оюуны агентууд гэж юу болохыг огт ойлгодоггүй эсвэл ойлгох гэж оролдсон ч хэт төвөгтэй, эсвэл дэндүү их техникийн зүйл гэж боддог. Энэ блогт би танд хиймэл оюуны агентын тухай ойлголтыг энгийнээр, алхам алхмаар тайлбарлаж өгөх болно. Магадгүй та хиймэл оюуны хэрэгслийг өдөр тутмын ажил, амьдралдаа ашигладаг, эсвэл техникийн мэдлэггүй ч энэ блогоос агентийн учрыг хялбар ойлгох болно.

Бид ХО-ыг гурван түвшинг авч үзэх болно. Энэ нь: хэлний том загварууд (LLM), хиймэл оюуны урсгалууд (AI workflows), мөн эцэст нь хиймэл оюуны агентууд (AI agents). Бид эдгээр ойлголтуудыг бодит жишээн дээр үндэслэн тайлбарлах бөгөөд тэдгээр нь таны өдөр тутмын амьдралд хэрхэн нөлөөлөхийг харуулах болно.

 

Алхам 1: Хэлний Том Загварууд (LLM)

Хиймэл оюуны ертөнцийн хамгийн эхний түвшин нь хэлний том загварууд буюу LLM (Large Language Models) юм. ChatGPT, Google Gemini, Claude зэрэг хиймэл оюуны алдартай чаат боотууд нь ийм загварууд дээр суурилсан бөгөөд текст бичих, засах гайхалтай чадвартай.

Энгийнээр тайлбарлавал, энэ загварыг ашиглахын тулд түүний оролт буюу “промпт”-ийг хүн бичиж өгдөг, харин LLM нь машин сургалтын их өгөгдлийн үндсэн дээр хариултыг үүсгэдэг. Жишээ нь, би ChatGPT-д “Кофе уунгаа уулзах тухай захидал бичээрэй” гэж оролт бичвэл, ChatGPT миний оролтыг уншаад ёс зүйтэй, найрсаг, гэх мэт хэллэгтэй захидал үүсгэнэ. Ийм загвар маш энгийн бөгөөд ойлгомжтой ажиллагаатай.

Гэхдээ дараагийн асуултаа бичье: “Миний дараагийн кофе уулзалт хэзээ билээ?” гэвэл ChatGPT энэ асуултад хариулахгүй. Учир нь LLM нь таны хувийн эсвэл компанийн мэдээлэлд нэвтрэх эрхгүй бөгөөд таны календарийг мэдэхгүй. Энэ нь LLM-ийн хоёр гол онцлогийг харуулж байна:

  • Хязгаарлагдмал мэдлэг: Их хэмжээний өгөгдлүүд дээр суурилсан ч хувийн мэдээлэлд хандах эрх нь хязгаарлагдмал.
  • Идэвхгүй байдал: LLM нь хүний бичсэн оролтыг хүлээж авсны дараа л хариу үүсгэдэг, өөрөөр хэлбэл идэвхтэйгээр шийдвэр гаргах чадваргүй.

Эдгээр хоёр онцлогийг санаж аваарай.

Алхам 2: Хиймэл Оюуны Урсгалууд (AI Workflows)

Одоо хиймэл оюуны урсгалууд буюу AI workflows гэж юу болохыг авч үзье. Урсгал гэдэг нь тодорхой дараалалтай үйлдлүүдийн цогц бөгөөд мөн хүний заавраар ажилладаг.

Өмнөх жишээгээ үргэлжлүүлье. Хэрэв LLM-д би “намайг хувийн арга хэмжээнийхээ тухай асуухад, миний Google календарийг шалгаад хариу өгч бай” гэсэн заавар өгвөл юу болох вэ? Энэ зааврын дараа, “Элон Масктай миний кофе уулзалт хэзээ билээ?” гэж асуувал LLM миний Google календарийг шалгаж үзээд, надад зөв хариултыг өгөх болно.

Одоо дараагийн асуултаа асууя: “Тэр өдөр цаг агаар ямар байх вэ?” гэвэл LLM энэ асуултад зөв хариулж чадахгүй. Учир нь би LLM-д зөвхөн миний Google колендариас мэдээлэл авч байх эрх өгсөн бөгөөд цаг агаарын мэдээлэл авах урсгалыг би түүнд оруулаагүй.

Энэ нь хиймэл оюуны урсгалын үндсэн онцлог юм. Урсгалууд нь зөвхөн хүний зааж өгсөн замыг дагадаг бөгөөд өөрөө мэдэж шийдвэр гаргах чадваргүй. Техникийн үг хэллэгээр бол ийм замыг “хяналтын логик” гэж нэрлэдэг.

Хэрэв би урсгалдаа цаг агаарын API (мэдээлэлд хандах эрх) нэмээд, аливаа хариултыг дуу болгон хувиргах буюу текстээс дуу руу шилжүүлдэг загварыг мөн ашиглавал, “Элон Масктай уулзах өдөр нарлаг, сайн өдөр байх болно” гэх мэт хариуг дуу хоолойгоор авах боломжтой. Гэсэн ч энэ нь нөгөө урсгал хэвээрээ л байх болно, учир нь хүний заасан замаар явж шийдвэр гаргаж байна.

Тайлбар: “Retrieval Augmented Generation” буюу RAG гэдэг нь хиймэл оюуны загвар хариулт өгөхийнхөө өмнө мэдээллийг хайж олох процессыг илэрхийлдэг бөгөөд энэ нь мөн AI workflow-ийн хэсэг юм.

Бодит жишээ яривал, би Helena Liu-ийн гайхалтай сайн зааврын дагуу make.com ашиглан өөрийн AI workflow бүтээсэн. Би Google Sheets ашиглан мэдээний холбоосуудыг цуглуулж, Perplexity ашиглан тэдгээрийг товчлон, Claude ашиглан LinkedIn ба Instagram-д зориулсан пост бичдэг. Эцэст нь энэ урсгалаа би өдөр бүрийн өглөөний 8 цагт автоматаар ажиллуулах тохиргоо хийсэн.

Энэ жишээ нь ХО-ы урсгалын онцлогийг тодорхой харуулж байна: алхам бүр нь тодорхой бөгөөд хүний заавраар ажиллана. Хэрэв би LinkedIn-ийхээ постыг илүү хөгжилтэй болгохыг хүсвэл Claude-д зориулсан оролт буюу промптоо өөрчилж, дахин турших хэрэгтэй болно. Энэ нь хүний оролцоо шаардсан ажил.

Алхам 3: Хиймэл Оюуны Агентууд (AI Agents)

Одоо хамгийн сонирхолтой шат болох хиймэл оюуны агентуудыг авч үзье. Өмнөх жишээгээрээ үргэлжлүүлэн тайлбарлая.

Make.com дээр бүтээсэн workflow-гийн хувьд би өөрөө шийдвэр гаргагч байсан: мэдээ цуглуулах, товчлох, бичих зэрэг алхмуудыг би шийдэж, хэрэгслийг ашигласан. Харин хиймэл оюуны агентийн гол ялгаа нь энэ хүний шийдвэр гаргах үүргийг хиймэл оюун өөрөө гүйцэтгэдэгт оршдог.

Тухайлбал, агент нь:

  • Шийдвэр гаргана (Reason): Мэдээ цуглуулах хамгийн үр дүнтэй аргыг өөрөө бодож олно. Жишээ нь, өгөгдлийг Word-д хуулж бичих үү, эсвэл холбоосыг нь хадгалах уу? Хариулт нь холбоосыг хадгалах нь илүү үр дүнтэй.
  • Үйлдэл хийнэ (Act): Google Sheets ашиглах уу, Excel ашиглах уу? Хэрэглэгчийн Google данс make.com-т холбогдсон тул Google Sheets ашиглах нь илүү тохиромжтой.

Энэ нь ХО-ы агентуудын хамгийн түгээмэл бүтэц болох ReAct framework-ийн зарчмыг харуулж байна. ReAct гэдэг нь Reason (шалтгаан, бодол) ба Act (үйлдэл) гэсэн үгсийн товчлол юм. ХО агентууд өөрөө шийдвэр гаргаж, үйлдэл хийнэ гэсэн утгатай.

ХО-ы агентуудын гурав дахь чухал онцлог бол түүний давталт буюу iteration хийх чадвар юм. Урьд нь би LinkedIn постыг илүү хөгжилтэй болгохын тулд өөрөө шинэ промпт бичиж байсан. Харин ХО-ы агент энэ процессыг өөрөө автоматжуулж чадна. Жишээ нь, нэг ХО постыг бичиж, өөр нэг ХО энэ постыг LinkedIn-ийн шилдэг туршлагад нийцэж байгаа эсэхийг хянана. Энэ давталтыг агент өөрөө хийх бөгөөд хамгийн сайн үр дүнг гаргана.

Бодит Жишээ

Andrew Ng бол хиймэл оюуны салбарын нэр хүндтэй мэргэжилтэн бөгөөд хиймэл оюуны агентуудыг ойлгоход туслах демо вебсайт бүтээсэн. Тэнд “skier” буюу цаначин гэж хайхад, агент нь эхлээд цаначны дүр төрхийг бодож, дараа нь видео бичлэгээс цаначинг олох, индексжүүлэх үйлдлийг хийж, эцсийн үр дүнг харуулдаг.

Энэ нь энгийн мэт санагдаж болох ч бодит байдалд хүн видео бичлэгийг үзэж, цаначинг олж авч, дараачийн алхмыг хийх ажлыг шаардлагагүй болгож байна.

Мөн би өөрийн ХО-ы агентыг Nan ашиглан бүтээж байна. Та өөрийн агентаа бүтээхийг хүсч байгаа бол сэтгэгдлээ бичээрэй. Би дараагийн зааварчилгаагаа тэр чиглэлээр бэлдэх болно.

Дүгнэлт: Гурван Түвшний Хиймэл Оюуны Тодорхойлолт

Эцэст нь бидний авч үзсэн гурван түвшинг товч эргэн харцгаая:

  1. Түвшин 1 – Хэлний том загварууд (LLM): Хүний өгсөн оролтод хариу үүсгэдэг энгийн систем. Жишээ нь, ChatGPT нь таны асуултад хариулна.
  2. Түвшин 2 – Хиймэл оюуны урсгалууд (AI Workflows): Хүний заавраар, тодорхой дараалалтайгаар алхмуудыг хийнэ. Жишээ нь, Google колендариас мэдээлэл хайж олох, цаг агаарын API ашиглах, дуу болгон хувиргах гэх мэт үйлдлүүдийг дараалуулан хийх.
  3. Түвшин 3 – Хиймэл оюуны агентууд (AI Agents): AI өөрөө зорилго тавьж, хамгийн үр дүнтэй арга замыг бодож олж, бусад хэрэгслийг ашиглан үйлдэл хийж, үр дүнг шүүн дүгнэж, шаардлагатай бол дахин давталт хийдэг.

ХО-ы агентууд нь хүний оролцоог багасгаж, илүү ухаалаг, автоматжуулсан шийдлүүдийг бий болгодог тул ирээдүйд маш чухал үүрэг гүйцэтгэх нь дамжиггүй.

Хэрэв та хиймэл оюуны талаар илүү гүнзгий суралцахыг хүсвэл, prompts буюу оролтын сан үүсгэх аргыг сурахыг зөвлөж байна. Энэ нь таны хиймэл оюуны туршлагыг илүү үр бүтээлтэй болгоно.

Танд амжилт хүсье! Хийж бүтээх үйлс тань үргэлж амжилттай байг.

Энэ тойм танд хэр өгөөжтэй байв?

Одыг дарж үнэлгээ өгнө үү!

Дундаж үнэлгээ 5 / 5. Саналаа өгсөн: 1

Санал ирээгүй байна! Та саналыг эхлүүлээрэй.

Facebook Comments

Бэлтгэж нийтэлсэн: BizMN / 2025.06.23