LLM (Large Language Model) ምንድን ነው?
- LLM ቋንቋን ለመረዳት እና አዳዲስ ጽሁፎችን ለማመንጨት እንዲችል እጅግ በጣም ብዙ በሆኑ የጽሁፍ መረጃዎች ላይ የሰለጠነ የሰው ሰራሽ አስተውሎት (AI) ሞዴል ዘርፍ ነው። (ምንጭ፦ IBM)
- አብዛኛዎቹ ዘመናዊ LLMs ትራንስፎርመር (Transformer) የተባለውን የሶፍትዌር መዋቅር ይጠቀማሉ። ይህም ቋንቋን በከፍተኛ መጠን እና ጥራት ለማስተናገድ ይረዳቸዋል። (ምንጭ፦ IBM)
በቀላል አገላለጽ፦ LLM ማለት እንደ መጽሐፍት፣ ድረ-ገጾች እና የጥናት ጽሁፎችን የመሰሉ ቢሊዮን የሚቆጠሩ ቃላትን አንብቦ የሰውን ልጅ አነጋገር እና አጻጻፍ የተማረ “ዲጂታል አእምሮ” እንደማለት ነው።

LLMs እንዴት ይሠራሉ? (ያለ ሂሳብ ቀመር ማብራሪያ)
- ደረጃ 1 — የመማሪያ መረጃ (Training data)፦ መጽሐፍት፣ ድረ-ገጾች፣ የኮምፒውተር ኮድ እና ልዩ ልዩ ሰነዶችን ማንበብ።
- ደረጃ 2 — ቃላትን መቆራረጥ (Tokenization)፦ ጽሁፎችን ወደ ትናንሽ ቁርጥራጮች (“ቶክኖች”) መቀየር።
- ደረጃ 3 — መተንበይ (Prediction)፦ ሞዴሉ ቀጥሎ ሊመጡ የሚችሉ ቃላትን የመገመት ችሎታን ይማራል።
- ደረጃ 4 — ምላሽ መስጠት (Inference)፦ እርስዎ ትእዛዝ ሲሰጡት፣ ለጥያቄዎ የተሻለውን ቀጣይ ምላሽ ይተነብያል።
- ደረጃ 5 — ስነ-ምግባር እና ደህንነት (Alignment)፦ ተጨማሪ ስልጠና እና ደንቦች የሞዴሉን ጠባይ እንዲያስተካክሉ ይደረጋል።
LLMs ምን ምን በደንብ ሊያደርጉ ይችላሉ?
- ጽሁፎችን ማርቀቅ እና እንደገና መጻፍ።
- ሰነዶችን ማጠቃለል።
- ትርጉም መስራት።
- የሥራ ዕቅዶችን (Outlines) ማዘጋጀት።
- የኮምፒውተር ኮድ ማመንጨት።
- ውስብስብ ርዕሰ ጉዳዮችን በቀላል ቋንቋ ማስረዳት።
LLMs ምን ላይ ይቸገራሉ?
- ፍጹም እውነታ (Hallucinations)፦ አንዳንድ ጊዜ የተሳሳተ መረጃን እውነት አስመስለው ሊናገሩ ይችላሉ።
- ድብቅ ስሌቶች፦ በከፍተኛ ልበ ሙሉነት የተሳሳተ የሂሳብ ውጤት ሊሰጡ ይችላሉ።
- ወቅታዊ እውነታዎች፦ ከመሳሪያዎች ወይም ከመረጃ ምንጮች ጋር ካልተገናኙ በስተቀር አዳዲስ መረጃዎችን ላያውቁ ይችላሉ።
- ጥንቃቄ የሚሹ የህግ/የህክምና ጉዳዮች፦ በእነዚህ ዘርፎች ላይ ሙሉ በሙሉ በእነሱ ላይ መተማመን አይቻልም።
ደረጃ በደረጃ፦ ጀማሪዎች LLMsን በደህንነት እንዴት መጠቀም አለባቸው?
- LLMsን ለመጀመሪያ ረቂቅ (Drafting) እንጂ ለመጨረሻው እውነት አይጠቀሙባቸው።
- ለአስፈላጊ መረጃዎች የጠቀሱትን ምንጭ (Sources) እንዲያሳዩ ይጠይቁ።
- ከኦፊሴላዊ ሰነዶች ጋር መረጃውን ያመሳክሩ።
- ሚስጥራዊ መረጃዎችን ወደ ቦቱ አያስገቡ።
- ተደጋጋሚ ስራዎችን ለመስራት የትእዛዝ ቅጾችን (Templates) ያዘጋጁ።
ተደጋጋሚ ጥያቄዎች (FAQ)
ChatGPT የLLM አይነት ነው?
- አይደለም፦ ChatGPT የLLM ሞዴሎችን (እንደ GPT-4 ያሉትን) የሚጠቀም “ምርት” ወይም “መተግበሪያ” ነው።
LLMs እንደ ሰው “መረዳት” ይችላሉ?
አይችሉም፦ ልክ እንደ ሰው አያስቡም፤ ነገር ግን በቢሊዮን የሚቆጠሩ መረጃዎችን በማገናኘት የሰውን ልጅ አነጋገርና እውቀት የመምሰል ከፍተኛ ብቃት አላቸው።

