LLM (Large Language Model) ምንድን ነው? በቀላል አማርኛ

LLM (Large Language Model) ምንድን ነው?

LLM ቋንቋን ለመረዳት እና አዳዲስ ጽሁፎችን ለማመንጨት እንዲችል እጅግ በጣም ብዙ በሆኑ የጽሁፍ መረጃዎች ላይ የሰለጠነ የሰው ሰራሽ አስተውሎት (AI) ሞዴል ዘርፍ ነው። (ምንጭ፦ IBM)
አብዛኛዎቹ ዘመናዊ LLMs ትራንስፎርመር (Transformer) የተባለውን የሶፍትዌር መዋቅር ይጠቀማሉ። ይህም ቋንቋን በከፍተኛ መጠን እና ጥራት ለማስተናገድ ይረዳቸዋል። (ምንጭ፦ IBM)

በቀላል አገላለጽ፦ LLM ማለት እንደ መጽሐፍት፣ ድረ-ገጾች እና የጥናት ጽሁፎችን የመሰሉ ቢሊዮን የሚቆጠሩ ቃላትን አንብቦ የሰውን ልጅ አነጋገር እና አጻጻፍ የተማረ “ዲጂታል አእምሮ” እንደማለት ነው።

ደረጃ 1 — የመማሪያ መረጃ (Training data)፦ መጽሐፍት፣ ድረ-ገጾች፣ የኮምፒውተር ኮድ እና ልዩ ልዩ ሰነዶችን ማንበብ።
ደረጃ 2 — ቃላትን መቆራረጥ (Tokenization)፦ ጽሁፎችን ወደ ትናንሽ ቁርጥራጮች (“ቶክኖች”) መቀየር።
ደረጃ 3 — መተንበይ (Prediction)፦ ሞዴሉ ቀጥሎ ሊመጡ የሚችሉ ቃላትን የመገመት ችሎታን ይማራል።
ደረጃ 4 — ምላሽ መስጠት (Inference)፦ እርስዎ ትእዛዝ ሲሰጡት፣ ለጥያቄዎ የተሻለውን ቀጣይ ምላሽ ይተነብያል።
ደረጃ 5 — ስነ-ምግባር እና ደህንነት (Alignment)፦ ተጨማሪ ስልጠና እና ደንቦች የሞዴሉን ጠባይ እንዲያስተካክሉ ይደረጋል።

ChatGPT የLLM አይነት ነው?

LLMs እንደ ሰው “መረዳት” ይችላሉ?

አይችሉም፦ ልክ እንደ ሰው አያስቡም፤ ነገር ግን በቢሊዮን የሚቆጠሩ መረጃዎችን በማገናኘት የሰውን ልጅ አነጋገርና እውቀት የመምሰል ከፍተኛ ብቃት አላቸው።