LLM ምንድን ነው? ትላልቅ የቋንቋ ሞዴሎች (Large Language Models) በቀላል አገላለጽ (ከምሳሌዎች ጋር)

ትልቅ የቋንቋ ሞዴል (LLM) ምንድን ነው?

LLM ማለት ቋንቋን ለመረዳት እና አዲስ ይዘትን ለመፍጠር እንዲችል እጅግ በጣም ከፍተኛ በሆነ የጽሁፍ መረጃ ላይ የሰለጠነ የሰው ሰራሽ አስተውሎት (AI) ዘርፍ ነው። (ምንጭ፦ IBM)
አብዛኞቹ ዘመናዊ LLMዎች ትራንስፎርመር (Transformer) የተባለውን የሶፍትዌር መዋቅር ይጠቀማሉ። ይህ መዋቅር ሞዴሎቹ ሰፋ ያሉ የቋንቋ መረጃዎችን በከፍተኛ ደረጃ እንዲያቀናጁ ይረዳቸዋል። (ምንጭ፦ IBM)

LLMs እንዴት ይሰራሉ? (ያለ ሂሳብ ስሌት ራስ ምታት)

ደረጃ 1 — የሥልጠና መረጃ (Training data)፦ ሞዴሉ እጅግ በጣም ብዙ መጽሐፍትን፣ ድረ-ገጾችን፣ የኮምፒውተር ኮዶችን እና ሰነዶችን በማንበብ ይጀምራል።

ደረጃ 2 — ቶከናይዜሽን (Tokenization)፦ ጽሁፎች ወደ ትናንሽ ቁርጥራጮች ወይም “ቶከኖች” (tokens) ይቀየራሉ። እነዚህ ቶከኖች ቃላት ወይም የቃላት ክፍሎች ሊሆኑ ይችላሉ።

ደረጃ 3 — ትንበያ (Prediction)፦ ሞዴሉ በመረጃዎቹ ውስጥ ያሉትን ቅጦች በማጥናት፣ ከአንድ ቃል ወይም ቶከን ቀጥሎ ሊመጣ የሚችለውን ተከታይ ቃል የመተንበይ ችሎታን ያዳብራል።

ደረጃ 4 — ኢንፈረንስ (Inference)፦ ትእዛዝ (prompt) ሲሰጡት፣ ሞዴሉ የተማረውን በመጠቀም ለጥያቄዎ የተሻለውን ተከታይ ምላሽ ይገምታል።

ደረጃ 5 — ቅንጅት እና ደህንነት (Alignment / safety)፦ ሞዴሉ ጠቃሚ፣ እውነተኛ እና ደህንነቱ የተጠበቀ ምላሽ ብቻ እንዲሰጥ ተጨማሪ ስልጠናዎች እና ደንቦች ይበጁለታል።

ጽሁፍ ረቂቅ ማዘጋጀትና እንደገና መጻፍ (Draft and rewrite text)፦ አዳዲስ ጽሁፎችን መጀመር ወይም የነበሩትን ይዘቶች በሌላ የአጻጻፍ ስልት ማስተካከል።
ሰነዶችን ማጠቃለል (Summarize documents)፦ ረጅም እና ውስብስብ የሆኑ ሰነዶችን ወደ አጭርና ግልጽ ነጥቦች መቀየር።
ትርጉም (Translate)፦ መልእክቱን ሳይለቁ ከአንድ ቋንቋ ወደ ሌላ ቋንቋ መተርጎም።
ረቂቅ አወቃቀር መፍጠር (Create outlines)፦ ለጽሁፎች፣ ለቪዲዮዎች ወይም ለፕሮጀክቶች መሰረታዊ መዋቅር ወይም ማውጫ ማዘጋጀት።
የኮምፒውተር ኮድ ማመንጨት (Generate code)፦ በተለያዩ የፕሮግራም ቋንቋዎች ኮዶችን መጻፍ ወይም ያሉትን ማረም።
ርዕሰ ጉዳዮችን በቀላል ቋንቋ ማስረዳት (Explain topics in simple language)፦ ከባድ የሆኑ ሳይንሳዊ ወይም ቴክኒካዊ ሀሳቦችን ለማንኛውም ሰው በሚገባ መልኩ ማብራራት።

ፍጹም የሆነ የመረጃ ትክክለኛነት (Perfect factual accuracy)፦ አንዳንድ ጊዜ የሌለ ነገርን እንዳለ አድርገው በልበ ሙሉነት ሊናገሩ ይችላሉ (ሀሉሲኔሽን/Hallucinations ይባላል)።
ውስብስብ ስሌቶች (Hidden calculations)፦ ረቂቅ የሆኑ የሂሳብ ስሌቶችን ሲሰሩ በልበ ሙሉነት ሊሳሳቱ ይችላሉ።
የወቅታዊ መረጃዎች እውነትነት (Real-time truth)፦ ከኢንተርኔት ወይም ከሌሎች የመረጃ ምንጮች ጋር ካልተገናኙ በስተቀር፣ የሰለጠኑበት መረጃ ካበቃበት ጊዜ በኋላ ያሉ አዳዲስ ክስተቶችን ላያውቁ ይችላሉ።
ህጋዊ ወይም ህክምናዊ እርግጠኝነት (Sensitive legal/medical certainty)፦ ጥንቃቄ የሚሹ የህግ ወይም የህክምና ምክሮችን በባለሙያ ደረጃ ለመስጠት አስተማማኝ አይደሉም።

ለረቂቅ ብቻ ይጠቀሙ (Drafting, not final truth)፦ AIን እንደ መጀመሪያ ረቂቅ ማዘጋጃ እንጂ እንደ መጨረሻው የማይታበል እውነት አይቁጠሩት።
የመረጃ ምንጮችን ይጠይቁ (Ask for sources)፦ ለሚሰጥዎ ጠቃሚ መረጃዎች ወይም ክርክሮች ማስረጃ ወይም ምንጭ እንዲጠቅስላችሁ ጠይቁ።
ከኦፊሴላዊ ሰነዶች ጋር ያነጻጽሩ (Cross-check)፦ AI የሰጠውን መረጃ ትክክለኛነት ከታወቁ ድረ-ገጾች ወይም ኦፊሴላዊ ሰነዶች ጋር በማመሳከር አረጋግጡ።
ሚስጥራዊ መረጃዎችን አያስገቡ (Keep sensitive info out)፦ የግል መረጃዎችን፣ የባንክ ምስጢሮችን ወይም ጥንቃቄ የሚሹ የኩባንያ ሰነዶችን ለAI አያጋሩ።
የተቀመጡ የትእዛዝ ቅጾችን ያዘጋጁ (Template prompt library)፦ ውጤታማ የሆኑ ትዕዛዞችን (Prompts) ደጋግመው ለመጠቀም እንዲመችዎ በዝርዝር አደራጅተው ያስቀምጡ።

ChatGPT እንደ LLM ይቆጠራል? (Is ChatGPT an LLM?)

ChatGPT የLLM ውጤት ነው፦ ChatGPT ራሱ ምርት (Product) ሲሆን፣ በውስጡ ግን LLMን እንደ ሞተር ይጠቀማል። (ChatGPT is a product that uses LLMs.)

LLMዎች እንደ ሰው “መረዳት” ይችላሉ? (Do LLMs “understand” like humans?)

የቋንቋ ቅጦችን በሚገባ ይከተላሉ፦ የቋንቋ አወቃቀሮችን እና ቅጦችን እጅግ በጣም በሚገርም ሁኔታ ይከተላሉ፤ ነገር ግን የእነሱ “መረዳት” ከሰው ልጅ ንቃተ-ህሊና እና ስሜታዊ ግንዛቤ ጋር አንድ አይደለም።