milkyway 6
milkyway 7
milkyway 8
Technology
09 กุมภาพันธ์ 2566
ภาษาไทย

ทำไม ‘ChatGPT’ และ ‘Large Language Model’ จึงได้รับความนิยม

เทรนด์ด้าน ‘Generative A.I.’ ส่งผลกระทบอย่างมากต่อการพัฒนาในหลากหลายด้าน โดยเฉพาะอย่างยิ่งในด้านของโมเดลภาษาขนาดใหญ่ (Large Language Model) และเป็นจุดเริ่มต้นของ ‘ChatGPT’ ดังนั้นเพื่อให้ทุกคนรู้จักกับ ChatGPT และโลกของ Large Language Models ที่กำลังถูกให้ความสนใจในขณะนี้มากยิ่งขึ้น SCB 10X จึงนำประเด็นสำคัญมานำเสนอในบทความนี้เพื่อพิจารณาโอกาสใหม่ๆ ด้าน AI จากงาน Moonshot Meetup กับหัวข้อ “Large Language Model and ChatGPT” จัดขึ้นโดย SCB 10X พร้อมพูดคุยกับ Speakers:

  1. Dr. Sarana Nutanong: Dean, School of IST at VISTEC and CEO & Co-founder, VISAI
  2. Dipen Mehta: General Manager, Financial Services, Asia Pacific at Microsoft
  3. Dr. Satya Nitta: CEO & Co-founder of Merlyn Mind (Former Global Head of AI Solutions at IBM) 
  • Moderated by Dr.Tanwa Arpornthip, Technical Advisor at SCB 10X 

Moonshot_1200X800.jpg


ทำไม ChatGPT และ Generative AI เกิดเป็นกระแสได้รับความสนใจอย่างยิ่ง เนื่องมาจากนวัตกรรมหรือผู้คนเปิดใจให้กับ Tech เหล่านี้มากยิ่งขึ้น?


เนื่องจากความสามารถแอปพลิเคชัน AI ที่มีการใช้งานมาก่อนหน้ายังมีข้อจำกัด เช่น ภาษาหรือบทสนทนาที่ไม่เป็นธรรมชาติ แต่ ChatGPT ทำให้ผู้คนสามารถสื่อสารโดยใช้ภาษาพูดที่ลื่นไหลและเป็นธรรมชาติมากขึ้น ซึ่งรองรับคำศัพท์จำนวนมากและสนทนาเป็นประโยคหรือเนื้อหาที่มีใจความยาวได้ดี ซึ่งนวัตกรรมที่เกิดขึ้นแท้จริงมาจากชุดข้อมูลที่ถูกใช้เพื่อพัฒนาธุรกิจ AI มาเป็นระยะเวลายาวนาน และ ChatGPT ก็เป็นตัวอย่างที่แสดงให้เห็นถึงวิศวกรรมอันยอดเยี่ยมที่สามารถรวมการทำงานทุกอย่างเข้าด้วยกันและนำมาถึงจุดเปลี่ยน (ความคิดเห็นโดย Dr. Satya) 

จุดเด่นสำคัญของ ChatGPT คือความเป็นธรรมชาติ ซึ่งได้ทำลายเส้นแบ่งของการโต้ตอบสื่อสารระหว่างมนุษย์กับเทคโนโลยี โดยเป็นวิวัฒนาการที่สมบูรณ์ จากรูปแบบของโมเดลที่ทำงานได้เพียงทีละหนึ่งอย่างจนพัฒนาให้สามารถทำงานได้หลายอย่างพร้อมกันและทำงานได้หลากหลายรูปแบบมากขึ้น 

แต่หากมองในเชิงเทคนิคก็นับว่าเป็นความชัดเจนของขนาดข้อมูลที่โมเดลได้รับการฝึกฝนอย่างตรงไปตรงมา และได้ถูกนำมาปรับใช้แบบเฉพาะจนเกิดกรณีใช้งานจำนวนมาก จึงมีความน่าติดตาม และเมื่อผู้คนสนใจนำไปใช้มากขึ้น อนาคตข้างหน้าก็จะมีสิ่งที่น่าตื่นเต้นเกิดขึ้นให้ติดตาม อย่างไรก็ตาม สุดท้ายเป็นเรื่องของประสิทธิภาพและความแม่นยำที่ยอดเยี่ยมและไม่เคยมีมาก่อน (ความคิดเห็นโดย Dipen Mehta) 

ข้อดีและข้อสังเกตจากโมเดล AI ที่อาศัยฐานข้อมูลขนาดใหญ่ และผู้เล่นรายเล็กควรเดินหน้าอย่างไร?

Dr. Sarana ให้ความเห็นว่า จากแง่มุมของการวิจัย เป็นเรื่องที่ดีที่ได้เห็นบริษัทใหญ่ๆ สร้างสิ่งใหม่และก้าวข้ามขีดจำกัดหรือขอบเขตเดิมได้ โดยในแบบจำลองภาษาสามารถมองในด้านของการแก้ปัญหาทางวิทยาศาสตร์ที่ต้องค่อยๆ ทำลายข้อจำกัดออกไปและมองหาสิ่งที่ดี 

เมื่อมองในแง่ของแบบจำลองภาษาขนาดใหญ่ข้อจำกัดที่นำออกไปคือจำนวนของพารามิเตอร์หรือขนาดของแบบจำลอง ซึ่ง ChatGPT สามารถทำออกมาได้อย่างน่าประทับใจ โดยมีแบบจำลองภาษาที่เป็นฐานข้อมูล พร้อมไปกับ Reinforcement Learning หรือหมายถึงการเรียนรู้ของ AI 

ส่วนในมุมมองด้านธุรกิจ การสร้าง Large language Model ให้เกิดประโยชน์ควรนำไปใช้งานแบบเปิดกว้างสากล แต่ในขณะเดียวกันโมเดลที่สร้างอาจไม่รองรับหรือเหมาะสมที่สุดสำหรับตลาดที่ต้องการ และมีความกังวลที่ผู้เล่นรายใหญ่อาจมีอำนาจควบคุมตลาดหรือเกิดการรวมศูนย์ ซึ่งทางออกหนึ่ง คือผู้เล่นควรเข้าไปหาตลาดเล็กหรือตลาดเฉพาะกลุ่มที่ผู้เล่นรายใหญ่ไม่ได้เข้าร่วม 

แต่ในทางกลับกัน ในมุมของผู้เล่นรายใหญ่ ยกตัวอย่างเช่น Microsoft ที่มีการสร้างแพลตฟอร์มแบบ Open-Source รวมถึงเปิดเผยข้อมูลการลงทุนเบื้องหลังอย่างชัดเจน รวมถึงเปิดให้ผู้ใช้หรือนักพัฒนาและธุรกิจต่างๆ สามารถนำไปต่อยอดได้ ซึ่งอาจไม่ยุติธรรมหากมองว่าผู้เล่นรายใหญ่ต้องการสร้างแพลตฟอร์มแบบรวมศูนย์ โดย Microsoft ไม่ได้เน้นไปที่การแข่งขันแต่เป็นเรื่องของความร่วมมือกัน โดยมีความพยายามทำให้ผู้อื่นสามารถเข้ามาพัฒนาต่อจากสิ่งที่ Microsoft มีได้

สรุปผู้เล่นรายเล็กที่มีความชำนาญด้าน AI สามารถพัฒนาโมเดลด้วยตนเองและเจาะไปที่ตลาดเฉพาะ แต่สำหรับผู้เล่นรายเล็กที่ไม่ต้องการพัฒนาด้วยตนเองก็สามารถสร้างแอปพลิเคชันโดยพัฒนาต่อจากโมเดลของผู้เล่นรายใหญ่ที่มีศักยภาพและที่มีอยู่ได้ รวมถึงสามารถไปปรับแต่งให้เหมาะสมเป็นโมเดลแบบเฉพาะตน
 

กรณีศึกษา “Merlyn Mind” กับแพลตฟอร์ม AI ที่ส่งเสริมด้านการศึกษา

Large Language Model ถูกนำมาใช้แบบเปิดและรองรับการใช้งานที่หลากหลายรูปแบบทั่วโลก โดยต้องมีการปรับแต่งอย่างละเอียดและจำเพาะสำหรับแต่ละโมเดล และท้ายที่สุดบริษัทยักษ์ใหญ่พยายามขยับขยายพัฒนา AI เพื่อเติมเต็มการใช้งานทั่วโลกเช่นเดียวกันกับหลายแพลตฟอร์ม 

โดย Merlyn Mind เริ่มจากเป้าหมายที่ต้องการนำ AI มาสร้างสิ่งที่เป็นประโยชน์และส่งผลกระทบต่อมนุษยชาติ รวมถึงมีความสนใจในด้านการศึกษาและสุขภาพเป็นพิเศษ ซึ่งการทำงานหลักจะมุ่งเน้นไปในด้านศักยภาพของคอมพิวเตอร์ที่สามารถทำได้ดีและแม่นยำ เช่น งานด้านเอกสาร หรือสร้างคำถามและสร้างแบบประเมินต่างๆ เพื่อแบ่งเบาภาระงาน ช่วยให้มนุษย์สามารถมุ่งเน้นกับงานอื่นๆ ที่ทำได้ดีกว่าคอมพิวเตอร์ หรือเรียกว่าเป็น AI Assistant โดยต้องมีการปรับแต่งที่ละเอียดเพื่อให้เข้ากับการใช้งานที่แตกต่างกันทั้งบริบทการเรียนการสอนและภาษาท้องถิ่น


ข้อจำกัดที่ต้องพิจารณาในการพัฒนา AI เพื่อโอกาสใหม่สำหรับผู้เล่นรายย่อย


Dr. Sarana ให้ความเห็นถึงแอปพลิเคชัน Advanced NLP ที่สามารถใช้ได้ดีหลากหลายภาษา เช่น ภาษาอังกฤษ จีนและญี่ปุ่น แต่ในไทยยังไม่มีแอปพลิเคชันที่ทำงานได้ในระดับสูงแบบแอปพลิเคชันดังกล่าว จึงมองว่ามีพื้นที่สำหรับผู้ที่สนใจพัฒนาแอปพลิเคชัน Advanced NLP สำหรับคนไทยต่อได้ในอนาคต 

โดยยกกรณีใช้งานตัวอย่างจากโมเดลที่ใช้ภาษาอังกฤษ อย่างเช่นโมเดลสำหรับสรุปการประชุมหากเป็นภาษาอังกฤษก็สามารถทำได้ง่ายในเวลาอันสั้น แต่หากเป็นภาษาไทยยังไม่สามารถทำได้ในระดับที่ดี และหากต้องการสร้างและพัฒนาต่อก็สามารถทำได้ แต่ต้องใช้ค่าใช้จ่ายค่อนข้างสูงในการพัฒนา Machine Learning ตั้งแต่ขั้นตอนเริ่มต้น ซึ่งเป็นโอกาสที่นักพัฒนาและผู้เล่นรายย่อยควรตามให้ทัน

อย่างไรก็ตาม มีกรณีการใช้งานใหม่ๆ ที่เป็นรูปแบบ Open Source และเป็นภาษาไทย อย่างเช่น “Thai NLP” ซึ่งเป็นหนึ่งในโครงการที่พยายามสร้างคอมพิวเตอร์ให้เข้าใจภาษาไทยหรือเป็นเครื่องมือเข้าใจภาษาคล้ายกันกับ Natural Language Toolkit (NLTK) โดยกรณีการใช้งานเหล่านี้ผู้เล่นรายย่อยสามารถติดตามและนำมาพัฒนาต่อได้อนาคต


สามารถปลดล็อกให้นวัตกรรมโมเดล AI เติบโตต่อไปได้อย่างไรในอนาคตอันใกล้?


ในขณะนี้ความก้าวหน้าของนวัตกรรม AI กำลังเกิดขึ้น อย่างเช่นกระแสที่ได้รับความสนใจของ Large Language Model แต่ยังเป็นเพียงจุดเริ่มต้นเท่านั้น และน่าติดตามวิวัฒนาการต่อไปว่าในอีกสองถึงสามปีข้างหน้าจะมีความแม่นยำมากขึ้นเพียงใด จึงทำให้เกิดการแข่งขันด้านค่าจำนวนของพารามิเตอร์และชุดของขนาดข้อมูลของแต่ละโมเดล รวมถึงมีการแข่งขันการปรับแต่งเพื่อให้เกิดความเหมาะสมและมีความจำเพาะมากยิ่งขึ้น 

และสิ่งที่น่าติดตามต่อไปคือการนำผลลัพธ์ที่ได้จากโมเดล AI เหล่านี้ไปต่อยอดการใช้งานใหม่ๆ อย่างเช่นที่เกิดขึ้นกับ ChatGPT และคาดว่าจะได้เห็นวิวัฒนาการที่รวดเร็วเมื่อผู้บริโภคพยายามที่จะใช้งาน จากนั้นจะเกิดกระบวนการแบบครบวงจรหรือมีโอกาสเกิดความร่วมมือกันจากผู้เล่นรายย่อย หรือมีการต่อยอดพัฒนาจากสิ่งที่มีอยู่มากขึ้น


รับชมรายละเอียดทั้งหมดได้ที่ Youtube: https://www.youtube.com/live/hneDON9djbk? feature=share

Use and Management of Cookies

We use cookies and other similar technologies on our website to enhance your browsing experience. For more information, please visit our Cookies Notice.

Reject
Accept