ทำไม ‘ChatGPT’ และ ‘Large Language Model’ จึงได้รับความนิยม
เทรนด์ด้าน ‘Generative A.I.’ ส่งผลกระทบอย่างมากต่อการพัฒนาในหลากหลายด้าน โดยเฉพาะอย่างยิ่งในด้านของโมเดลภาษาขนาดใหญ่ (Large Language Model) และเป็นจุดเริ่มต้นของ ‘ChatGPT’ ดังนั้นเพื่อให้ทุกคนรู้จักกับ ChatGPT และโลกของ Large Language Models ที่กำลังถูกให้ความสนใจในขณะนี้มากยิ่งขึ้น SCB 10X จึงนำประเด็นสำคัญมานำเสนอในบทความนี้เพื่อพิจารณาโอกาสใหม่ๆ ด้าน AI จากงาน Moonshot Meetup กับหัวข้อ “Large Language Model and ChatGPT” จัดขึ้นโดย SCB 10X พร้อมพูดคุยกับ Speakers:
- Dr. Sarana Nutanong: Dean, School of IST at VISTEC and CEO & Co-founder, VISAI
- Dipen Mehta: General Manager, Financial Services, Asia Pacific at Microsoft
- Dr. Satya Nitta: CEO & Co-founder of Merlyn Mind (Former Global Head of AI Solutions at IBM)
- Moderated by Dr.Tanwa Arpornthip, Technical Advisor at SCB 10X

ทำไม ChatGPT และ Generative AI เกิดเป็นกระแสได้รับความสนใจอย่างยิ่ง เนื่องมาจากนวัตกรรมหรือผู้คนเปิดใจให้กับ Tech เหล่านี้มากยิ่งขึ้น?
เนื่องจากความสามารถแอปพลิเคชัน AI ที่มีการใช้งานมาก่อนหน้ายังมีข้อจำกัด เช่น ภาษาหรือบทสนทนาที่ไม่เป็นธรรมชาติ แต่ ChatGPT ทำให้ผู้คนสามารถสื่อสารโดยใช้ภาษาพูดที่ลื่นไหลและเป็นธรรมชาติมากขึ้น ซึ่งรองรับคำศัพท์จำนวนมากและสนทนาเป็นประโยคหรือเนื้อหาที่มีใจความยาวได้ดี ซึ่งนวัตกรรมที่เกิดขึ้นแท้จริงมาจากชุดข้อมูลที่ถูกใช้เพื่อพัฒนาธุรกิจ AI มาเป็นระยะเวลายาวนาน และ ChatGPT ก็เป็นตัวอย่างที่แสดงให้เห็นถึงวิศวกรรมอันยอดเยี่ยมที่สามารถรวมการทำงานทุกอย่างเข้าด้วยกันและนำมาถึงจุดเปลี่ยน (ความคิดเห็นโดย Dr. Satya)
จุดเด่นสำคัญของ ChatGPT คือความเป็นธรรมชาติ ซึ่งได้ทำลายเส้นแบ่งของการโต้ตอบสื่อสารระหว่างมนุษย์กับเทคโนโลยี โดยเป็นวิวัฒนาการที่สมบูรณ์ จากรูปแบบของโมเดลที่ทำงานได้เพียงทีละหนึ่งอย่างจนพัฒนาให้สามารถทำงานได้หลายอย่างพร้อมกันและทำงานได้หลากหลายรูปแบบมากขึ้น
แต่หากมองในเชิงเทคนิคก็นับว่าเป็นความชัดเจนของขนาดข้อมูลที่โมเดลได้รับการฝึกฝนอย่างตรงไปตรงมา และได้ถูกนำมาปรับใช้แบบเฉพาะจนเกิดกรณีใช้งานจำนวนมาก จึงมีความน่าติดตาม และเมื่อผู้คนสนใจนำไปใช้มากขึ้น อนาคตข้างหน้าก็จะมีสิ่งที่น่าตื่นเต้นเกิดขึ้นให้ติดตาม อย่างไรก็ตาม สุดท้ายเป็นเรื่องของประสิทธิภาพและความแม่นยำที่ยอดเยี่ยมและไม่เคยมีมาก่อน (ความคิดเห็นโดย Dipen Mehta)
ข้อดีและข้อสังเกตจากโมเดล AI ที่อาศัยฐานข้อมูลขนาดใหญ่ และผู้เล่นรายเล็กควรเดินหน้าอย่างไร?
Dr. Sarana ให้ความเห็นว่า จากแง่มุมของการวิจัย เป็นเรื่องที่ดีที่ได้เห็นบริษัทใหญ่ๆ สร้างสิ่งใหม่และก้าวข้ามขีดจำกัดหรือขอบเขตเดิมได้ โดยในแบบจำลองภาษาสามารถมองในด้านของการแก้ปัญหาทางวิทยาศาสตร์ที่ต้องค่อยๆ ทำลายข้อจำกัดออกไปและมองหาสิ่งที่ดี
เมื่อมองในแง่ของแบบจำลองภาษาขนาดใหญ่ข้อจำกัดที่นำออกไปคือจำนวนของพารามิเตอร์หรือขนาดของแบบจำลอง ซึ่ง ChatGPT สามารถทำออกมาได้อย่างน่าประทับใจ โดยมีแบบจำลองภาษาที่เป็นฐานข้อมูล พร้อมไปกับ Reinforcement Learning หรือหมายถึงการเรียนรู้ของ AI
ส่วนในมุมมองด้านธุรกิจ การสร้าง Large language Model ให้เกิดประโยชน์ควรนำไปใช้งานแบบเปิดกว้างสากล แต่ในขณะเดียวกันโมเดลที่สร้างอาจไม่รองรับหรือเหมาะสมที่สุดสำหรับตลาดที่ต้องการ และมีความกังวลที่ผู้เล่นรายใหญ่อาจมีอำนาจควบคุมตลาดหรือเกิดการรวมศูนย์ ซึ่งทางออกหนึ่ง คือผู้เล่นควรเข้าไปหาตลาดเล็กหรือตลาดเฉพาะกลุ่มที่ผู้เล่นรายใหญ่ไม่ได้เข้าร่วม
แต่ในทางกลับกัน ในมุมของผู้เล่นรายใหญ่ ยกตัวอย่างเช่น Microsoft ที่มีการสร้างแพลตฟอร์มแบบ Open-Source รวมถึงเปิดเผยข้อมูลการลงทุนเบื้องหลังอย่างชัดเจน รวมถึงเปิดให้ผู้ใช้หรือนักพัฒนาและธุรกิจต่างๆ สามารถนำไปต่อยอดได้ ซึ่งอาจไม่ยุติธรรมหากมองว่าผู้เล่นรายใหญ่ต้องการสร้างแพลตฟอร์มแบบรวมศูนย์ โดย Microsoft ไม่ได้เน้นไปที่การแข่งขันแต่เป็นเรื่องของความร่วมมือกัน โดยมีความพยายามทำให้ผู้อื่นสามารถเข้ามาพัฒนาต่อจากสิ่งที่ Microsoft มีได้
สรุปผู้เล่นรายเล็กที่มีความชำนาญด้าน AI สามารถพัฒนาโมเดลด้วยตนเองและเจาะไปที่ตลาดเฉพาะ แต่สำหรับผู้เล่นรายเล็กที่ไม่ต้องการพัฒนาด้วยตนเองก็สามารถสร้างแอปพลิเคชันโดยพัฒนาต่อจากโมเดลของผู้เล่นรายใหญ่ที่มีศักยภาพและที่มีอยู่ได้ รวมถึงสามารถไปปรับแต่งให้เหมาะสมเป็นโมเดลแบบเฉพาะตน
กรณีศึกษา “Merlyn Mind” กับแพลตฟอร์ม AI ที่ส่งเสริมด้านการศึกษา
Large Language Model ถูกนำมาใช้แบบเปิดและรองรับการใช้งานที่หลากหลายรูปแบบทั่วโลก โดยต้องมีการปรับแต่งอย่างละเอียดและจำเพาะสำหรับแต่ละโมเดล และท้ายที่สุดบริษัทยักษ์ใหญ่พยายามขยับขยายพัฒนา AI เพื่อเติมเต็มการใช้งานทั่วโลกเช่นเดียวกันกับหลายแพลตฟอร์ม
โดย Merlyn Mind เริ่มจากเป้าหมายที่ต้องการนำ AI มาสร้างสิ่งที่เป็นประโยชน์และส่งผลกระทบต่อมนุษยชาติ รวมถึงมีความสนใจในด้านการศึกษาและสุขภาพเป็นพิเศษ ซึ่งการทำงานหลักจะมุ่งเน้นไปในด้านศักยภาพของคอมพิวเตอร์ที่สามารถทำได้ดีและแม่นยำ เช่น งานด้านเอกสาร หรือสร้างคำถามและสร้างแบบประเมินต่างๆ เพื่อแบ่งเบาภาระงาน ช่วยให้มนุษย์สามารถมุ่งเน้นกับงานอื่นๆ ที่ทำได้ดีกว่าคอมพิวเตอร์ หรือเรียกว่าเป็น AI Assistant โดยต้องมีการปรับแต่งที่ละเอียดเพื่อให้เข้ากับการใช้งานที่แตกต่างกันทั้งบริบทการเรียนการสอนและภาษาท้องถิ่น
ข้อจำกัดที่ต้องพิจารณาในการพัฒนา AI เพื่อโอกาสใหม่สำหรับผู้เล่นรายย่อย
Dr. Sarana ให้ความเห็นถึงแอปพลิเคชัน Advanced NLP ที่สามารถใช้ได้ดีหลากหลายภาษา เช่น ภาษาอังกฤษ จีนและญี่ปุ่น แต่ในไทยยังไม่มีแอปพลิเคชันที่ทำงานได้ในระดับสูงแบบแอปพลิเคชันดังกล่าว จึงมองว่ามีพื้นที่สำหรับผู้ที่สนใจพัฒนาแอปพลิเคชัน Advanced NLP สำหรับคนไทยต่อได้ในอนาคต
โดยยกกรณีใช้งานตัวอย่างจากโมเดลที่ใช้ภาษาอังกฤษ อย่างเช่นโมเดลสำหรับสรุปการประชุมหากเป็นภาษาอังกฤษก็สามารถทำได้ง่ายในเวลาอันสั้น แต่หากเป็นภาษาไทยยังไม่สามารถทำได้ในระดับที่ดี และหากต้องการสร้างและพัฒนาต่อก็สามารถทำได้ แต่ต้องใช้ค่าใช้จ่ายค่อนข้างสูงในการพัฒนา Machine Learning ตั้งแต่ขั้นตอนเริ่มต้น ซึ่งเป็นโอกาสที่นักพัฒนาและผู้เล่นรายย่อยควรตามให้ทัน
อย่างไรก็ตาม มีกรณีการใช้งานใหม่ๆ ที่เป็นรูปแบบ Open Source และเป็นภาษาไทย อย่างเช่น “Thai NLP” ซึ่งเป็นหนึ่งในโครงการที่พยายามสร้างคอมพิวเตอร์ให้เข้าใจภาษาไทยหรือเป็นเครื่องมือเข้าใจภาษาคล้ายกันกับ Natural Language Toolkit (NLTK) โดยกรณีการใช้งานเหล่านี้ผู้เล่นรายย่อยสามารถติดตามและนำมาพัฒนาต่อได้อนาคต
สามารถปลดล็อกให้นวัตกรรมโมเดล AI เติบโตต่อไปได้อย่างไรในอนาคตอันใกล้?
ในขณะนี้ความก้าวหน้าของนวัตกรรม AI กำลังเกิดขึ้น อย่างเช่นกระแสที่ได้รับความสนใจของ Large Language Model แต่ยังเป็นเพียงจุดเริ่มต้นเท่านั้น และน่าติดตามวิวัฒนาการต่อไปว่าในอีกสองถึงสามปีข้างหน้าจะมีความแม่นยำมากขึ้นเพียงใด จึงทำให้เกิดการแข่งขันด้านค่าจำนวนของพารามิเตอร์และชุดของขนาดข้อมูลของแต่ละโมเดล รวมถึงมีการแข่งขันการปรับแต่งเพื่อให้เกิดความเหมาะสมและมีความจำเพาะมากยิ่งขึ้น
และสิ่งที่น่าติดตามต่อไปคือการนำผลลัพธ์ที่ได้จากโมเดล AI เหล่านี้ไปต่อยอดการใช้งานใหม่ๆ อย่างเช่นที่เกิดขึ้นกับ ChatGPT และคาดว่าจะได้เห็นวิวัฒนาการที่รวดเร็วเมื่อผู้บริโภคพยายามที่จะใช้งาน จากนั้นจะเกิดกระบวนการแบบครบวงจรหรือมีโอกาสเกิดความร่วมมือกันจากผู้เล่นรายย่อย หรือมีการต่อยอดพัฒนาจากสิ่งที่มีอยู่มากขึ้น
รับชมรายละเอียดทั้งหมดได้ที่ Youtube: https://www.youtube.com/live/hneDON9djbk? feature=share