เปิดตัว ‘Typhoon 2’: ก้าวสำคัญของ Thai LLM ขับเคลื่อน AI ภาษาไทยสู่อนาคต
Typhoon 2 กับการพัฒนาอย่างต่อเนื่อง
Typhoon เป็นโมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ที่มีการพัฒนามาอย่างต่อเนื่อง โดยขณะนี้ Typhoon มีความสามารถในการประมวลผลภาษาไทยที่มีประสิทธิภาพสูง และยังมุ่งเน้นการปรับแต่งให้เหมาะกับบริบทในภาษาไทยโดยเฉพาะ ซึ่งได้มีการพัฒนามาหลายเวอร์ชัน ดังนี้
- Typhoon 1.0 หรือ Typhoon-7B เป็นโมเดลภาษาไทยขนาด 7B มี 2 เวอร์ชั่น คือ Pretrained และ Instruction-tuned
- Typhoon 1.5 และ 1.5X มาพร้อมกับโมเดล 2 ขนาด คือ 8B และ 70B มีประสิทธิภาพที่สูงและแม่นยำมากขึ้นแข่งขันได้กับโมเดลชั้นนำ ซึ่งถูกพัฒนามาเพื่อให้ใช้งานในแอปพลิเคชั่นได้จริง
- Typhoon 2 ประสิทธิภาพสูงสุด พร้อมกับมีโมเดลให้เลือก 5 ขนาด นำไปประยุกต์ใช้ได้กว้าง รวมถึงมีการพัฒนา Multimodal Models ที่สามารถประมวลผลข้อมูลทั้งภาพและเสียงได้
ขนาดโมเดลของ Typhoon 2 ที่ตอบโจทย์ทุกการใช้งาน
Typhoon 2 คือเวอร์ชั่นอัปเดตล่าสุด ที่ถูกพัฒนาขึ้น มีขนาด (Parameter Size) ที่เพิ่มขึ้น เพื่อรองรับการใช้งานที่หลากหลาย โดยเพิ่มจากเวอร์ชั่นก่อนมาทั้งหมด 5 ขนาดด้วยกัน ดังนี้
- 1B (ชื่อโมเดล: Typhoon2-1B)
- 3B (ชื่อโมเดล: Typhoon2-3B)
- 7B (ชื่อโมเดล: Typhoon2-7B)
- 8B (ชื่อโมเดล: Typhoon2-8B)
- 70B (ชื่อโมเดล: Typhoon2-70B)
โมเดลขนาด 1B และ 3B เหมาะสำหรับงานที่ไม่ซับซ้อน อย่างการสรุปความหรือแปลภาษา โดยเฉพาะในสภาพแวดล้อมที่มีทรัพยากรการประมวลผลต่ำ เหมาะสำหรับอุปกรณ์ เช่น สมาร์ทโฟน และคอมพิวเตอร์ที่ใช้พลังงานการประมวลผลน้อย
โมเดลขนาด 7B และ 8B เหมาะสำหรับการทำงานทั่วไปหรือการพัฒนาต้นแบบ (Proof of Concept) ก่อนนำไปปรับใช้ในระดับ Production นอกจากนี้ยังตอบโจทย์ผู้ใช้งานที่คำนึงถึงต้นทุน (Cost-Conscious Users) และเหมาะสำหรับเวิร์กโฟลว์ที่เน้นความเรียบง่ายและต้องการปรับแต่งให้สอดคล้องกับบริบทในท้องถิ่น
โมเดลขนาด 70B เหมาะสำหรับงานที่มีความสำคัญระดับองค์กรซึ่งต้องการความแม่นยำสูงเป็นพิเศษ หรือใช้เป็นระบบปฏิบัติการหลัก โดยการใช้งานโมเดลขนาด 70B จำเป็นต้องพึ่งพาทรัพยากรการประมวลผลในระดับที่สูงขึ้นเช่นกัน จึงเหมาะสำหรับการใช้งานในด้าน Production เพื่อรองรับความต้องการที่ซับซ้อนและท้าทายขององค์กร
คุณสมบัติเด่น (Key Features) ของ Typhoon 2
- เพิ่มประสิทธิภาพและความแม่นยำของภาษาไทยที่สูงขึ้น ประเมินจากเกณฑ์มาตรฐาน เช่น ThaiExam และ M3Exam ซึ่งมีการประมวลผลภาษาไทยที่เหนือกว่าโมเดล Open source อื่นๆ
- ปรับปรุงประสิทธิภาพการทำตามคำสั่งที่ดีขึ้น เมื่อเทียบกับ Typhoon 1.0 และ Typhoon 1.5X โดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench
- รับข้อมูล และ Generate text ได้มากขึ้น โดยขยาย Context Window จาก 8,192 เป็น 128,000 Tokens ช่วยให้สามารถทำงานกับข้อมูลที่ซับซ้อนได้มากขึ้น
- เพิ่มความสามารถในการเรียกใช้งานฟังก์ชัน (Function Calling) ที่ดีที่สุดในระดับ SOTA (State-of-the-Art)
- มีโมเดลขนาดเล็กที่รองรับการทำงานบนอุปกรณ์พกพา สำหรับงานที่ไม่ซับซ้อน เช่น การสรุปข้อมูลและแปลภาษา
- มี Safety Classifier Model (Preview) ที่ถูกปรับแต่งเพื่อบริบทภาษาไทย ช่วยพิจารณาความเหมาะสมของคำที่ป้อนเข้าไป หากพบว่าไม่เหมาะสมก็จะแจ้งเตือน
รู้จักเกณฑ์มาตรฐานสำคัญในการประเมินประสิทธิภาพและความสามารถของ Typhoon 2
Typhoon 2 ใช้เกณฑ์มาตรฐานที่มีความสำคัญในการประเมินประสิทธิภาพและความสามารถของ LLM โดยเฉพาะอย่างยิ่งในบริบทของภาษาไทย ซึ่งช่วยให้ผู้พัฒนาสามารถปรับปรุงและพัฒนาโมเดลให้มีความสามารถและประสิทธิภาพที่ดีขึ้น
- ThaiExam และ M3Exam: เน้นประเมินความสามารถในการทำความเข้าใจและแก้ปัญหาในภาษาไทย
- IFEval-EN และ IFEval-TH: เน้นประเมินความสามารถในการปฏิบัติตามคำสั่งทั้งในภาษาไทยและภาษาอังกฤษ
- MT-Bench-EN และ MT-Bench-TH (VISTEC): เน้นประเมินประสิทธิภาพโดยรวมของ LLM ในงานที่หลากหลายและมิติการใช้งานต่างๆ ทั้งภาษาไทยและภาษาอังกฤษ
ประสิทธิภาพและความแม่นยำในภาษาไทยของ Typhoon 2 ที่สูงขึ้น
ผลการทดสอบเกณฑ์มาตรฐาน ThaiExam และ M3Exam (ประเมินความสามารถในการทำความเข้าใจและแก้ปัญหาภาษาไทย)
ประสิทธิภาพในการติดตามคำสั่ง (Instruction-Following) ของ Typhoon 2
Typhoon 2 มีศักยภาพที่ดีขึ้นในด้านการติดตามคำสั่ง โดยเฉพาะโมเดลขนาด 70B ซึ่งมีผลลัพธ์ที่ยอดเยี่ยมทั้งใน IFEval และ MT-Bench โดยสามารถเทียบเคียงหรือเหนือกว่าคู่แข่งในหลายตัวชี้วัด เหมาะสำหรับการประยุกต์ใช้งานขั้นสูง เช่น ด้านการสนทนาอัจฉริยะ หรือการพัฒนาเครื่องมือ AI ในบริบทของภาษาไทยโดยเฉพาะ
เมื่อเปรียบเทียบกับโมเดลก่อนหน้า Typhoon 2 แสดงให้เห็นถึงความสามารถที่เหนือกว่าโดยเฉพาะในการประมวลผลภาษาไทย และการทำตามคำสั่งโดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench
โมเดล ‘Typhoon 2 Audio’ และ ‘Typhoon 2 Vision’ (Research Preview) Multimodal Model ของ Typhoon 2 ที่สามารถประมวลผลได้ทั้งภาพและเสียง
Typhoon 2 ได้พัฒนาโมเดลที่ตอบสนองต่อการใช้งานได้อย่างหลากหลายมากขึ้น ด้วยการสร้าง Multimodal Models ที่ไม่ได้จำกัดเพียงการประมวลผลข้อความ แต่ยังครอบคลุมถึงเสียงและภาพในเวอร์ชันใหม่นี้ โดยมีโมเดลหลักที่โดดเด่น 2 โมเดลหลัก
- Typhoon2-Audio
- ฟัง เข้าใจ และโต้ตอบได้ดีขึ้น - สามารถรับทั้งข้อความและเสียงเป็น Input และสร้างทั้งข้อความและเสียงเป็น Output ได้พร้อมกัน ทำให้สามารถมีปฏิสัมพันธ์แบบสองทางได้อย่างสมบูรณ์ คล้ายกันกับฟีเจอร์ Advanced Voice Mode ใน ChatGPT ที่ช่วยให้สนทนากับ Chat GPT ได้อย่างเป็นธรรมชาติ
- เข้าใจเสียงได้ลึกซึ้งยิ่งขึ้น - สามารถวิเคราะห์เสียงได้ละเอียดมากขึ้นและทำให้เข้าใจความหมายของเสียงได้ดีขึ้น เช่น น้ำเสียงที่แสดงอารมณ์
- ทำตามคำสั่งได้ดีขึ้น - สามารถทำตามคำสั่งที่ซับซ้อนได้มากขึ้น เช่น สนทนาแบบหลายรอบ หรือการตอบคำถามที่ต้องการข้อมูลเชิงลึกได้
- รองรับการแปลงข้อความเป็นเสียงพูด - สามารถเปลี่ยนข้อความเป็นเสียงพูดภาษาไทยได้มีประสิทธิภาพมากกว่าโมเดล Open Source อื่นๆ
- Use Case เช่น ผู้ใช้งานสามารถพิมพ์ข้อความเข้าไป แล้วเพิ่มคำสั่งให้ Typhoon 2 พูดออกมาเป็นเสียงได้
- Typhoon2-Vision
- ประมวลผลภาพและเข้าใจภาพได้ดีขึ้น - สามารถวิเคราะห์ภาพและเข้าใจเนื้อหาของภาพได้อย่างละเอียด
- มีฟังก์ชัน OCR (Optical Character Recognition) ในตัว - เป็นฟังก์ชันที่สามารถแปลงข้อความในรูปภาพหรือเอกสารให้เป็นข้อความแบบดิจิทัลได้ ทำให้สามารถนำไปใช้ในงานที่เกี่ยวข้องกับการดึงข้อความจากเอกสารหรือภาพถ่าย
โดยรวม โมเดล Typhoon2-Audio และ Typhoon2-Vision มีศักยภาพที่โดดเด่น ในการนำไปประยุกต์ใช้ในหลากหลายรูปแบบ ไม่ว่าจะเป็นการสร้างผู้ช่วยเสมือน การพัฒนาแอปพลิเคชันในหลายประเภท และการวิเคราะห์ข้อมูลจากภาพและเสียง
**คำชี้แจงสำคัญ (Disclaimer) ทั้ง 2 โมเดล Typhoon2-Audio และ Typhoon2-Vision ยังอยู่ในขั้นตอนพัฒนาและทดลองวิจัย ซึ่งอาจยังไม่เหมาะสำหรับการใช้งานในเชิงพาณิชย์ อย่างไรก็ตาม โมเดลเหล่านี้สามารถทดลองใช้งานหรือประยุกต์ใช้ร่วมกับแอปพลิเคชันในรูปแบบต่างๆ ได้อย่างหลากหลาย
กลุ่มผู้ใช้งานเป้าหมายของ Typhoon 2
Typhoon 2 ได้รับการออกแบบมาเพื่อรองรับกลุ่มผู้ใช้งานที่หลากหลาย ตัวอย่างเช่น:
- นักวิจัยทางวิชาการ (Researchers): ช่วยให้สามารถเข้าถึงเครื่องมือสำหรับการประมวลผลภาษาธรรมชาติ (NLP) ในภาษาไทยที่มีประสิทธิภาพสูงและทันสมัย สามารถนำไปใช้ในการวิจัยและพัฒนาเทคโนโลยี NLP
- นักวิทยาศาสตร์ข้อมูล (Data Scientists): สามารถใช้ประโยชน์จากเกณฑ์มาตรฐานและชุดข้อมูลที่เกี่ยวข้องกับบริบท เพื่อพัฒนาและประเมินผลของโมเดล AI
- วิศวกรซอฟต์แวร์ (Software Engineers): สามารถสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย LLM หรือรวม LLM เข้ากับระบบที่มีอยู่ ตัวอย่างเช่น ใช้พัฒนา Chatbot ทางกฎหมาย อย่างแพลตฟอร์มสมหมาย โดย VISAI
- วิศวกร AI (AI Engineers): ได้เข้าถึง LLM ที่มีประสิทธิภาพสูงและใช้เป็นเครื่องมือสำหรับการทำงานกับ AI เพื่อพัฒนาและปรับใช้โซลูชัน AI ต่างๆ
กลุ่มอุตสาหกรรมเป้าหมายของ Typhoon 2
Typhoon 2 มีศักยภาพในการประยุกต์ใช้ในหลากหลายอุตสาหกรรม ตอบโจทย์หลากหลายการทำงาน
- ด้านการเงินเพื่อผู้บริโภค (Consumer Finance) เช่น พัฒนา Chatbot เพื่อให้บริการลูกค้า และวิเคราะห์ความเสี่ยงทางการเงิน
- ด้านการแพทย์ (Healthcare) เช่น วิเคราะห์ข้อมูลทางการแพทย์ หรือ ด้านกฎหมาย (Legal) เช่น ค้นคว้าข้อมูลทางกฎหมาย
- ด้านประกันภัย (Insurance) เช่น ประเมินความเสี่ยง และต่อพัฒนาผลิตภัณฑ์ประกันภัยใหม่ๆ
- ภาครัฐ (Public Sector) เช่น ให้บริการข้อมูลสาธารณะ หรือพัฒนาระบบบริการภาครัฐแบบอัจฉริยะ
- ด้านการศึกษา (Education) เช่น พัฒนาเครื่องมือช่วยสอน สร้างเนื้อหาการเรียนรู้ และปรับปรุงประสิทธิภาพการเรียนการสอน
ความเห็นจากผู้ทดลองใช้งาน Typhoon
"Typhoon เป็นโมเดลที่มีความสามารถในการเข้าใจภาษาไทยอย่างลึกซึ้ง สามารถนำไปประยุกต์ใช้ได้อย่างกว้างขวาง เช่น Text2SQL และ RAG" - ทีม Data Analytics, SCB
"Typhoon API เป็นเครื่องมือที่มีประสิทธิภาพและใช้งานง่าย ช่วยให้นักศึกษาสามารถทดลองใช้งาน LLM ได้อย่างสะดวก"
- ดร. ฐิติพัทธ อัชชะกุลวิสุทธิ์, ภาควิชาวิศวกรรมชีวการแพทย์ คณะวิศวกรรมศาสตร์, มหาวิทยาลัยมหิดล
"พวกเรารู้สึกประทับใจอย่างมากกับผลงานการพัฒนาโมเดล Typhoon ของทีมพัฒนา " - SI Data+ Team
“Typhoon เป็น LLM ที่ทำงานได้ดีที่สุดบนภาษาไทย โดยเฉพาะ task ที่ต้องการความรู้และความเข้าใจในบริบทไทย เช่น งานด้านกฎหมาย ซึ่งเป็น domain ที่ต้องการความรู้ในระดับ local สำหรับการตอบคำถามที่ถูกต้องและแม่นยำ และยิ่งไปกว่านั้น typhoon ยังมีความสามารถในการใช้เป็น chatbot สำหรับการตอบคำถาม รวมถึงการทำหน้าที่เป็น agent ใน framework ที่มีความซับซ้อน เช่น RAG หรือ multi-agentic workflow ได้อย่างมีประสิทธิภาพ จึงทำให้เป็นตัวเลือกอันดับแรกสำหรับการทำ task ที่ต้องใช้ LLM บนข้อมูลภาษาไทยครับ” - ภวิศภาคย์ อัครจรัสวงศ์, Senior Data Scientist, VISAI AI
"ทีมพัฒนา Typhoon จาก SCB 10X ได้พิสูจน์ตัวเองว่าเป็นผู้นำในด้านการวิจัยและพัฒนา Large Language Models (LLMs) ด้วยการสร้างนวัตกรรมและตั้งมาตรฐานใหม่ให้กับศักยภาพ AI นอกจากการพัฒนาโมเดลและระบบ LLM ที่ล้ำสมัยยังมีส่วนสำคัญในการผลักดันงานวิจัยด้านภาษาศาสตร์เชิงธรรมชาติ ในฐานะหัวหน้าห้องปฏิบัติการ Natural Language Processing and Representation Learning Lab (NRL) ที่ VISTEC ผมมีโอกาสได้ร่วมงานกับนักวิจัยจากทีม Typhoon โดยในปี 2024 ความร่วมมือของเรานำไปสู่บทความวิจัยสำคัญ 3 ชิ้นที่ตีพิมพ์ในงาน EMNLP ในหัวข้อ Multilingual Reasoning, Bias Mitigation และ Cross-lingual Retrieval Question Answering และยังคงมีการร่วมมือกันอย่างต่อเนื่องด้วยการมุ่งไปที่การแก้ไขปัญหาสำคัญของการวิจัย AI เช่น ความปลอดภัยใน AI, การประเมินพฤติกรรมที่เกิดขึ้นเอง และความโปร่งใสของระบบ AI รวมถึงความมุ่งมั่นร่วมกันของเราในการพัฒนาทั้งด้านปฏิบัติและทฤษฎีของ AI ทำให้มั่นใจได้ว่าจะช่วยสร้างสรรค์งานวิจัยที่ส่งผลเชิงบวกต่อชุมชนวิจัยระดับโลก และช่วยยกระดับประเทศไทยให้เป็นที่ยอมรับในเวทีโลกในด้านการวิจัย AI" - รศ.ดร.สรณะ นุชอนงค์, VISTEC
พาร์ทเนอร์ทั้งไทยและต่างประเทศที่มีส่วนร่วมพัฒนาและนำ Typhoon 2 ไปประยุกต์ใช้
- VISTEC
- Mahidol University
- Artificial Intelligence Association of Thailand (AIAT)
- AI Singapore (AISG)
- Stanford Human-Centered Artificial Intelligence (Stanford HAI)
- Together AI
- SEA AI Lab
- InnovestX
- Sambanova Systems
สรุป Typhoon 2 เป็นโมเดลอัปเดตล่าสุดที่เป็นก้าวสำคัญในการพัฒนาโมเดลภาษาไทยขนาดใหญ่ (Thai LLM) มีจุดมุ่งเน้นเพิ่มประสิทธิภาพ และปรับปรุงให้ตอบสนองต่อความต้องการและการใช้งานในอุตสาหกรรมและธุรกิจที่หลากหลายมากขึ้น พร้อมเพิ่มความปลอดภัย เพื่อให้สามารถนำไปประยุกต์ใช้ได้อย่างเต็มประสิทธิภาพในทุกแพลตฟอร์ม Typhoon ยังคงเดินหน้าสร้างความร่วมมือกับพันธมิตรในหลากหลายอุตสาหกรรมที่มองเห็นโอกาสในการพัฒนาและปรับใช้โมเดลภาษาไทยขนาดใหญ่ เพื่อยกระดับศักยภาพทางธุรกิจ และต่อยอดการใช้งานในอนาคตได้อย่างยั่งยืน
อ่านบทความเกี่ยวกับ Typhoon2 เพิ่มเติมได้ที่
1.) Typhoon 2 Text Models: https://medium.com/opentyphoon/typhoon-2-release-9dd36e3882c0
2.) Typhoon 2 Multimodal Models: https://medium.com/opentyphoon/typhoon-2-multimodal-release-research-preview-200fe9015ad9
ติดตามข้อมูลเพิ่มเติมและทดลองใช้งานได้ที่เว็บไซต์: https://opentyphoon.ai/
ทดลองใช้โมเดล Typhoon2 Audio และ Typhoon2 Vision:
- Typhoon2 Audio: https://audio.opentyphoon.ai/ (update coming soon)
- Typhoon2 Vision: https://vision.opentyphoon.ai/ (coming soon)