เปิดตัว ‘Typhoon 2’: ก้าวสำคัญของ Thai LLM ขับเคลื่อน AI ภาษาไทยสู่อนาคต

Typhoon 2 กับการพัฒนาอย่างต่อเนื่อง

Typhoon เป็นโมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ที่มีการพัฒนามาอย่างต่อเนื่อง โดยขณะนี้ Typhoon มีความสามารถในการประมวลผลภาษาไทยที่มีประสิทธิภาพสูง และยังมุ่งเน้นการปรับแต่งให้เหมาะกับบริบทในภาษาไทยโดยเฉพาะ ซึ่งได้มีการพัฒนามาหลายเวอร์ชัน ดังนี้

Typhoon 1.0 หรือ Typhoon-7B เป็นโมเดลภาษาไทยขนาด 7B มี 2 เวอร์ชั่น คือ Pretrained และ Instruction-tuned
Typhoon 1.5 และ 1.5X มาพร้อมกับโมเดล 2 ขนาด คือ 8B และ 70B มีประสิทธิภาพที่สูงและแม่นยำมากขึ้นแข่งขันได้กับโมเดลชั้นนำ ซึ่งถูกพัฒนามาเพื่อให้ใช้งานในแอปพลิเคชั่นได้จริง
Typhoon 2 ประสิทธิภาพสูงสุด พร้อมกับมีโมเดลให้เลือก 5 ขนาด นำไปประยุกต์ใช้ได้กว้าง รวมถึงมีการพัฒนา Multimodal Models ที่สามารถประมวลผลข้อมูลทั้งภาพและเสียงได้

ขนาดโมเดลของ Typhoon 2 ที่ตอบโจทย์ทุกการใช้งาน

Typhoon 2 คือเวอร์ชั่นอัปเดตล่าสุด ที่ถูกพัฒนาขึ้น มีขนาด (Parameter Size) ที่เพิ่มขึ้น เพื่อรองรับการใช้งานที่หลากหลาย โดยเพิ่มจากเวอร์ชั่นก่อนมาทั้งหมด 5 ขนาดด้วยกัน ดังนี้

1B (ชื่อโมเดล: Typhoon2-1B)
3B (ชื่อโมเดล: Typhoon2-3B)
7B (ชื่อโมเดล: Typhoon2-7B)
8B (ชื่อโมเดล: Typhoon2-8B)
70B (ชื่อโมเดล: Typhoon2-70B)

โมเดลขนาด 1B และ 3B เหมาะสำหรับงานที่ไม่ซับซ้อน อย่างการสรุปความหรือแปลภาษา โดยเฉพาะในสภาพแวดล้อมที่มีทรัพยากรการประมวลผลต่ำ เหมาะสำหรับอุปกรณ์ เช่น สมาร์ทโฟน และคอมพิวเตอร์ที่ใช้พลังงานการประมวลผลน้อย

โมเดลขนาด 7B และ 8B เหมาะสำหรับการทำงานทั่วไปหรือการพัฒนาต้นแบบ (Proof of Concept) ก่อนนำไปปรับใช้ในระดับ Production นอกจากนี้ยังตอบโจทย์ผู้ใช้งานที่คำนึงถึงต้นทุน (Cost-Conscious Users) และเหมาะสำหรับเวิร์กโฟลว์ที่เน้นความเรียบง่ายและต้องการปรับแต่งให้สอดคล้องกับบริบทในท้องถิ่น

โมเดลขนาด 70B เหมาะสำหรับงานที่มีความสำคัญระดับองค์กรซึ่งต้องการความแม่นยำสูงเป็นพิเศษ หรือใช้เป็นระบบปฏิบัติการหลัก โดยการใช้งานโมเดลขนาด 70B จำเป็นต้องพึ่งพาทรัพยากรการประมวลผลในระดับที่สูงขึ้นเช่นกัน จึงเหมาะสำหรับการใช้งานในด้าน Production เพื่อรองรับความต้องการที่ซับซ้อนและท้าทายขององค์กร

คุณสมบัติเด่น (Key Features) ของ Typhoon 2

เพิ่มประสิทธิภาพและความแม่นยำของภาษาไทยที่สูงขึ้น ประเมินจากเกณฑ์มาตรฐาน เช่น ThaiExam และ M3Exam ซึ่งมีการประมวลผลภาษาไทยที่เหนือกว่าโมเดล Open source อื่นๆ
ปรับปรุงประสิทธิภาพการทำตามคำสั่งที่ดีขึ้น เมื่อเทียบกับ Typhoon 1.0 และ Typhoon 1.5X โดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench
รับข้อมูล และ Generate text ได้มากขึ้น โดยขยาย Context Window จาก 8,192 เป็น 128,000 Tokens ช่วยให้สามารถทำงานกับข้อมูลที่ซับซ้อนได้มากขึ้น
เพิ่มความสามารถในการเรียกใช้งานฟังก์ชัน (Function Calling) ที่ดีที่สุดในระดับ SOTA (State-of-the-Art)
มีโมเดลขนาดเล็กที่รองรับการทำงานบนอุปกรณ์พกพา สำหรับงานที่ไม่ซับซ้อน เช่น การสรุปข้อมูลและแปลภาษา
มี Safety Classifier Model (Preview) ที่ถูกปรับแต่งเพื่อบริบทภาษาไทย ช่วยพิจารณาความเหมาะสมของคำที่ป้อนเข้าไป หากพบว่าไม่เหมาะสมก็จะแจ้งเตือน

รู้จักเกณฑ์มาตรฐานสำคัญในการประเมินประสิทธิภาพและความสามารถของ Typhoon 2

Typhoon 2 ใช้เกณฑ์มาตรฐานที่มีความสำคัญในการประเมินประสิทธิภาพและความสามารถของ LLM โดยเฉพาะอย่างยิ่งในบริบทของภาษาไทย ซึ่งช่วยให้ผู้พัฒนาสามารถปรับปรุงและพัฒนาโมเดลให้มีความสามารถและประสิทธิภาพที่ดีขึ้น

ThaiExam และ M3Exam: เน้นประเมินความสามารถในการทำความเข้าใจและแก้ปัญหาในภาษาไทย

IFEval-EN และ IFEval-TH: เน้นประเมินความสามารถในการปฏิบัติตามคำสั่งทั้งในภาษาไทยและภาษาอังกฤษ

MT-Bench-EN และ MT-Bench-TH (VISTEC): เน้นประเมินประสิทธิภาพโดยรวมของ LLM ในงานที่หลากหลายและมิติการใช้งานต่างๆ ทั้งภาษาไทยและภาษาอังกฤษ

ประสิทธิภาพและความแม่นยำในภาษาไทยของ Typhoon 2 ที่สูงขึ้น

ผลการทดสอบเกณฑ์มาตรฐาน ThaiExam และ M3Exam (ประเมินความสามารถในการทำความเข้าใจและแก้ปัญหาภาษาไทย)

ประสิทธิภาพในการติดตามคำสั่ง (Instruction-Following) ของ Typhoon 2

Typhoon 2 มีศักยภาพที่ดีขึ้นในด้านการติดตามคำสั่ง โดยเฉพาะโมเดลขนาด 70B ซึ่งมีผลลัพธ์ที่ยอดเยี่ยมทั้งใน IFEval และ MT-Bench โดยสามารถเทียบเคียงหรือเหนือกว่าคู่แข่งในหลายตัวชี้วัด เหมาะสำหรับการประยุกต์ใช้งานขั้นสูง เช่น ด้านการสนทนาอัจฉริยะ หรือการพัฒนาเครื่องมือ AI ในบริบทของภาษาไทยโดยเฉพาะ

Typhoon (2).png

เมื่อเปรียบเทียบกับโมเดลก่อนหน้า Typhoon 2 แสดงให้เห็นถึงความสามารถที่เหนือกว่าโดยเฉพาะในการประมวลผลภาษาไทย และการทำตามคำสั่งโดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench

โมเดล ‘Typhoon 2 Audio’ และ ‘Typhoon 2 Vision’ (Research Preview) Multimodal Model ของ Typhoon 2 ที่สามารถประมวลผลได้ทั้งภาพและเสียง

Typhoon 2 ได้พัฒนาโมเดลที่ตอบสนองต่อการใช้งานได้อย่างหลากหลายมากขึ้น ด้วยการสร้าง Multimodal Models ที่ไม่ได้จำกัดเพียงการประมวลผลข้อความ แต่ยังครอบคลุมถึงเสียงและภาพในเวอร์ชันใหม่นี้ โดยมีโมเดลหลักที่โดดเด่น 2 โมเดลหลัก

Typhoon2-Audio

ฟัง เข้าใจ และโต้ตอบได้ดีขึ้น - สามารถรับทั้งข้อความและเสียงเป็น Input และสร้างทั้งข้อความและเสียงเป็น Output ได้พร้อมกัน ทำให้สามารถมีปฏิสัมพันธ์แบบสองทางได้อย่างสมบูรณ์ คล้ายกันกับฟีเจอร์ Advanced Voice Mode ใน ChatGPT ที่ช่วยให้สนทนากับ Chat GPT ได้อย่างเป็นธรรมชาติ
เข้าใจเสียงได้ลึกซึ้งยิ่งขึ้น - สามารถวิเคราะห์เสียงได้ละเอียดมากขึ้นและทำให้เข้าใจความหมายของเสียงได้ดีขึ้น เช่น น้ำเสียงที่แสดงอารมณ์
ทำตามคำสั่งได้ดีขึ้น - สามารถทำตามคำสั่งที่ซับซ้อนได้มากขึ้น เช่น สนทนาแบบหลายรอบ หรือการตอบคำถามที่ต้องการข้อมูลเชิงลึกได้
รองรับการแปลงข้อความเป็นเสียงพูด - สามารถเปลี่ยนข้อความเป็นเสียงพูดภาษาไทยได้มีประสิทธิภาพมากกว่าโมเดล Open Source อื่นๆ
Use Case เช่น ผู้ใช้งานสามารถพิมพ์ข้อความเข้าไป แล้วเพิ่มคำสั่งให้ Typhoon 2 พูดออกมาเป็นเสียงได้

Typhoon2-Vision

ประมวลผลภาพและเข้าใจภาพได้ดีขึ้น - สามารถวิเคราะห์ภาพและเข้าใจเนื้อหาของภาพได้อย่างละเอียด
มีฟังก์ชัน OCR (Optical Character Recognition) ในตัว - เป็นฟังก์ชันที่สามารถแปลงข้อความในรูปภาพหรือเอกสารให้เป็นข้อความแบบดิจิทัลได้ ทำให้สามารถนำไปใช้ในงานที่เกี่ยวข้องกับการดึงข้อความจากเอกสารหรือภาพถ่าย

โดยรวม โมเดล Typhoon2-Audio และ Typhoon2-Vision มีศักยภาพที่โดดเด่น ในการนำไปประยุกต์ใช้ในหลากหลายรูปแบบ ไม่ว่าจะเป็นการสร้างผู้ช่วยเสมือน การพัฒนาแอปพลิเคชันในหลายประเภท และการวิเคราะห์ข้อมูลจากภาพและเสียง

**คำชี้แจงสำคัญ (Disclaimer) ทั้ง 2 โมเดล Typhoon2-Audio และ Typhoon2-Vision ยังอยู่ในขั้นตอนพัฒนาและทดลองวิจัย ซึ่งอาจยังไม่เหมาะสำหรับการใช้งานในเชิงพาณิชย์ อย่างไรก็ตาม โมเดลเหล่านี้สามารถทดลองใช้งานหรือประยุกต์ใช้ร่วมกับแอปพลิเคชันในรูปแบบต่างๆ ได้อย่างหลากหลาย

กลุ่มผู้ใช้งานเป้าหมายของ Typhoon 2

Typhoon 2 ได้รับการออกแบบมาเพื่อรองรับกลุ่มผู้ใช้งานที่หลากหลาย ตัวอย่างเช่น:

นักวิจัยทางวิชาการ (Researchers): ช่วยให้สามารถเข้าถึงเครื่องมือสำหรับการประมวลผลภาษาธรรมชาติ (NLP) ในภาษาไทยที่มีประสิทธิภาพสูงและทันสมัย สามารถนำไปใช้ในการวิจัยและพัฒนาเทคโนโลยี NLP
นักวิทยาศาสตร์ข้อมูล (Data Scientists): สามารถใช้ประโยชน์จากเกณฑ์มาตรฐานและชุดข้อมูลที่เกี่ยวข้องกับบริบท เพื่อพัฒนาและประเมินผลของโมเดล AI
วิศวกรซอฟต์แวร์ (Software Engineers): สามารถสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย LLM หรือรวม LLM เข้ากับระบบที่มีอยู่ ตัวอย่างเช่น ใช้พัฒนา Chatbot ทางกฎหมาย อย่างแพลตฟอร์มสมหมาย โดย VISAI
วิศวกร AI (AI Engineers): ได้เข้าถึง LLM ที่มีประสิทธิภาพสูงและใช้เป็นเครื่องมือสำหรับการทำงานกับ AI เพื่อพัฒนาและปรับใช้โซลูชัน AI ต่างๆ

กลุ่มอุตสาหกรรมเป้าหมายของ Typhoon 2

Typhoon 2 มีศักยภาพในการประยุกต์ใช้ในหลากหลายอุตสาหกรรม ตอบโจทย์หลากหลายการทำงาน

ด้านการเงินเพื่อผู้บริโภค (Consumer Finance) เช่น พัฒนา Chatbot เพื่อให้บริการลูกค้า และวิเคราะห์ความเสี่ยงทางการเงิน
ด้านการแพทย์ (Healthcare) เช่น วิเคราะห์ข้อมูลทางการแพทย์ หรือ ด้านกฎหมาย (Legal) เช่น ค้นคว้าข้อมูลทางกฎหมาย
ด้านประกันภัย (Insurance) เช่น ประเมินความเสี่ยง และต่อพัฒนาผลิตภัณฑ์ประกันภัยใหม่ๆ
ภาครัฐ (Public Sector) เช่น ให้บริการข้อมูลสาธารณะ หรือพัฒนาระบบบริการภาครัฐแบบอัจฉริยะ
ด้านการศึกษา (Education) เช่น พัฒนาเครื่องมือช่วยสอน สร้างเนื้อหาการเรียนรู้ และปรับปรุงประสิทธิภาพการเรียนการสอน

ความเห็นจากผู้ทดลองใช้งาน Typhoon

"Typhoon เป็นโมเดลที่มีความสามารถในการเข้าใจภาษาไทยอย่างลึกซึ้ง สามารถนำไปประยุกต์ใช้ได้อย่างกว้างขวาง เช่น Text2SQL และ RAG" - ทีม Data Analytics, SCB

"Typhoon API เป็นเครื่องมือที่มีประสิทธิภาพและใช้งานง่าย ช่วยให้นักศึกษาสามารถทดลองใช้งาน LLM ได้อย่างสะดวก"
- ดร. ฐิติพัทธ อัชชะกุลวิสุทธิ์, ภาควิชาวิศวกรรมชีวการแพทย์ คณะวิศวกรรมศาสตร์, มหาวิทยาลัยมหิดล

"พวกเรารู้สึกประทับใจอย่างมากกับผลงานการพัฒนาโมเดล Typhoon ของทีมพัฒนา " - SI Data+ Team

“Typhoon เป็น LLM ที่ทำงานได้ดีที่สุดบนภาษาไทย โดยเฉพาะ task ที่ต้องการความรู้และความเข้าใจในบริบทไทย เช่น งานด้านกฎหมาย ซึ่งเป็น domain ที่ต้องการความรู้ในระดับ local สำหรับการตอบคำถามที่ถูกต้องและแม่นยำ และยิ่งไปกว่านั้น typhoon ยังมีความสามารถในการใช้เป็น chatbot สำหรับการตอบคำถาม รวมถึงการทำหน้าที่เป็น agent ใน framework ที่มีความซับซ้อน เช่น RAG หรือ multi-agentic workflow ได้อย่างมีประสิทธิภาพ จึงทำให้เป็นตัวเลือกอันดับแรกสำหรับการทำ task ที่ต้องใช้ LLM บนข้อมูลภาษาไทยครับ” - ภวิศภาคย์ อัครจรัสวงศ์, Senior Data Scientist, VISAI AI

"ทีมพัฒนา Typhoon จาก SCB 10X ได้พิสูจน์ตัวเองว่าเป็นผู้นำในด้านการวิจัยและพัฒนา Large Language Models (LLMs) ด้วยการสร้างนวัตกรรมและตั้งมาตรฐานใหม่ให้กับศักยภาพ AI นอกจากการพัฒนาโมเดลและระบบ LLM ที่ล้ำสมัยยังมีส่วนสำคัญในการผลักดันงานวิจัยด้านภาษาศาสตร์เชิงธรรมชาติ ในฐานะหัวหน้าห้องปฏิบัติการ Natural Language Processing and Representation Learning Lab (NRL) ที่ VISTEC ผมมีโอกาสได้ร่วมงานกับนักวิจัยจากทีม Typhoon โดยในปี 2024 ความร่วมมือของเรานำไปสู่บทความวิจัยสำคัญ 3 ชิ้นที่ตีพิมพ์ในงาน EMNLP ในหัวข้อ Multilingual Reasoning, Bias Mitigation และ Cross-lingual Retrieval Question Answering และยังคงมีการร่วมมือกันอย่างต่อเนื่องด้วยการมุ่งไปที่การแก้ไขปัญหาสำคัญของการวิจัย AI เช่น ความปลอดภัยใน AI, การประเมินพฤติกรรมที่เกิดขึ้นเอง และความโปร่งใสของระบบ AI รวมถึงความมุ่งมั่นร่วมกันของเราในการพัฒนาทั้งด้านปฏิบัติและทฤษฎีของ AI ทำให้มั่นใจได้ว่าจะช่วยสร้างสรรค์งานวิจัยที่ส่งผลเชิงบวกต่อชุมชนวิจัยระดับโลก และช่วยยกระดับประเทศไทยให้เป็นที่ยอมรับในเวทีโลกในด้านการวิจัย AI" - รศ.ดร.สรณะ นุชอนงค์, VISTEC

พาร์ทเนอร์ทั้งไทยและต่างประเทศที่มีส่วนร่วมพัฒนาและนำ Typhoon 2 ไปประยุกต์ใช้

VISTEC
Mahidol University
Artificial Intelligence Association of Thailand (AIAT)
AI Singapore (AISG)
Stanford Human-Centered Artificial Intelligence (Stanford HAI)
Together AI
SEA AI Lab
InnovestX
Sambanova Systems

สรุป Typhoon 2 เป็นโมเดลอัปเดตล่าสุดที่เป็นก้าวสำคัญในการพัฒนาโมเดลภาษาไทยขนาดใหญ่ (Thai LLM) มีจุดมุ่งเน้นเพิ่มประสิทธิภาพ และปรับปรุงให้ตอบสนองต่อความต้องการและการใช้งานในอุตสาหกรรมและธุรกิจที่หลากหลายมากขึ้น พร้อมเพิ่มความปลอดภัย เพื่อให้สามารถนำไปประยุกต์ใช้ได้อย่างเต็มประสิทธิภาพในทุกแพลตฟอร์ม Typhoon ยังคงเดินหน้าสร้างความร่วมมือกับพันธมิตรในหลากหลายอุตสาหกรรมที่มองเห็นโอกาสในการพัฒนาและปรับใช้โมเดลภาษาไทยขนาดใหญ่ เพื่อยกระดับศักยภาพทางธุรกิจ และต่อยอดการใช้งานในอนาคตได้อย่างยั่งยืน

อ่านบทความเกี่ยวกับ Typhoon2 เพิ่มเติมได้ที่