milkyway 6
milkyway 7
milkyway 8
Technology
10 มกราคม 2568
ภาษาไทย

เปิดตัว ‘Typhoon 2’: ก้าวสำคัญของ Thai LLM ขับเคลื่อน AI ภาษาไทยสู่อนาคต

Typhoon2-B1200x800.jpg

Typhoon 2 กับการพัฒนาอย่างต่อเนื่อง


Typhoon เป็นโมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ที่มีการพัฒนามาอย่างต่อเนื่อง โดยขณะนี้ Typhoon มีความสามารถในการประมวลผลภาษาไทยที่มีประสิทธิภาพสูง และยังมุ่งเน้นการปรับแต่งให้เหมาะกับบริบทในภาษาไทยโดยเฉพาะ ซึ่งได้มีการพัฒนามาหลายเวอร์ชัน ดังนี้

  1. Typhoon 1.0 หรือ Typhoon-7B เป็นโมเดลภาษาไทยขนาด 7B มี 2 เวอร์ชั่น คือ Pretrained และ Instruction-tuned 

  2. Typhoon 1.5 และ 1.5X มาพร้อมกับโมเดล 2 ขนาด คือ 8B และ 70B มีประสิทธิภาพที่สูงและแม่นยำมากขึ้นแข่งขันได้กับโมเดลชั้นนำ ซึ่งถูกพัฒนามาเพื่อให้ใช้งานในแอปพลิเคชั่นได้จริง

  3. Typhoon 2 ประสิทธิภาพสูงสุด พร้อมกับมีโมเดลให้เลือก 5 ขนาด นำไปประยุกต์ใช้ได้กว้าง รวมถึงมีการพัฒนา Multimodal Models ที่สามารถประมวลผลข้อมูลทั้งภาพและเสียงได้ 


ขนาดโมเดลของ Typhoon 2 ที่ตอบโจทย์ทุกการใช้งาน 

Typhoon 2 คือเวอร์ชั่นอัปเดตล่าสุด ที่ถูกพัฒนาขึ้น มีขนาด (Parameter Size) ที่เพิ่มขึ้น เพื่อรองรับการใช้งานที่หลากหลาย โดยเพิ่มจากเวอร์ชั่นก่อนมาทั้งหมด 5 ขนาดด้วยกัน ดังนี้

  • 1B (ชื่อโมเดล: Typhoon2-1B)

  • 3B (ชื่อโมเดล: Typhoon2-3B)

  • 7B (ชื่อโมเดล: Typhoon2-7B)

  • 8B (ชื่อโมเดล: Typhoon2-8B)

  • 70B (ชื่อโมเดล: Typhoon2-70B)

 

โมเดลขนาด 1B และ 3B เหมาะสำหรับงานที่ไม่ซับซ้อน อย่างการสรุปความหรือแปลภาษา โดยเฉพาะในสภาพแวดล้อมที่มีทรัพยากรการประมวลผลต่ำ เหมาะสำหรับอุปกรณ์ เช่น สมาร์ทโฟน และคอมพิวเตอร์ที่ใช้พลังงานการประมวลผลน้อย

 

โมเดลขนาด 7B และ 8B เหมาะสำหรับการทำงานทั่วไปหรือการพัฒนาต้นแบบ (Proof of Concept) ก่อนนำไปปรับใช้ในระดับ Production นอกจากนี้ยังตอบโจทย์ผู้ใช้งานที่คำนึงถึงต้นทุน (Cost-Conscious Users) และเหมาะสำหรับเวิร์กโฟลว์ที่เน้นความเรียบง่ายและต้องการปรับแต่งให้สอดคล้องกับบริบทในท้องถิ่น

 

โมเดลขนาด 70B เหมาะสำหรับงานที่มีความสำคัญระดับองค์กรซึ่งต้องการความแม่นยำสูงเป็นพิเศษ หรือใช้เป็นระบบปฏิบัติการหลัก โดยการใช้งานโมเดลขนาด 70B จำเป็นต้องพึ่งพาทรัพยากรการประมวลผลในระดับที่สูงขึ้นเช่นกัน จึงเหมาะสำหรับการใช้งานในด้าน Production เพื่อรองรับความต้องการที่ซับซ้อนและท้าทายขององค์กร

 

 

คุณสมบัติเด่น (Key Features) ของ Typhoon 2 

  • เพิ่มประสิทธิภาพและความแม่นยำของภาษาไทยที่สูงขึ้น ประเมินจากเกณฑ์มาตรฐาน เช่น ThaiExam และ M3Exam ซึ่งมีการประมวลผลภาษาไทยที่เหนือกว่าโมเดล Open source อื่นๆ 

  • ปรับปรุงประสิทธิภาพการทำตามคำสั่งที่ดีขึ้น เมื่อเทียบกับ Typhoon 1.0 และ Typhoon 1.5X โดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench 

  • รับข้อมูล และ Generate text ได้มากขึ้น โดยขยาย Context Window จาก 8,192 เป็น 128,000 Tokens ช่วยให้สามารถทำงานกับข้อมูลที่ซับซ้อนได้มากขึ้น

  • เพิ่มความสามารถในการเรียกใช้งานฟังก์ชัน (Function Calling) ที่ดีที่สุดในระดับ SOTA (State-of-the-Art)

  • มีโมเดลขนาดเล็กที่รองรับการทำงานบนอุปกรณ์พกพา สำหรับงานที่ไม่ซับซ้อน เช่น การสรุปข้อมูลและแปลภาษา 

  • มี Safety Classifier Model (Preview) ที่ถูกปรับแต่งเพื่อบริบทภาษาไทย ช่วยพิจารณาความเหมาะสมของคำที่ป้อนเข้าไป หากพบว่าไม่เหมาะสมก็จะแจ้งเตือน


รู้จักเกณฑ์มาตรฐานสำคัญในการประเมินประสิทธิภาพและความสามารถของ Typhoon 2 

Typhoon 2 ใช้เกณฑ์มาตรฐานที่มีความสำคัญในการประเมินประสิทธิภาพและความสามารถของ LLM โดยเฉพาะอย่างยิ่งในบริบทของภาษาไทย ซึ่งช่วยให้ผู้พัฒนาสามารถปรับปรุงและพัฒนาโมเดลให้มีความสามารถและประสิทธิภาพที่ดีขึ้น

  • ThaiExam และ M3Exam: เน้นประเมินความสามารถในการทำความเข้าใจและแก้ปัญหาในภาษาไทย
  • IFEval-EN และ IFEval-TH: เน้นประเมินความสามารถในการปฏิบัติตามคำสั่งทั้งในภาษาไทยและภาษาอังกฤษ
  • MT-Bench-EN และ MT-Bench-TH (VISTEC): เน้นประเมินประสิทธิภาพโดยรวมของ LLM ในงานที่หลากหลายและมิติการใช้งานต่างๆ ทั้งภาษาไทยและภาษาอังกฤษ


ประสิทธิภาพและความแม่นยำในภาษาไทยของ Typhoon 2 ที่สูงขึ้น

 

ผลการทดสอบเกณฑ์มาตรฐาน ThaiExam และ M3Exam (ประเมินความสามารถในการทำความเข้าใจและแก้ปัญหาภาษาไทย


Typhoon2-11.png

ประสิทธิภาพในการติดตามคำสั่ง (Instruction-Following) ของ Typhoon 2

Typhoon 2 มีศักยภาพที่ดีขึ้นในด้านการติดตามคำสั่ง โดยเฉพาะโมเดลขนาด 70B ซึ่งมีผลลัพธ์ที่ยอดเยี่ยมทั้งใน IFEval และ MT-Bench โดยสามารถเทียบเคียงหรือเหนือกว่าคู่แข่งในหลายตัวชี้วัด เหมาะสำหรับการประยุกต์ใช้งานขั้นสูง เช่น ด้านการสนทนาอัจฉริยะ หรือการพัฒนาเครื่องมือ AI ในบริบทของภาษาไทยโดยเฉพาะ 



Typhoon (2).png


เมื่อเปรียบเทียบกับโมเดลก่อนหน้า Typhoon 2 แสดงให้เห็นถึงความสามารถที่เหนือกว่าโดยเฉพาะในการประมวลผลภาษาไทย และการทำตามคำสั่งโดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench



โมเดล ‘Typhoon 2 Audio’ และ ‘Typhoon 2 Vision’ (Research Preview) Multimodal Model ของ Typhoon 2 ที่สามารถประมวลผลได้ทั้งภาพและเสียง

Typhoon 2 ได้พัฒนาโมเดลที่ตอบสนองต่อการใช้งานได้อย่างหลากหลายมากขึ้น ด้วยการสร้าง Multimodal Models ที่ไม่ได้จำกัดเพียงการประมวลผลข้อความ แต่ยังครอบคลุมถึงเสียงและภาพในเวอร์ชันใหม่นี้ โดยมีโมเดลหลักที่โดดเด่น 2 โมเดลหลัก

  1. Typhoon2-Audio 
  • ฟัง เข้าใจ และโต้ตอบได้ดีขึ้น - สามารถรับทั้งข้อความและเสียงเป็น Input และสร้างทั้งข้อความและเสียงเป็น Output ได้พร้อมกัน ทำให้สามารถมีปฏิสัมพันธ์แบบสองทางได้อย่างสมบูรณ์ คล้ายกันกับฟีเจอร์ Advanced Voice Mode ใน ChatGPT ที่ช่วยให้สนทนากับ Chat GPT ได้อย่างเป็นธรรมชาติ

  • เข้าใจเสียงได้ลึกซึ้งยิ่งขึ้น - สามารถวิเคราะห์เสียงได้ละเอียดมากขึ้นและทำให้เข้าใจความหมายของเสียงได้ดีขึ้น เช่น น้ำเสียงที่แสดงอารมณ์ 

  • ทำตามคำสั่งได้ดีขึ้น - สามารถทำตามคำสั่งที่ซับซ้อนได้มากขึ้น เช่น สนทนาแบบหลายรอบ หรือการตอบคำถามที่ต้องการข้อมูลเชิงลึกได้

  • รองรับการแปลงข้อความเป็นเสียงพูด - สามารถเปลี่ยนข้อความเป็นเสียงพูดภาษาไทยได้มีประสิทธิภาพมากกว่าโมเดล Open Source อื่นๆ

  • Use Case เช่น ผู้ใช้งานสามารถพิมพ์ข้อความเข้าไป แล้วเพิ่มคำสั่งให้ Typhoon 2 พูดออกมาเป็นเสียงได้
  1. Typhoon2-Vision 
  • ประมวลผลภาพและเข้าใจภาพได้ดีขึ้น - สามารถวิเคราะห์ภาพและเข้าใจเนื้อหาของภาพได้อย่างละเอียด

  • มีฟังก์ชัน OCR (Optical Character Recognition) ในตัว - เป็นฟังก์ชันที่สามารถแปลงข้อความในรูปภาพหรือเอกสารให้เป็นข้อความแบบดิจิทัลได้ ทำให้สามารถนำไปใช้ในงานที่เกี่ยวข้องกับการดึงข้อความจากเอกสารหรือภาพถ่าย

โดยรวม โมเดล Typhoon2-Audio และ Typhoon2-Vision มีศักยภาพที่โดดเด่น ในการนำไปประยุกต์ใช้ในหลากหลายรูปแบบ ไม่ว่าจะเป็นการสร้างผู้ช่วยเสมือน การพัฒนาแอปพลิเคชันในหลายประเภท และการวิเคราะห์ข้อมูลจากภาพและเสียง

 **คำชี้แจงสำคัญ (Disclaimer) ทั้ง 2 โมเดล Typhoon2-Audio และ Typhoon2-Vision ยังอยู่ในขั้นตอนพัฒนาและทดลองวิจัย ซึ่งอาจยังไม่เหมาะสำหรับการใช้งานในเชิงพาณิชย์ อย่างไรก็ตาม โมเดลเหล่านี้สามารถทดลองใช้งานหรือประยุกต์ใช้ร่วมกับแอปพลิเคชันในรูปแบบต่างๆ ได้อย่างหลากหลาย

 

 

กลุ่มผู้ใช้งานเป้าหมายของ Typhoon 2

Typhoon 2 ได้รับการออกแบบมาเพื่อรองรับกลุ่มผู้ใช้งานที่หลากหลาย ตัวอย่างเช่น:

  • นักวิจัยทางวิชาการ (Researchers): ช่วยให้สามารถเข้าถึงเครื่องมือสำหรับการประมวลผลภาษาธรรมชาติ (NLP) ในภาษาไทยที่มีประสิทธิภาพสูงและทันสมัย สามารถนำไปใช้ในการวิจัยและพัฒนาเทคโนโลยี NLP

  • นักวิทยาศาสตร์ข้อมูล (Data Scientists): สามารถใช้ประโยชน์จากเกณฑ์มาตรฐานและชุดข้อมูลที่เกี่ยวข้องกับบริบท เพื่อพัฒนาและประเมินผลของโมเดล AI

  • วิศวกรซอฟต์แวร์ (Software Engineers): สามารถสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย LLM หรือรวม LLM เข้ากับระบบที่มีอยู่ ตัวอย่างเช่น ใช้พัฒนา Chatbot ทางกฎหมาย อย่างแพลตฟอร์มสมหมาย โดย VISAI

  • วิศวกร AI (AI Engineers): ได้เข้าถึง LLM ที่มีประสิทธิภาพสูงและใช้เป็นเครื่องมือสำหรับการทำงานกับ AI เพื่อพัฒนาและปรับใช้โซลูชัน AI ต่างๆ


กลุ่มอุตสาหกรรมเป้าหมายของ Typhoon 2

 

Typhoon 2 มีศักยภาพในการประยุกต์ใช้ในหลากหลายอุตสาหกรรม ตอบโจทย์หลากหลายการทำงาน

  • ด้านการเงินเพื่อผู้บริโภค (Consumer Finance) เช่น พัฒนา Chatbot เพื่อให้บริการลูกค้า และวิเคราะห์ความเสี่ยงทางการเงิน

  • ด้านการแพทย์ (Healthcare) เช่น วิเคราะห์ข้อมูลทางการแพทย์ หรือ ด้านกฎหมาย (Legal) เช่น ค้นคว้าข้อมูลทางกฎหมาย

  • ด้านประกันภัย (Insurance) เช่น ประเมินความเสี่ยง และต่อพัฒนาผลิตภัณฑ์ประกันภัยใหม่ๆ

  • ภาครัฐ (Public Sector) เช่น ให้บริการข้อมูลสาธารณะ หรือพัฒนาระบบบริการภาครัฐแบบอัจฉริยะ

  • ด้านการศึกษา (Education) เช่น พัฒนาเครื่องมือช่วยสอน สร้างเนื้อหาการเรียนรู้ และปรับปรุงประสิทธิภาพการเรียนการสอน

 

ความเห็นจากผู้ทดลองใช้งาน Typhoon 

"Typhoon เป็นโมเดลที่มีความสามารถในการเข้าใจภาษาไทยอย่างลึกซึ้ง สามารถนำไปประยุกต์ใช้ได้อย่างกว้างขวาง เช่น Text2SQL และ RAG" - ทีม Data Analytics, SCB

 

"Typhoon API เป็นเครื่องมือที่มีประสิทธิภาพและใช้งานง่าย ช่วยให้นักศึกษาสามารถทดลองใช้งาน LLM ได้อย่างสะดวก"
- ดร. ฐิติพัทธ อัชชะกุลวิสุทธิ์, ภาควิชาวิศวกรรมชีวการแพทย์ คณะวิศวกรรมศาสตร์, มหาวิทยาลัยมหิดล 

 

"พวกเรารู้สึกประทับใจอย่างมากกับผลงานการพัฒนาโมเดล Typhoon ของทีมพัฒนา " - SI Data+ Team

 

“Typhoon เป็น LLM ที่ทำงานได้ดีที่สุดบนภาษาไทย โดยเฉพาะ task ที่ต้องการความรู้และความเข้าใจในบริบทไทย เช่น งานด้านกฎหมาย ซึ่งเป็น domain ที่ต้องการความรู้ในระดับ local สำหรับการตอบคำถามที่ถูกต้องและแม่นยำ และยิ่งไปกว่านั้น typhoon ยังมีความสามารถในการใช้เป็น chatbot สำหรับการตอบคำถาม รวมถึงการทำหน้าที่เป็น agent ใน framework ที่มีความซับซ้อน เช่น RAG หรือ multi-agentic workflow ได้อย่างมีประสิทธิภาพ จึงทำให้เป็นตัวเลือกอันดับแรกสำหรับการทำ task ที่ต้องใช้ LLM บนข้อมูลภาษาไทยครับ” - ภวิศภาคย์ อัครจรัสวงศ์, Senior Data Scientist, VISAI AI 

 

"ทีมพัฒนา Typhoon จาก SCB 10X ได้พิสูจน์ตัวเองว่าเป็นผู้นำในด้านการวิจัยและพัฒนา Large Language Models (LLMs) ด้วยการสร้างนวัตกรรมและตั้งมาตรฐานใหม่ให้กับศักยภาพ AI นอกจากการพัฒนาโมเดลและระบบ LLM ที่ล้ำสมัยยังมีส่วนสำคัญในการผลักดันงานวิจัยด้านภาษาศาสตร์เชิงธรรมชาติ ในฐานะหัวหน้าห้องปฏิบัติการ Natural Language Processing and Representation Learning Lab (NRL) ที่ VISTEC ผมมีโอกาสได้ร่วมงานกับนักวิจัยจากทีม Typhoon โดยในปี 2024 ความร่วมมือของเรานำไปสู่บทความวิจัยสำคัญ 3 ชิ้นที่ตีพิมพ์ในงาน EMNLP ในหัวข้อ Multilingual Reasoning, Bias Mitigation และ Cross-lingual Retrieval Question Answering และยังคงมีการร่วมมือกันอย่างต่อเนื่องด้วยการมุ่งไปที่การแก้ไขปัญหาสำคัญของการวิจัย AI เช่น ความปลอดภัยใน AI, การประเมินพฤติกรรมที่เกิดขึ้นเอง และความโปร่งใสของระบบ AI รวมถึงความมุ่งมั่นร่วมกันของเราในการพัฒนาทั้งด้านปฏิบัติและทฤษฎีของ AI ทำให้มั่นใจได้ว่าจะช่วยสร้างสรรค์งานวิจัยที่ส่งผลเชิงบวกต่อชุมชนวิจัยระดับโลก และช่วยยกระดับประเทศไทยให้เป็นที่ยอมรับในเวทีโลกในด้านการวิจัย AI" - รศ.ดร.สรณะ นุชอนงค์, VISTEC

 

 

พาร์ทเนอร์ทั้งไทยและต่างประเทศที่มีส่วนร่วมพัฒนาและนำ Typhoon 2 ไปประยุกต์ใช้

  • VISTEC

  • Mahidol University

  • Artificial Intelligence Association of Thailand (AIAT)

  • AI Singapore (AISG)

  • Stanford Human-Centered Artificial Intelligence (Stanford HAI)

  • Together AI

  • SEA AI Lab

  • InnovestX

  • Sambanova Systems


สรุป Typhoon 2 เป็นโมเดลอัปเดตล่าสุดที่เป็นก้าวสำคัญในการพัฒนาโมเดลภาษาไทยขนาดใหญ่ (Thai LLM) มีจุดมุ่งเน้นเพิ่มประสิทธิภาพ และปรับปรุงให้ตอบสนองต่อความต้องการและการใช้งานในอุตสาหกรรมและธุรกิจที่หลากหลายมากขึ้น พร้อมเพิ่มความปลอดภัย เพื่อให้สามารถนำไปประยุกต์ใช้ได้อย่างเต็มประสิทธิภาพในทุกแพลตฟอร์ม Typhoon ยังคงเดินหน้าสร้างความร่วมมือกับพันธมิตรในหลากหลายอุตสาหกรรมที่มองเห็นโอกาสในการพัฒนาและปรับใช้โมเดลภาษาไทยขนาดใหญ่ เพื่อยกระดับศักยภาพทางธุรกิจ และต่อยอดการใช้งานในอนาคตได้อย่างยั่งยืน

อ่านบทความเกี่ยวกับ Typhoon2 เพิ่มเติมได้ที่

1.) Typhoon 2 Text Models: https://medium.com/opentyphoon/typhoon-2-release-9dd36e3882c0 

2.) Typhoon 2 Multimodal Models: https://medium.com/opentyphoon/typhoon-2-multimodal-release-research-preview-200fe9015ad9

 

 

ติดตามข้อมูลเพิ่มเติมและทดลองใช้งานได้ที่เว็บไซต์: https://opentyphoon.ai/ 

ทดลองใช้โมเดล Typhoon2 Audio และ Typhoon2 Vision: 

 

Use and Management of Cookies

We use cookies and other similar technologies on our website to enhance your browsing experience. For more information, please visit our Cookies Notice.

Reject
Accept