AWS เปิดตัว Nova ตระกูลโมเดล AI มัลติโมเดลใหม่ล่าสุด

ธันวาคม 4, 2024 | By Techsauce Team

ในงาน re:Invent เมื่อวันอังคารที่ผ่านมา Amazon Web Services (AWS) ซึ่งเป็นแผนกคลาวด์คอมพิวติ้งของ Amazon ได้ประกาศเปิดตัวตระกูลโมเดล AI แบบมัลติโหมดใหม่ภายใต้ชื่อ Nova

Nova ประกอบด้วยโมเดลสร้างข้อความ 4 รุ่น ได้แก่ Micro, Lite, Pro และ Premier โดย Micro, Lite และ Pro พร้อมให้บริการแก่ลูกค้า AWS ตั้งแต่วันนี้ ขณะที่ Premier มีกำหนดเปิดตัวในต้นปี 2025 ตามที่ Andy Jassy CEO ของ Amazon เปิดเผยในงาน

นอกจากนี้ยังมีการเปิดตัว Image-generation model ชื่อว่า Nova Canvas และ Video-generating model ชื่อว่า Nova Reel ออกมาอีกด้วย

รู้จัก Nova มัลติโมเดลจาก AWS

Nova ประกอบด้วยโมเดลทั้งหมด 4 รุ่น ได้แก่ Micro, Lite, Pro และ Premier เป็นโมเดลที่ออกแบบให้มีความสามารถหลากหลาย ครอบคลุมทั้งข้อความ ภาพ และวิดีโอ รองรับ 15 ภาษา (เน้นภาษาอังกฤษเป็นหลัก) โดยแต่ละรุ่นมีจุดเด่นเฉพาะตัว ดังนี้:

Micro เป็นโมเดลที่เล็กที่สุด รองรับการป้อนข้อมูลและสร้างผลลัพธ์เฉพาะข้อความ จุดเด่นคือ ความเร็วสูงสุดและการใช้ทรัพยากรต่ำที่สุด เหมาะกับงานที่ต้องการความรวดเร็ว เช่น การตอบคำถามแบบเรียลไทม์
Lite สามารถประมวลผลทั้งข้อความ ภาพ และวิดีโอ ด้วยความเร็วปานกลาง จะมีความสมดุลระหว่างความสามารถและประสิทธิภาพ เหมาะสำหรับงานที่หลากหลาย เช่น การวิเคราะห์ข้อความพร้อมไฟล์ภาพ
Pro ออกแบบมาเพื่อความสมดุลระหว่าง ความแม่นยำ ความเร็ว และต้นทุน รองรับงานวิเคราะห์เอกสาร สรุปชาร์ต หรือสร้างข้อความที่ซับซ้อนในเวลาที่เหมาะสม
Premier เป็นรุ่นที่ทรงพลังที่สุดในตระกูล Nova ใช้สำหรับงานที่ซับซ้อน เช่น การสร้างโมเดล AI เฉพาะทางแบบ Custom AI Models ซึ่ง Premier มีความสามารถในการช่วยสร้างโมเดลอื่น ๆ แต่ไม่ได้ออกแบบมาเพื่อใช้งานเดี่ยวโดยทั่วไป

Context Window และขอบเขตความสามารถของ Nova

Nova มาพร้อมกับ Context Window ซึ่งช่วยให้โมเดลสามารถประมวลผลข้อมูลปริมาณมากขึ้น

Micro รองรับ 128,000 โทเคน หรือประมาณ 100,000 คำ
Lite และ Pro รองรับ 300,000 โทเคน (ประมาณ 225,000 คำ, 15,000 บรรทัดของโค้ด หรือวิดีโอความยาว 30 นาที)

ภายในปี 2025 ขอบเขตนี้จะขยายเพิ่มเป็น มากกว่า 2 ล้านโทเคน โดย AWS ระบุว่า Nova ถูกพัฒนาให้มีต้นทุนการใช้งานที่ต่ำและประมวลผลได้เร็วที่สุดในตลาด AI Frontier

Andy Jassy CEO ของ Amazon เผยว่า "เราออกแบบโมเดลให้ทำงานร่วมกับระบบและ API พิเศษได้ดี ทำให้งานที่ต้องทำหลายขั้นตอนอัตโนมัติเป็นเรื่องง่ายขึ้น ผมคิดว่านี่คือจุดเด่นที่น่าสนใจ" ซึ่งโมเดล Nova จะพร้อมให้ใช้งานบน AWS Bedrock แพลตฟอร์ม AI ของ Amazon

เปิดตัว Canvas และ Reel สำหรับสื่อมัลติมีเดีย

นอกจากนี้ AWS ยังได้ประกาศเปิดตัว Canvas และ Reel ซึ่งเป็นเครื่องมือใหม่ที่ทรงพลังที่สุดในกลุ่ม Generative AI สำหรับสื่อมัลติมีเดีย โดย Jassy เน้นย้ำว่า Canvas และ Reel มาพร้อมกับเครื่องมือควบคุมเพื่อความรับผิดชอบในการใช้งาน เช่น การฝังลายน้ำบนผลงานและการกรองเนื้อหาที่ไม่เหมาะสม

AWS ยังกล่าวเสริมในบล็อกโพสต์ว่า Nova ถูกออกแบบให้มีมาตรการป้องกันการแพร่กระจายข้อมูลผิดพลาด เนื้อหาเกี่ยวกับการล่วงละเมิดทางเพศเด็ก และความเสี่ยงด้านเคมี ชีวภาพ รังสี หรืออาวุธนิวเคลียร์ แต่ไม่ได้ลงรายละเอียดว่ามาตรการเหล่านี้มีลักษณะอย่างไร

Canvas โมเดล image-generating

Canvas สามารถสร้างและแก้ไขภาพด้วยคำสั่ง Prompts เช่น การลบพื้นหลังของภาพ การปรับโทนสี หรือการออกแบบเลย์เอาต์ใหม่ทั้งหมด ผู้ใช้ยังสามารถควบคุมรายละเอียดของภาพ เช่น สีสันและการจัดวางองค์ประกอบได้อย่างง่ายดาย

Reel โมเดล video-generating

Reel สามารถสร้างวิดีโอความยาวสูงสุด 6 วินาทีจากคำสั่งข้อความหรือภาพอ้างอิงที่กำหนด พร้อมทั้งปรับแต่งการเคลื่อนไหวของกล้องได้อย่างอิสระ เช่น การแพน, หมุน 360 องศา หรือการซูม เพื่อเพิ่มมิติและความสมจริงให้กับวิดีโอ ปัจจุบัน Reel รองรับการสร้างวิดีโอความยาว 6 วินาที โดยใช้เวลาประมวลผลประมาณ 3 นาที แต่ AWS ได้เผยแผนการพัฒนาเวอร์ชันใหม่ที่รองรับวิดีโอความยาว 2 นาที ในเร็ว ๆ นี้

สุดท้ายแล้ว AWS เตรียมเปิดตัว Speech-to-Speech Model ในไตรมาสแรกปี 2025 โดยโมเดลนี้สามารถแปลงเสียงพูดต้นทางเป็นเสียงใหม่ พร้อมวิเคราะห์น้ำเสียงและจังหวะการพูด เพื่อสร้างเสียงที่ใกล้เคียงมนุษย์ และในกลางปี 2025 จะมีการเปิดตัว Any-to-Any Model ที่สามารถรับและแปลงข้อมูลได้หลากหลายรูปแบบ เช่น ข้อความ เสียง ภาพ หรือวิดีโอ รองรับการใช้งานตั้งแต่โปรแกรมแปลภาษาไปจนถึงผู้ช่วย AI

Jassy กล่าวถึงโมเดลนี้ว่า "นี่คืออนาคตของ AI คุณจะป้อนข้อมูลในรูปแบบใดก็ได้และรับผลลัพธ์ในรูปแบบที่ต้องการ"

อ้างอิง: techcrunch

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

เข้าสู่ระบบ
ลงทะเบียน

ลืมรหัสผ่าน?

มีบัญชีแล้วหรือยัง ?

มีบัญชีอยู่แล้ว ?

No comment

Gemini Robotics ER 2 มาแล้ว สมองกล AI จาก DeepMind ดูวิดีโอเป็น แก้งานผิดเองได้ สั่งหุ่นยนต์หลายตัวทำงานร่วมกันได้

Google DeepMind เปิดตัว Gemini Robotics ER 2 โมเดล AI ที่เป็นสมองระดับสูงให้หุ่นยนต์ ดูวิดีโอต่อเนื่อง แก้งานผิดเองได้ และสั่งหุ่นยนต์หลายตัวทำงานร่วมกัน เปิดให้นักพัฒนาใช้แล้วผ่าน...

กรกฎาคม 31, 2026 | By Techsauce Team

บีโอไอเร่งปั้นไทยเป็นฐานผลิตโฟโตนิกส์โลก รับเม็ดเงินลงทุนกว่า 8 หมื่นล้าน

บีโอไอเดินหน้าส่งเสริมการลงทุนในอุตสาหกรรมโฟโตนิกส์ (Photonics) เทคโนโลยีที่เป็นหัวใจของโครงสร้างพื้นฐานดิจิทัลยุค AI ล่าสุดในช่วง 5 ปีที่ผ่านมา มีโครงการขอรับการส่งเสริมแล้วถึง 79...

กรกฎาคม 30, 2026 | By Techsauce Team

depa-IBM-กระทรวงดีอี รวมตัวดึงนักวิจัย มหาลัย ผู้พัฒนาเทค และหน่วยงานรัฐ สร้าง Quantum Ecosystem ให้ประเทศไทย

เมื่อคอมพิวเตอร์ทั่วไปถอดรหัสใช้ 4.7 พันล้านปี แต่ควอนตัมทำเสร็จใน 8 ชม. เจาะลึกบทบาท depa x IBM ดัน Thailand Quantum Readiness ปูทางสร้าง Ecosystem ในก่อนสายเกินแก้...

กรกฎาคม 27, 2026 | By Techsauce Team

News

ibm

Thailand Quantum Readiness Workshop