ในงาน re:Invent เมื่อวันอังคารที่ผ่านมา Amazon Web Services (AWS) ซึ่งเป็นแผนกคลาวด์คอมพิวติ้งของ Amazon ได้ประกาศเปิดตัวตระกูลโมเดล AI แบบมัลติโหมดใหม่ภายใต้ชื่อ Nova
Nova ประกอบด้วยโมเดลสร้างข้อความ 4 รุ่น ได้แก่ Micro, Lite, Pro และ Premier โดย Micro, Lite และ Pro พร้อมให้บริการแก่ลูกค้า AWS ตั้งแต่วันนี้ ขณะที่ Premier มีกำหนดเปิดตัวในต้นปี 2025 ตามที่ Andy Jassy CEO ของ Amazon เปิดเผยในงาน
นอกจากนี้ยังมีการเปิดตัว Image-generation model ชื่อว่า Nova Canvas และ Video-generating model ชื่อว่า Nova Reel ออกมาอีกด้วย
Nova ประกอบด้วยโมเดลทั้งหมด 4 รุ่น ได้แก่ Micro, Lite, Pro และ Premier เป็นโมเดลที่ออกแบบให้มีความสามารถหลากหลาย ครอบคลุมทั้งข้อความ ภาพ และวิดีโอ รองรับ 15 ภาษา (เน้นภาษาอังกฤษเป็นหลัก) โดยแต่ละรุ่นมีจุดเด่นเฉพาะตัว ดังนี้:
Nova มาพร้อมกับ Context Window ซึ่งช่วยให้โมเดลสามารถประมวลผลข้อมูลปริมาณมากขึ้น
ภายในปี 2025 ขอบเขตนี้จะขยายเพิ่มเป็น มากกว่า 2 ล้านโทเคน โดย AWS ระบุว่า Nova ถูกพัฒนาให้มีต้นทุนการใช้งานที่ต่ำและประมวลผลได้เร็วที่สุดในตลาด AI Frontier
Andy Jassy CEO ของ Amazon เผยว่า "เราออกแบบโมเดลให้ทำงานร่วมกับระบบและ API พิเศษได้ดี ทำให้งานที่ต้องทำหลายขั้นตอนอัตโนมัติเป็นเรื่องง่ายขึ้น ผมคิดว่านี่คือจุดเด่นที่น่าสนใจ" ซึ่งโมเดล Nova จะพร้อมให้ใช้งานบน AWS Bedrock แพลตฟอร์ม AI ของ Amazon
นอกจากนี้ AWS ยังได้ประกาศเปิดตัว Canvas และ Reel ซึ่งเป็นเครื่องมือใหม่ที่ทรงพลังที่สุดในกลุ่ม Generative AI สำหรับสื่อมัลติมีเดีย โดย Jassy เน้นย้ำว่า Canvas และ Reel มาพร้อมกับเครื่องมือควบคุมเพื่อความรับผิดชอบในการใช้งาน เช่น การฝังลายน้ำบนผลงานและการกรองเนื้อหาที่ไม่เหมาะสม
AWS ยังกล่าวเสริมในบล็อกโพสต์ว่า Nova ถูกออกแบบให้มีมาตรการป้องกันการแพร่กระจายข้อมูลผิดพลาด เนื้อหาเกี่ยวกับการล่วงละเมิดทางเพศเด็ก และความเสี่ยงด้านเคมี ชีวภาพ รังสี หรืออาวุธนิวเคลียร์ แต่ไม่ได้ลงรายละเอียดว่ามาตรการเหล่านี้มีลักษณะอย่างไร
Canvas สามารถสร้างและแก้ไขภาพด้วยคำสั่ง Prompts เช่น การลบพื้นหลังของภาพ การปรับโทนสี หรือการออกแบบเลย์เอาต์ใหม่ทั้งหมด ผู้ใช้ยังสามารถควบคุมรายละเอียดของภาพ เช่น สีสันและการจัดวางองค์ประกอบได้อย่างง่ายดาย
Reel สามารถสร้างวิดีโอความยาวสูงสุด 6 วินาทีจากคำสั่งข้อความหรือภาพอ้างอิงที่กำหนด พร้อมทั้งปรับแต่งการเคลื่อนไหวของกล้องได้อย่างอิสระ เช่น การแพน, หมุน 360 องศา หรือการซูม เพื่อเพิ่มมิติและความสมจริงให้กับวิดีโอ ปัจจุบัน Reel รองรับการสร้างวิดีโอความยาว 6 วินาที โดยใช้เวลาประมวลผลประมาณ 3 นาที แต่ AWS ได้เผยแผนการพัฒนาเวอร์ชันใหม่ที่รองรับวิดีโอความยาว 2 นาที ในเร็ว ๆ นี้
สุดท้ายแล้ว AWS เตรียมเปิดตัว Speech-to-Speech Model ในไตรมาสแรกปี 2025 โดยโมเดลนี้สามารถแปลงเสียงพูดต้นทางเป็นเสียงใหม่ พร้อมวิเคราะห์น้ำเสียงและจังหวะการพูด เพื่อสร้างเสียงที่ใกล้เคียงมนุษย์ และในกลางปี 2025 จะมีการเปิดตัว Any-to-Any Model ที่สามารถรับและแปลงข้อมูลได้หลากหลายรูปแบบ เช่น ข้อความ เสียง ภาพ หรือวิดีโอ รองรับการใช้งานตั้งแต่โปรแกรมแปลภาษาไปจนถึงผู้ช่วย AI
Jassy กล่าวถึงโมเดลนี้ว่า "นี่คืออนาคตของ AI คุณจะป้อนข้อมูลในรูปแบบใดก็ได้และรับผลลัพธ์ในรูปแบบที่ต้องการ"
อ้างอิง: techcrunch
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด