
Luma AI สตาร์ทอัพด้านการสร้างวิดีโอด้วยปัญญาประดิษฐ์สัญชาติอเมริกัน เปิดตัว Luma Agents แพลตฟอร์มที่ออกแบบมาเพื่อรองรับงานสร้างสรรค์แบบครบวงจร ครอบคลุมทั้งข้อความ ภาพ วิดีโอ และเสียง โดยขับเคลื่อนด้วยโมเดลใหม่ในตระกูล Unified Intelligence ที่บริษัทพัฒนาขึ้นเอง บริษัทซึ่งก่อตั้งในปี 2021 ปัจจุบันระดมทุนแล้วทั้งสิ้น 1.1 พันล้านดอลลาร์ มูลค่าบริษัทอยู่ที่ 4 พันล้านดอลลาร์
หัวใจของ Luma Agents คือโมเดล Uni-1 ซึ่งเป็นโมเดลแรกในตระกูล Unified Intelligence ในทางเทคนิค Uni-1 ใช้สถาปัตยกรรมแบบ "Decoder-only Autoregressive Transformer" กล่าวคือโมเดลจะสร้างผลลัพธ์ทีละหน่วยข้อมูล โดยอ้างอิงจากสิ่งที่สร้างมาก่อนหน้าเสมอ คล้ายกับหลักการทำงานของ GPT และโมเดลภาษาขนาดใหญ่ทั่วไป สิ่งที่แตกต่างคือ Uni-1 ทำงานบน พื้นที่โทเคนร่วม (shared token space) ที่ผสมรวมทั้งโทเคนภาษาและโทเคนภาพเข้าด้วยกันในลำดับเดียว ทำให้ทั้งสองรูปแบบทำหน้าที่เป็นได้ทั้งข้อมูลเข้าและข้อมูลออก
ต่างจากระบบแบบเดิมที่เชื่อมต่อโมเดลแยกกันสำหรับภาษาและภาพ Unified Intelligence ฝึกฝนบนระบบการประมวลผลและใช้เหตุผลหลายรูปแบบในระบบเดียว ครอบคลุมทั้งภาษา ภาพ วิดีโอ เสียง และการรับรู้เชิงพื้นที่ Amit Jain ซีอีโอและผู้ร่วมก่อตั้ง Luma อธิบายว่า Uni-1 สามารถ "คิดด้วยภาษา และจินตนาการรวมถึงแสดงผลออกมาในรูปแบบพิกเซลหรือภาพ" ซึ่งบริษัทเรียกแนวคิดนี้ว่า "Intelligence in Pixels"
สิ่งที่ทำให้ Luma Agents โดดเด่นคือความสามารถในการประสานงานกับโมเดลปัญญาประดิษฐ์ภายนอกได้หลากหลาย ได้แก่
ทีมงานสามารถเปิดหรือปิดการใช้งานแต่ละโมเดลได้ตามต้องการ โดยระบบจะรักษา บริบทที่ต่อเนื่อง ตั้งแต่บรีฟเริ่มต้นจนถึงชิ้นงานสุดท้าย ครอบคลุมแนวทางแบรนด์ เหตุผลเชิงสร้างสรรค์ และการตัดสินใจก่อนหน้าทั้งหมด โดยไม่ต้องเริ่มต้นใหม่ทุกครั้งที่เปลี่ยนรูปแบบผลลัพธ์

Caroline Ingeborn ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ Luma AI อธิบายว่ากระบวนการสร้างสรรค์ในปัจจุบันยังคงเป็นแบบเส้นตรงและมีราคาแพง ตั้งแต่การเขียนสคริปต์ ทำ กระดานแนวคิดภาพ (Mood Board) ไปจนถึงการสร้างวิดีโอ ในแต่ละขั้นตอนโปรเจกต์อาจถูกยกเลิกหรือต้องหางบประมาณเพิ่ม Luma Agents ออกแบบมาเพื่อเปลี่ยนกระบวนการเส้นตรงนี้ ด้วยการสร้าง รูปแบบทางเลือก จำนวนมากในคราวเดียว แล้วให้ผู้ใช้บอกทิศทางผ่านการสนทนาแทนการป้อนคำสั่งซ้ำ ๆ ทีละรอบ
นอกจากนี้ระบบยังมี กลไกตรวจสอบและแก้ไขตัวเอง ที่ประเมินผลลัพธ์แล้ววนซ้ำปรับปรุงจนได้มาตรฐาน คล้ายกับที่ปัญญาประดิษฐ์สำหรับเขียนโค้ดทำจนได้รับความนิยมอย่างแพร่หลาย Jain อธิบายว่า "คุณต้องการความสามารถในการประเมินงาน แก้ไขมัน และวนซ้ำจนกว่าผลลัพธ์จะดีและแม่นยำ"
Luma เริ่มทดสอบกับลูกค้าแล้วกว่า 100 รายตั้งแต่เดือนธันวาคม 2568 โดยพาร์ตเนอร์เปิดตัวได้แก่เอเจนซีโฆษณาระดับโลกอย่าง Publicis Groupe และ Serviceplan Group รวมถึงแบรนด์ชื่อดังอย่าง Adidas, Mazda และบริษัทปัญญาประดิษฐ์จากซาอุดีอาระเบียอย่าง Humain
ตัวอย่างที่น่าสนใจคือ Luma Agents ช่วยแปลงแคมเปญโฆษณามูลค่า 15 ล้านดอลลาร์ ที่ใช้เวลาทำทั้งปี ให้กลายเป็นโฆษณาที่ปรับให้เหมาะกับแต่ละประเทศภายใน 40 ชั่วโมง ด้วยต้นทุนไม่ถึง 20,000 ดอลลาร์ และยังผ่านการตรวจสอบคุณภาพภายในของแบรนด์ได้อีกด้วย ในการสาธิตอีกตัวอย่าง ระบบรับบรีฟ 200 คำพร้อมภาพผลิตภัณฑ์ลิปสติกหนึ่งหลอด แล้วสร้างไอเดียหลากหลายสำหรับสถานที่ นางแบบ และโทนสีสำหรับแคมเปญโฆษณาได้โดยอัตโนมัติ
ปัจจุบัน Luma Agents เปิดให้เข้าถึงผ่าน อินเทอร์เฟซสำหรับนักพัฒนา (API) แล้ว แต่บริษัทจะค่อย ๆ ขยายการเข้าถึงอย่างระมัดระวัง เพื่อให้มั่นใจว่าผู้ใช้จะได้รับประสบการณ์ที่เสถียรและไม่กระทบกระบวนการทำงานที่มีอยู่ ในอนาคต Luma วางแผนเพิ่มความสามารถด้านเสียงและวิดีโอเต็มรูปแบบผ่านโมเดลรุ่นถัดไปในตระกูล Unified Intelligence
ที่มา: TechCrunch, Adweek, Business Wire, Media Play News, LBB Online
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด