Luma เปิดตัว ‘Luma Agents’ รวมงานครีเอทีฟจบในที่เดียว ลดเวลาทำโฆษณาจากหลักปีเหลือ 40 ชั่วโมง!

Luma AI สตาร์ทอัพด้านการสร้างวิดีโอด้วยปัญญาประดิษฐ์สัญชาติอเมริกัน เปิดตัว Luma Agents แพลตฟอร์มที่ออกแบบมาเพื่อรองรับงานสร้างสรรค์แบบครบวงจร ครอบคลุมทั้งข้อความ ภาพ วิดีโอ และเสียง โดยขับเคลื่อนด้วยโมเดลใหม่ในตระกูล Unified Intelligence ที่บริษัทพัฒนาขึ้นเอง บริษัทซึ่งก่อตั้งในปี 2021 ปัจจุบันระดมทุนแล้วทั้งสิ้น 1.1 พันล้านดอลลาร์ มูลค่าบริษัทอยู่ที่ 4 พันล้านดอลลาร์

เบื้องหลังสถาปัตยกรรม Unified Intelligence

หัวใจของ Luma Agents คือโมเดล Uni-1 ซึ่งเป็นโมเดลแรกในตระกูล Unified Intelligence ในทางเทคนิค Uni-1 ใช้สถาปัตยกรรมแบบ "Decoder-only Autoregressive Transformer" กล่าวคือโมเดลจะสร้างผลลัพธ์ทีละหน่วยข้อมูล โดยอ้างอิงจากสิ่งที่สร้างมาก่อนหน้าเสมอ คล้ายกับหลักการทำงานของ GPT และโมเดลภาษาขนาดใหญ่ทั่วไป สิ่งที่แตกต่างคือ Uni-1 ทำงานบน พื้นที่โทเคนร่วม (shared token space) ที่ผสมรวมทั้งโทเคนภาษาและโทเคนภาพเข้าด้วยกันในลำดับเดียว ทำให้ทั้งสองรูปแบบทำหน้าที่เป็นได้ทั้งข้อมูลเข้าและข้อมูลออก

ต่างจากระบบแบบเดิมที่เชื่อมต่อโมเดลแยกกันสำหรับภาษาและภาพ Unified Intelligence ฝึกฝนบนระบบการประมวลผลและใช้เหตุผลหลายรูปแบบในระบบเดียว ครอบคลุมทั้งภาษา ภาพ วิดีโอ เสียง และการรับรู้เชิงพื้นที่ Amit Jain ซีอีโอและผู้ร่วมก่อตั้ง Luma อธิบายว่า Uni-1 สามารถ "คิดด้วยภาษา และจินตนาการรวมถึงแสดงผลออกมาในรูปแบบพิกเซลหรือภาพ" ซึ่งบริษัทเรียกแนวคิดนี้ว่า "Intelligence in Pixels"

ทำงานร่วมกับโมเดลปัญญาประดิษฐ์อื่นได้

สิ่งที่ทำให้ Luma Agents โดดเด่นคือความสามารถในการประสานงานกับโมเดลปัญญาประดิษฐ์ภายนอกได้หลากหลาย ได้แก่

  • Ray 3.14 ของ Luma เอง สำหรับสร้างวิดีโอความละเอียดสูง 1080p
  • Veo 3 และ Nano Banana Pro จาก Google
  • Seedream จาก ByteDance และ Kling สำหรับสร้างวิดีโอ
  • DeepSeek สำหรับการประมวลผลภาษา
  • โมเดลสร้างเสียงพูดจาก ElevenLabs

ทีมงานสามารถเปิดหรือปิดการใช้งานแต่ละโมเดลได้ตามต้องการ โดยระบบจะรักษา บริบทที่ต่อเนื่อง ตั้งแต่บรีฟเริ่มต้นจนถึงชิ้นงานสุดท้าย ครอบคลุมแนวทางแบรนด์ เหตุผลเชิงสร้างสรรค์ และการตัดสินใจก่อนหน้าทั้งหมด โดยไม่ต้องเริ่มต้นใหม่ทุกครั้งที่เปลี่ยนรูปแบบผลลัพธ์

เปลี่ยนกระบวนการทำงานเชิงสร้างสรรค์

Caroline Ingeborn ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ Luma AI อธิบายว่ากระบวนการสร้างสรรค์ในปัจจุบันยังคงเป็นแบบเส้นตรงและมีราคาแพง ตั้งแต่การเขียนสคริปต์ ทำ กระดานแนวคิดภาพ (Mood Board) ไปจนถึงการสร้างวิดีโอ ในแต่ละขั้นตอนโปรเจกต์อาจถูกยกเลิกหรือต้องหางบประมาณเพิ่ม Luma Agents ออกแบบมาเพื่อเปลี่ยนกระบวนการเส้นตรงนี้ ด้วยการสร้าง รูปแบบทางเลือก จำนวนมากในคราวเดียว แล้วให้ผู้ใช้บอกทิศทางผ่านการสนทนาแทนการป้อนคำสั่งซ้ำ ๆ ทีละรอบ

นอกจากนี้ระบบยังมี กลไกตรวจสอบและแก้ไขตัวเอง ที่ประเมินผลลัพธ์แล้ววนซ้ำปรับปรุงจนได้มาตรฐาน คล้ายกับที่ปัญญาประดิษฐ์สำหรับเขียนโค้ดทำจนได้รับความนิยมอย่างแพร่หลาย Jain อธิบายว่า "คุณต้องการความสามารถในการประเมินงาน แก้ไขมัน และวนซ้ำจนกว่าผลลัพธ์จะดีและแม่นยำ"

ผลลัพธ์จากการใช้งานจริง

Luma เริ่มทดสอบกับลูกค้าแล้วกว่า 100 รายตั้งแต่เดือนธันวาคม 2568 โดยพาร์ตเนอร์เปิดตัวได้แก่เอเจนซีโฆษณาระดับโลกอย่าง Publicis Groupe และ Serviceplan Group รวมถึงแบรนด์ชื่อดังอย่าง Adidas, Mazda และบริษัทปัญญาประดิษฐ์จากซาอุดีอาระเบียอย่าง Humain

ตัวอย่างที่น่าสนใจคือ Luma Agents ช่วยแปลงแคมเปญโฆษณามูลค่า 15 ล้านดอลลาร์ ที่ใช้เวลาทำทั้งปี ให้กลายเป็นโฆษณาที่ปรับให้เหมาะกับแต่ละประเทศภายใน 40 ชั่วโมง ด้วยต้นทุนไม่ถึง 20,000 ดอลลาร์ และยังผ่านการตรวจสอบคุณภาพภายในของแบรนด์ได้อีกด้วย ในการสาธิตอีกตัวอย่าง ระบบรับบรีฟ 200 คำพร้อมภาพผลิตภัณฑ์ลิปสติกหนึ่งหลอด แล้วสร้างไอเดียหลากหลายสำหรับสถานที่ นางแบบ และโทนสีสำหรับแคมเปญโฆษณาได้โดยอัตโนมัติ

เข้าถึงได้แล้วผ่านอินเทอร์เฟซสำหรับนักพัฒนา

ปัจจุบัน Luma Agents เปิดให้เข้าถึงผ่าน อินเทอร์เฟซสำหรับนักพัฒนา (API) แล้ว แต่บริษัทจะค่อย ๆ ขยายการเข้าถึงอย่างระมัดระวัง เพื่อให้มั่นใจว่าผู้ใช้จะได้รับประสบการณ์ที่เสถียรและไม่กระทบกระบวนการทำงานที่มีอยู่ ในอนาคต Luma วางแผนเพิ่มความสามารถด้านเสียงและวิดีโอเต็มรูปแบบผ่านโมเดลรุ่นถัดไปในตระกูล Unified Intelligence

ที่มา: TechCrunch, Adweek, Business Wire, Media Play News, LBB Online

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Reed Hastings ผู้ก่อตั้ง Netflix เตรียมลงจากตำแหน่งกลางปีนี้ ปิดตำนาน 27 ปี ผู้เปลี่ยนโลกการดูหนัง

Reed Hastings ผู้ร่วมก่อตั้งและประธานบอร์ดของ Netflix กำลังจะก้าวลงจากตำแหน่งกรรมการบริษัทที่เขาสร้างขึ้นมาตั้งแต่ต้น หลังจากอยู่กับองค์กรมาอย่างยาวนานกว่า 27 ปี โดยการเปลี่ยนแปลงน...

Responsive image

สวีเดนสั่งยกเลิกหน้าจอในห้องเรียน กลับไปใช้หนังสือและปากกา

สวีเดนประกาศเลิกใช้หน้าจอในเด็กเล็ก กลับไปเน้นอ่านเขียนบนกระดาษเพื่อกู้คะแนน PISA เกิดอะไรขึ้นกับระบบการศึกษาที่เคยดีที่สุดในโลก?...

Responsive image

Opus 4.7 สรุปความเก่งของโมเดลล่าสุดจาก Anthropic คิดเองได้ว่าโค้ดผิดตรงไหน เถียงผู้ใช้ได้ ทำงานลากยาวได้โดยไม่ต้องคอยคุม

ลองนึกภาพว่าถ้าคุณเป็น Developer ที่ต้องเขียนเขียนระบบแปลงข้อความเป็นเสียงพูด (Text-to-Speech) ด้วยภาษา Rust โดยต้องเขียนตั้งแต่ Neural Model, การจัดการประมวลผลระดับฮาร์ดเแวร์, ทำ ...