Luma เปิดตัว ‘Luma Agents’ รวมงานครีเอทีฟจบในที่เดียว ลดเวลาทำโฆษณาจากหลักปีเหลือ 40 ชั่วโมง!

Luma AI สตาร์ทอัพด้านการสร้างวิดีโอด้วยปัญญาประดิษฐ์สัญชาติอเมริกัน เปิดตัว Luma Agents แพลตฟอร์มที่ออกแบบมาเพื่อรองรับงานสร้างสรรค์แบบครบวงจร ครอบคลุมทั้งข้อความ ภาพ วิดีโอ และเสียง โดยขับเคลื่อนด้วยโมเดลใหม่ในตระกูล Unified Intelligence ที่บริษัทพัฒนาขึ้นเอง บริษัทซึ่งก่อตั้งในปี 2021 ปัจจุบันระดมทุนแล้วทั้งสิ้น 1.1 พันล้านดอลลาร์ มูลค่าบริษัทอยู่ที่ 4 พันล้านดอลลาร์

เบื้องหลังสถาปัตยกรรม Unified Intelligence

หัวใจของ Luma Agents คือโมเดล Uni-1 ซึ่งเป็นโมเดลแรกในตระกูล Unified Intelligence ในทางเทคนิค Uni-1 ใช้สถาปัตยกรรมแบบ "Decoder-only Autoregressive Transformer" กล่าวคือโมเดลจะสร้างผลลัพธ์ทีละหน่วยข้อมูล โดยอ้างอิงจากสิ่งที่สร้างมาก่อนหน้าเสมอ คล้ายกับหลักการทำงานของ GPT และโมเดลภาษาขนาดใหญ่ทั่วไป สิ่งที่แตกต่างคือ Uni-1 ทำงานบน พื้นที่โทเคนร่วม (shared token space) ที่ผสมรวมทั้งโทเคนภาษาและโทเคนภาพเข้าด้วยกันในลำดับเดียว ทำให้ทั้งสองรูปแบบทำหน้าที่เป็นได้ทั้งข้อมูลเข้าและข้อมูลออก

ต่างจากระบบแบบเดิมที่เชื่อมต่อโมเดลแยกกันสำหรับภาษาและภาพ Unified Intelligence ฝึกฝนบนระบบการประมวลผลและใช้เหตุผลหลายรูปแบบในระบบเดียว ครอบคลุมทั้งภาษา ภาพ วิดีโอ เสียง และการรับรู้เชิงพื้นที่ Amit Jain ซีอีโอและผู้ร่วมก่อตั้ง Luma อธิบายว่า Uni-1 สามารถ "คิดด้วยภาษา และจินตนาการรวมถึงแสดงผลออกมาในรูปแบบพิกเซลหรือภาพ" ซึ่งบริษัทเรียกแนวคิดนี้ว่า "Intelligence in Pixels"

ทำงานร่วมกับโมเดลปัญญาประดิษฐ์อื่นได้

สิ่งที่ทำให้ Luma Agents โดดเด่นคือความสามารถในการประสานงานกับโมเดลปัญญาประดิษฐ์ภายนอกได้หลากหลาย ได้แก่

  • Ray 3.14 ของ Luma เอง สำหรับสร้างวิดีโอความละเอียดสูง 1080p
  • Veo 3 และ Nano Banana Pro จาก Google
  • Seedream จาก ByteDance และ Kling สำหรับสร้างวิดีโอ
  • DeepSeek สำหรับการประมวลผลภาษา
  • โมเดลสร้างเสียงพูดจาก ElevenLabs

ทีมงานสามารถเปิดหรือปิดการใช้งานแต่ละโมเดลได้ตามต้องการ โดยระบบจะรักษา บริบทที่ต่อเนื่อง ตั้งแต่บรีฟเริ่มต้นจนถึงชิ้นงานสุดท้าย ครอบคลุมแนวทางแบรนด์ เหตุผลเชิงสร้างสรรค์ และการตัดสินใจก่อนหน้าทั้งหมด โดยไม่ต้องเริ่มต้นใหม่ทุกครั้งที่เปลี่ยนรูปแบบผลลัพธ์

เปลี่ยนกระบวนการทำงานเชิงสร้างสรรค์

Caroline Ingeborn ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ Luma AI อธิบายว่ากระบวนการสร้างสรรค์ในปัจจุบันยังคงเป็นแบบเส้นตรงและมีราคาแพง ตั้งแต่การเขียนสคริปต์ ทำ กระดานแนวคิดภาพ (Mood Board) ไปจนถึงการสร้างวิดีโอ ในแต่ละขั้นตอนโปรเจกต์อาจถูกยกเลิกหรือต้องหางบประมาณเพิ่ม Luma Agents ออกแบบมาเพื่อเปลี่ยนกระบวนการเส้นตรงนี้ ด้วยการสร้าง รูปแบบทางเลือก จำนวนมากในคราวเดียว แล้วให้ผู้ใช้บอกทิศทางผ่านการสนทนาแทนการป้อนคำสั่งซ้ำ ๆ ทีละรอบ

นอกจากนี้ระบบยังมี กลไกตรวจสอบและแก้ไขตัวเอง ที่ประเมินผลลัพธ์แล้ววนซ้ำปรับปรุงจนได้มาตรฐาน คล้ายกับที่ปัญญาประดิษฐ์สำหรับเขียนโค้ดทำจนได้รับความนิยมอย่างแพร่หลาย Jain อธิบายว่า "คุณต้องการความสามารถในการประเมินงาน แก้ไขมัน และวนซ้ำจนกว่าผลลัพธ์จะดีและแม่นยำ"

ผลลัพธ์จากการใช้งานจริง

Luma เริ่มทดสอบกับลูกค้าแล้วกว่า 100 รายตั้งแต่เดือนธันวาคม 2568 โดยพาร์ตเนอร์เปิดตัวได้แก่เอเจนซีโฆษณาระดับโลกอย่าง Publicis Groupe และ Serviceplan Group รวมถึงแบรนด์ชื่อดังอย่าง Adidas, Mazda และบริษัทปัญญาประดิษฐ์จากซาอุดีอาระเบียอย่าง Humain

ตัวอย่างที่น่าสนใจคือ Luma Agents ช่วยแปลงแคมเปญโฆษณามูลค่า 15 ล้านดอลลาร์ ที่ใช้เวลาทำทั้งปี ให้กลายเป็นโฆษณาที่ปรับให้เหมาะกับแต่ละประเทศภายใน 40 ชั่วโมง ด้วยต้นทุนไม่ถึง 20,000 ดอลลาร์ และยังผ่านการตรวจสอบคุณภาพภายในของแบรนด์ได้อีกด้วย ในการสาธิตอีกตัวอย่าง ระบบรับบรีฟ 200 คำพร้อมภาพผลิตภัณฑ์ลิปสติกหนึ่งหลอด แล้วสร้างไอเดียหลากหลายสำหรับสถานที่ นางแบบ และโทนสีสำหรับแคมเปญโฆษณาได้โดยอัตโนมัติ

เข้าถึงได้แล้วผ่านอินเทอร์เฟซสำหรับนักพัฒนา

ปัจจุบัน Luma Agents เปิดให้เข้าถึงผ่าน อินเทอร์เฟซสำหรับนักพัฒนา (API) แล้ว แต่บริษัทจะค่อย ๆ ขยายการเข้าถึงอย่างระมัดระวัง เพื่อให้มั่นใจว่าผู้ใช้จะได้รับประสบการณ์ที่เสถียรและไม่กระทบกระบวนการทำงานที่มีอยู่ ในอนาคต Luma วางแผนเพิ่มความสามารถด้านเสียงและวิดีโอเต็มรูปแบบผ่านโมเดลรุ่นถัดไปในตระกูล Unified Intelligence

ที่มา: TechCrunch, Adweek, Business Wire, Media Play News, LBB Online

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ติดปีก HealthTech ไทย NIA ผนึกมหิดลและพันธมิตร เปิดตัว 'SpearH HealthTech Accelerator'

ในช่วงไม่กี่ปีที่ผ่านมาอุตสาหกรรม HealthTech ทั่วโลกเติบโตอย่างรวดเร็ว โดยมีอัตราการขยายตัวมากกว่า 25% ต่อปี ท่ามกลางกระแสการเปลี่ยนแปลงนี้ ประเทศไทยกำลังเดินหน้าผลักดันศักยภาพของต...

Responsive image

Ratepayer Protection Pledge คืออะไร? ทำไมบิ๊กเทคทั่วโลกถึงต้องจับตามองดีลนี้

สรุปดีลประวัติศาสตร์ Ratepayer Protection Pledge ! Google, Microsoft และบิ๊กเทคยอมสยบ Trump ลงนามจ่ายค่าไฟ Data Center เอง 100% เลิกเบียดบังภาษีประชาชน พร้อมปั้น AI แบบไม่ทำค่าไฟบ้...

Responsive image

Peter Steinberger ผู้สร้าง Openclaw ประกาศรับทีมงานร่วมทัพ Codex ที่ OpenAI

OpenAI เดินหน้าขยายทีม Codex ครั้งใหญ่! Peter Steinberger ผู้สร้าง Openclaw ประกาศรับสมัครทีมงาน 14 ตำแหน่ง รุกตลาด Windows และ CLI มุ่งสร้าง AI แห่งอนาคตที่เน้น High Agency อ่านรา...