OpenAI เปิดตัว ‘Jalapeño’ ชิป AI ตัวแรกที่ออกแบบเอง จับมือ Broadcom ลดต้นทุนรันโมเดลต่อโทเคน ถูกลงราว 50%

Hock Tan ประธานเจ้าหน้าที่บริหาร Broadcom เดินขึ้นเวทีพร้อมชิปตัวเล็ก ๆ ในมือ ส่งต่อให้ Sam Altman และ Greg Brockman สองผู้นำ OpenAI รับไว้ ภาพนี้เกิดขึ้นเมื่อวันที่ 24 มิถุนายน 2026 และมันคือหมุดหมายที่ OpenAI รอคอยมานาน เพราะนี่คือชิป AI ตัวแรกที่บริษัทออกแบบเองตั้งแต่ต้นจนจบ

ชิปตัวนั้นชื่อ Jalapeño ซึ่ง OpenAI เรียกมันว่า Intelligence Processor ตัวแรกของบริษัท เป็นตัวเร่งประมวลผล (Accelerator) ที่ถูกออกแบบมาเพื่องาน Inference ของ Large Language Model (LLM) โดยเฉพาะ พูดง่าย ๆ คือชิปที่ทำหน้าที่ 'รันโมเดลตอบคำถามผู้ใช้จริง' ไม่ใช่ชิปสำหรับเทรนโมเดล และมันคือก้าวแรกของแพลตฟอร์มคอมพิวต์ที่ OpenAI กับ Broadcom ตั้งใจจะพัฒนาร่วมกันไปอีกหลายเจเนอเรชัน ภายใต้ดีลความร่วมมือมูลค่ามหาศาลที่สองบริษัทประกาศไว้ตั้งแต่เดือนตุลาคม 2025 ว่าจะติดตั้งตัวเร่งประมวลผลที่ OpenAI ออกแบบเองรวมกำลังถึง 10 กิกะวัตต์

ชิปที่ออกแบบจากศูนย์เพื่อ LLM ไม่ใช่ GPU ดัดแปลง

จุดที่ OpenAI ย้ำหนักที่สุดคือ Jalapeño ไม่ใช่ตัวเร่งประมวลผลอเนกประสงค์ที่เอางาน AI รุ่นเก่ามาดัดแปลง แต่เป็นการออกแบบจากกระดาษเปล่าเพื่องาน Inference ของ LLM ยุคใหม่โดยเฉพาะ ทีมงานออกแบบโดยอิงจากความเข้าใจระดับรากฐานว่าโมเดลภาษาทำงานอย่างไร ไล่ไปตั้งแต่ Kernel การเคลื่อนย้ายข้อมูลในหน่วยความจำ ระบบเครือข่าย ไปจนถึงรูปแบบการให้บริการ (Serving Pattern) ที่สำคัญที่สุดสำหรับโมเดล AI ระดับแนวหน้า

แนวคิดเบื้องหลังคือการรวมพละกำลังและปริมาณงานของตัวเร่งประมวลผล AI ชั้นนำในวันนี้ เข้ากับความหน่วงต่ำระดับเดียวกับระบบ Inference เฉพาะทางที่เร็วที่สุด ซึ่งทำให้ Jalapeño เหมาะกับผลิตภัณฑ์ LLM แบบโต้ตอบทันทีในสเกลใหญ่ สถาปัตยกรรมของมันถูกออกแบบให้ลดการเคลื่อนย้ายข้อมูลให้น้อยลง และจัดสมดุลระหว่างการประมวลผล หน่วยความจำ และเครือข่าย เพื่อดึงประสิทธิภาพการใช้งานจริงให้เข้าใกล้ขีดสูงสุดทางทฤษฎีของฮาร์ดแวร์ให้มากที่สุด โดยมี Broadcom ช่วยด้านการผลิตซิลิคอนและเทคโนโลยีเครือข่าย รวมถึงชิปเครือข่าย Tomahawk ส่วน Celestica เข้ามาดูแลงานบอร์ด แร็ค และการประกอบระบบ

ที่น่าสนใจคือชิปตัวอย่างสำหรับวิศวกรเริ่มรันงาน Machine Learning จริงในห้องแล็บแล้ว ที่ความถี่และระดับพลังงานตามเป้าหมายการผลิตจริง หนึ่งในงานที่รันอยู่คือ GPT‑5.3‑Codex‑Spark ซึ่งเป็นโมเดลสายเขียนโค้ดของบริษัทเอง

Richard Ho ผู้นำโครงการฮาร์ดแวร์ของ OpenAI อธิบายว่า ทีมออกแบบสถาปัตยกรรมของ Jalapeño โดยโฟกัสไปที่ Kernel การเคลื่อนย้ายข้อมูลในหน่วยความจำ เครือข่าย และรูปแบบการให้บริการที่สำคัญที่สุดต่อโมเดล AI ระดับแนวหน้า และจากการทดสอบช่วงแรก ชิปตัวนี้รันงานสำคัญที่สุดของบริษัทได้อย่างมีประสิทธิภาพ ใกล้เคียงกับขีดจำกัดทางทฤษฎีของฮาร์ดแวร์

เก้าเดือนจากกระดาษสู่ซิลิคอน และ AI ก็เป็นคนช่วยออกแบบ

ตัวเลขที่ทำเอาวงการชิปสะดุดคือ Jalapeño ใช้เวลาพัฒนาจากการออกแบบเริ่มต้นไปจนถึงขั้นส่งผลิต (Tape-out) เพียงเก้าเดือนเท่านั้น OpenAI เชื่อว่านี่คือรอบการพัฒนาชิปแบบ Application-Specific Integrated Circuit (ASIC) ที่เร็วที่สุดเท่าที่เคยมีมาในวงการเซมิคอนดักเตอร์ขั้นสูงสมรรถนะสูง ขณะที่การผลิตจริงอยู่ในมือของ TSMC

ความเร็วระดับนี้ไม่ได้มาจากแค่การทำงานร่วมกันแบบแนบแน่นระหว่างทีมวิศวกรของ OpenAI กับความเชี่ยวชาญด้านการผลิตซิลิคอนของ Broadcom เท่านั้น แต่มาจากการที่ OpenAI เอาโมเดล AI ของตัวเองมาช่วยเร่งบางส่วนของกระบวนการออกแบบและปรับจูนชิปด้วย พูดอีกแบบคือโมเดลตัวเดียวกับที่ให้บริการผู้ใช้อยู่ทุกวัน กำลังถูกใช้ไปปรับปรุงโครงสร้างพื้นฐานที่จะรันโมเดลรุ่นถัดไป ซึ่งถ้า AI ช่วยให้วิศวกรออกแบบชิปได้ดีขึ้นและเร็วขึ้นจริง มันก็มีโอกาสกดต้นทุนคอมพิวต์ของทั้งอุตสาหกรรมให้ถูกลงตามไปด้วย

ถูกลงครึ่งหนึ่ง? เป้าหมายที่เขย่าบัลลังก์ Nvidia

OpenAI บอกว่ายังวัดสมรรถนะตัวสุดท้ายไม่เสร็จ แต่ผลทดสอบช่วงแรกชี้ว่า Jalapeño จะให้ประสิทธิภาพต่อวัตต์ (Performance per Watt) ดีกว่าของที่ดีที่สุดในตลาดวันนี้อย่างมีนัยสำคัญ และบริษัทจะออกรายงานทางเทคนิคแบบละเอียดในอีกไม่กี่เดือนข้างหน้า

ตัวเลขที่ดุกว่านั้นมาจากฝั่ง Broadcom โดย Bloomberg รายงานว่าคุณ Hock Tan ระบุว่าจากการทดสอบช่วงแรก Jalapeño มีต้นทุน Inference ต่อโทเคนถูกลงราว 50% เมื่อเทียบกับ Graphics Processing Unit (GPU) รุ่นปัจจุบัน ซึ่งถ้าเป็นจริงจะมีความหมายมากต่อเส้นทางสู่การทำกำไรของ OpenAI ที่กำลังแบกต้นทุนการรันโมเดลมหาศาล

แต่ก็ต้องฟังหูไว้หู เพราะตัวเลขทั้งหมดนี้ยังเป็นการทดสอบที่ OpenAI และ Broadcom รายงานเอง บนชุดงานที่บริษัทเลือกเอง ยังไม่มีการเปิดเผยเกณฑ์เปรียบเทียบที่ชัดเจนหรือการตรวจสอบจากภายนอกที่เป็นกลาง

ถึงอย่างนั้น สัญญาณเชิงกลยุทธ์ก็ชัดเจน อย่างที่ TechCrunch และ CNBC ตั้งข้อสังเกตว่า Jalapeño คือก้าวที่ลดการพึ่งพา GPU ของ Nvidia ในงาน Inference ซึ่งเป็นส่วนที่โตเร็วที่สุดของตลาดคอมพิวต์ AI การที่ลูกค้ารายใหญ่ที่สุดรายหนึ่งเริ่มสร้างทางเลือกของตัวเองขึ้นมา ย่อมเป็นแรงกดดันที่ Nvidia มองข้ามไม่ได้ แม้ในงานเทรนโมเดล OpenAI น่าจะยังใช้ฮาร์ดแวร์ของ Nvidia ต่อไปก็ตาม

เกมระยะยาวที่ OpenAI ขอคุมทั้งกอง ตั้งแต่ชิปยันแอป

Greg Brockman ประธานและผู้ร่วมก่อตั้ง OpenAI อธิบายว่าโลกกำลังเคลื่อนเข้าสู่เศรษฐกิจที่ขับเคลื่อนด้วยพลังประมวลผล และ Jalapeño คือส่วนหนึ่งของกลยุทธ์โครงสร้างพื้นฐานแบบ Full-stack ระยะยาวที่จะทำให้คอมพิวต์มีมากขึ้น ส่งผลให้ AI เร็วขึ้น เชื่อถือได้มากขึ้น และราคาเข้าถึงได้มากขึ้นสำหรับทั้งคนทั่วไปและภาคธุรกิจ คุณ Greg ย้ำว่ายิ่งบริษัทออกแบบส่วนต่าง ๆ ของกองเทคโนโลยีเองได้มากเท่าไหร่ ก็ยิ่งให้บริการความฉลาดได้มีประสิทธิภาพมากขึ้นเท่านั้น

นี่คือสิ่งที่ OpenAI เรียกว่าความได้เปรียบแบบ Full-stack เพราะบริษัทไม่ได้แค่พัฒนาโมเดลระดับแนวหน้าหรือสร้างผลิตภัณฑ์ทับลงไปบนโมเดลเท่านั้น แต่ลงไปออกแบบโครงสร้างพื้นฐานข้างใต้เองทั้งหมด ตั้งแต่สถาปัตยกรรมชิป Kernel ระบบหน่วยความจำ เครือข่าย การจัดคิวงาน ระบบการ Deploy ไปจนถึงประสบการณ์ของผลิตภัณฑ์ปลายทาง เมื่อคุมได้ทุกชั้น ทุกชั้นก็ถูกปรับจูนไปในทิศทางเดียวกัน นั่นคือทำให้โมเดลเร็วขึ้น เสถียรขึ้น และถูกลงสำหรับผู้ใช้

OpenAI มองว่า Jalapeño จะยิ่งทำให้วงจรการเติบโตของบริษัทหมุนแรงขึ้น โครงสร้างพื้นฐานที่ดีขึ้นทำให้ใช้คอมพิวต์ได้คุ้มขึ้น คอมพิวต์ที่คุ้มขึ้นทำให้เทรนและให้บริการโมเดลได้ดีขึ้น โมเดลที่ดีขึ้นกลายเป็นผลิตภัณฑ์ที่ดีขึ้น ผลิตภัณฑ์ที่ดีขึ้นดึงผู้ใช้และรายได้เข้ามามากขึ้น แล้วบริษัทก็เอารายได้นั้นกลับไปลงทุนสร้างโครงสร้างพื้นฐานรุ่นถัดไป วนเป็นวงจรที่ค่อย ๆ ทำให้ความฉลาดถูกลงและเข้าถึงได้ง่ายขึ้น

พร้อมติดตั้งปลายปี 2026 ดันสู่ดาต้าเซ็นเตอร์ระดับกิกะวัตต์

Jalapeño เป็นเพียงก้าวแรกของแพลตฟอร์มคอมพิวต์ที่จะพัฒนาต่อไปอีกหลายเจเนอเรชัน โดยมีกำหนดติดตั้งใช้งานครั้งแรกภายในสิ้นปี 2026 และจะขยายตัวต่อเนื่องในปีถัด ๆ ไป คุณ Hock Tan ระบุว่าความร่วมมือกับ OpenAI ครั้งนี้คือการลงทุนกับโครงสร้างพื้นฐานทางกายภาพที่ AI จะต้องใช้ในทศวรรษหน้า และนี่เป็นเพียงจุดเริ่มต้นของโรดแมปหลายเจเนอเรชัน ที่จะเปิดทางให้ติดตั้งดาต้าเซ็นเตอร์ระดับกิกะวัตต์ร่วมกับ Microsoft และพันธมิตรรายอื่นตั้งแต่ปี 2026 เป็นต้นไป

หัวใจของงานทั้งหมดนี้เรียบง่าย นั่นคือ Inference คือจุดที่ AI ไปถึงมือผู้คนจริง ๆ ทุกการพัฒนาด้านต้นทุน ความเร็ว และความน่าเชื่อถือ จะปรากฏออกมาเป็นคำตอบของ ChatGPT ที่เร็วขึ้น งานบน Codex ที่ทำได้หลายขั้นตอนขึ้นโดยรอน้อยลง ผลิตภัณฑ์ Application Programming Interface (API) ที่สร้างได้ถูกลง หรือการเข้าถึงที่เสถียรกว่าเดิมในวันที่คนแห่ใช้งานพร้อมกัน

ที่มา: OpenAI, TechCrunch, CNBC, VentureBeat, Broadcom

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ประเทศจีนจะไปไกลแค่ไหนในโลกของนวัตกรรม? ถอดบทเรียนความสำเร็จ เมื่อจีนไม่ได้เป็นแค่ผู้ตามอีกต่อไป

ตลอดหลายสิบปีที่ผ่านมาโลกมักมองจีนในฐานะ ‘โรงงานการผลิตของโลก’ ประเทศที่มีแรงงานมหาศาล ต้นทุนการผลิตที่ต่ำ และการเป็นเพียงฐานการผลิตสำคัญโลก แต่ภาพนั้นกำลังเปลี่ยนไป...

Responsive image

สรุปวิสัยทัศน์เกาหลีใต้จากเวที Summer Davos ก้าวสู่มหาอำนาจ AI และแนวคิดรายได้พื้นฐาน สำหรับโลกอนาคต

สรุปวิสัยทัศน์นายกฯ เกาหลีใต้จากเวที Summer Davos ประกาศยุทธศาสตร์ดันประเทศสู่มหาอำนาจ AI เบอร์ 3 ของโลก พร้อมเผยไอเดียล้ำแจกรายได้พื้นฐาน (UBI) แก้เกม AI แย่งงาน...

Responsive image

ใครจ่ายให้เงินเฟ้อ? เมื่อราคาพลังงานพุ่ง สหรัฐฯ ผลักภาระให้ผู้บริโภค จีนกลับบีบกำไรผู้ผลิต

สรุปวงเสวนา 'Who Pays for Inflation?' จาก Summer Davos 2026 ว่าเงินเฟ้อรอบนี้แต่ละประเทศจ่ายไม่เท่ากัน สหรัฐฯ ส่งต้นทุนถึงผู้บริโภค จีนบีบกำไรผู้ผลิต พร้อมไอเดียธนาคารสำรองพลังงานแ...