ในวันที่ระบบ IT ซับซ้อนขึ้นทุกวัน การมอนิเตอร์แบบเดิมอาจไม่เพียงพออีกต่อไป Splunk แบรนด์ชั้นนำด้าน Observability และ Digital Resilience ที่ก่อตั้งมาตั้งแต่ปี 2003 และปัจจุบันเป็นส่วนหนึ่งของ Cisco จึงมุ่งช่วยให้องค์กรทั่วโลกมองเห็นภาพรวมของระบบได้ครบถ้วนและเชื่อมโยงกับผลกระทบทางธุรกิจ

นี่คือที่มาของสัมมนาออนไลน์ “Unlocking the Black Box: True Observability in Action” ที่จัดขึ้นโดยความร่วมมือระหว่าง Splunk x Opsta และ Techsauce เพื่อพาผู้เข้าร่วมก้าวข้ามจาก “Monitoring” ไปสู่ “Observability” พร้อมแง่คิดและตัวอย่างจากผู้ใช้งานจริงที่เปิดโลกใหม่ของการดูแลระบบ IT
งานนี้มีผู้เข้าร่วมมากมายจากหลากหลายสายอาชีพจากทั้งองค์กรขนาดใหญ่และ Startup ที่กำลังมองหาแนวทางในการปรับปรุงระบบให้มีประสิทธิภาพและเข้าใจผู้ใช้มากขึ้น รวมถึงเหล่าพาร์ทเนอร์และลูกค้าของ Splunk และ Opsta ที่อยากอัปเดตแนวทางใหม่ ๆ ของ Observability โดยเฉพาะ
นอกจากนี้ยังได้รับเกียรติจากสองผู้เชี่ยวชาญในวงการเทคโนโลยีที่มาร่วมถ่ายทอดความรู้แบบจัดเต็ม ได้แก่
คุณเดียร์ จิรายุส นิ่มแสง CEO จาก Opsta เริ่มต้นด้วยการชวนตั้งคำถามว่า “Monitoring แบบเดิม... ยังเอาอยู่ไหม?” เพราะในอดีต แค่ดู CPU, Memory หรือ uptime ก็ดูเหมือนเพียงพอแล้วสำหรับการดูแลระบบ IT แต่วันนี้ โลกเปลี่ยนไป
ระบบในยุคปัจจุบันไม่ใช่แค่ Server เครื่องเดียวอีกต่อไป แต่มักประกอบด้วยหลายองค์ประกอบ ทั้ง Container, Microservices, Cloud-native infrastructure และ User Journey ที่ซับซ้อนมากขึ้นเรื่อย ๆ ซึ่ง Monitoring แบบเดิมเน้นการมองสิ่งที่เกิดขึ้น แต่ Observability คือการทำความเข้าใจว่า ทำไมมันถึงเกิดขึ้น และ จะจัดการอย่างไร

คุณเดียร์สรุปวิวัฒนาการของการดูแลระบบ IT ไว้เป็น 3 ยุคหลักที่เชื่อมต่อกันได้แก่
ดังนั้นการ Observability ไม่ได้แค่แสดงผล แต่ช่วยให้ทีมเข้าใจปัญหาเชิงลึก และจัดลำดับความสำคัญในการแก้ไขได้

หนึ่งในหัวใจสำคัญที่คุณเดียร์จาก Opsta เน้นย้ำตลอดเซสชันคือ Observability ที่มีประสิทธิภาพต้องประกอบด้วยข้อมูลหลัก 3 ประเภท ได้แก่ Metrics, Logs และ Traces ซึ่งแต่ละแบบต่างก็มีบทบาทของตัวเอง
สิ่งที่องค์กรควรเข้าใจคือ ข้อมูลทั้ง 3 ประเภทนี้ กินพื้นที่ไม่เท่ากัน Metrics นั้นเล็กและเบา เก็บได้ยาวนานอย่างไม่ลำบาก แต่ Logs และ Traces นั้น “หนักมาก” หากเก็บโดยไม่คัดกรอง จะเปลืองทรัพยากรเกินความจำเป็น ดังนั้นแนวทางที่ดีที่สุดคือ การเก็บเฉพาะข้อมูลที่มีประโยชน์ ต่อการใช้งานจริง

คุณเดียร์สรุปบทเรียนว่า เรากำลังเข้าสู่ยุคของ Observability 3.0 แล้ว ซึ่งต่างจากยุคแรก ๆ ที่แค่ดูกราฟกับ Log
“ระบบล่มไม่ใช่แค่เรื่องของ Dev แล้ว แต่คือเรื่องของ CEO, CMO และลูกค้า” ดังนั้น Observability ที่ดีต้องตอบให้ได้ว่า “ระบบที่ล่ม กระทบธุรกิจแค่ไหน และเรารู้ล่วงหน้าไหมว่ามันจะล่ม”
หลังจากคุณเดียร์จาก Opsta ปูพื้นฐานเรื่องแนวคิด Observability อย่างเต็มอิ่มแล้ว เซสชันถัดมาคือมุมมองของ คุณแนน Solutions Engineer จาก Splunk ที่พาเราก้าวข้ามจากแนวคิด มาสู่การลงมือทำจริงผ่านเครื่องมือที่สามารถสร้าง Observability แบบครบวงจร
คุณแนนเริ่มจากปัญหาที่ทุกคนคุ้นเคย คือ แต่ละทีมในองค์กรมีเครื่องมือของตัวเอง เช่น ทีม Network ใช้ Tool หนึ่ง, ทีม Infra ใช้อีก Tool, ทีมแอปใช้ Tool ของตัวเอง ทำให้เวลาเกิดปัญหา ไม่สามารถเชื่อมโยงข้อมูลข้ามทีมได้ การตามหา root cause จึงกลายเป็นภารกิจงมเข็มในมหาสมุทรทุกครั้ง เพราะข้อมูลกระจัดกระจาย ไม่มีศูนย์กลางเดียว

ดังนั้น สิ่งที่ Splunk Observability ทำ คือ การเป็นแพลตฟอร์มที่ไม่ได้เน้นแค่การเก็บข้อมูลหรือดูแลระบบ แต่คือการ “เชื่อมโยงข้อมูลทุกระดับ” ทั้ง Infrastructure, Application, Network, Security ไปจนถึง Experience ของผู้ใช้ และ Business Health ทั้งหมดนี้ทำให้ทีมสามารถ “มองเห็นภาพรวมของระบบอย่างแท้จริง” (End-to-End Visibility)

หนึ่งในจุดเด่นของ Splunk ที่คุณแนนจากทีม Solutions Engineer ได้อธิบายไว้อย่างชัดเจนก็คือ การรวมเอาความสามารถด้าน Observability หลายมิติไว้ในแพลตฟอร์มเดียว ไม่ว่าจะเป็นมุมมองจากโครงสร้างพื้นฐาน (Infrastructure) ประสบการณ์ของผู้ใช้ (User Experience) ไปจนถึงระดับแอปพลิเคชัน (Application Monitoring)
จากภาพประกอบจะเห็นว่า Splunk Observability มีโมดูลหลักมากถึง 10 ส่วนที่เชื่อมโยงกันอย่างเป็นระบบ อาทิ
AIOps ใช้ AI วิเคราะห์ข้อมูลย้อนหลังจำนวนมาก เพื่อทำนายปัญหาที่อาจเกิดขึ้นล่วงหน้า และช่วยลด noise จาก alert ที่ไม่จำเป็น
หนึ่งในไฮไลต์สำคัญของ Splunk Observability คือการเสริมความสามารถด้วย AI Assistant ที่ออกแบบมาเพื่อช่วยให้ทีม IT, DevOps และ SRE ทำงานได้เร็วขึ้น ฉลาดขึ้น และแม่นยำยิ่งขึ้น โดยใช้เพียงแค่ “ภาษาพูดธรรมดา” ไม่ต้องเขียนโค้ด ไม่ต้องจมอยู่กับ Dashboard หลายสิบหน้า
AI Assistant ใน Splunk ช่วยให้ผู้ใช้งานสามารถพิมพ์คำถามในรูปแบบภาษาธรรมชาติ เช่น:
ระบบจะประมวลผลคำถามเหล่านี้ และเชื่อมโยงข้อมูลจากหลายแหล่ง ทั้ง metric, log, trace, event และ dependency map แล้วตอบกลับด้วย Insight ที่อธิบายเข้าใจง่าย พร้อมทางเลือก หรือแนวทางแก้ไขที่สามารถคลิกดูต่อได้ทันที

หนึ่งในเครื่องมือที่ทรงพลังที่สุดของ Splunk คือ Glass Table เป็นแดชบอร์ดแบบ visual ที่แสดงความเชื่อมโยงของระบบทั้งหมด ตั้งแต่โครงสร้างพื้นฐาน, แอปพลิเคชัน, ไปจนถึงประสบการณ์ของผู้ใช้งานจริง ๆ ในแบบ end-to-end ทั้งในมุมของ IT และธุรกิจ
ยกตัวอย่างเช่น เมื่อระบบบางส่วนล่ม Glass Table จะช่วยบอกทันทีว่าเกิดขึ้นตรงไหน, มี service ไหนได้รับผลกระทบ, และสิ่งนี้สัมพันธ์กับ business metric เช่น conversion rate หรือลูกค้า login ไม่ได้อย่างไร แถมยังแสดง “สุขภาพของระบบในอนาคต” ว่ามีแนวโน้มจะมี incident หรือไม่ ด้วย predicted health และแสดงจำนวนเหตุการณ์ที่ต้องจัดการ เช่น P1/P2 incidents
ความพิเศษคือ Glass Tables ออกแบบให้ผู้บริหารหรือ IT Executive เข้าใจได้ทันที โดยไม่ต้องลงลึกในเชิงเทคนิค แต่สามารถใช้ตัดสินใจได้เลยว่าควรเร่งแก้จุดไหนก่อน หรือส่งทีมไหนเข้าไปจัดการ
ในวันที่ระบบ IT กลายเป็น “กล่องดำ” ที่ซับซ้อนเกินกว่าจะมองเห็นแค่ผ่าน Dashboard ธรรมดา งานสัมมนาออนไลน์ “Unlocking the Black Box: True Observability in Action” จึงเป็นเวทีสำคัญที่เปิดโลกของ Observability ให้เข้าใจง่าย ใช้งานได้จริง และเห็นผลกระทบต่อธุรกิจ
ทั้งจากมุมมองแนวคิดลึก ๆ โดยคุณจิรายุส นิ่มแสง (CEO – Opsta) ไปจนถึงโซลูชันระดับองค์กรที่ใช้ได้ทันทีจากคุณชุติมา กิจเจริญไพศาล (Solutions Engineer – Splunk) ผู้เข้าร่วมได้เห็นว่า Observability ไม่ใช่แค่เรื่องของเครื่องมือ แต่คือวิธีคิดใหม่ในการดูแลระบบให้ไม่เพียงพร้อมใช้งาน แต่พร้อมเข้าใจไปพร้อมกัน
สำหรับใครที่สนใจติดตามงานสัมมนาดี ๆ แบบนี้อีก สามารถติดตามได้ที่: https://www.splunk.com/en_us/products/observability.html
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด