ในบทความก่อนหน้านี้ เราได้แนะนำให้รู้จักกับ IBM Storage Utility Offering โซลูชันด้าน Storage ขององค์กร ด้วยระบบแบบ Consumption-based ซึ่งช่วยในการจัดการ Storage เพื่อให้เพียงพอกับการใช้งาน ด้วยวิธีที่ประหยัดค่าใช้จ่าย และสามารถที่จะใช้ประสิทธิภาพ Storage ได้สูงสุด แต่นอกจากการเก็บข้อมูลดังกล่าวแล้ว ปัจจุบันหลายองค์กรยังมีโครงการ AI และ Big Data ที่ต้องการ Storage ในการจัดเก็บด้วยเช่นกัน ในบทความนี้ เราจะพาไปรู้จักกับโซลูชันจัดเก็บข้อมูลสำหรับ AI และ Big Data อย่าง IBM Elastic Storage System สำหรับธุรกิจองค์กร ซึ่งเวลานี้มีความสำคัญอย่างมากในหลายธุรกิจ
นอกจากการจัดเก็บข้อมูลมหาศาลในองค์กรแล้ว ปัจจุบัน องค์กรต่างๆ มักมีโครงการด้าน AI และ Big Data ที่ได้กลายมาเป็นหัวใจสำคัญของธุรกิจ ส่งผลให้ต้องมีระบบจัดเก็บข้อมูลหรือ Storage ที่เหมาะสม เพราะขั้นตอนของการจัดการกับข้อมูลนั้นก็ถือเป็นปัจจัยสำคัญอย่างยิ่งที่จะส่งผลต่อประสิทธิภาพการทำงานของระบบ
ทั้งยังเป็นการลงทุนระยะยาว หากเลือกใช้ Storage ที่ไม่เหมาะสมต่อรูปแบบการใช้งานข้อมูลนั้น อาจนำมาซึ่งประเด็นปัญหาทั้งประสิทธิภาพในการประมวลผล, ความมั่นคงทนทานของข้อมูล, พื้นที่จัดเก็บข้อมูล และ Downtime รวมถึงค่าใช้จ่ายที่อาจเกิดขึ้นอย่างไม่รู้จบในการลงทุนเพิ่มขยายระบบโดยแก้ปัญหาไม่ตรงจุด
ดังนั้น IBM ในฐานะของผู้เชี่ยวชาญเทคโนโลยีด้าน AI Infrastructure สำหรับธุรกิจองค์กร จึงได้ทำการออกแบบระบบ Storage เฉพาะทางสำหรับงาน AI และ Big Data ที่ตอบโจทย์ต่อการใช้งานในกระบวนการย่อยของการพัฒนา AI ขึ้นมาโดยเฉพาะ ภายใต้ชื่อโซลูชัน IBM Elastic Storage System หรือ IBM ESS นั่นเอง
ก่อนจะทำความรู้จักกับ IBM ESS นั้น สิ่งที่ควรจะทราบก่อนก็คือ AI Ladder หรือขั้นตอนการในจัดการกับข้อมูลในแต่ละกระบวนการในการพัฒนาระบบ AI นั่นเอง ซึ่ง IBM ได้ระบุว่ากระบวนการเหล่านี้มีด้วยกัน 4 ขั้นตอนหลักๆ ได้แก่ Collect , Organize , Analyze และ Infuse ซึ่งแต่ละขั้นตอนนั้นมีความต้องการในการใช้งานหรือเข้าถึงข้อมูลที่แตกต่างกันออกไป
Collect การรวบรวมและบันทึกข้อมูลเอาไว้ โดยข้อมูลที่เข้ามาในส่วนนี้มักเป็นข้อมูลดิบหรือข้อมูลที่มีปริมาณมหาศาลและเกิดขึ้นอย่างรวดเร็ว รวมถึงอาจถูกนำไปใช้งานหรือประมวลผลต่อในหลากหลายรูปแบบ โดยในขั้นตอนของการ Collect นั้นจะมุ่งเน้นไปที่การจัดเก็บข้อมูลให้รวดเร็วทันความต้องการและมีความจุที่มากพอ
Organize การจัดระเบียบข้อมูลเพื่อให้ถูกนำไปใช้งานได้อย่างง่ายดายและแม่นยำมากยิ่งขึ้น รวมถึงการทำให้ข้อมูลมีคุณภาพมากยิ่งขึ้นด้วย โดยขั้นตอนของการ Organize นั้นจะเน้นไปที่การทำความเข้าใจและจัดระเบียบข้อมูลที่ได้รับมาเพื่อให้สามารถนำไปใช้งานต่อได้อย่างเหมาะสม
Analyze การนำข้อมูลไปทำการวิเคราะห์และประมวลผลภายในระบบ AI หรือ Analytics โดยข้อมูลจะต้องสามารถถูกเข้าถึงได้ด้วยความเร็วสูง และอยู่ใกล้กับหน่วยประมวลผลให้มากที่สุด ส่วนขั้นตอน Analyze นั้นจะเป็นการนำข้อมูลไปใช้ในการทำการวิเคราะห์จริง จึงต้องเน้นเรื่องของความเร็วเป็นหลัก
Infuse การนำข้อมูลและ AI ไปใช้งานจริงในธุรกิจหรือการทำงาน ในขั้นตอน Infuse นั้นจะเป็นเรื่องของการนำระบบ AI และ Analytics ร่วมกับข้อมูลที่เกี่ยวข้องไปใช้หน้างานจริง
กฎข้อหนึ่งของวงการ Enterprise Storage ที่เป็นจริงมาตั้งแต่อดีตกาลแล้วนั้นก็คือการที่ระบบ Storage ไม่มีคำว่า One size fits all ซึ่งหมายถึงว่าในการใช้งานข้อมูลแต่ละแบบนั้น หากต้องการให้การทำงานกับข้อมูลเป็นไปได้ด้วยประสิทธิภาพสูงสุดและเกิดความคุ้มค่าสูงสุด ก็ต้องเลือก Storage ที่ตอบโจทย์กับงานนั้นๆ นั่นเอง
IBM Elastic Storage System เป็นระบบ Enterprise Storage สำหรับงาน AI, Big Data และ Supercomputer โดยเฉพาะ
IBM เป็นผู้บุกเบิกเทคโนโลยีทางด้าน AI อย่างยาวนาน จึงมีความเข้าใจในความต้องการด้านการใช้ข้อมูลในระบบลักษณะนี้เป็นอย่างดี จึงได้ทำการเปิดตัวผลิตภัณฑ์ Storage ตระกูลใหม่ภายใต้ชื่อIBM Elastic Storage System เป็นระบบ Storage สำหรับ AI โดยเฉพาะขึ้นมา โดยใช้ IBM Elastic Storage Server ถูกออกแบบให้ระบบรองรับ I/O ปริมาณมหาศาลได้ พร้อมติดตั้ง IBM Spectrum Scale ซึ่งเป็นเทคโนโลยี Software-Defined Storage สำหรับงาน High Performance Computing (HPC) เนื่องจากสามารถรองรับการรับส่งข้อมูลปริมาณมากแบบขนานหรือที่เรียกว่า Massive Parallel File System โดยทำงานบนระบบปฏิบัติการแบบเปิดอย่าง Red Hat Enterprise Linux เวอร์ชันล่าสุด ทำงานร่วมกันอย่างเป็นระบบและถูกออกแบบมาอย่างดีเพื่อให้กลายเป็นระบบ IBM Elastic Storage System ที่สามารถเริ่มต้นใช้งานที่ความจุระดับ Terabyte และเพิ่มขยายแบบ Scale-Out และ Scale-Up ไปจนถึงหลัก Petabyte, Exabyte หรือ Yottabyte ได้เลยทีเดียว
การรักษาข้อมูลให้มีความมั่นคงทนทาน
ระบบจะใช้การทำ Erasure Coding เป็นหลัก โดยระบบสามารถเลือกการตั้งค่าให้เหมาะสมกับระดับความทนทานและความจุที่ต้องการได้ ในขณะที่ยังเหมาะสมกับการใช้งานทั้งบน HDD และ All Flash ได้อย่างเต็มประสิทธิภาพ รวมไปถึงการออกแบบสถาปัตยกรรมของระบบแบบ Full Redundancy หรือไม่มี Single Point of Failure (SPOF) ทำให้สามารถปกป้องข้อมูลได้อย่างมีประสิทธิภาพ รองรับการเข้ารหัสข้อมูลที่เก็บใน IBM ESS ที่เรียกว่า Data-at-rest Encryption
การเชื่อมต่อเครือข่ายหรือระบบต่างๆ ขององค์กร
IBM ESS รองรับความเร็วในการเชื่อมต่อตั้งแต่ 10/40/100GbE ไปจนถึง InfiniBand ที่ความเร็ว 56Gbps FDR, 100Gbps EDR และ 200Gbps HDR ซึ่งเป็นความเร็วมาตรฐานที่มักใช้กันในงาน HPC รวมไปถึงการเชื่อมต่อเครือข่ายเน็ตเวิร์กรูปแบบอื่นๆ ในปัจจุบันและอนาคต ทำให้สามารถทำงานได้กับทั้ง Server ที่ใช้หน่วยประมวลผล IBM Power ไปจนถึง x86 และ Server อื่นๆ อย่างเช่น NVIDIA DGX ที่เป็นที่นิยมในงานทางด้าน AI ได้เป็นอย่างดี
การเชื่อมต่อโพรโตคอล
สำหรับเชื่อมต่อไปยังเครื่องแม่ข่ายและแอพพลิเคชันต่างๆ ในองค์กร ยังสามารถของระบบโพรโตคอลในการเชื่อมต่อมากที่สุดในท้องตลาดตอนนี้ ไม่ว่าจะเป็น
NFS สำหรับ Linux และ Unix
SMB/CIFS สำหรับ Windows
S3 สำหรับคลาวด์และ Object Storage
HDFS สำหรับ Hadoop และงาน Big Data
OpenStack สำหรับคลาวด์และ Open Standards
CSI Driver สำหรับ Container-based Application รองรับ Kubernetes Docker และ Red Hat OpenShift
GPFS Client สำหรับโพรโตคอล POSIX ที่ทำให้เครื่องแม่ข่ายเชื่อมต่อ ESS Storage ได้เสมือน Local Disk ของตัวเอง และมีความเร็วสูง
การเชื่อมต่อระบบ Cloud
IBM ESS ยังสามารถเชื่อมต่อกับระบบคลาวด์ในรูปแบบ Transparent Cloud Tiering ที่ทำให้ลูกค้าสามารถรับส่งข้อมูลขึ้น-ลงเครือข่ายผู้ให้บริการคลาวด์ทั้งในและนอกประเทศได้อีกด้วย ไม่ว่าจะเป็น IBM Cloud, AWS Cloud, Microsoft Azure Cloud เป็นต้น รูปแบบการจัดเก็บข้อมูลของ IBM ESS ยังรองรับการจัดเก็บข้อมูลทั้งในลักษณะของ File System และ Object Storage เป็นหลัก และสามารถทำงานร่วมกับโซลูชันอื่นๆ ของ IBM ได้เป็นอย่างดี รวมถึง IBM Spectrum Discover สำหรับใช้ในการ Organize ข้อมูลเพื่อนำไปใช้งานต่อได้อย่างง่ายดายอีกด้วย
จุดเด่น
อีกจุดเด่นที่สำคัญที่ทำให้ IBM ESS มีผู้ใช้งานมากมายทั่วโลกคือ ความสามารถในการให้บริการอุปกรณ์จัดเก็บข้อมูลในรูปแบบ Global Single Namespace ที่สามารถลดความยุ่งยากในการเข้าถึงข้อมูลไฟล์หรือการค้นหาไฟล์เอกสารต่างๆ ได้อย่างมีประสิทธิภาพ เพราะผู้ใช้สามารถเข้าถึงไฟล์ที่จัดเก็บในรูปแบบ Hierarchical File System ที่ซับซ้อนได้ง่ายขึ้น ไม่ว่าผู้ดูแลระบบย้ายข้อมูลไปยังสตอเรจรูปอื่นหรือ Tier อื่น ผู้ใช้ก็ยังสามารถเข้าถึงข้อมูลที่ต้องการได้เหมือนเดิมโดยไม่ระบบ รวมไปถึงการเข้าถึงข้อมูลจากระยะไกลหรือตั้งอยู่คนละภูมิภาคก็ยังได้
IBM Elastic Storage Serve 5000 คือ Storage Appliance ที่ประกอบด้วย IBM Power9 Data Server จำนวน 2 Node และ IBM Power9 ESS Management Server จำนวน 1 Nodeต่อ Cluster รวมถึงชุด Expansion ซึ่งพร้อมใช้งานได้ทันที
IBM ESS 2 รุ่นล่าสุดในปี 2020
IBM Elastic Storage System 5000 (ESS 5000) ระบบจัดเก็บข้อมูลสำหรับงาน Data Lake โดยจะเป็นรุ่น HDD ที่เน้นความจุในการจัดเก็บข้อมูลเป็นหลัก
IBM Elastic Storage System 3000 (ESS 3000) ระบบจัดเก็บข้อมูลสำหรับงานประมวลผลความเร็วสูง โดยจะเป็นรุ่น NVMe Flash เพื่อให้สามารถเข้าถึงข้อมูลได้ด้วยความเร็วสูงสุด
ด้วยความที่ระบบเป็นแบบสำเร็จรูปติดตั้งมาพร้อมใช้งานนี้ ก็ทำให้ IBM ESS นี้สามารถติดตั้งใช้งานได้ภายในเวลาเพียงไม่กี่นาทีเท่านั้น และสำหรับการอัปเกรดเองก็สามารถทำได้อย่างง่ายดาย เพราะระบบนี้ใช้ Container เป็นหลักในการทำงาน ทำให้การอัปเกรดสามารถทำได้อย่างราบรื่นไม่ต้องหยุดการทำงานของระบบ
สำหรับการดูแลรักษา IBM ได้ติดตั้ง IBM Storage Insights มาให้พร้อมใช้งานได้ทันที ทำให้ทุกเหตุการณ์ที่เกิดขึ้นบน IBM ESS นี้จะถูกวิเคราะห์โดย AI และแจ้งเตือนผู้ดูแลระบบโดยอัตโนมัติทันทีหากมีแนวโน้มว่าจะเกิดปัญหาใดๆ ทำให้สามารถทำการแก้ไขป้องกันปัญหาได้ล่วงหน้าก่อนที่จะเกิดปัญหาขึ้นจริง ลดโอกาสการเกิด Downtime ที่ไม่คาดฝันลงได้อย่างมีประสิทธิภาพ
ผู้ที่สนใจโซลูชัน AI Infrastructure จาก IBM สามารถศึกษาข้อมูลเพิ่มเติมได้ที่ https://www.ibm.com/it-infrastructure/storage/ai-infrastructure
สำหรับผู้ที่สนใจโซลูชันของ IBM สามารถติดต่อทีมงานบริษัท Metro Connect ได้ที่แผนกการตลาด อีเมล์ [email protected] หรือโทร 02-089-4508
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด