จัดเก็บข้อมูล AI และ Big Data ด้วย IBM Elastic Storage System โซลูชันเพื่อธุรกิจ | Techsauce

จัดเก็บข้อมูล AI และ Big Data ด้วย IBM Elastic Storage System โซลูชันเพื่อธุรกิจ

ในบทความก่อนหน้านี้ เราได้แนะนำให้รู้จักกับ IBM Storage Utility Offering โซลูชันด้าน Storage ขององค์กร ด้วยระบบแบบ Consumption-based ซึ่งช่วยในการจัดการ Storage เพื่อให้เพียงพอกับการใช้งาน ด้วยวิธีที่ประหยัดค่าใช้จ่าย และสามารถที่จะใช้ประสิทธิภาพ Storage ได้สูงสุด แต่นอกจากการเก็บข้อมูลดังกล่าวแล้ว ปัจจุบันหลายองค์กรยังมีโครงการ AI และ Big Data ที่ต้องการ Storage ในการจัดเก็บด้วยเช่นกัน ในบทความนี้ เราจะพาไปรู้จักกับโซลูชันจัดเก็บข้อมูลสำหรับ AI และ Big Data อย่าง  IBM Elastic Storage System สำหรับธุรกิจองค์กร ซึ่งเวลานี้มีความสำคัญอย่างมากในหลายธุรกิจ 

AI - Big Data หัวใจของธุรกิจ

นอกจากการจัดเก็บข้อมูลมหาศาลในองค์กรแล้ว ปัจจุบัน องค์กรต่างๆ มักมีโครงการด้าน  AI และ Big Data ที่ได้กลายมาเป็นหัวใจสำคัญของธุรกิจ ส่งผลให้ต้องมีระบบจัดเก็บข้อมูลหรือ Storage ที่เหมาะสม เพราะขั้นตอนของการจัดการกับข้อมูลนั้นก็ถือเป็นปัจจัยสำคัญอย่างยิ่งที่จะส่งผลต่อประสิทธิภาพการทำงานของระบบ

ทั้งยังเป็นการลงทุนระยะยาว หากเลือกใช้ Storage ที่ไม่เหมาะสมต่อรูปแบบการใช้งานข้อมูลนั้น อาจนำมาซึ่งประเด็นปัญหาทั้งประสิทธิภาพในการประมวลผล, ความมั่นคงทนทานของข้อมูล, พื้นที่จัดเก็บข้อมูล และ Downtime รวมถึงค่าใช้จ่ายที่อาจเกิดขึ้นอย่างไม่รู้จบในการลงทุนเพิ่มขยายระบบโดยแก้ปัญหาไม่ตรงจุด

ดังนั้น IBM ในฐานะของผู้เชี่ยวชาญเทคโนโลยีด้าน AI Infrastructure สำหรับธุรกิจองค์กร จึงได้ทำการออกแบบระบบ Storage เฉพาะทางสำหรับงาน AI และ Big Data ที่ตอบโจทย์ต่อการใช้งานในกระบวนการย่อยของการพัฒนา AI ขึ้นมาโดยเฉพาะ ภายใต้ชื่อโซลูชัน IBM Elastic Storage System หรือ IBM ESS นั่นเอง

4 ขั้นตอนของการจัดการข้อมูลในระบบ AI

ก่อนจะทำความรู้จักกับ IBM ESS นั้น สิ่งที่ควรจะทราบก่อนก็คือ AI Ladder หรือขั้นตอนการในจัดการกับข้อมูลในแต่ละกระบวนการในการพัฒนาระบบ AI นั่นเอง ซึ่ง IBM ได้ระบุว่ากระบวนการเหล่านี้มีด้วยกัน 4 ขั้นตอนหลักๆ ได้แก่ Collect , Organize , Analyze และ Infuse ซึ่งแต่ละขั้นตอนนั้นมีความต้องการในการใช้งานหรือเข้าถึงข้อมูลที่แตกต่างกันออกไป

  1. Collect การรวบรวมและบันทึกข้อมูลเอาไว้ โดยข้อมูลที่เข้ามาในส่วนนี้มักเป็นข้อมูลดิบหรือข้อมูลที่มีปริมาณมหาศาลและเกิดขึ้นอย่างรวดเร็ว รวมถึงอาจถูกนำไปใช้งานหรือประมวลผลต่อในหลากหลายรูปแบบ โดยในขั้นตอนของการ Collect นั้นจะมุ่งเน้นไปที่การจัดเก็บข้อมูลให้รวดเร็วทันความต้องการและมีความจุที่มากพอ

  2. Organize การจัดระเบียบข้อมูลเพื่อให้ถูกนำไปใช้งานได้อย่างง่ายดายและแม่นยำมากยิ่งขึ้น รวมถึงการทำให้ข้อมูลมีคุณภาพมากยิ่งขึ้นด้วย โดยขั้นตอนของการ Organize นั้นจะเน้นไปที่การทำความเข้าใจและจัดระเบียบข้อมูลที่ได้รับมาเพื่อให้สามารถนำไปใช้งานต่อได้อย่างเหมาะสม

  3. Analyze การนำข้อมูลไปทำการวิเคราะห์และประมวลผลภายในระบบ AI หรือ Analytics โดยข้อมูลจะต้องสามารถถูกเข้าถึงได้ด้วยความเร็วสูง และอยู่ใกล้กับหน่วยประมวลผลให้มากที่สุด ส่วนขั้นตอน Analyze นั้นจะเป็นการนำข้อมูลไปใช้ในการทำการวิเคราะห์จริง จึงต้องเน้นเรื่องของความเร็วเป็นหลัก

  4. Infuse การนำข้อมูลและ AI ไปใช้งานจริงในธุรกิจหรือการทำงาน ในขั้นตอน Infuse นั้นจะเป็นเรื่องของการนำระบบ AI และ Analytics ร่วมกับข้อมูลที่เกี่ยวข้องไปใช้หน้างานจริง

กฎข้อหนึ่งของวงการ Enterprise Storage ที่เป็นจริงมาตั้งแต่อดีตกาลแล้วนั้นก็คือการที่ระบบ Storage ไม่มีคำว่า One size fits all ซึ่งหมายถึงว่าในการใช้งานข้อมูลแต่ละแบบนั้น หากต้องการให้การทำงานกับข้อมูลเป็นไปได้ด้วยประสิทธิภาพสูงสุดและเกิดความคุ้มค่าสูงสุด ก็ต้องเลือก Storage ที่ตอบโจทย์กับงานนั้นๆ นั่นเอง

รู้จัก IBM Elastic Storage System

IBM Elastic Storage System เป็นระบบ Enterprise Storage สำหรับงาน AI, Big Data และ Supercomputer โดยเฉพาะ

IBM เป็นผู้บุกเบิกเทคโนโลยีทางด้าน AI อย่างยาวนาน จึงมีความเข้าใจในความต้องการด้านการใช้ข้อมูลในระบบลักษณะนี้เป็นอย่างดี จึงได้ทำการเปิดตัวผลิตภัณฑ์ Storage ตระกูลใหม่ภายใต้ชื่อIBM Elastic Storage System เป็นระบบ Storage สำหรับ AI โดยเฉพาะขึ้นมา โดยใช้ IBM Elastic Storage Server ถูกออกแบบให้ระบบรองรับ I/O ปริมาณมหาศาลได้ พร้อมติดตั้ง IBM Spectrum Scale ซึ่งเป็นเทคโนโลยี Software-Defined Storage สำหรับงาน High Performance Computing (HPC) เนื่องจากสามารถรองรับการรับส่งข้อมูลปริมาณมากแบบขนานหรือที่เรียกว่า Massive Parallel File System โดยทำงานบนระบบปฏิบัติการแบบเปิดอย่าง Red Hat Enterprise Linux เวอร์ชันล่าสุด ทำงานร่วมกันอย่างเป็นระบบและถูกออกแบบมาอย่างดีเพื่อให้กลายเป็นระบบ IBM Elastic Storage System ที่สามารถเริ่มต้นใช้งานที่ความจุระดับ Terabyte และเพิ่มขยายแบบ Scale-Out และ Scale-Up ไปจนถึงหลัก Petabyte, Exabyte หรือ Yottabyte ได้เลยทีเดียว

การทำงานของ IBM Elastic Storage System

การรักษาข้อมูลให้มีความมั่นคงทนทาน 

ระบบจะใช้การทำ Erasure Coding เป็นหลัก โดยระบบสามารถเลือกการตั้งค่าให้เหมาะสมกับระดับความทนทานและความจุที่ต้องการได้ ในขณะที่ยังเหมาะสมกับการใช้งานทั้งบน HDD และ All Flash ได้อย่างเต็มประสิทธิภาพ รวมไปถึงการออกแบบสถาปัตยกรรมของระบบแบบ Full Redundancy หรือไม่มี Single Point of Failure (SPOF) ทำให้สามารถปกป้องข้อมูลได้อย่างมีประสิทธิภาพ รองรับการเข้ารหัสข้อมูลที่เก็บใน IBM ESS ที่เรียกว่า Data-at-rest Encryption

การเชื่อมต่อเครือข่ายหรือระบบต่างๆ ขององค์กร 

IBM ESS รองรับความเร็วในการเชื่อมต่อตั้งแต่ 10/40/100GbE ไปจนถึง InfiniBand ที่ความเร็ว 56Gbps FDR, 100Gbps EDR และ 200Gbps HDR ซึ่งเป็นความเร็วมาตรฐานที่มักใช้กันในงาน HPC รวมไปถึงการเชื่อมต่อเครือข่ายเน็ตเวิร์กรูปแบบอื่นๆ ในปัจจุบันและอนาคต ทำให้สามารถทำงานได้กับทั้ง Server ที่ใช้หน่วยประมวลผล IBM Power ไปจนถึง x86 และ Server อื่นๆ อย่างเช่น NVIDIA DGX ที่เป็นที่นิยมในงานทางด้าน AI ได้เป็นอย่างดี

การเชื่อมต่อโพรโตคอล

สำหรับเชื่อมต่อไปยังเครื่องแม่ข่ายและแอพพลิเคชันต่างๆ ในองค์กร ยังสามารถของระบบโพรโตคอลในการเชื่อมต่อมากที่สุดในท้องตลาดตอนนี้ ไม่ว่าจะเป็น 

  • NFS สำหรับ Linux และ Unix

  • SMB/CIFS สำหรับ Windows

  • S3 สำหรับคลาวด์และ Object Storage

  • HDFS สำหรับ Hadoop และงาน Big Data

  • OpenStack สำหรับคลาวด์และ Open Standards

  • CSI Driver สำหรับ Container-based Application รองรับ Kubernetes Docker และ Red Hat OpenShift

  • GPFS Client สำหรับโพรโตคอล POSIX ที่ทำให้เครื่องแม่ข่ายเชื่อมต่อ ESS Storage ได้เสมือน Local Disk ของตัวเอง และมีความเร็วสูง

การเชื่อมต่อระบบ Cloud

IBM ESS ยังสามารถเชื่อมต่อกับระบบคลาวด์ในรูปแบบ Transparent Cloud Tiering ที่ทำให้ลูกค้าสามารถรับส่งข้อมูลขึ้น-ลงเครือข่ายผู้ให้บริการคลาวด์ทั้งในและนอกประเทศได้อีกด้วย ไม่ว่าจะเป็น IBM Cloud, AWS Cloud, Microsoft Azure Cloud เป็นต้น รูปแบบการจัดเก็บข้อมูลของ IBM ESS ยังรองรับการจัดเก็บข้อมูลทั้งในลักษณะของ File System และ Object Storage เป็นหลัก และสามารถทำงานร่วมกับโซลูชันอื่นๆ ของ IBM ได้เป็นอย่างดี รวมถึง IBM Spectrum Discover สำหรับใช้ในการ Organize ข้อมูลเพื่อนำไปใช้งานต่อได้อย่างง่ายดายอีกด้วย

จุดเด่น

อีกจุดเด่นที่สำคัญที่ทำให้ IBM ESS มีผู้ใช้งานมากมายทั่วโลกคือ ความสามารถในการให้บริการอุปกรณ์จัดเก็บข้อมูลในรูปแบบ Global Single Namespace ที่สามารถลดความยุ่งยากในการเข้าถึงข้อมูลไฟล์หรือการค้นหาไฟล์เอกสารต่างๆ ได้อย่างมีประสิทธิภาพ เพราะผู้ใช้สามารถเข้าถึงไฟล์ที่จัดเก็บในรูปแบบ Hierarchical File System ที่ซับซ้อนได้ง่ายขึ้น ไม่ว่าผู้ดูแลระบบย้ายข้อมูลไปยังสตอเรจรูปอื่นหรือ Tier อื่น ผู้ใช้ก็ยังสามารถเข้าถึงข้อมูลที่ต้องการได้เหมือนเดิมโดยไม่ระบบ รวมไปถึงการเข้าถึงข้อมูลจากระยะไกลหรือตั้งอยู่คนละภูมิภาคก็ยังได้

IBM Elastic Storage Serve 5000 คือ Storage Appliance ที่ประกอบด้วย IBM Power9 Data Server จำนวน 2 Node และ IBM Power9 ESS Management Server จำนวน 1 Nodeต่อ Cluster รวมถึงชุด Expansion ซึ่งพร้อมใช้งานได้ทันที

IBM ESS 2 รุ่นล่าสุดในปี 2020

  • IBM Elastic Storage System 5000 (ESS 5000) ระบบจัดเก็บข้อมูลสำหรับงาน Data Lake โดยจะเป็นรุ่น HDD ที่เน้นความจุในการจัดเก็บข้อมูลเป็นหลัก

  • IBM Elastic Storage System 3000 (ESS 3000) ระบบจัดเก็บข้อมูลสำหรับงานประมวลผลความเร็วสูง โดยจะเป็นรุ่น NVMe Flash เพื่อให้สามารถเข้าถึงข้อมูลได้ด้วยความเร็วสูงสุด

ด้วยความที่ระบบเป็นแบบสำเร็จรูปติดตั้งมาพร้อมใช้งานนี้ ก็ทำให้ IBM ESS นี้สามารถติดตั้งใช้งานได้ภายในเวลาเพียงไม่กี่นาทีเท่านั้น และสำหรับการอัปเกรดเองก็สามารถทำได้อย่างง่ายดาย เพราะระบบนี้ใช้ Container เป็นหลักในการทำงาน ทำให้การอัปเกรดสามารถทำได้อย่างราบรื่นไม่ต้องหยุดการทำงานของระบบ

สำหรับการดูแลรักษา IBM ได้ติดตั้ง IBM Storage Insights มาให้พร้อมใช้งานได้ทันที ทำให้ทุกเหตุการณ์ที่เกิดขึ้นบน IBM ESS นี้จะถูกวิเคราะห์โดย AI และแจ้งเตือนผู้ดูแลระบบโดยอัตโนมัติทันทีหากมีแนวโน้มว่าจะเกิดปัญหาใดๆ ทำให้สามารถทำการแก้ไขป้องกันปัญหาได้ล่วงหน้าก่อนที่จะเกิดปัญหาขึ้นจริง ลดโอกาสการเกิด Downtime ที่ไม่คาดฝันลงได้อย่างมีประสิทธิภาพ

ผู้ที่สนใจโซลูชัน AI Infrastructure จาก IBM สามารถศึกษาข้อมูลเพิ่มเติมได้ที่ https://www.ibm.com/it-infrastructure/storage/ai-infrastructure

สำหรับผู้ที่สนใจโซลูชันของ IBM สามารถติดต่อทีมงานบริษัท Metro Connect ได้ที่แผนกการตลาด อีเมล์ [email protected] หรือโทร 02-089-4508

RELATED ARTICLE

Responsive image

ปรับ Mindset คนในองค์กรให้พร้อมรับการเปลี่ยนแปลง และแนะวิธีการใช้ Big Data ให้ได้จริง

ICHI ผู้ให้ความรู้ด้าน Digital Solution จึงได้เชิญ ดร.ศักดิ์ เสกขุนทด ที่ปรึกษาผู้ทรงคุณวุฒิด้าน Digital Transformation สำนักงานพัฒนาธุรกรรมทางอิเล็กทรอนิกส์ (สพธอ.) หรือ ETDA มาร่...

Responsive image

Cloud HM เตรียมพร้อมนำองค์กรไทยสู่ Modern Application เปลี่ยน Legacy App สู่ Cloud Native App ด้วย VMware Tanzu

Cloud HM ร่วมกับ VMware Thailand จัดงาน “It's A Cloud Native Day. Transform your Legacy App into Cloud Native App with VMware Tanzu” รวมผู้บริหารและผู้เชี่ยวชาญจาก VMware, Cloud HM...

Responsive image

การสร้าง Data Team จากบริษัท Tech ระดับโลกไปจนถึง Startup

แนวทางการสร้าง Data Team และการทำงานเชิงเทคนิคในรูปแบบต่าง ๆ รวมถึง Support Structure จากองค์กรที่จะช่วยสนับสนุนการทำงานและดึงดูดพนักงานที่มีความสามารถมาร่วมงาน...