ปฏิวัติข้อมูลองค์กรด้วย Data Architecture รับมือความเสี่ยงจากการใช้ข้อมูลขยะ | Techsauce

ปฏิวัติข้อมูลองค์กรด้วย Data Architecture รับมือความเสี่ยงจากการใช้ข้อมูลขยะ

Garbage in – Garbage Out (GIGO) หมายถึง ป้อนขยะเข้ามา ก็จะได้ขยะออกไป เป็นนิยามที่มักพบได้บ่อยในโลกของ Computer Science และ Data Analytics ที่สะท้อนถึงปัญหาที่หลายองค์กรอาจกำลังเผชิญอยู่ จากการใช้ข้อมูลที่ขาดคุณภาพและความถูกต้องแม่นยำ จนทำให้การตัดสินใจทางธุรกิจผิดพลาด แม้ว่าข้อมูลเหล่านั้นได้ผ่านกระบวนการวิเคราะห์ขั้นสูงของเทคโนโลยีปัญญาประดิษฐ์อย่าง Artificial Intelligence: AI หรือ Machine Learning: M/L มาแล้วก็ตาม

Data Architecture

กระแสความต้องการนำ AI หรือ M/L มาใช้ยกระดับขีดความสามารถในการแข่งขันธุรกิจเป็นหนึ่งในเทรนด์เทคโนโลยีที่หลายองค์กรอยากมีไว้ในครอบครอง แต่โดยหลักการแล้ว การใช้ปัญญาประดิษฐ์ หรือ Data Analytics    เพื่อวิเคราะห์ข้อมูลขั้นสูงนั้น เปรียบได้กับภาพกระบวนการท้ายๆ ของการใช้ประโยชน์จากข้อมูล นั่นหมายความว่า องค์กรส่วนใหญ่กำลังมุ่งไปสู่ปลายทางของการใช้งาน โดยมองข้ามขั้นตอนสำคัญในการสร้างพื้นฐานที่แข็งแกร่งและเพิ่มคุณค่าให้กับข้อมูลด้วยการสร้าง “Data Architecture หรือ สถาปัตยกรรมข้อมูล” เพราะการนำข้อมูลที่ยังไม่ผ่านกระบวนการตรวจสอบความถูกต้องหรือได้มาตรฐานไปใช้ประมวลผลหรือวิเคราะห์ด้วยปัญญาประดิษฐ์ ผลลัพธ์ที่ได้อาจคลาดเคลื่อนจนถึงผิดพลาด ส่งผลต่อการตัดสินใจทางธุรกิจในที่สุด และอาจสร้างความสูญเสียหรือเสียหายที่ยากจะคาดเดาได้ในอนาคต 

ด้วยเหตุนี้ “บลูบิค” จึงอยากนำเสนอบทความเกี่ยวกับ “Data Architecture” สถาปัตยกรรมที่เข้ามาสร้าง   ขุมพลังแห่งข้อมูล ซึ่งเป็นรากฐานสำคัญในการสร้างมาตรฐานข้อมูลและการใช้งาน ที่จะนำไปสู่การปลดล็อคพลังแห่งปัญญาประดิษฐ์ และผลักดันให้ภาคธุรกิจสามารถปรับเปลี่ยนเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล หรือ Data-Driven Organization ได้ตามเป้าหมาย  

DATA Architecture คือ? 

Data Architecture เปรียบเสมือนการมีพิมพ์เขียวที่กำหนดทิศทาง มาตรฐานข้อมูลและองค์ประกอบอื่นๆ ในการบริหารจัดการข้อมูลให้มีประสิทธิภาพ มีมาตรฐานและเป็นไปในทิศทางเดียวกัน รวมถึงมีความคล่องตัวและความยืดหยุ่นในการเรียกใช้งานข้อมูลเพื่อตอบสนองความต้องการทางธุรกิจได้อย่างถูกต้องแม่นยำและรวดเร็ว โดยองค์ประกอบสำคัญของ Data Architecture มีดังต่อไปนี้     

1) Data Sources แหล่งข้อมูลต้นน้ำขององค์กรที่จะนำเข้าสู่ระบบ หรือ Input ที่มาจากแหล่งต่างๆ และหลากหลายรูปแบบทั้งแบบที่มีโครงสร้าง (Structured Data) กึ่งโครงสร้าง (Semi-structured Data) และแบบที่ไม่มีโครงสร้าง (Unstructured Data) อาทิ ข้อมูลในฐานข้อมูล (Database) ข้อมูลจากแอปพลิเคชัน และข้อมูลรูปภาพ 

2) Data Modeling เป็นการออกแบบจำลองข้อมูลให้สอดรับกับความต้องการใช้งานทางธุรกิจ 

3) Data Integration วิธีการเชื่อมต่อไปยังแหล่งข้อมูลดิบเพื่อที่จะนำเข้าข้อมูลต่างๆ มายังแหล่งเก็บข้อมูลกลาง Data Lake และ Data Warehouse  

4) Data Pipeline and Data Flow กำหนดรูปแบบการนำเข้าข้อมูลว่าจะเป็นแบบ Batch หรือ Realtime พร้อมทั้งจัดการควบคุมการนำเข้าข้อมูล และปรับเปลี่ยนรูปแบบ (Transform) ข้อมูลให้อยู่ในรูปแบบ Data Model ที่ออกแบบไว้แล้ว

5) Data Storage แหล่งเก็บข้อมูลอาจจะเป็น Data Lake ที่เป็นแหล่งของข้อมูลดิบ หรือ Data Warehouse ซึ่งเป็นแหล่งเก็บข้อมูลที่ผ่านกระบวนการ Data Cleansing ที่อยู่ในรูปแบบพร้อมนำไปวิเคราะห์ต่อ หรือจะเป็น Data Mart ที่เป็นแหล่งเก็บข้อมูลที่พร้อมนำไปใช้ในการนำเสนองาน ทำรายงาน (Report) หรือการทำ Dashboard ให้ผู้บริหาร 

6) Data Serving ช่องทางให้บริการข้อมูลที่พร้อมใช้กับหน่วยงานต่างๆ อาจจะอยู่ในหลากหลายรูปแบบ เช่น Database และ Application Programming Interface (API) เป็นต้น

บทบาทหน้าที่ของ Data Architecture สู่การสร้างมาตรฐาน Data of True

1) การทำความเข้าใจภาพธุรกิจ เพื่อใช้ในการออกแบบ Data Modeling (แบบจำลองข้อมูล) ให้มี Attribute หรือข้อมูลลักษณะเฉพาะที่ใช้แบ่งหมวดหมู่ของข้อมูล และ Identify Data ให้ตรงกับความต้องการใช้งานขององค์กร 

2) การสร้างมาตรฐานแบบเดียวกันให้กับข้อมูล เป็นการสร้างมาตรฐานการในจัดเก็บข้อมูลให้อยู่ในรูปแบบเดียวกัน ทำให้ง่ายต่อการนำไปใช้งานและการเชื่อมต่อข้อมูลต่างๆ นอกจากนั้นยังสามารถรองรับการทำงานของระบบใหม่ๆ ในอนาคต 

3) การกำหนดวิธีการจัดเก็บและการดำเนินการของข้อมูล (Data Storage and Operation) เป็นการกำหนดแหล่งข้อมูล หรือ Data Source ที่จะนำมาวางเป็นแกนกลางของ Data Model และออกแบบ Flow ของข้อมูลที่ใช้ในการประมวลผล (Process) ซึ่งในกระบวนการนี้จะต้องมีการคิดเป็นภาพและกำหนดขั้นตอนการบริหารจัดการข้อมูลให้ชัดเจน ตั้งแต่สถานที่จัดเก็บข้อมูล เทคโนโลยีที่ใช้ จนถึงแหล่งข้อมูลที่ใช้สำหรับการประมวลผล   

4) การเชื่อมโยงและแลกเปลี่ยนข้อมูล โดยการออกแบบเทคโนโลยีที่ใช้ในการเชื่อมต่อและแลกเปลี่ยนข้อมูลให้กับ Data Source ที่มาจากหลายแหล่ง ซึ่งอาจจะต้องใช้วิธีการเชื่อมต่อที่แตกต่างกัน เช่น บางแอปพลิเคชันอาจต้องเชื่อมต่อโดยใช้ API ในขณะที่บางแอปฯ สามารถเชื่อมต่อตรงกับฐานข้อมูลที่มีอยู่ได้เลย 

5) การออกแบบความปลอดภัยให้ข้อมูล (Data Security) โดยการกำหนดสิทธิ์การเข้าถึงข้อมูล ด้วยการทำ Data Classify ให้กับข้อมูลอย่างชัดเจนว่า ข้อมูลไหนเป็นข้อมูลสาธารณะ (Public) ข้อมูลไหนเป็นข้อมูลเฉพาะแผนก และข้อมูลไหนสามารถเข้าถึงได้เฉพาะผู้บริหารเท่านั้น เพื่อสร้างมาตรฐานความปลอดภัยเบื้องต้นให้ข้อมูลองค์กร

6) การแยกแยะข้อมูล โดยการแยกประเภทข้อมูลว่า ข้อมูลใดเป็น Master Data และข้อมูลใดเป็น Reference Data เพื่อให้การเรียกใช้ข้อมูลสามารถทำได้อย่างถูกต้องแม่นยำมากขึ้น ยกตัวอย่างเช่น บริษัทที่จำเป็นต้องใช้ข้อมูลอัตราแลกเปลี่ยน (Exchange Rate) ที่มีการเปลี่ยนแปลงตลอดเวลา ถ้าหากไม่มีการกำหนด Reference Data ให้ชัดเจนอาจทำให้อัตราแลกเปลี่ยนที่นำมาใช้อ้างอิงของแต่ละแผนก (Business Units) คลาดเคลื่อนไม่ตรงกัน เพราะมาจากแหล่งอ้างอิงต่างกัน เป็นต้น

7) การกำหนดเงื่อนไขการทำ Data Cleansing เป็นการสร้างมาตรฐานคุณภาพให้กับข้อมูล แต่การทำ Data Cleansing นั้นไม่สามารถทำได้ทุก Attribute ดังนั้นสถาปนิกข้อมูลจำเป็นต้องทำงานร่วมกับผู้ใช้งานในการกำหนดข้อมูลหลักที่จำเป็นต้องมีคุณภาพ (Critical Data Element : CDE) ว่าข้อมูลใดมีความสำคัญ และจำเป็นต้องมีความถูกต้องสูงสุด เพื่อนำไปใช้ในกระบวนการวิเคราะห์ขั้นสูง 

8) การออกแบบการนำข้อมูลออกไปใช้วิเคราะห์ เป็นอีกหนึ่งขั้นตอนสำคัญในการสร้างสถาปัตยกรรมข้อมูล ซึ่งจะต้องออกแบบให้การเรียกใช้งานข้อมูลใน Storage นั้นทำได้อย่างยืดหยุ่นและตอบโจทย์กระบวนการนำข้อมูลไปวิเคราะห์ต่อได้อย่างสะดวกและราบรื่น 

การออกแบบ Data Architecture ด้วยมืออาชีพ เพิ่มแต้มต่อ พร้อมลดความเสี่ยงให้องค์กร

เมื่อการสร้าง “Data Architecture” ไม่ใช่แค่การวาง Framework ที่มี Best Practice เป็นกรอบการทำงานให้กับองค์กร แต่การออกแบบสถาปัตยกรรมข้อมูลนั้นต้องอาศัยความเข้าใจทั้งด้านธุรกิจและเทคโนโลยี ดังนั้นการเลือกใช้ Vendor ที่มีความเชี่ยวชาญด้านเทคโนโลยีเป็นหลักนั้น อาจตอบโจทย์การออกแบบโมเดลข้อมูลได้ตรงตามความต้องการ  ของแต่ละอุตสาหกรรม ปัญหาที่พบบ่อยในการออกแบบจำลองข้อมูลคือ บาง Attribute ที่จำเป็นต้องมีกลับไม่มีอยู่ใน Common Model นั้นๆ เพราะขาดความรู้ความเข้าใจในธุรกิจขององค์กร ด้วยเหตุนี้ การออกแบบสถาปัตยกรรมที่สามารถต่อยอดในมุมของ Data Analytics ได้อย่างแท้จริง ลดความเสี่ยงจาก Human Error จนถึงการลดต้นทุนในการดำเนินงานและชั่วโมงการทำงานของพนักงานลงได้นั้น จำเป็นต้องใช้บุคคลากรที่มีประสบการณ์มีความรู้ความเข้าใจในธุรกิจนั้นๆ อย่างถ่องแท้ และมีเชี่ยวชาญด้านเทคโนโลยี เพื่อปิดความเสี่ยงต่างๆ ที่อาจเกิดขึ้น

วินาทีคงไม่มีใครสามารถปฏิเสธได้ว่า “ข้อมูล หรือ Data” เป็นหัวใจสำคัญในการดำเนินธุรกิจ การใช้สัญชาตญาณและประสบการณ์ที่ผ่านมาเหมือนในอดีต อาจกลายเป็นความเสี่ยงต่อการเติบโตขององค์กรในอนาคตโดยเฉพาะในวันที่คู่แข่งสามารถปรับเปลี่ยนเป็นองค์กรที่ขับเคลื่อนด้วยข้อมูลได้อย่างแท้จริง ดังนั้นองค์กรใดที่เริ่มวางรากฐานข้อมูลด้วยการทำ Data Architecture อย่างมืออาชีพได้ก่อนนั้น ถือเป็นการสร้างความได้เปรียบในการทำธุรกิจในยุคที่ทุกอย่างหมุนเร็วกว่าที่เคย 

บทความนี้เขียนโดย คุณพิพัฒน์ ประภาพรรณพงศ์ ผู้อำนวยการและหัวหน้าทีม Data Science (Machine Learning)  บริษัท บลูบิค กรุ๊ป จํากัด (มหาชน)  ติดตามข้อมูลเพิ่มเติมได้ที่ www.bluebik.com


ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Power Harassment การกลั่นแกล้งโดยผู้มีอำนาจ เรื่องใหญ่ที่หลายคนมองข้าม

รู้หรือไม่? ในสังคมการทำงานของหลายประเทศในเอเชีย มักโดนกลั่นแกล้งในที่ทำงานโดยผู้มีตำแหน่งสูงกว่า เราเรียกสิ่งนี้ว่า Power harassment...

Responsive image

เถียงใครก็ไม่มีวันแพ้ แค่หัดเป็น ‘ผู้ฟังที่ดี’ เพราะรู้เขา รู้เรา รบกี่ครั้งก็ชนะ

รู้เขา รู้เรา รบร้อยครั้งก็ชนะร้อยครั้ง คนที่เถียงใครก็ชนะเสมอ นอกจากจะเป็นผู้พูดที่ดีแล้ว ทักษะหนึ่งที่ขาดไม่ได้เลย และจะทำให้เราเป็นผู้ชนะทุกข้อโต้แย้งและการโต้เถียงนั่นคือ “การเ...

Responsive image

Storytelling ทักษะเอาชีวิตรอดในยุค AI ทำไมยิ่ง AI ฉลาดขึ้น เราต้องเล่าเรื่องเก่ง ?

Storytelling หรือ ทักษะการเล่าเรื่อง ทักษะทรงพลังที่มักถูกมองข้าม จะสำคัญกับ ‘ทุกคน’ มากยิ่งขึ้นในยุค AI เพราะอะไร ?...