คุยกับสองนักศึกษาไทยที่จบปริญญาโทจากอเมริกา ซึ่งมีสนใจทั้งในด้านดนตรีและ Data Science จากความชอบด้านดนตรี ผสานกับความรู้ในการวิเคราะห์ข้อมูล ทำให้เขาตัดสินใจวิเคราะห์ข้อมูลจนออกมาเป็นบทสรุปว่ามีปัจจัยใดบ้างที่ทำให้หนึ่งเพลงได้รับความนิยมหรือฮิตขึ้นมา โดยใช้ข้อมูลเพลงฮิตบน Spotify มาวิเคราะห์ รายละเอียดจะเป็นอย่างไร อ่านได้ในบทสัมภาษณ์นี้ครับ

หนึ่งเพลงจะดังได้ ต้องมีปัจจัยอะไรบ้าง? ถ้าเป็นเมื่อก่อนเราคงต้องนั่งฟังเพลงหลายๆ เพลงแล้วเอามาวิเคราะห์ด้วยตนเอง แต่สิ่งหนึ่งที่จะเกิดขึ้นหลังการวิเคราะห์ คือ ความคิดเห็น (Opinion) และอคติ (Bias) ที่เกิดขึ้นมาระหว่างเก็บข้อมูล ดังนั้นการใช้ศาสตร์ของ Data Science จึงอาจเป็นทางออกที่ช่วยให้ได้ข้อมูลที่ตรงไปตรงมาออกมาด้วย ประกอบกับปัจจุบัน บริการฟังเพลงออนไลน์อย่าง Spotify มี API ที่เปิดให้เราดึงข้อมูลเพลงต่างๆ ไปวิเคราะห์ได้อีกด้วย

ทำให้สองนักศึกษาปริญญาโทที่จบอเมริกา ที่สนใจทางด้านดนตรี และยังสนใจในศาสตร์ Data Science นำข้อมูลที่มีผสานกับความรู้ในการประมวล-สังเคราะห์ข้อมูลเกี่ยวกับเพลงบนโลกนี้ออกมา กลายเป็นข้อมูลที่น่าสนใจ โดยสรุปปัจจัยที่ทำให้หนึ่งเพลงได้รับความนิยมหรือฮิตขึ้นมา โดยใช้ข้อมูลเพลงฮิตบน Spotify มาวิเคราะห์นั่นเอง

Techsauce สัมภาษณ์ถึงที่มาที่ไปทั้งการตัดสินใจวิเคราะห์ข้อมูล ความสนใจทั้งด้านดนตรีและการวิเคราะห์ข้อมูล หรือการทำ Data Science รวมถึงความท้าทายในการวิเคราะห์ข้อมูลที่เป็นลักษณะของเพลงฮิตนั้นมีอะไรบ้าง อย่าพลาด! ต้องอ่านโดยพลันครับ

https://www.facebook.com/kaminph/posts/10156509934306505

 

แนะนำตัวหน่อยครับ ตอนนี้แต่ละคนกำลังเรียน (หรือเคยเรียน) อะไรอยู่?

คามิน: สวัสดีครับ คามิน ภัคดุรงค์ หรือ 'คามิน' ครับ

มุก: สวัสดีค่ะ 'มุก' พร้อมพร ชัยจิรวิวัฒน์ค่ะ เราสองคนพึ่งเรียนจบปริญญาโทที่สหรัฐอเมริกาค่ะ

คามิน: ผมเรียนปริญญาโทที่ MIT (Massachusetts Institute of Technology) สาขาชื่อ Integrated Design & Management เป็นโปรแกรมแนวๆ Multi-Disciplinary ที่รวม Engineering, Design, Management เข้าด้วยกัน ซึ่งเป็นอะไรที่เราชอบอยู่แล้ว เพราะตอนอยู่ไทยเราก็ทำ Startup ของตัวเอง และก็รับ Consult ให้ Tech Startup หลายราย ซึ่งทำให้เราตระหนักเลยว่ามันสำคัญมากที่ทั้ง 3 ด้านนี้มันต้องคุยกันกันให้รู้เรื่อง

มุก: มุกเรียนที่ Carnegie Mellon University ในหลักสูตร Information Systems Management ค่ะ ตอนนี้มุกทำงานเป็น Product Manager อยู่ที่ Temasek International ที่สิงคโปร์ เราสองคนเรียนปริญญาตรีจากคณะวิศวกกรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัยค่ะ

เห็นบอกในโพสว่าลงเรียนวิชา Data Science เขาสอนอะไรบ้าง?

มุก: มุกเรียน Data Mining และ Text Analytics โดย Data Mining ก็เรียนตั้งแต่การสร้าง Prediction Model ต่างๆ หรือการทำ Classification ส่วน Text Analytics ก็จะเน้นไปที่ Unstructured Data (ข้อมูลที่ไม่มีโครงสร้างชัดเจน) เช่น บทความ ข่าว และคอมเมนต์ต่างๆ

ซึ่ง Thesis จบของเราก็ทำเรื่องเกี่ยวกับข้อมูล (Data) เราได้ข้อมูลขอ Fitness App เจ้าใหญ่เจ้าหนึ่งมา แล้วเราพยายามช่วยเขาดูว่าทำยังไงถึงจะทำให้คนใช้แอปของนานขึ้น ไม่ใช่ว่าโหลดมาแล้วลองใช้แค่อาทิตย์เดียวแล้วลบทิ้ง ตรงนี้ข้อมูลก็เข้ามาช่วยได้

คามิน: ผมเรียนไปสองตัว Data Mining & Analytics กับ Data Visualization โดยเอามาช่วยในวิเคราะห์และสร้าง Storytelling รวมถึงการทำทำยังไงให้คนทั่วไปอ่านเข้าใจ ทำยังไงให้ผลลัพธ์ที่ได้มันมีประโยชน์จริงๆ ไม่ใช่แค่พูดถึงข้อมูลทางสถิติที่ไม่มีใครเข้าใจ

ทำไมจึงอยากวิเคราะห์เพลงฮิตบน Spotify?

คามิน: ผมเล่นดนตรีด้วยครับ ตอนนี้ทำวงชื่อ The Dai Dai สังกัด Genie Records ครับ ในขณะที่เรียนไป เราก็ต้องรับหน้าที่ทำเพลงให้วงไปด้วย มันเลยเป็นความสนใจตั้งแต่ต้นอยู่แล้วว่าทำยังไงให้เพลงฮิต เพราะเราทำเพลงให้คนฟัง เราก็อยากเข้าใจคนฟังให้มากขึ้นด้วย ซึ่งผมเชื่อว่าอะไรแบบนี้ไม่ได้มีแค่ผมคนเดียวที่อยากรู้

เวลาผมคุยกับเพื่อนๆนักแต่งเพลงด้วยกัน แต่ละคนก็จะมีความคิดเห็น (Opinion) และอคติ (Bias) ของตัวเอง แต่ถามว่ามันคือ Fact ไหม ก็ไม่ ในขณะที่ถึงแม้ข้อมูลก็มาพร้อม Bias อะไรบางอย่างเหมือนกัน แต่ผมว่ามันน่าจะทำให้เราเห็นภาพได้กลมขึ้น

https://www.youtube.com/watch?v=6zMu-r5HXlI

มุก: คามินเคยคุยกับพี่โฟร์ 25 Hours ซึ่งเป็น Producer ให้วง รวมถึงเพื่อนๆ คนอื่นในวงการดนตรี ทุกคนก็อยากรู้เหมือนกัน ไม่มีใครตอบได้ คิดว่าเพลงนี้จะมา แต่ดันไม่มาเสียอย่างนั้นไปก็มี

ซึ่งสำหรับมุก เราคิดว่าทำยังไงให้คนไทยสนใจเรื่อง Data Analytics มากกว่านี้ เราอยากให้คนทั่วๆ ไปที่ไม่ได้อยู่ในสาย Tech อ่านด้วย ก็เลยคิดว่านี่แหละเป็นเรื่องที่น่าสนใจ เพราะเราก็เป็นคนชอบฟังเพลงเป็นทุนเดิมอยู่แล้ว

Spotify ดึงข้อมูลคุณสมบัติของเพลงได้มากน้อยแค่ไหน?

มุก: เยอะมากนะ ลองเข้าไปดูได้ที่ https://developer.spotify.com/documentation/web-api/ โดยตัวที่น่าสนใจมากคือ Audio Feature เขาจะบอกเลยว่าเพลงนี้มี Character ยังไง เช่น Danceability, Energy, Tempo, Key ไปลองอ่านได้ในบทความของเราว่าแต่ละอันเป็นยังไง แล้วเพลงฮิตของไทยมี Character ยังไง เราทำ Visualization สวยๆ ไว้ด้วย ต้องของคุณ Spotify API มากๆ

คามิน: แต่ก็ไม่ใช่ว่าข้อมูลทุกอย่างจะแม่นยำ (Accurate) 100% นะครับ เราก็พยายามระวังตรงนั้นมากๆ เช่น อย่างเวลาเจอค่าผิดปกติ (Outlier) แปลกๆ เราก็ไปนั่งไล่ฟังว่ามันจริงไหม หรืออย่าง Feature บางตัวเช่น Danceability, Energy ซึ่งมาจาก Audio Wave Analyzer หลังบ้านเขา เราก็ต้องเข้าใจว่ามันมาจาก Algorithm ของ Spotify เขา มันไม่ใช่ Fact

ดึง Data มาอย่างไร ใช้กระบวนการวิเคราะห์อะไรบ้าง?

คามิน: หลักๆ คือ มี 4 Steps คือ (1) Collect data หรือเก็บข้อมูล (2) Clean data หรือทำความสะอาดข้อมูล (3) Analyze หรือวิเคราะห์ข้อมูล และ (4) Storytelling & Data Visualization หรือการสร้างเรื่องราวและแผนภาพประกอบข้อมูล

ส่วนตัวเรามีโจทย์คร่าวๆ อยู่ในหัว แต่ก็ไม่ได้มี Details มากตั้งแต่ต้นเพราะเราไม่รู้ว่าจะเจออะไร ทุกอย่างคือการ Improvise ตอนแรกเราเริ่มจากหา Data ก่อนว่ามีอะไรให้เราเล่นได้บ้าง โชคดีที่ไปเจอ Spotify API แล้วก็ใช้ข้อมูลจาก Top 200 Chart ด้วย โดยเราก็เขียน Script ดึงข้อมูลทั้งหมดมา merge รวมกัน

มุก: พอดึง Data มาเสร็จ เราก็ทำ Descriptive Analysis ก่อนเลย เอาเข้า R Studio และ Tableau ดูว่าข้อมูลมีหน้าตาเป็นยังไง โดยดูว่าต้อง Clean Data ไหม มันมีค่าที่ผิดปกติอยู่บ้าง แล้วจากที่สุ่มๆ ดูก็รู้ว่า Feature ที่ได้จาก API บางอันก็ไม่แม่นยำเท่าไหร่ เลยยิ่งต้องนั่งไล่ฟังค่าที่ผิดปกติกันดีๆ แต่ด้วยคามินเป็นคนเล่นดนตรีอยู่แล้วเลยสบาย เช่น บางที Spotify ไปนับ Tempo เป็น Double Time ทำให้ Tempo สูงผิดปกติ คามินก็จะบอก

เสร็จแล้วตอนแรกพยายามทำโมเดลนู่นนี่ เช่น Regression หรือ Classification Tree โดยลองหลายโมเดลมาก แล้วไม่ได้อะไรเลยก็เคยมีค่ะ ค่อนข้างยากค่ะ

ในบทความจะเห็นว่าเราทำเป็น Descriptive Analysis เยอะ คือพูดถึงภาพรวมของของข้อมูลมากกว่าที่จะพยายาม Fit Model ไม่ใช่ว่าไม่ได้ทำนะคะ คือทำแล้วแต่มันไม่ดีพอ Accuracy ต่ำมาก Feature ที่ได้ก็ไม่ค่อย Significant เราเลยเน้นการทำ Visualization, Storytelling มากกว่า

สุดท้าย ก็ใช้ D3 และ Tableau ในการทำ Visualization ค่ะ

ปัจจัยอะไรที่ทำให้หนึ่งเพลงดังขึ้นมา

คามิน: ในบทความผมเขียนไว้ว่ามันมีปัจจัยภายนอกและภายใน และผมต้องออกตัวไว้ก่อนเลยว่าผมไม่ได้มาโชว์เหนือว่าผมเก่ง รู้ว่าทำยังไงให้เพลงดัง เพราะเพลงผมก็ยังไม่ค่อยดังเท่าไร แต่ถ้าคร่าวๆ จากการศึกษามาก็คือ Branding ของศิลปิน, การโปรโมทของค่ายเพลง, Network Effect, จนไปถึงตัวเพลงเองด้วยครับ

ทั้งหมดนี้ลองอ่านเต็มๆ ได้ในเว็บ Look Alive เราครับ ซึ่งในนั้นจะมาจากประสบการณ์ส่วนตัวของผมเอง ของเพื่อนๆ ศิลปินด้วยกัน หรือแม้แต่พี่ Nick ซึ่งเป็นเจ้าของค่าย Genie Records ที่ปั้นศิลปินดังมาแล้วไม่รู้เท่าไร รวมทั้งมีการใช้ Data Visualization ในการเล่าเรื่องด้วยครับ

วิเคราะห์เพลงใน Spotify ไปแล้ว จะวิเคราะห์เพลงดังใน JOOX ด้วยหรือไม่?

มุก: จริงๆ เราอยากทำของ JOOX มาก เราทำ Survey มาแล้วรู้ว่าคนไทยใช้ JOOX เป็นส่วนใหญ่ แต่ว่า JOOX ยังไม่มี API ให้ดึง Data เหมือน Spotify แล้วเราก็ไม่รู้จักใครที่ JOOX ด้วย ถ้าพี่ๆ ที่ JOOX ได้อ่านอยากบอกว่าอยากทำมากๆ ค่ะ

เปรียบเทียบแนวเพลงฮิตในไทยกับในต่างประเทศ มีความเหมือนหรือต่างกันมากน้อยแค่ไหน?

 

https://www.youtube.com/watch?v=UoamH7G94mk&t=135s

คามิน: ต้องท้าวความก่อนว่า Project วิเคราะห์เพลงฮิตในไทย คือการต่อยอดจาก Project เล็กๆ ในคลาสๆ หนึ่งที่ผมไปวิเคราะห์เพลงฮิตใน U.S. เลยน่าจะพอตอบและเปรียบเทียบได้บ้าง

ถ้าในแง่ Audio Features ผมรู้สึกว่ามันไม่ต่างกันมากขนาดนั้น แต่ถ้าถามว่าพอเราไล่ฟังเพลงฮิตเพลงต่อเพลงแล้วต่างกันไหม มันก็ต่างกันมากในหลาย Layer แค่ Genre ของเพลงก็ต่างกันสุดขั้วแล้ว ผมว่าข้อมูลที่มีตอนนี้มันพอนะในการแนะนำ (Suggest) Playlist ให้กับ User นะ แต่มันไม่พอที่จะตอบได้ว่าเพลงฮิตเพราะอะไร ทำเพลงแบบไหนแล้วจะฮิต หรือแม้กระทั้งจะอธิบายว่าเพลงฮิตแต่ละประเทศต่างกันยังไงบ้าง

เพราะ Audio Features ที่มีมัน Over-Simplify เพลงมากๆ ซะจนเหลือแค่ Dimension (มิติ) เดียว

คิดเห็นอย่างไรกับข่าวที่มีการระบุว่า Spotify จะสร้าง Playlist โดยอ้างอิงจาก DNA ของเรา

คามิน:  ถ้าเปรียบเทียบง่ายๆ ถ้ามีคนบอกว่าเราจะ Predict หวยที่จะออกงวดนี้โดยดูจาก DNA ของผู้ประกาศเลขที่ออก ถามว่าทำได้ไหม ก็อาจจะได้นะ แต่ส่วนตัวเลยนะ ต้องถามว่าเพื่อ?  ทำเพื่ออะไร?

ผมเชื่อว่า ดนตรี คือ By Product มาจากสังคมรอบตัวเราครับ ซึ่งมันเป็น External Factor มากกว่า หรือบางทีคนเราในอารมณ์ที่ต่างกัน สถานที่ที่ต่างกัน ช่วงอายุที่ต่างกัน ก็อยากฟังเพลงไม่เหมือนกัน สุดท้ายเราไปใช้ Factor อื่นๆที่มัน Significant ดีกว่าไหม

เห็นความท้าทายของการวิเคราะห์ Data อย่างไรบ้าง รวมถึงมีคำแนะนำอะไรสำหรับคนอื่นๆ

มุก: ความท้าทายของ Data Analytics โดยเฉพาะการทำให้เป็นบทความที่อ่านง่ายหลายอย่าง โดยมองว่ามี 3 ประเด็นที่ต้องดู คือ

1. หาข้อมูล Data ที่น่าสนใจ ต้องยอมรับว่าชุดข้อมูลหรือ Dataset ของไทยเรายังมีให้เล่นไม่เยอะเหมือนของต่างประเทศ เราเห็นทางรัฐบาลพยายามทำอยู่ แต่ว่า Data ที่เป็นเรื่องที่เราสนใจ คนอ่านสนใจด้วย หายากนิดนึง

2. ตีความจาก Data และ Model ทางสถิติต่างๆ จากผลของโมเดลของเรา เราจะตีความยังไง เล่าเรื่องยังไง ต้องใช้ระมัดระวังคำด้วยค่ะ เคยมีคนเมสเสจมาทวงว่า แบบนี้มันไม่ถูกนะ ซึ่งเราขอบคุณเขามากๆ นะ อุตส่าห์อ่านแล้วสละเวลามา Feedback เรา คือดีมากๆ มันก็ทำให้เราเรียนรู้แล้วยิ่งระมัดระวังมากขึ้น

3. ทำยังไงให้คนอ่าน นอกจากเรื่อง Technical เราว่าอันนี้ท้าทายที่สุด ไหนๆ จะทำแล้ว เราก็อยากให้คนอ่านใช่ไหมคะ มันมีทั้งเรื่องการเลือกเรื่องที่น่าสนใจ การทำ Graphics และ Visualization ต่างๆ ซึ่งท้าทายมาก

เราสองคนสนใจหลายอย่าง อย่างเช่นตอนนี้คามินทำ Interactive Art Installation ที่ชื่อว่า LOOK ALIVE อยู่ซึ่งจัดแสดงหลายที่ ทั้ง New York และ Boston นอกจากนี้เราเองก็หันไปทำพวก Social Entrepreneur ด้วยการทำเว็บให้โรงเรียนอนุบาลเล็กๆ แถวบ้าน เอาเทคโนโลยีไปให้เขาลอง

เราว่าที่สำคัญสำหรับคนที่สนใจสายนี้ คือ ถ้าอยากทำ ทำเลย! อย่าคิดนาน อย่าคิดมาก ไม่งั้นก็จะไม่ได้ทำอะไรสักที Just Do it ค่ะ หาเรียน Online ก็ได้ ลองเอา Tools มาเล่นทำตาม Tutorial ก็ได้ ไม่จำเป็นต้องไปเรียนในมหาลัยแบบพวกเราก็ได้ค่ะ

ในเฟสบุ๊กมีเพจดีๆ ที่แนะนำเรื่อง Data Science อยู่อย่าง Data Science ชิล ชิล ของเพื่อนเรา หรือ DataRockie ดีมากๆ ค่ะ ไปติดตามกันได้

RELATED ARTICLE

Responsive image

ทำความรู้จัก TAGTHAi (ทักทาย) แอปจองทริปท่องเที่ยวไทยครบวงจร

แอป TAGTHAi เปิดตัวครั้งแรกด้วยการรองรับถึง 3 ภาษา ทั้ง ไทย จีน อังกฤษ โดยมีจุดเด่นด้วยการเป็น One Stop Service แนะนำ ที่เที่ยว ที่พัก ที่กิน แหล่งช้อปปิ้ง และกิจกรรมที่น่าสนใจ พร้...

Responsive image

Transformation ของ ‘วิชาช่าง’ Upskill ด้วยคอร์สเรียนออนไลน์จากสยามเทค

Transformation ของ ‘วิชาช่าง’ Upskill ด้วยคอร์สเรียนออนไลน์จากสยามเทค...

Responsive image

Recession or Not? โลกจะเกิดเศรษฐกิจถดถอยจริงหรือไม่?

บทวิเคราะห์ : Recession or not โลกจะเกิดเศรษฐกิจถดถอยหรือไม่ โดย SCB Chief Investment Office (SCB CIO)...