รู้จัก Hermes Agent เมื่อ AI ยิ่งใช้ยิ่งฉลาด ปรับปรุง Skills ได้เอง คู่แข่งคนใหม่ OpenClaw

ลองนึกภาพผู้ช่วย AI ที่ทุกครั้งที่เราสั่งงาน มันไม่ได้แค่ทำแล้วจบ แต่จดจำวิธีการทำงานนั้นไว้ สร้างเป็น 'skill' ที่เรียกใช้ได้ทันที และครั้งต่อไปมันจะทำได้ดีกว่าเดิม

นี่คือสิ่งที่เกิดขึ้นจริงแล้วกับ Hermes Agent จาก Nous Research โดยหลังเปิดตัวช่วงปลายกุมภาพันธ์ที่ผ่านมา สามารถกวาดดาวบน GitHubs ได้ถึง 22,000 ดาวในเดือนแรก และพุ่งขึ้นไม่หยุด จนครองอันดับ 1 โปรเจกต์ open-source ยอดนิยมของโลกอยู่หลายวัน

Hermes Agent คืออะไร และทำไมถึงต่างจาก Agent แบบอื่น

Hermes Agent ถูกสร้างโดย Nous Research กลุ่มนักวิจัย AI สาย open-source ที่เริ่มต้นจาก Discord และ Twitter ในปี 2022 ก่อนจะจดทะเบียนเป็นบริษัทอย่างเป็นทางการในปี 2023 แนวคิดของพวกเขาตั้งแต่แรกเริ่มคือ สร้าง AI ที่ผู้ใช้ควบคุมได้เอง ไม่ใช่ AI ที่ถูกควบคุมโดยบริษัทใหญ่ไม่กี่แห่ง

สิ่งที่ทำให้ Hermes ต่างจาก AI Agent ตัวอื่น ๆ คือระบบ self-improving skill ที่อยู่ตรงแกนกลางของสถาปัตยกรรม ลองนึกถึงพนักงานใหม่ที่เข้ามาทำงานวันแรก AI Agent ทั่ว ๆ ไปจะเหมือนพนักงานที่เริ่มต้นจากศูนย์ทุกเช้า ลืมทุกอย่างที่เรียนรู้เมื่อวาน 

แต่ Hermes เหมือนพนักงานที่จดทุกอย่างลงสมุด สร้างขั้นตอนการทำงานเป็นระบบ และยิ่งทำงานนานยิ่งเก่งขึ้นเรื่อย ๆ

เมื่อ Hermes เจอ workflow ที่ซับซ้อน มันจะบันทึกวิธีการทั้งหมดเป็น 'skill document' ที่นำกลับมาใช้ได้อีก ไม่ต้องเริ่มใหม่ ไม่ต้องสอนซ้ำ ครั้งต่อไปมันรู้เองว่าต้องทำอะไร และยิ่งใช้มากก็ยิ่งทำงานได้ดีขึ้นไปเรื่อย ๆ 

สิ่งที่น่าสนใจกว่านั้นคือ Hermes สามารถ Generate Tool Call Traces (บันทึกประวัติโดยละเอียดว่าในระหว่างที่ AI กำลังทำงานหนึ่งๆ มันมีกระบวนการคิดอย่างไร มีการเรียกใช้เครื่องมืออะไรบ้าง และตัดสินใจแก้ปัญหาด้วยเส้นทางไหน) ระหว่างทำงานออกมาได้ด้วย

แถมยัง export ข้อมูลนั้นออกมาสำหรับ Fine-tune model ได้ต่อ นั่นหมายความว่า Hermes ไม่ได้แค่ใช้โมเดลเป็น แต่ยังผลิต Training Data ที่ป้อนกลับเข้าสู่ตัวโมเดลได้อีกด้วย 

และในเวอร์ชันล่าสุด ยังเปิดให้รัน Agent หลายตัวในสภาพแวดล้อมเดียวกันพร้อมกัน โดยแต่ละตัวมีความจำและ Skill เป็นของตัวเองแยกออกจากกัน ทำให้ Hermes เริ่มใกล้เคียงกับระบบปฏิบัติการสำหรับ Agent มากกว่าแค่ผู้ช่วย AI

ตัว Agent รองรับ model จาก Provider แทบทุกค่าย ตั้งแต่ Claude, OpenAI, Qwen, Kimi, Xiaomi MiMo ไปจนถึงโมเดลที่รันบนเครื่องของเราเอง และ deploy ได้หลายรูปแบบไม่ว่าจะเป็นบน VPS หรือ Android (ผ่าน Termux)

OpenClaw กับ Hermes ต่างกันตรงไหน ?

หากดูจากความสามารถในเบื้องต้นแล้ว จะเห็นว่า Hermes และ OpenClaw มีความใกล้เคียงกันในเรื่องของการเป็น AI Agent ที่เรียกใช้ Tools และ Skills ได้ รวมทั้งมีคอมมูนิตี้รองรับ แต่ความต่างของ Agent ทั้งสองตัวนี้คือหลักการออกแบบ และวิธีชใ้งาน

OpenClaw คือ AI Agent ที่ได้รับการพัฒนามาอย่างต่อเนื่อง มี marketplace ชื่อ ClawHub ที่รวม skill สำเร็จรูปกว่า 5,000 ตัว แถมได้รับการสนับสนุนจาก OpenAI และมี Nvidia ร่วมพัฒนา ทำให้อัปเดตได้แทบทุกวัน 

ปรัชญาของ OpenClaw คือ ecosystem-first ผู้ใช้ได้ Agent ที่เป็นเหมือนสมุดเปล่า หน้าที่ของเราคือค่อย ๆ ติดตั้ง skill จากคอมมูนิตี้เพื่อสั่งให้ AI ทำในสิ่งที่ต้องการ

ในทางกลับกันปรัชญาของ Hermes คือ Learning-first ทุกอย่างในสถาปัตยกรรมถูกออกแบบมาเพื่อให้ Agent พัฒนาตัวเองผ่านการใช้งาน

พูดง่าย ๆ คือ OpenClaw ต้องการเป็นเครื่องมือที่ทำได้ทุกอย่าง ส่วน Hermes ต้องการเป็นผู้เชี่ยวชาญที่เก่งขึ้นเรื่อย ๆ ในสิ่งที่เราให้มันทำ นี่คือความต่างระหว่าง 'เครื่องมือ' กับ 'คนที่เติบโตไปพร้อมกันกับเรา'

ในแง่ความเร็ว Hermes ทำงานได้ไวกว่าแม้จะใช้โมเดลเดียวกัน เพราะสถาปัตยกรรมเบามาก เป็นแค่ terminal ไม่มี UI หนัก ทำให้ latency ต่ำกว่าและเรียก tool ได้ไวกว่า 

ขณะที่ OpenClaw เคยมีปัญหาเรื่อง performance มาก่อน แม้ทีมจะแก้ไขอยู่เรื่อย ๆ แต่ OpenClaw ก็มีจุดแข็งที่ชัดเจนในเรื่อง Subagent สามารถแตก Agent ย่อยออกมาทำงานเฉพาะทางได้ และมี ecosystem ที่ใหญ่กว่ามาก

แต่สิ่งที่น่ากังวลสำหรับ OpenClaw ก็คือ Skill จากคอมมูนิตี้ของตัวเอง เพราะOpenClaw เปิดให้ใครก็ได้สร้าง Skill แล้วแชร์ใน ClawHub ซึ่งหมายความว่าผู้ใช้ต้องเชื่อใจโค้ดจากคนแปลกหน้าที่รันด้วยสิทธิ์เต็มของ agent บนเครื่องตัวเอง 

ส่วน Hermes เน้นสร้าง skill เองจากการใช้งาน ผู้ใช้มือใหม่จะไม่ต้องเสี่ยงกับ skill ของคนอื่นที่อาจมี prompt injection หรือโค้ดที่ไม่ปลอดภัยแฝงอยู่

แม้ Hermes และ OpenClaw จะเป็นเครื่องมือ AI ที่ทรงพลัง แต่ระบบทั้งสองยังคงต้องการความเชี่ยวชาญทางเทคนิคระดับสูงจากผู้ใช้งาน ไม่ว่าจะเป็นความเข้าใจในสถาปัตยกรรมของ Agent, การตั้งค่าการทำงานผ่าน Command Line, รวมถึงการจัดการ API

สิ่งที่ต้องระมัดระวังขั้นสูงสุดคือ ความปลอดภัยและการให้สิทธิ์เข้าถึงระบบ (Permissions) เนื่องจาก Agent เหล่านี้สามารถเข้าถึงระบบในระดับลึกและทำงานภายใต้สิทธิ์ของบัญชีผู้ใช้บนเครื่องของคุณ (Hermes มีคำเตือนชัดเจนว่าห้ามรันในฐานะ root เด็ดขาด)

และทั้งสองระบบไม่ได้ ปลอดภัยตั้งแต่เริ่มต้น หากไม่มีการตั้งค่าจำกัดสิทธิ์ที่รัดกุมเพียงพอ นอกจากนี้ ผู้ใช้อาจต้องเผชิญกับความเสี่ยงเพิ่มเติม 2 ประการ ได้แก่

อันตรายจากโค้ดของบุคคลที่สาม โดยเฉพาะในระบบของ OpenClaw ที่ผู้ใช้อาจเผลอติดตั้ง Skill ที่มี Prompt Injection หรือโค้ดอันตรายแฝงอยู่ ซึ่งจะเข้ามารันด้วยสิทธิ์เต็มรูปแบบบนเครื่องของคุณ

อาการหลอนของ AI หากไม่มีการตั้งค่าระบบป้องกันที่ดีพอ AI อาจทำงานนอกเหนือคำสั่งจนควบคุมไม่ได้ ตัวอย่างเช่น การสั่งให้ AI สรุปข่าวเช้า แต่มันกลับคิดแต่งชื่อคน ร่างอีเมลหาบุคคลภายนอก หรือพยายามนำเงินไปเดิมพันบนเว็บไซต์พนันเอง

ดังนั้น Hermes และ OpenClaw ในปัจจุบันจึงยังไม่เหมาะกับผู้ใช้งานทั่วไป ผู้ที่ต้องการนำไปใช้จะต้องมีความเข้าใจในกระบวนการทำงานอย่างถ่องแท้ และต้องตั้งค่าระบบความปลอดภัยอย่างระมัดระวังสูงสุดในทุกครั้งที่ใช้งาน

อ้างอิง : GitHub, panewslab, decrypt


ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

Google เปิดตัวโมเดลแปลงเสียง ‘Gemini 3.1 Flash TTS’ สั่ง AI กระซิบ ตะโกน เปลี่ยนอารมณ์ได้ทันที ด้วยแท็กเสียงกว่า 200 แบบ และ 70 ภาษา

Google เปิดตัว Gemini 3.1 Flash TTS โมเดลแปลงข้อความเป็นเสียงพูดรุ่นใหม่ พร้อมแท็กเสียงกว่า 200 แบบ ควบคุมจังหวะ อารมณ์ และน้ำเสียงได้ละเอียด รองรับ 70+ ภาษา มีลายน้ำ SynthID ในตัว...

Responsive image

สรุป Layoffs สัปดาห์นี้ Snap ปลด 1,000 คนเพราะ AI, Disney ปลดพัน, BBC ลด 2,000 ตำแหน่ง

Snap ปลด 1,000 คน อ้าง AI เขียนโค้ดแทนได้ 65% Disney CEO ใหม่ปลดพันตำแหน่งเดือนแรก BBC ลดคน 2,000 ครั้งใหญ่สุดรอบ 15 ปี สรุปครบทุกรายละเอียด...

Responsive image

อ.เชน เปิด 8 ยุทธศาสตร์ อว. พลิกไทยสู่ประเทศรายได้สูง

กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.) เปิดฉากแถลงนโยบายอย่างเป็นทางการครั้งแรก โดยมี ศ.ดร.ยศชนัน วงศ์สวัสดิ์ รองนายกรัฐมนตรีและรัฐมนตรีว่าการกระทรวง อว. เป็นประธาน...