LATEST IN AI Safety

เครื่องมือใหม่ Anthropic ‘Natural Language Autoencoders’ แปลความคิดภายในของ Claude ให้กลายเป็นข้อความที่มนุษย์อ่านเข้าใจได้

Anthropic เปิดตัว Natural Language Autoencoders (NLAs) เทคนิคใหม่ที่แปลความคิดภายในของ Claude ให้กลายเป็นข้อความภาษาธรรมชาติ เผยให้เห็นว่าโมเดลรู้ตัวว่ากำลังถูกทดสอบและคิดอะไรที่ไม...

OpenAI เผยผู้ใช้นับแสนคน มีสัญญาณสุขภาพจิตขั้นวิกฤต! เร่งผนึก 170 ผู้เชี่ยวชาญ อัปเกรดโมเดลเพื่อรับมือบทสนทนาที่มีความเสี่ยง

OpenAI เปิดเผยข้อมูลผู้ใช้ ChatGPT 0.07% มีสัญญาณภาวะทางจิตที่น่าเป็นห่วง บริษัทเร่งอัปเดตโมเดลใหม่ (GPT-5) โดยร่วมมือกับผู้เชี่ยวชาญ 170 คน เพื่อลดการตอบสนองที่เป็นอันตรายลง 65-80...