Anthropic เปิดตัว Claude Opus 4.8 อย่างเป็นทางการเมื่อวันที่ 28 พฤษภาคม 2026 โดยโมเดลใหม่นี้ทำคะแนน SWE-Bench Pro ได้ 69.2% และมาพร้อม fast mode ที่เร็วกว่ารุ่นก่อนถึง 2.5 เท่า ขณะที่ค่าบริการในโหมดดังกล่าวลดลงเหลือเพียง 1 ใน 3 ของราคาเดิม ถือเป็นการอัปเดตที่น่าจับตาสำหรับนักพัฒนาและองค์กรที่ใช้งาน AI เชิงเอเจนต์

SWE-Bench Pro 69.2% — เหนือกว่า GPT-5.5 และ Gemini 3.1 Pro ในหลายเกณฑ์

ตามผลการประเมินภายในของ Anthropic Claude Opus 4.8 ทำคะแนน SWE-Bench Pro ได้ 69.2% และสามารถแซงหน้าทั้ง GPT-5.5 และ Gemini 3.1 Pro ในหลายเกณฑ์การทดสอบ บริษัทระบุว่าโมเดลนี้ได้รับการปรับปรุงในด้านการเขียนโค้ดเชิงเอเจนต์ การอนุมานข้ามหลายโดเมน การควบคุมคอมพิวเตอร์แบบอัตโนมัติ งานด้านความรู้ และการวิเคราะห์การเงินเชิงเอเจนต์

อย่างไรก็ตาม Anthropic ยอมรับอย่างตรงไปตรงมาว่าในเกณฑ์การเขียนโค้ดผ่าน terminal โดยตรง GPT-5.5 ยังคงนำอยู่ ดังนั้นการเลือกใช้งานควรพิจารณาตามบริบท กล่าวคือหากต้องการความสามารถรอบด้าน Opus 4.8 เป็นตัวเลือกที่แข็งแกร่ง แต่หากเน้นงาน terminal-based coding โดยเฉพาะ GPT-5.5 ยังคงเป็นคู่แข่งที่ต้องพิจารณา

รายการClaude Opus 4.8
SWE-Bench Pro69.2% (เหนือกว่า GPT-5.5 และ Gemini 3.1 Pro ตามการประเมินของ Anthropic)
Terminal CodingGPT-5.5 ยังนำอยู่
ความเร็ว fast modeเร็วขึ้น 2.5 เท่าเทียบรุ่นก่อน
ค่าบริการ fast modeลดลงเหลือ 1 ใน 3 ของราคาเดิม

"ความซื่อสัตย์" ที่ดีขึ้น — โอกาสมองข้ามข้อบกพร่องในโค้ดลดลง 4 เท่า

นอกเหนือจากตัวเลขประสิทธิภาพ Anthropic ยังเน้นย้ำการพัฒนาด้าน honesty หรือ "ความซื่อสัตย์" ของโมเดล ผู้ทดสอบในช่วงแรกรายงานว่า Opus 4.8 มีความน่าเชื่อถือสูงขึ้นและมีการตัดสินใจที่คมชัดขึ้นในงานเชิงเอเจนต์

ผลการประเมินภายในระบุว่าโอกาสที่ Opus 4.8 จะมองข้ามข้อบกพร่องในโค้ดที่ตัวเองเขียนโดยไม่แจ้งให้ทราบลดลงเหลือเพียง 1 ใน 4 เมื่อเทียบกับ Opus 4.7 รุ่นก่อนหน้า ในด้าน alignment โมเดลใหม่ยังแสดงคุณสมบัติ prosocial ในระดับสูงสุดใหม่ ขณะที่อัตราการเกิดพฤติกรรมหลอกลวงต่ำกว่า Opus 4.7 และอยู่ในระดับเดียวกับ Claude Mythos Preview

สำหรับทีมพัฒนาที่มอบหมายงานเขียนโค้ดให้ AI ดูแล การลดลงของอัตราการมองข้ามข้อบกพร่องนี้มีนัยสำคัญต่อการลดภาระในขั้นตอน code review อย่างเป็นรูปธรรม

ฟีเจอร์ใหม่ 3 รายการ — Dynamic Workflows, Effort Control และ Messages API

พร้อมกับการเปิดตัวโมเดล Anthropic ได้เพิ่มฟีเจอร์ใหม่ 3 รายการดังนี้

Dynamic Workflows (Research Preview) ใช้งานได้เฉพาะใน Claude Code สำหรับแพลน Enterprise, Team และ Max เท่านั้น ฟีเจอร์นี้ช่วยให้ Claude วางแผนงานก่อน จากนั้นรัน sub-agent หลายร้อยตัวพร้อมกันภายใน session เดียว เหมาะสำหรับงานขนาดใหญ่ เช่น การย้าย codebase ที่มีโค้ดหลายแสนบรรทัด

Effort Control ใช้งานได้บน Claude.ai และ Cowork ช่วยให้ผู้ใช้ปรับระดับ "ความพยายาม" ที่ Claude ใช้ในการตอบสนอง หากตั้งค่าต่ำจะได้รับคำตอบเร็วขึ้นและใช้ rate limit น้อยลง โดยค่าเริ่มต้นของ Opus 4.8 ถูกตั้งไว้ที่ระดับ high เพื่อสมดุลระหว่างคุณภาพและประสบการณ์ใช้งาน

Messages API นักพัฒนาสามารถแทรก system entry ลงใน messages array ได้แล้ว ทำให้สามารถอัปเดตคำสั่งให้ Claude ระหว่างที่งานกำลังดำเนินอยู่ได้โดยไม่ต้องเริ่ม session ใหม่

ราคาคงเดิม — ยกเว้น Fast Mode ที่ถูกลงอย่างมีนัยสำคัญ

ค่าบริการสำหรับการใช้งานปกติยังคงเท่ากับ Opus 4.7 ทุกประการ ส่วน fast mode เท่านั้นที่ปรับลดลงเหลือ 1 ใน 3 ของราคาเดิม ผู้ใช้ที่เข้าถึงผ่าน Claude.ai หรือ API มาตรฐานจึงได้รับประโยชน์จากคุณภาพที่ดีขึ้นโดยไม่มีค่าใช้จ่ายเพิ่มเติม

Anthropic ยังระบุด้วยว่ากำลังพัฒนาโมเดลที่มีความสามารถเทียบเท่า Opus 4.8 ในราคาที่ต่ำกว่า รวมถึงโมเดลระดับใหม่ที่มีความฉลาดเกินกว่า Opus ซึ่งคาดว่าจะเปิดตัวในอนาคต

Claude Mythos — คาดเปิดให้ใช้งานทั่วไปภายในไม่กี่สัปดาห์

โมเดล Claude Mythos ที่ขณะนี้อยู่ในช่วงทดสอบกับองค์กรจำนวนจำกัด มีแนวโน้มจะเปิดให้ลูกค้าทุกรายเข้าถึงได้ "ภายในไม่กี่สัปดาห์" ตามที่ Anthropic ระบุ ทั้งนี้เป็นเพียงการคาดการณ์ของบริษัท ยังไม่ใช่กำหนดการที่ยืนยันแล้ว

เนื่องจาก Opus 4.8 มีผล alignment evaluation อยู่ในระดับเดียวกับ Claude Mythos Preview การทดลองใช้ Opus 4.8 ในช่วงนี้จึงอาจให้ภาพคร่าวๆ ของพฤติกรรมที่คาดหวังได้จาก Mythos เมื่อเปิดตัวจริง

สำหรับนักพัฒนาและองค์กรในไทยที่ใช้งาน Claude ผ่าน API หรือแพลตฟอร์ม Claude.ai อยู่แล้ว การอัปเดตครั้งนี้ถือว่าคุ้มค่าในการทดสอบทันที โดยเฉพาะในงานที่ต้องการความแม่นยำสูงและการตรวจสอบโค้ดอัตโนมัติ ส่วนผู้ที่สนใจ Dynamic Workflows ควรตรวจสอบก่อนว่าองค์กรมีสัญญาในแพลน Enterprise, Team หรือ Max หรือไม่

แหล่งที่มา