รายงานล่าสุดจาก The Information ที่ถูกอ้างถึงโดย Wccftech เมื่อวันที่ 4 มิถุนายน 2026 ระบุว่า Apple กำลังถอยจากแผนเดิมที่จะรันงานประมวลผล AI ของ Siri ใหม่บนเซิร์ฟเวอร์ของตนเองทั้งหมด โดยหันไปพึ่งพา Google Cloud สำหรับโมเดล Gemini ขนาดยักษ์ พร้อมเลือกใช้ฟีเจอร์การเข้ารหัสในตัวของ NVIDIA B200 GPU เป็นกลไกหลักในการปกป้องข้อมูลผู้ใช้ ทั้งนี้ ยังไม่มีการยืนยันอย่างเป็นทางการจาก Apple, Google หรือ NVIDIA แต่อย่างใด

Private Cloud Compute รองรับไม่ไหว — โมเดล Gemini ทะลุระดับล้านล้านพารามิเตอร์

ตามรายงานของ Wccftech ระบุว่า Siri เวอร์ชันใหม่จะขับเคลื่อนด้วยโมเดล Gemini แบบกำหนดเอง ซึ่ง Apple เรียกภายในว่า "Apple Foundation Models version 11" โดยก่อนหน้านี้ Apple เคยประกาศจุดยืนชัดเจนว่าการประมวลผล Generative AI ทั้งหมดจะดำเนินการอยู่บน Apple silicon เพื่อรักษามาตรฐานความเป็นส่วนตัวที่บริษัทยึดมั่นมาตลอด

อย่างไรก็ตาม โมเดล Gemini ที่ Apple ได้รับใบอนุญาตให้ใช้งานนั้นมีขนาดถึงระดับล้านล้านพารามิเตอร์ (trillions of parameters) ซึ่งเกินกว่าโครงสร้างพื้นฐาน "Private Cloud Compute" ของ Apple จะรองรับได้ ส่งผลให้คำขอจากผู้ใช้บางส่วนต้องถูกส่งไปประมวลผลโดยตรงบน Gemini ที่รันอยู่ใน Google Cloud เพื่อให้ได้ประสิทธิภาพการอนุมานที่เหมาะสมที่สุด

Mark Gurman นักวิเคราะห์จาก Bloomberg ระบุว่าโมเดลดังกล่าว "คาดว่าจะแข่งขันได้กับ Gemini 3 และมีความสามารถที่สูงขึ้นอย่างมีนัยสำคัญ" โดย Wccftech ชี้ว่าเกณฑ์เปรียบเทียบดังกล่าวคือโมเดลที่ขับเคลื่อน Siri เวอร์ชันปรับปรุงปัจจุบัน นอกจากนี้ Apple ยังใช้เทคนิค "การกลั่นกรอง" (distillation) เพื่อถ่ายทอดความสามารถจากโมเดลครูไปยังโมเดลขนาดเล็กที่ทำงานบนอุปกรณ์ ซึ่งในกรณีนี้ Gemini ที่ได้รับใบอนุญาตจาก Google ทำหน้าที่เป็นโมเดลครู

ทางออกประนีประนอม: พึ่งการเข้ารหัสระหว่างประมวลผลของ NVIDIA B200

The Information ตามที่ Wccftech อ้างถึง ระบุว่า Apple มีแนวโน้มจะเลือกติดตั้ง NVIDIA B200 GPU บนเซิร์ฟเวอร์ของ Google เพื่อบรรเทาความกังวลด้านความเป็นส่วนตัวจากการที่ Siri ต้องทำงานบนโครงสร้างพื้นฐานของ Google

เหตุผลหลักที่เลือก B200 อยู่ที่ความสามารถในการเข้ารหัสข้อมูลขณะประมวลผล (in-use encryption) ซึ่ง NVIDIA อธิบายไว้อย่างเป็นทางการว่า สามารถ "รักษาความลับและความสมบูรณ์ของโมเดล AI ที่ปรับใช้บน GPU ตระกูล Rubin, Blackwell และ Hopper" และ "รันงาน AI ที่มีความอ่อนไหวสูงในระดับขนาดใหญ่ได้อย่างปลอดภัย ด้วยประสิทธิภาพใกล้เคียงระดับเนทีฟ (near-native performance) แม้ในสภาพแวดล้อมแบบแชร์หรือคลาวด์"

แก่นของแนวทางนี้คือ แม้ตัวโมเดลจะทำงานในศูนย์ข้อมูลของ Google แต่ข้อมูลผู้ใช้ระหว่างการอนุมานจะถูกจัดการในสถานะที่เข้ารหัสภายใน GPU ทำให้ซอฟต์แวร์ฝั่ง Google ไม่สามารถเข้าถึงข้อมูลดิบได้

โครงสร้างใหม่ของ Siri: สามชั้นการประมวลผล

หากรายงานของ The Information เป็นความจริง ผู้ใช้จะยังคงเห็น Siri ใหม่ในฐานะผู้ช่วยที่ได้รับการปกป้องตามมาตรฐานความเป็นส่วนตัวของ Apple แต่เบื้องหลังจะมีโครงสร้างใหม่ ดังนี้

ชั้นการประมวลผลผู้รับผิดชอบบทบาท
โมเดลขนาดเล็กบนอุปกรณ์Apple siliconกลุ่มโมเดลขนาดเล็กที่ผ่านการกลั่นกรอง
การอนุมานบนคลาวด์NVIDIA B200 ใน Google Cloudโมเดล Gemini แบบกำหนดเอง ระดับล้านล้านพารามิเตอร์
การปกป้องความเป็นส่วนตัวฟีเจอร์เข้ารหัสในตัวของ B200 (Rubin / Blackwell / Hopper)เข้ารหัสข้อมูลใน GPU ระหว่างการอนุมาน

สิ่งที่ Apple ยอมถอยคือชิ้นส่วนสุดท้ายของแนวคิดเดิม นั่นคือการประมวลผลทั้งหมดบนโครงสร้างพื้นฐานของตนเอง แต่ยังคงพยายามรักษาคำมั่นด้านความเป็นส่วนตัวภายนอก ผ่านการเข้ารหัสที่รับประกันว่า Google จะไม่สามารถดูดเอาข้อมูลดิบของผู้ใช้ไปได้

ขนาดสัญญา 1,000 ล้านดอลลาร์ต่อปี — โมเดลแตะ 1.2 ล้านล้านพารามิเตอร์

ตัวเลขที่เกี่ยวข้องกับความร่วมมือระหว่าง Apple และ Google เริ่มปรากฏชัดขึ้นจากรายงานหลายแหล่ง ดังนี้

  • Apple เตรียมจ่ายเงินให้ Google ประมาณ 1,000 ล้านดอลลาร์ต่อปี (ราว 36,000 ล้านบาท)
  • โมเดล Gemini ที่ปรับแต่งเฉพาะสำหรับ Siri และ Apple Intelligence มีขนาด 1.2 ล้านล้านพารามิเตอร์
  • ขนาดดังกล่าวใหญ่กว่าโมเดลคลาวด์เดิมของ Apple ที่ 150,000 ล้านพารามิเตอร์ ราว 8 เท่า
  • ทั้งสองบริษัทได้ออกแถลงการณ์ร่วมในรูปแบบสัญญาหลายปี

ตัวเลข 1,000 ล้านดอลลาร์ต่อปี (US$1 billion ≈ 36,000 ล้านบาท) สะท้อนว่าแนวคิด Apple silicon เพียวๆ ที่ Apple เคยยึดถือนั้นไม่สามารถดำเนินต่อไปได้จริงในยุคที่โมเดล AI มีขนาดทะลุระดับล้านล้านพารามิเตอร์

การเข้ารหัสของ B200 ครอบคลุมทั้ง NVLink และเส้นทาง CPU-GPU

ฟีเจอร์ Confidential Computing ใน B200 ไม่ได้จำกัดอยู่เพียงการเข้ารหัสในหน่วยความจำของ GPU แต่ครอบคลุมการปกป้องแบบหลายชั้นทั่วทั้งระบบ

ในโหมด CC (Confidential Computing) ของ Blackwell ข้อมูลทุกอย่างในหน่วยความจำ GPU — รวมถึง model weights, ข้อมูลฝึก และผลลัพธ์การอนุมาน — จะถูกจัดการในสถานะที่เข้ารหัสทั้งหมด สำหรับการตั้งค่าแบบ multi-GPU passthrough การสื่อสารระหว่าง GPU ผ่าน NVLink ก็จะถูกเข้ารหัสด้วยฮาร์ดแวร์ และการรับส่งข้อมูลระหว่าง CPU กับ GPU จะดำเนินการผ่าน bounce buffer ที่เข้ารหัส

ยิ่งไปกว่านั้น กลไก Dual Remote Attestation จากทั้ง Intel TDX และ NVIDIA ทำให้สามารถยืนยันด้วยกระบวนการเข้ารหัสได้ว่า workload กำลังทำงานบนฮาร์ดแวร์ของแท้และโค้ดที่ไม่ถูกแก้ไข โดย Corvex ได้ประกาศแล้วว่าการนำ Confidential Computing บน HGX B200 มาใช้งานจริงในระดับ Production ได้เสร็จสมบูรณ์ ซึ่งเป็นสัญญาณว่าเทคโนโลยีนี้พร้อมใช้งานในระดับองค์กรแล้ว

นัยสำคัญต่อผู้ใช้ Apple ในประเทศไทย

สำหรับผู้ใช้ iPhone และผลิตภัณฑ์ Apple ในไทยที่ซื้อผ่าน Studio7, iStudio หรือ Power Buy การเปลี่ยนแปลงนี้ในเชิงประสบการณ์การใช้งานคาดว่าจะไม่มีผลต่างที่สังเกตได้ชัดเจน Siri ใหม่จะยังคงทำงานเหมือนเดิมจากมุมมองผู้ใช้ปลายทาง อย่างไรก็ตาม ประเด็นที่ผู้ใช้ในไทยควรจับตาคือ การเปิดให้บริการ Apple Intelligence อย่างเป็นทางการในประเทศไทยอาจขึ้นอยู่กับการขยายโครงสร้างพื้นฐาน Google Cloud ในภูมิภาคเอเชียตะวันออกเฉียงใต้ ซึ่งหากเป็นจริง อาจส่งผลต่อเวลาที่ Apple Intelligence จะพร้อมใช้งานในไทยอย่างเต็มรูปแบบ

ทั้งนี้ ข้อมูลทั้งหมดยังคงเป็นรายงานที่ยังไม่ได้รับการยืนยันจาก Apple, Google และ NVIDIA อย่างเป็นทางการ ผู้บริโภคควรรอประกาศอย่างเป็นทางการจาก Apple ก่อนตัดสินใจในระยะยาว

แหล่งที่มา