Gemini 3 จาก Google กระแทกศึก AI ด้วยสมรรถนะทำลายสถิติและความสามารถในรูปแบบ Agent

ทีมบรรณาธิการ BigGo

Gemini 3 จาก Google กระแทกศึก AI ด้วยสมรรถนะทำลายสถิติและความสามารถในรูปแบบ Agent

ภูมิทัศน์ปัญญาประดิษฐ์ได้เผชิญกับการเปลี่ยนแปลงครั้งใหญ่กับการเปิดตัว Gemini 3 ของ Google ซึ่งเป็นโมเดลที่กุมความสนใจจากแวดวงอุตสาหกรรมได้ในทันทีด้วยสมรรถนะในการทดสอบมาตรฐานอันน่าประทับใจและความสามารถขั้นสูงในรูปแบบ Agent ที่เปิดตัวเมื่อวันที่ 19 พฤศจิกายน 2025 รุ่นล่าสุดนี้เป็นตัวแทนของสิ่งที่ Google อธิบายว่าเป็น "ยุคใหม่แห่งความฉลาด" ซึ่งเป็นการก้าวหน้าทาง AI ที่สำคัญที่สุดของบริษัทจนถึงปัจจุบัน และเป็นการกำหนดมาตรฐานใหม่ในด้านการให้เหตุใจ การทำความเข้าใจแบบมัลติโมดัล และการประยุกต์ใช้จริง

สมรรถนะทำลายสถิติในการทดสอบมาตรฐาน

Gemini 3 ได้แสดงความสามารถที่ไม่มีแบบอย่างมาก่อน across แพลตฟอร์มการประเมินหลายแห่ง สร้างความได้เปรียบที่ชัดเจนในด้านสำคัญต่างๆ บน LMArena ซึ่งเป็นแพลตฟอร์มประเมิน AI แบบ crowdsourced ที่มักถูกอธิบายว่าเป็น Billboard Hot 100 ของการจัดอันดับโมเดล AI นั้น Gemini 3 Pro ได้กลายเป็นโมเดลแรกที่ทำคะแนนทะลุประมาณ 1500 ในการจัดอันดับแบบข้อความ โมเดลนี้แสดงความแข็งแกร่งเป็นพิเศษในหมวดหมู่เชิงอาชีพ รวมถึงการเขียนโค้ด คณิตศาสตร์ และการเขียนเชิงสร้างสรรค์ โดยความสามารถด้านการเขียนโค้ดในรูปแบบ Agent ของมันมีรายงานว่าทำได้ดีกว่าโมเดลเขียนโค้ดเฉพาะทางชั้นนำอย่าง Claude 4.5 และ GPT-5.1 ในหลายกรณี ที่น่าประทับใจที่สุดอาจเป็นเรื่องที่ Gemini 3 ทำคะแนนได้เกือบสองเท่าของ GPT-5 Pro จาก OpenAI ในแบบทดสอบการให้เหตุใจที่ท้าทายอย่าง ARC-AGI-2 ขณะที่ดำเนินการด้วยต้นทุนต่องานเพียงหนึ่งในสิบ ซึ่งเป็นการท้าทายสมมติฐานเดิมๆ เกี่ยวกับขีดจำกัดของสมรรถนะโมเดล

การเปรียบเทียบประสิทธิภาพตามเกณฑ์มาตรฐานหลัก:

เกณฑ์มาตรฐานการให้เหตุผล ARC-AGI-2: Gemini 3 ทำคะแนนได้สูงเกือบสองเท่าของ OpenAI GPT-5 Pro ในขณะที่ทำงานด้วยต้นทุนเพียงหนึ่งในสิบต่องาน
เกณฑ์มาตรฐาน SimpleQA: Gemini 3 Pro ทำคะแนนได้สูงกว่าสองเท่าของ OpenAI GPT-5.1
กระดานคะแนนข้อความ LMArena: เป็นโมเดลแรกที่ทำคะแนนทะลุ ~1500 คะแนน
ความเข้าใจด้านภาพ: ประสิทธิภาพสูงสุดในบรรดาโมเดลคู่แข่ง
หมวดหมู่ทางอาชีพ: มีความได้เปรียบชัดเจนในด้านการเขียนโค้ด คณิตศาสตร์ และการเขียนเชิงสร้างสรรค์

ความสามารถขั้นสูงในรูปแบบ Agent และการประยุกต์ใช้ในโลกจริง

เหนือไปกว่าตัวเลขจากการทดสอบมาตรฐาน Gemini 3 ได้นำเสนอฟังก์ชันการทำงานในรูปแบบ Agent ที่ซับซ้อนซึ่งแสดงถึงการเปลี่ยนแปลงขั้นพื้นฐานจากการสนทนาของ AI ไปสู่ความฉลาดที่นำไปปฏิบัติได้จริง Gemini Agent ในตอนนี้สามารถจัดการงานหลายขั้นตอนได้โดยตรงภายในระบบนิเวศ Gemini โดยการวางแผนลำดับของการกระทำ เรียกใช้บริการที่เชื่อมต่อกันเช่น Gmail, Calendar และ Maps และกลับมาพร้อมกับการกระทำที่เสนอเพื่อขอการอนุมัติจากผู้ใช้ การสาธิตในช่วงแรกแสดงให้เห็นว่าระบบสามารถจัดลำดับขั้นงานที่ซับซ้อน เช่น การจัดการอีเมล – การจัดกลุ่มข้อความที่ยังไม่ได้อ่านเป็นกลุ่มที่ดำเนินการได้ การร่างคำตอบ การจัดลำดับความสำคัญของ RSVP และบิลต่างๆ – และการวางแผนการเดินทางแบบครบวงจรที่รวมข้อมูลจากอีเมลกับผลลัพธ์จากเว็บแบบเรียลไทม์เพื่อจัดโครงสร้าง itineraries ที่สมบูรณ์ ซึ่งเป็นการเปลี่ยนโฉม AI จากผู้ช่วยที่ตอบสนองเป็นสิ่งที่คล้ายคลึงกับผู้จัดการฝ่ายปฏิบัติการระดับต้นที่ทำงานอย่างอิสระในพื้นหลัง

ความก้าวหน้าทางการสร้างสรรค์และการพัฒนา

ความสามารถแบบมัลติโมดัลที่ได้รับการปรับปรุงของโมเดลนี้ทำให้เกิดการประยุกต์ใช้เชิงสร้างสรรค์และเทคนิคที่น่าทาย Gemini 3 สามารถเปลี่ยนรูปภาพเดียวให้เป็นโค้ดสำหรับประสบการณ์เว็บแบบอินเทอร์แอคทีฟได้ เช่น การแปลงภาพถ่ายสวนให้เป็นสภาพแวดล้อม 3 มิติที่สามารถสำรวจได้ ซึ่งผู้ใช้สามารถปลูกดอกไม้เสมือนจริงด้วยการคลิกง่ายๆ แพลตฟอร์ม Antigatform ใหม่ของ Google ทำหน้าที่เป็น "ศูนย์ควบคุมภารกิจ" สำหรับเอเจนต์เขียนโค้ด ซึ่งอนุญาตให้นักพัฒนาสามารถสร้าง จัดการ และสังเกตการณ์เอเจนต์ AI หลายตัวที่ทำงาน across ตัวแก้ไขโค้ด, เทอร์มินัล และเบราว์เซอร์ที่ฝังตัวอยู่ ซึ่งนี่เป็นการก้าวหน้าอย่างมีนัยสำคัญสู่การทำให้ส่วนใหญ่ของกระบวนการสร้างสรรค์และการพัฒนาทำงานอัตโนมัติ โดยที่การเขียนโค้ดจะกลายเป็นเรื่องของการระบุความตั้งใจมากกว่าการเขียนคำสั่งโดยละเอียด

ภาพรวมความสามารถของ Gemini 3:

โหมด Deep Think: ประสิทธิภาพที่เพิ่มขึ้นสำหรับงานเขียนโค้ดที่ซับซ้อนและใช้เวลานาน
Nano Banana Pro: ความสามารถขั้นสูงในการสร้างภาพ
Gemini Antigravity Platform: ศูนย์ควบคุมภารกิจสำหรับเอเจนต์ AI หลายตัว
ความเข้าใจหลายรูปแบบ: การสร้างโค้ดจากภาพสำหรับประสบการณ์แบบอินเทอร์แอคทีฟ
เวิร์กโฟลว์แบบเอเจนต์: การทำงานแบบหลายขั้นตอนข้ามบริการที่เชื่อมต่อกัน

การตอบรับจากอุตสาหกรรมและข้อจำกัดในทางปฏิบัติ

การตอบรับจากผู้เชี่ยวชาญต่อ Gemini 3 นั้นเป็นไปในทางบวกอย่างท่วมท้น โดยมีบุคคลสำคัญในแวดวงเทคโนโลยีแสดงความชื่นชม Marc Benioff ซีอีโอของ Salesforce อธิบายประสบการณ์ของเขาว่าเป็นการเปลี่ยนแปลง โดยระบุว่าหลังจากใช้ ChatGPT เป็นประจำทุกวันเป็นเวลาสามปี การใช้ Gemini 3 เพียงสองชั่วโมงก็เปลี่ยนทุกอย่างไปหมด โดยเขาชื่นชมในด้านการให้เหตุใจ ความเร็ว และความสามารถแบบมัลติโมดัลที่เหนือกว่า อย่างไรก็ตาม การทดสอบในโลกจริงเผยให้เห็นว่าในขณะที่ Gemini 3 ทำได้ดีในงานทั่วไป มันยังคงเผชิญกับความท้าทายในการประยุกต์ใช้เฉพาะทาง Cognita สตาร์ทอัพ AI ด้านรังสีวิทยา รายงานว่าโมเดลนี้ยังคงมีปัญหากับการระบุรอยร้าวซี่โครงที่ละเอียดอ่อนในภาพเอ็กซเรย์ทรวงอกและภาวะทางการแพทย์ที่พบไม่บ่อยได้อย่างถูกต้อง ซึ่งเป็นการเน้นย้ำช่องว่างระหว่างสมรรถนะในการทดสอบมาตรฐานกับประโยชน์ใช้สยในโลกจริงในการประยุกต์ใช้เฉพาะทางซึ่งมีกรณีขอบเขต (edge cases) มากมาย

เศรษฐกิจในรูปแบบ Agent ที่กำลังเกิดขึ้น

ความสามารถของ Gemini 3 เป็นสัญญาณของการเริ่มต้นของสิ่งที่ผู้สังเกตการณ์ในอุตสาหกรรมเรียกว่า "เศรษฐกิจในรูปแบบ Agent" ซึ่งระบบ AI สามารถสร้างซอฟต์แวร์ บริการ และแพลตฟอร์มด้วยความเร็วที่มนุษย์ไม่สามารถเทียบเคียงได้ตามลำพัง การพัฒนานี้สัญญาว่าจะลดอุปสรรคในการสร้างซอฟต์แวร์ลงอย่างมาก – ทำให้ผู้จัดการผลิตภัณฑ์สามารถสร้างแอปพลิเคชันที่ใช้งานได้ผ่านการร้องขอด้วยภาษาธรรมชาติ – ในขณะเดียวกันก็สร้างแรงกดดันทางการแข่งขันใหม่และความพึ่งพาโครงสร้างพื้นฐาน ความอุดมสมบูรณ์ของเครื่องมือที่สร้างได้ง่ายอาจท้าทายโมเดลธุรกิจซอฟต์แวร์แบบดั้งเดิม เนื่องจากมูลค่าเปลี่ยนจากการเป็นเจ้าของแอปพลิเคชันแบบคงที่ไปสู่การควบคุมข้อมูล แบรนด์ และระบบการประสานงานในระดับที่สูงขึ้น ข้อขัดแย้งนี้หมายความว่าการสร้างสรรค์ของแต่ละบุคคลจะง่ายขึ้น ในขณะที่การดำเนินงานนอกแพลตฟอร์ม AI หลักจะยากขึ้นเรื่อยๆ

ภูมิทัศน์การแข่งขันและผลกระทบในอนาคต

อุตสาหกรรม AI ยังคงดำเนินวงจรการพัฒนาที่ก้าวกระโดดอย่างรวดเร็วต่อไป โดยที่ OpenAI เปิดตัว GPT-5.1-Codex-Max ในวันหลังจาก Gemini 3 เปิดตัว ซึ่งโดยเห็นได้ชัดว่าเพื่อท้าทายตำแหน่งของมันบนมาตรฐานการทดสอบการเขียนโค้ด ผู้เชี่ยวชาญหลายคนรายงานว่าพวกเขาจะยังคงใช้โมเดลเฉพาะทางสำหรับความต้องการเฉพาะ – ใช้ Claude สำหรับการเขียนโค้ด, ChatGPT สำหรับการค้นหาทางเว็บ, GPT-5 Pro สำหรับการระดมสมองเชิงลึก – ในขณะที่นำ Gemini 3 มาใช้เป็นโมเดลพื้นฐานสำหรับงานผู้บริโภค across ด้านการสร้างสรรค์ ข้อความ และรูปภาพ ดังที่ Joel Hron CTO ของ Thomson Reuters ระบุไว้ สิ่งที่ทำให้การเปิดตัวของ Google แตกต่างคือการปรับปรุงที่สำคัญ across หลายมิติ แทนที่จะเป็นการก้าวหน้าแบบแยกส่วน ซึ่งทำให้เรื่องนี้เป็นมากกว่าแค่การอัปเดตทีละน้อยในศึกชิงความเป็นจ้าว AI ที่ยังคงดำเนินอยู่

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌