Google ได้เปิดตัวการปรับปรุงที่สำคัญสำหรับผู้ช่วย AI ชื่อ Gemini โดยนำเสนอความสามารถในการประมวลผล PDF อัจฉริยะ พร้อมกับการเปิดให้ใช้งานทั่วไปของตระกูลโมเดลล่าสุด 2.5 การอัปเดตเหล่านี้แสดงถึงการก้าวกระโดดที่สำคัญในเครื่องมือผลิตภาพที่ขับเคลื่อนด้วย AI โดยมอบการช่วยเหลือเชิงรุกมากขึ้นและประสิทธิภาพที่ดีขึ้นในแอปพลิเคชันต่างๆ
ปัญญาประดิษฐ์ PDF เชิงรุกเปลี่ยนแปลงขั้นตอนการทำงานกับเอกสาร
Gemini ขณะนี้สร้างการ์ดสรุปโดยอัตโนมัติเมื่อผู้ใช้เปิดไฟล์ PDF ที่เก็บไว้ใน Google Drive โดยไม่จำเป็นต้องขอสรุปด้วยตนเอง ผู้ช่วย AI นี้ทำได้มากกว่าการสรุปพื้นฐาน โดยแนะนำการดำเนินการถัดไปตามบริบท เช่น ร่างข้อเสนอตัวอย่าง หรือ จัดทำรายการคำถามสัมภาษณ์ตามประวัติย่อนี้ เมื่อผู้ใช้เลือกการดำเนินการที่แนะนำเหล่านี้ Gemini จะเปิดแผงด้านข้างที่สะดวกเพื่อดำเนินการตามคำขอทันที
การปรับปรุงนี้ช่วยปรับปรุงขั้นตอนการประมวลผลเอกสารอย่างมีนัยสำคัญ การทดสอบกับเอกสารทุนครอบคลุม 120 หน้าแสดงให้เห็นความสามารถของฟีเจอร์นี้ โดยบีบอัดข้อมูลที่ซับซ้อนให้เป็นสรุป 500 คำที่เข้าถึงได้ พร้อมจุดสำคัญ 8 ข้อ และให้คำแนะนำติดตามผลที่เกี่ยวข้อง ฟังก์ชันนี้รองรับ 20 ภาษาและผสานรวมเข้ากับอินเทอร์เฟซของ Google Drive ได้อย่างราบรื่น
ข้อมูลจำเพาะทางเทคนิค
- การรองรับการสรุป PDF: 20 ภาษา
- หน้าต่างบริบท ( Flash-Lite ): 1 ล้านโทเค็น
- ประสิทธิภาพการทดสอบ: เอกสาร 120 หน้า → สรุปเป็น 500 คำพร้อมหัวข้อย่อย 8 ข้อ
- รองรับการป้อนข้อมูลแบบหลายรูปแบบในทุกโมเดล 2.5
- การผสานรวมกับ Google Search และความสามารถในการรันโค้ด
ประสบการณ์การดู PDF ที่ปรับปรุงแล้วใน Drive
Google ได้ปรับปรุงวิธีการแสดง PDF ภายใน Drive โดยเปลี่ยนจากการเปิดเอกสารในแท็บเบราว์เซอร์ใหม่เป็นระบบแสดงตัวอย่างแบบซ้อน การเปลี่ยนแปลงนี้รักษาการเข้าถึง Gemini ผ่านแผงด้านข้างในขณะที่ผู้ใช้อยู่ในพื้นที่ทำงานหลัก ผู้ใช้ที่ต้องการวิธีการแบบแท็บก่อนหน้านี้สามารถปรับการตั้งค่านี้ผ่านการตั้งค่า Drive ได้
ฟีเจอร์สรุป PDF มุ่งเป้าไปที่ระดับการสมัครสมาชิกเฉพาะ รวมถึง Business Standard Plus, Enterprise Standard Plus, Google AI Pro และผู้สมัครสมาชิก Ultra รวมถึงผู้ใช้ที่มีส่วนเสริม Gemini Education หรือการสมัครสมาชิก Gemini Business และ Enterprise ที่มีอยู่
ความพร้อมใช้งานของฟีเจอร์สรุป PDF
- ผู้ใช้บริการ Business Standard Plus
- ผู้ใช้บริการ Enterprise Standard Plus
- ผู้ใช้บริการ Google AI Pro
- ผู้ใช้บริการ Ultra
- ผู้ใช้ Gemini Education add-on
- ผู้ใช้ Gemini Education Premium add-on
- ผู้ใช้ Gemini Business add-on
- ผู้ใช้ Gemini Enterprise add-on
โมเดล Gemini 2.5 บรรลุการใช้งานทั่วไป
หลังจากการทดสอบแสดงตัวอย่างสาธารณะหลายเดือน Google ได้เปิดตัวเวอร์ชันเสถียรของ Gemini 2.5 Pro และ Gemini 2.5 Flash อย่างเป็นทางการ โมเดลเหล่านี้สามารถเข้าถึงได้ผ่านแอป Gemini มือถือ, Google AI Studio และแพลตฟอร์ม Vertex AI ซึ่งเป็นการเปลี่ยนผ่านจากสถานะทดลองเป็นพร้อมใช้งานจริง
โมเดล Flash-Lite ใหม่ให้ความสำคัญกับประสิทธิภาพ
ควบคู่กับการเปิดตัวเวอร์ชันเสถียร Google ได้แนะนำ Gemini 2.5 Flash-Lite ในรูปแบบแสดงตัวอย่าง โดยวางตำแหน่งเป็นโมเดลที่ประหยัดต้นทุนและเร็วที่สุดในตระกูล 2.5 แม้ว่าจะไม่เทียบเท่าระดับประสิทธิภาพของ Pro หรือ Flash รุ่นมาตรฐาน แต่ Flash-Lite ให้ผลลัพธ์ที่เหนือกว่าเมื่อเปรียบเทียบกับรุ่นก่อนหน้า 2.0 ในด้านการเขียนโค้ด คณิตศาสตร์ วิทยาศาสตร์ การใช้เหตุผล และมาตรฐานมัลติโมดอล
โมเดล Flash-Lite เป็นเลิศในแอปพลิเคชันที่มีปริมาณสูงและต้องการความไวต่อเวลาแฝง เช่น งานแปลและการจำแนกประเภท โมเดลนี้รักษาหน้าต่างบริบทหนึ่งล้านโทเค็นที่น่าประทับใจและความสามารถในการรับข้อมูลมัลติโมดอล ในขณะที่เสนอต้นทุนการดำเนินงานที่ลดลงสำหรับนักพัฒนา โมเดลนี้ยังรองรับงบประมาณการคิด ช่วยให้ผู้ใช้เปิดใช้งานการใช้เหตุผลขั้นสูงโดยไม่ใช้โทเค็นมากเกินไป
การเปรียบเทียบโมเดล Gemini 2.5
โมเดล | สถานะ | คุณสมบัติเด่น | กรณีการใช้งานที่เหมาะสม |
---|---|---|---|
Gemini 2.5 Pro | พร้อมใช้งานทั่วไป | ประสิทธิภาพสูงสุด | งานที่ต้องใช้การใช้เหตุผลที่ซับซ้อน |
Gemini 2.5 Flash | พร้อมใช้งานทั่วไป | ประสิทธิภาพและความเร็วที่สมดุล | การใช้งานทั่วไปเพื่อเพิ่มประสิทธิภาพ |
Gemini 2.5 Flash-Lite | ตัวอย่าง | ประหยัดต้นทุนสูงสุด เร็วที่สุด | งานที่มีปริมาณสูงและต้องการความไวในการตอบสนอง |
การเข้าถึงที่กว้างขวางในทุกแพลตฟอร์ม
การอัปเดตเหล่านี้สะท้อนความมุ่งมั่นของ Google ในการทำให้ความสามารถ AI ขั้นสูงเข้าถึงได้และใช้งานได้จริงมากขึ้นในการใช้งานประจำวัน โมเดล Gemini 2.5 เสถียรมีให้บริการทุกที่ที่ผู้ใช้เข้าถึง Gemini ตามปกติ รวมถึงแอปพลิเคชันมือถือ iOS และ Android ในขณะที่นักพัฒนาสามารถทดลองกับ Flash-Lite ผ่านแพลตฟอร์ม Google AI Studio และ Vertex AI