AI Agent ของ Excel จาก Microsoft แสดงอัตราความแม่นยำ 57% ทำให้เกิดความกังวลเรื่องความน่าเชื่อถือของข้อมูล

ทีมชุมชน BigGo
AI Agent ของ Excel จาก Microsoft แสดงอัตราความแม่นยำ 57% ทำให้เกิดความกังวลเรื่องความน่าเชื่อถือของข้อมูล

Microsoft ได้เปิดตัว Agent Mode ใหม่สำหรับ Excel และ Word โดยสัญญาว่าจะเปลี่ยนแปลงวิธีที่ผู้ใช้สร้างสเปรดชีตและเอกสารที่ซับซ้อนผ่านความช่วยเหลือของ AI อย่างไรก็ตาม เมตริกประสิทธิภาพและการตอบสนองจากชุมชนเผยให้เห็นความกังวลที่สำคัญเกี่ยวกับความน่าเชื่อถือและการนำไปใช้งานจริง

ความพร้อมใช้งานของฟีเจอร์

  • Agent Mode (Excel/Word): พร้อมใช้งานแล้ววันนี้ในโปรแกรม Frontier
  • การรองรับแพลตฟอร์ม: เวอร์ชันเว็บในขั้นต้น การรองรับเดสก์ท็อปจะมาเร็วๆ นี้
  • คุณสมบัติ: ลูกค้า Microsoft 365 Copilot หรือผู้ใช้งาน Microsoft 365 Personal/Family
  • Office Agent: พร้อมใช้งานในสหรัฐอเมริกาเท่านั้นผ่านโปรแกรม Frontier

ความแม่นยำยังไม่เทียบเท่าประสิทธิภาพของมนุษย์

Agent Mode ใหม่ใน Excel ทำคะแนนได้ 57.2% ใน SpreadsheetBench ซึ่งเป็นมาตรฐานสำหรับประเมินความสามารถของ AI ในการทำงานกับสเปรดชีต แม้ว่าจะอยู่ข้างหน้าคู่แข่งอย่าง Shortcut.ai และ Excel agent ของ ChatGPT แต่ยังคงล้าหลังความแม่นยำของมนุษย์ที่ 71.3% อย่างมาก ช่องว่างนี้ทำให้เกิดคำถามว่าเทคโนโลยีนี้พร้อมสำหรับแอปพลิเคชันธุรกิจที่สำคัญซึ่งความแม่นยำมีความสำคัญที่สุดหรือไม่

ความกังวลเรื่องความแม่นยำจะกลายเป็นเรื่องเร่งด่วนมากขึ้นเมื่อพิจารณาบทบาทของ Excel ในการจัดการข้อมูลธุรกิจที่สำคัญทั่วโลก Microsoft ได้รับทราบความท้าทายนี้โดยการนำ validation loops มาใช้และให้ความมั่นใจว่าชีตที่สร้างโดย AI ยังคงสามารถตรวจสอบ รีเฟรช และตรวจสอบความถูกต้องได้

การเปรียบเทียบความแม่นยำของ Agent Mode Excel

  • Microsoft Agent Mode: 57.2%
  • ประสิทธิภาพของมนุษย์: 71.3%
  • Shortcut.ai: ต่ำกว่า 57.2%
  • ChatGPT Excel Agent: ต่ำกว่า 57.2%
  • Claude Files Opus 4.1: ต่ำกว่า 57.2%

ความสงสัยของชุมชนเกี่ยวกับ Vibe Working

ผู้เชี่ยวชาญด้านเทคโนโลยีได้แสดงปฏิกิริยาที่หลากหลายต่อแนวคิด vibe working ของ Microsoft บางคนมองว่าแนวทางนี้เรียบง่ายเกินไปสำหรับงานวิเคราะห์ที่ซับซ้อน ชุมชนได้เปรียบเทียบกับความคาดหวังที่ไม่สมจริง โดยเปรียบเทียบคำสั่งอย่าง do a full analysis & find me insights กับความสามารถคอมพิวเตอร์ enhance และ zoom ที่เป็นเรื่องแต่งใน Hollywood

อัตราผลตอบแทนตามโมเดลทางการเงินของเราเป็นเท่าไหร่? ให้ฉัน vibe คำตอบให้คุณนะ รอสักครู่

ความรู้สึกนี้สะท้อนถึงความกังวลที่กว้างขึ้นเกี่ยวกับว่า AI สามารถจัดการกับความต้องการที่มีความละเอียดอ่อนของการสร้างโมเดลทางการเงินและการวิเคราะห์ข้อมูลที่ผู้เชี่ยวชาญพึ่งพาในชีวิตประจำวันได้หรือไม่

' Agent Mode ' ใหม่ของ Microsoft เตือนผู้ใช้สำหรับการวิเคราะห์ข้อมูลขั้นสูงในขณะที่ทำให้เกิดความกังวลเกี่ยวกับประสิทธิภาพ
' Agent Mode ' ใหม่ของ Microsoft เตือนผู้ใช้สำหรับการวิเคราะห์ข้อมูลขั้นสูงในขณะที่ทำให้เกิดความกังวลเกี่ยวกับประสิทธิภาพ

ความท้าทายในการนำไปใช้ทางเทคนิค

ผู้ใช้ได้เน้นย้ำปัญหาพื้นฐานในการรวม AI เข้ากับเฟรมเวิร์กที่มีอยู่ของ Excel ไม่เหมือนกับระบบ version control ที่ให้การติดตามการเปลี่ยนแปลงที่ชัดเจน Excel ขาดความสามารถ diff ที่แข็งแกร่ง ทำให้ยากต่อการตรวจสอบการแก้ไขที่สร้างโดย AI ลักษณะที่เชื่อมต่อกันของข้อมูลสเปรดชีตหมายความว่าข้อผิดพลาดของ AI อาจส่งผลกระทบต่อเนื่องผ่านการคำนวณและการอ้างอิงหลายรายการ

สมาชิกชุมชนบางคนแนะนำว่าการรวม AI ที่มีประสิทธิภาพจะต้องมีการจินตนาการใหม่ทั้งหมดของสถาปัตยกรรมของ Excel พวกเขามองเห็นฟีเจอร์อย่าง structured dependency trees และการจัดการสถานะที่ดีกว่า คล้ายกับซอฟต์แวร์ 3D CAD ซึ่งจะทำให้การแทรกแซงของ AI โปร่งใสและควบคุมได้มากขึ้น

ฟีเจอร์ใหม่เหล่านี้ปัจจุบันมีให้ผ่านโปรแกรม Frontier ของ Microsoft สำหรับลูกค้า Copilot และผู้สมัครสมาชิก Personal/Family เริ่มต้นจำกัดเฉพาะเวอร์ชันเว็บ โดยมีแผนสนับสนุนเดสก์ท็อปในภายหลัง

อ้างอิง: Microsoft launches 'vibe working' in Excel and Word