อุปกรณ์ AI แบบไร้หน้าจอของ OpenAI เผชิญอุปสรรคทางเทคนิคครั้งใหญ่ ขณะที่ชุมชนตั้งคำถามเรื่องความใช้งานได้จริง

ทีมชุมชน BigGo

อุปกรณ์ AI แบบไร้หน้าจอของ OpenAI เผชิญอุปสรรคทางเทคนิคครั้งใหญ่ ขณะที่ชุมชนตั้งคำถามเรื่องความใช้งานได้จริง

OpenAI และ Jony Ive อดีตหัวหน้าฝ่ายดีไซน์ของ Apple กำลังเผชิญกับอุปสรรคทางเทคนิคที่สำคัญในการพัฒนาอุปกรณ์ AI แบบไร้หน้าจอที่มีความทะเยอทะยานสูง ซึ่งทำให้เกิดคำถามว่าผลิตภัณฑ์นี้จะสามารถทำตามสัญญาที่ให้ไว้ได้หรือไม่ การเข้าซื้อกิจการบริษัทของ Ive มูลค่า 6.5 พันล้านดอลลาร์สหรัฐในเดือนพฤษภาคม 2024 มีจุดประสงค์เพื่อนำความเชี่ยวชาญด้านการออกแบบของ Apple มาสู่ความทะเยอทะยานด้านฮาร์ดแวร์ของ OpenAI แต่ความเป็นจริงในการสร้างผู้ช่วย AI ที่ปฏิวัติวงการกลับพิสูจน์ให้เห็นว่าซับซ้อนกว่าที่คาดการณ์ไว้

อุปกรณ์นี้มีขนาดประมาณสมาร์ทโฟนแต่ไม่มีหน้าจอ มีเป้าหมายที่จะปฏิวัติวิธีที่ผู้ใช้โต้ตอบกับ AI ผ่านเสียงและเซนเซอร์ภาพ อย่างไรก็ตาม ชุมชนเทคโนโลยีกำลังแสดงความสงสัยอย่างจริงจังเกี่ยวกับทั้งความเป็นไปได้ทางเทคนิคและประโยชน์ใช้สอยในทางปฏิบัติของผลิตภัณฑ์ดังกล่าว

บริบทของตลาด:

การเข้าซื้อกิจการบริษัทของ Jony Ive โดย OpenAI : 6.5 พันล้านดอลลาร์สหรัฐ (พฤษภาคม 2024)
มูลค่าปัจจุบันของ OpenAI : 500 พันล้านดอลลาร์สหรัฐ
ผลิตภัณฑ์คู่แข่ง: Amazon Echo / Alexa , Google Home , Humane AI pin ที่หยุดผลิตแล้ว
ตลาดเป้าหมาย: การอัปเกรดลำโพงอัจฉริยะด้วยความสามารถ AI ขั้นสูง

พลังการประมวลผลสร้างปัญหาคอขวดใหญ่

หนึ่งในความท้าทายที่เร่งด่วนที่สุดที่โครงการนี้เผชิญคือความต้องการในการประมวลผลขนาดใหญ่ที่จำเป็นในการรันโมเดลขั้นสูงของ OpenAI บนอุปกรณ์ผู้บริโภค ต่างจาก Alexa ของ Amazon หรืออุปกรณ์ Home ของ Google ที่อาศัยเทคโนโลยีการรู้จำเสียงที่เรียบง่ายกว่า วิสัยทัศน์ของ OpenAI ต้องการพลังการประมวลผลที่มากกว่าอย่างมีนัยสำคัญ สิ่งนี้สร้างความกังวลทั้งเรื่องต้นทุนและอายุการใช้งานแบตเตอรี่ที่ทีมยังไม่สามารถแก้ไขได้

ลักษณะการทำงานตลอดเวลาของอุปกรณ์ทำให้ปัญหาเหล่านี้รุนแรงขึ้น ต่างจากลำโพงอัจฉริยะปัจจุบันที่เปิดใช้งานด้วยคำสั่งปลุก อุปกรณ์นี้จะตรวจสอบสภาพแวดล้อมอย่างต่อเนื่อง สร้างสิ่งที่บริษัทเรียกว่าความทรงจำตลอดทั้งวัน แนวทางนี้ทำให้เกิดคำถามทันทีเกี่ยวกับการใช้พลังงานและว่าเทคโนโลยีแบตเตอรี่ปัจจุบันสามารถรองรับการดำเนินงานที่เข้มข้นเช่นนี้ได้หรือไม่

ความท้าทายทางเทคนิค:

ความต้องการพลังการประมวลผลสำหรับการรันโมเดล OpenAI
อายุแบตเตอรี่สำหรับการทำงานตลอดเวลา
การจัดการบุคลิกภาพ AI และการสนทนา
ความกังวลเรื่องความเป็นส่วนตัวและการเก็บรวบรวมข้อมูล
การขยายโครงสร้างพื้นฐานสำหรับการใช้งานผู้บริโภคจำนวนมาก

บุคลิกภาพ AI พิสูจน์ให้เห็นว่ายากอย่างน่าประหลาด

บางทีความท้าทายที่มากกว่าข้อจำกัดของฮาร์ดแวร์คือการกำหนดว่า AI ควรประพฤติตัวอย่างไรในการสนทนาในโลกแห่งความเป็นจริง ทีมพัฒนากำลังดิ้นรนกับคำถามพื้นฐานเกี่ยวกับเวลาที่อุปกรณ์ควรพูดขึ้นและเวลาที่ควรเงียบ การทำให้สมดุลนี้ผิดพลาดอาจส่งผลให้เกิดผู้ช่วยที่ขัดจังหวะตลอดเวลาหรือล้มเหลวในการช่วยเหลือเมื่อจำเป็น

บุคลิกภาพของโมเดลเป็นสิ่งที่ยากที่จะสร้างสมดุล มันไม่สามารถเป็นพวกประจบประแจงมากเกินไป ไม่ตรงไปตรงมาเกินไป ช่วยเหลือได้ แต่ไม่พูดต่อเนื่องในลูปป้อนกลับ

ชุมชนได้ชี้ให้เห็นว่าแม้แต่ระบบ AI ปัจจุบันอย่าง ChatGPT ยังดิ้นรนกับการรู้ว่าเมื่อไหร่ควรจบการสนทนา ทำให้อุปกรณ์ที่ฟังตลอดเวลาเป็นปัญหาเป็นพิเศษ ผู้ใช้ได้เปรียบเทียบแนวคิดนี้กับฟีเจอร์ Recall ที่ถูกโต้แย้งของ Microsoft โดยเน้นความกังวลด้านความเป็นส่วนตัวเกี่ยวกับการเฝ้าระวังอย่างต่อเนื่อง

การตรวจสอบความเป็นจริงของตลาดจากชุมชนเทค

การตอบสนองของชุมชนเทคโนโลยีมีความสงสัยอย่างเห็นได้ชัด โดยหลายคนตั้งคำถามว่าการเอาหน้าจอออกจริง ๆ แล้วปรับปรุงประสบการณ์ผู้ใช้หรือไม่ นักวิจารณ์โต้แย้งว่าหน้าจอยังคงเป็นวิธีที่มีประสิทธิภาพที่สุดในการสื่อสารข้อมูลที่ซับซ้อน และอินเทอร์เฟซที่ใช้เสียงเพียงอย่างเดียวกลายเป็นเรื่องน่าเบื่อสำหรับสิ่งใดก็ตามที่เกินกว่าคำสั่งง่าย ๆ

ความพยายามก่อนหน้านี้ในอุปกรณ์ AI แบบไร้หน้าจอส่วนใหญ่ล้มเหลวในตลาด Humane AI pin ถูกยกเลิก และ Friend AI pendant ได้รับการวิจารณ์ว่าน่าขนลุก ความล้มเหลวเหล่านี้บ่งชี้ว่าผู้บริโภคอาจยังไม่พร้อมสำหรับเพื่อน AI ที่เปิดใช้งานตลอดเวลา ไม่ว่าเทคโนโลยีจะซับซ้อนแค่ไหนก็ตาม

โครงการนี้ยังเผชิญกับความท้าทายในการแยกความแตกต่างจากลำโพงอัจฉริยะที่มีอยู่ในขณะที่ต้องแสดงให้เห็นถึงความคุ้มค่าของราคาพรีเมียมที่น่าจะเป็น ผู้ใช้หลายคนสังเกตว่าพวกเขาใช้ผู้ช่วยเสียงปัจจุบันอย่าง Siri ไม่เต็มที่ โดยใช้เป็นหลักสำหรับงานพื้นฐานอย่างการตั้งเวลามากกว่าการโต้ตอบที่ซับซ้อน

ข้อมูลจำเพาะของอุปกรณ์:

ขนาด: เท่าฝ่ามือ ประมาณขนาดของสมาร์ทโฟน
หน้าจอ: ไม่มีหน้าจอ
การรับข้อมูล: กล้อง ไมโครโฟน เซ็นเซอร์สิ่งแวดล้อม
การแสดงผล: ลำโพงสำหรับตอบกลับด้วยเสียง
การทำงาน: ตรวจจับตลอดเวลา (ไม่ต้องใช้คำสั่งปลุก)
การพกพา: ออกแบบสำหรับใช้บนโต๊ะ แต่สามารถพกพาได้

ความกังวลด้านความเป็นส่วนตัวเพิ่มขึ้น

ความสามารถในการบันทึกตลอดเวลาทำให้เกิดคำถามด้านความเป็นส่วนตัวที่สำคัญซึ่งขยายไปเกินกว่าเจ้าของอุปกรณ์ การบันทึกการสนทนาที่เกี่ยวข้องกับคนอื่น ๆ โดยไม่ได้รับความยินยอมอย่างชัดเจนอาจสร้างความซับซ้อนทางกฎหมายและสังคม ชุมชนได้แสดงความกังวลเป็นพิเศษเกี่ยวกับอุปกรณ์ที่บันทึกทุกคนรอบตัวคุณตลอดเวลา

ความท้าทายด้านความเป็นส่วนตัวเหล่านี้กลายเป็นเรื่องซับซ้อนยิ่งขึ้นเมื่อพิจารณาการใช้งานที่ตั้งใจไว้ของอุปกรณ์ในสถานการณ์ทางสังคมและการทำงานต่าง ๆ ต่างจากสมาร์ทโฟนที่ผู้ใช้เปิดใช้งานอย่างมีสติสำหรับการบันทึก ผู้ช่วย AI ที่ฟังตลอดเวลาทำให้เส้นแบ่งของความยินยอมและการเฝ้าระวังเบลอ

แม้จะมีความท้าทายเหล่านี้ OpenAI ยังคงจ้างผู้เชี่ยวชาญฮาร์ดแวร์จาก Apple และ Meta ทำงานกับผู้ผลิตจีนอย่าง Luxshare เพื่อนำอุปกรณ์สู่ตลาด อย่างไรก็ตาม อุปสรรคทางเทคนิคและสังคมที่เพิ่มขึ้นบ่งชี้ว่าไทม์ไลน์เดิมสำหรับการเปิดตัวในปี 2025 อาจมองในแง่ดีเกินไป ความสำเร็จของการลงทุนนี้อาจขึ้นอยู่กับว่า OpenAI สามารถแก้ปัญหาพื้นฐานที่รบกวนอุตสาหกรรมผู้ช่วยเสียงมานานหลายปีได้หรือไม่ ในขณะเดียวกันก็ต้องโน้มน้าวผู้บริโภคว่าพวกเขาต้องการโซลูชันสำหรับปัญหาที่พวกเขาอาจไม่รู้ตัวว่ามี

อ้างอิง: OpenAI, Jony Ive struggle with technical details on secretive new AI gadget

ข่าวที่เกี่ยวข้อง

‌

‌
‌

‌

‌
‌

‌