OpenAI และ Jony Ive อดีตหัวหน้าฝ่ายดีไซน์ของ Apple กำลังเผชิญกับอุปสรรคทางเทคนิคที่สำคัญในการพัฒนาอุปกรณ์ AI แบบไร้หน้าจอที่มีความทะเยอทะยานสูง ซึ่งทำให้เกิดคำถามว่าผลิตภัณฑ์นี้จะสามารถทำตามสัญญาที่ให้ไว้ได้หรือไม่ การเข้าซื้อกิจการบริษัทของ Ive มูลค่า 6.5 พันล้านดอลลาร์สหรัฐในเดือนพฤษภาคม 2024 มีจุดประสงค์เพื่อนำความเชี่ยวชาญด้านการออกแบบของ Apple มาสู่ความทะเยอทะยานด้านฮาร์ดแวร์ของ OpenAI แต่ความเป็นจริงในการสร้างผู้ช่วย AI ที่ปฏิวัติวงการกลับพิสูจน์ให้เห็นว่าซับซ้อนกว่าที่คาดการณ์ไว้
อุปกรณ์นี้มีขนาดประมาณสมาร์ทโฟนแต่ไม่มีหน้าจอ มีเป้าหมายที่จะปฏิวัติวิธีที่ผู้ใช้โต้ตอบกับ AI ผ่านเสียงและเซนเซอร์ภาพ อย่างไรก็ตาม ชุมชนเทคโนโลยีกำลังแสดงความสงสัยอย่างจริงจังเกี่ยวกับทั้งความเป็นไปได้ทางเทคนิคและประโยชน์ใช้สอยในทางปฏิบัติของผลิตภัณฑ์ดังกล่าว
บริบทของตลาด:
- การเข้าซื้อกิจการบริษัทของ Jony Ive โดย OpenAI : 6.5 พันล้านดอลลาร์สหรัฐ (พฤษภาคม 2024)
- มูลค่าปัจจุบันของ OpenAI : 500 พันล้านดอลลาร์สหรัฐ
- ผลิตภัณฑ์คู่แข่ง: Amazon Echo / Alexa , Google Home , Humane AI pin ที่หยุดผลิตแล้ว
- ตลาดเป้าหมาย: การอัปเกรดลำโพงอัจฉริยะด้วยความสามารถ AI ขั้นสูง
พลังการประมวลผลสร้างปัญหาคอขวดใหญ่
หนึ่งในความท้าทายที่เร่งด่วนที่สุดที่โครงการนี้เผชิญคือความต้องการในการประมวลผลขนาดใหญ่ที่จำเป็นในการรันโมเดลขั้นสูงของ OpenAI บนอุปกรณ์ผู้บริโภค ต่างจาก Alexa ของ Amazon หรืออุปกรณ์ Home ของ Google ที่อาศัยเทคโนโลยีการรู้จำเสียงที่เรียบง่ายกว่า วิสัยทัศน์ของ OpenAI ต้องการพลังการประมวลผลที่มากกว่าอย่างมีนัยสำคัญ สิ่งนี้สร้างความกังวลทั้งเรื่องต้นทุนและอายุการใช้งานแบตเตอรี่ที่ทีมยังไม่สามารถแก้ไขได้
ลักษณะการทำงานตลอดเวลาของอุปกรณ์ทำให้ปัญหาเหล่านี้รุนแรงขึ้น ต่างจากลำโพงอัจฉริยะปัจจุบันที่เปิดใช้งานด้วยคำสั่งปลุก อุปกรณ์นี้จะตรวจสอบสภาพแวดล้อมอย่างต่อเนื่อง สร้างสิ่งที่บริษัทเรียกว่าความทรงจำตลอดทั้งวัน แนวทางนี้ทำให้เกิดคำถามทันทีเกี่ยวกับการใช้พลังงานและว่าเทคโนโลยีแบตเตอรี่ปัจจุบันสามารถรองรับการดำเนินงานที่เข้มข้นเช่นนี้ได้หรือไม่
ความท้าทายทางเทคนิค:
- ความต้องการพลังการประมวลผลสำหรับการรันโมเดล OpenAI
- อายุแบตเตอรี่สำหรับการทำงานตลอดเวลา
- การจัดการบุคลิกภาพ AI และการสนทนา
- ความกังวลเรื่องความเป็นส่วนตัวและการเก็บรวบรวมข้อมูล
- การขยายโครงสร้างพื้นฐานสำหรับการใช้งานผู้บริโภคจำนวนมาก
บุคลิกภาพ AI พิสูจน์ให้เห็นว่ายากอย่างน่าประหลาด
บางทีความท้าทายที่มากกว่าข้อจำกัดของฮาร์ดแวร์คือการกำหนดว่า AI ควรประพฤติตัวอย่างไรในการสนทนาในโลกแห่งความเป็นจริง ทีมพัฒนากำลังดิ้นรนกับคำถามพื้นฐานเกี่ยวกับเวลาที่อุปกรณ์ควรพูดขึ้นและเวลาที่ควรเงียบ การทำให้สมดุลนี้ผิดพลาดอาจส่งผลให้เกิดผู้ช่วยที่ขัดจังหวะตลอดเวลาหรือล้มเหลวในการช่วยเหลือเมื่อจำเป็น
บุคลิกภาพของโมเดลเป็นสิ่งที่ยากที่จะสร้างสมดุล มันไม่สามารถเป็นพวกประจบประแจงมากเกินไป ไม่ตรงไปตรงมาเกินไป ช่วยเหลือได้ แต่ไม่พูดต่อเนื่องในลูปป้อนกลับ
ชุมชนได้ชี้ให้เห็นว่าแม้แต่ระบบ AI ปัจจุบันอย่าง ChatGPT ยังดิ้นรนกับการรู้ว่าเมื่อไหร่ควรจบการสนทนา ทำให้อุปกรณ์ที่ฟังตลอดเวลาเป็นปัญหาเป็นพิเศษ ผู้ใช้ได้เปรียบเทียบแนวคิดนี้กับฟีเจอร์ Recall ที่ถูกโต้แย้งของ Microsoft โดยเน้นความกังวลด้านความเป็นส่วนตัวเกี่ยวกับการเฝ้าระวังอย่างต่อเนื่อง
การตรวจสอบความเป็นจริงของตลาดจากชุมชนเทค
การตอบสนองของชุมชนเทคโนโลยีมีความสงสัยอย่างเห็นได้ชัด โดยหลายคนตั้งคำถามว่าการเอาหน้าจอออกจริง ๆ แล้วปรับปรุงประสบการณ์ผู้ใช้หรือไม่ นักวิจารณ์โต้แย้งว่าหน้าจอยังคงเป็นวิธีที่มีประสิทธิภาพที่สุดในการสื่อสารข้อมูลที่ซับซ้อน และอินเทอร์เฟซที่ใช้เสียงเพียงอย่างเดียวกลายเป็นเรื่องน่าเบื่อสำหรับสิ่งใดก็ตามที่เกินกว่าคำสั่งง่าย ๆ
ความพยายามก่อนหน้านี้ในอุปกรณ์ AI แบบไร้หน้าจอส่วนใหญ่ล้มเหลวในตลาด Humane AI pin ถูกยกเลิก และ Friend AI pendant ได้รับการวิจารณ์ว่าน่าขนลุก ความล้มเหลวเหล่านี้บ่งชี้ว่าผู้บริโภคอาจยังไม่พร้อมสำหรับเพื่อน AI ที่เปิดใช้งานตลอดเวลา ไม่ว่าเทคโนโลยีจะซับซ้อนแค่ไหนก็ตาม
โครงการนี้ยังเผชิญกับความท้าทายในการแยกความแตกต่างจากลำโพงอัจฉริยะที่มีอยู่ในขณะที่ต้องแสดงให้เห็นถึงความคุ้มค่าของราคาพรีเมียมที่น่าจะเป็น ผู้ใช้หลายคนสังเกตว่าพวกเขาใช้ผู้ช่วยเสียงปัจจุบันอย่าง Siri ไม่เต็มที่ โดยใช้เป็นหลักสำหรับงานพื้นฐานอย่างการตั้งเวลามากกว่าการโต้ตอบที่ซับซ้อน
ข้อมูลจำเพาะของอุปกรณ์:
- ขนาด: เท่าฝ่ามือ ประมาณขนาดของสมาร์ทโฟน
- หน้าจอ: ไม่มีหน้าจอ
- การรับข้อมูล: กล้อง ไมโครโฟน เซ็นเซอร์สิ่งแวดล้อม
- การแสดงผล: ลำโพงสำหรับตอบกลับด้วยเสียง
- การทำงาน: ตรวจจับตลอดเวลา (ไม่ต้องใช้คำสั่งปลุก)
- การพกพา: ออกแบบสำหรับใช้บนโต๊ะ แต่สามารถพกพาได้
ความกังวลด้านความเป็นส่วนตัวเพิ่มขึ้น
ความสามารถในการบันทึกตลอดเวลาทำให้เกิดคำถามด้านความเป็นส่วนตัวที่สำคัญซึ่งขยายไปเกินกว่าเจ้าของอุปกรณ์ การบันทึกการสนทนาที่เกี่ยวข้องกับคนอื่น ๆ โดยไม่ได้รับความยินยอมอย่างชัดเจนอาจสร้างความซับซ้อนทางกฎหมายและสังคม ชุมชนได้แสดงความกังวลเป็นพิเศษเกี่ยวกับอุปกรณ์ที่บันทึกทุกคนรอบตัวคุณตลอดเวลา
ความท้าทายด้านความเป็นส่วนตัวเหล่านี้กลายเป็นเรื่องซับซ้อนยิ่งขึ้นเมื่อพิจารณาการใช้งานที่ตั้งใจไว้ของอุปกรณ์ในสถานการณ์ทางสังคมและการทำงานต่าง ๆ ต่างจากสมาร์ทโฟนที่ผู้ใช้เปิดใช้งานอย่างมีสติสำหรับการบันทึก ผู้ช่วย AI ที่ฟังตลอดเวลาทำให้เส้นแบ่งของความยินยอมและการเฝ้าระวังเบลอ
แม้จะมีความท้าทายเหล่านี้ OpenAI ยังคงจ้างผู้เชี่ยวชาญฮาร์ดแวร์จาก Apple และ Meta ทำงานกับผู้ผลิตจีนอย่าง Luxshare เพื่อนำอุปกรณ์สู่ตลาด อย่างไรก็ตาม อุปสรรคทางเทคนิคและสังคมที่เพิ่มขึ้นบ่งชี้ว่าไทม์ไลน์เดิมสำหรับการเปิดตัวในปี 2025 อาจมองในแง่ดีเกินไป ความสำเร็จของการลงทุนนี้อาจขึ้นอยู่กับว่า OpenAI สามารถแก้ปัญหาพื้นฐานที่รบกวนอุตสาหกรรมผู้ช่วยเสียงมานานหลายปีได้หรือไม่ ในขณะเดียวกันก็ต้องโน้มน้าวผู้บริโภคว่าพวกเขาต้องการโซลูชันสำหรับปัญหาที่พวกเขาอาจไม่รู้ตัวว่ามี
อ้างอิง: OpenAI, Jony Ive struggle with technical details on secretive new AI gadget