โปรแกรมอ่านหนังสือดิจิทัลแบบ terminal ชื่อ Lue ได้จุดประกายการสนทนาที่น่าสนใจในหมู่ผู้ใช้งานรุ่นแรกที่กำลังผลักดันขีดจำกัดของสิ่งที่เป็นไปได้กับประสบการณ์การอ่านผ่าน command-line แม้ว่าโครงการนี้จะถูกออกแบบมาโดยคำนึงถึงความสามารถในการแปลงข้อความเป็นเสียงเป็นหลัก แต่ผู้ใช้กำลังค้นพบวิธีการสร้างสรรค์เพื่อปรับปรุงประสบการณ์การอ่านด้วยสายตาและขอการปรับปรุงที่เป็นประโยชน์
รูปแบบไฟล์ที่รองรับ:
- EPUB, PDF, TXT, DOCX, DOC, HTML, RTF, Markdown
- รวมถึงการตรวจจับรูปแบบไฟล์อัตโนมัติ
![]() |
---|
โลโก้สมัยใหม่ของ Lue ที่เป็นสัญลักษณ์ของแนวทางนวัตกรรมในการสร้างประสบการณ์การอ่านผ่าน command-line |
การค้นพบฟอนต์ความกว้างแปรผันเปลี่ยนประสบการณ์การอ่าน
หนึ่งในการพัฒนาที่น่าตื่นเต้นที่สุดมาจากผู้ใช้ที่ทดลองใช้ฟอนต์ความกว้างแปรผันใน terminal emulator สมาชิกชุมชนคนหนึ่งค้นพบว่าการกำหนดค่า terminal ของพวกเขาด้วยฟอนต์ความกว้างแปรผันและการแก้ไขโค้ดเพียงสองบรรทัดเพื่อลบขอบด้านข้าง Lue สามารถดูคล้ายกับโปรแกรมอ่าน ePub แบบดั้งเดิมได้อย่างน่าทึ่ง การค้นพบนี้ท้าทายสมมติฐานที่ว่าการอ่านแบบ terminal จะต้องจำกัดอยู่กับฟอนต์ monospace เปิดโอกาสใหม่สำหรับประสบการณ์การอ่านที่ดูน่าสนใจมากขึ้น
การแก้ไขนี้เกี่ยวข้องกับการใช้ Rich Panel โดยไม่มีขอบด้านข้าง ซึ่งทำให้ข้อความไหลได้อย่างเป็นธรรมชาติมากขึ้นเมื่อแสดงผลด้วยฟอนต์แบบสัดส่วน การค้นพบนี้แสดงให้เห็นว่าโครงการโอเพ่นซอร์สสามารถพัฒนาผ่านการทดลองและการร่วมมือของชุมชนได้อย่างไร
ผู้ใช้ผลักดันให้มีฟังก์ชันการทำงานที่ดีขึ้น
ผู้ใช้รุ่นแรกกำลังขอฟีเจอร์ที่จะทำให้ Lue เป็นประโยชน์มากขึ้นสำหรับการใช้งานประจำวัน การควบคุมอัตราการพูดได้กลายเป็นคำขอที่มีความสำคัญจากผู้ใช้ที่ต้องการปรับแต่งประสบการณ์เสียงของพวกเขา นอกจากนี้ ผู้ใช้ยังขอให้มีการเปิดหนังสืออัตโนมัติโดยไม่ต้องระบุ file path ทุกครั้ง พร้อมกับฟังก์ชันประวัติการอ่าน
มันจะยอดเยี่ยมมากถ้ามีการควบคุมอัตราการพูด
ชุมชนยังแนะนำให้ใช้เฟรมเวิร์ก terminal UI ที่ซับซ้อนมากขึ้นอย่าง Textual Python Terminal เพื่อสร้างอินเทอร์เฟซเชิงโต้ตอบมากขึ้นที่อาจดึงดูดผู้ใช้ที่คุ้นเคยกับอินเทอร์เฟซแบบกราฟิก
ตัวเลือก TTS ที่มีให้บริการ:
- Edge TTS (ค่าเริ่มต้น ต้องการการเชื่อมต่ออินเทอร์เน็ต)
- Kokoro TTS (สามารถใช้งานแบบภายในเครื่อง/ออฟไลน์ได้)
- สถาปัตยกรรมแบบโมดูลาร์สำหรับโมเดลเพิ่มเติม
ความท้าทายทางเทคนิคและการแก้ไข
ผู้ใช้ได้ระบุปัญหาทางเทคนิคหลายประการระหว่างการทดสอบ บางคนพบปัญหากับ keyboard shortcuts โดยเฉพาะ shortcut t ที่ทำให้การเล่นเสียงหยุดตอบสนอง โครงการยังเผชิญกับความท้าทายในการจัดการ dependency โดยผู้ใช้บางคนต้องการให้เครื่องมือทั้งหมดสามารถติดตั้งภายในสภาพแวดล้อม Python ที่แยกออกมาแทนที่จะต้องการ package ระดับระบบอย่าง espeak และ antiword
ความเข้ากันได้ของเวอร์ชัน Python ได้กลายเป็นปัญหาอีกประการหนึ่ง โดยโครงการต้องการ Python 3.10 ขึ้นไปเนื่องจาก dependency ของ Kokoro TTS แม้ว่าในตอนแรกจะระบุการรองรับ Python 3.8
การควบคุมแป้นพิมพ์หลัก:
q
- ออกและบันทึกความคืบหน้าp
- หยุดชั่วคราว/เล่นต่อ TTSa
- เปิด/ปิดโหมดเลื่อนอัตโนมัติt
- เน้นประโยคบนสุดh/j
- นำทางย่อหน้าj/k
- นำทางประโยคl/m
- ข้ามหน้าเต็ม
ความหวังอย่างระมัดระวังจากชุมชน
แม้จะมีความกระตือรือร้น แต่ผู้ใช้บางคนกำลังใช้แนวทางที่รอบคอบในการใช้งาน โครงการนี้มาจากบัญชีนักพัฒนาใหม่ ทำให้สมาชิกชุมชนบางคนตรวจสอบโค้ด Python ประมาณ 2,500 บรรทัดอย่างระมัดระวังก่อนการใช้งานเต็มรูปแบบ แนวทางที่ระมัดระวังนี้สะท้อนถึงความตระหนักของชุมชนเกี่ยวกับการพิจารณาด้านความปลอดภัยเมื่อลองใช้เครื่องมือใหม่
นักพัฒนาได้ตอบสนองต่อความคิดเห็น รับทราบปัญหาและสัญญาว่าจะแก้ไข พวกเขายังได้แบ่งปันข้อมูลเชิงลึกเกี่ยวกับกระบวนการพัฒนาของพวกเขา รวมถึงการใช้เครื่องมือ AI เพื่อช่วยในการพอร์ต TTS model อื่น ๆ ให้ทำงานกับสถาปัตยกรรมแบบโมดูลาร์ของ Lue
ความต้องการของระบบ:
- Python 3.10+ (แก้ไขจากที่ระบุไว้เดิมคือ 3.8+)
- FFmpeg (จำเป็นสำหรับการประมวลผลเสียง)
- เพิ่มเติม: espeak, antiword สำหรับฟังก์ชันการทำงานที่ปรับปรุงแล้ว
- รองรับข้ามแพลตฟอร์ม: macOS, Linux, Windows
บทสรุป
Lue แสดงถึงจุดตัดที่น่าสนใจระหว่างเครื่องมือ command-line แบบดั้งเดิมและฟีเจอร์การเข้าถึงสมัยใหม่ แม้ว่าจะยังอยู่ในช่วงการพัฒนาเริ่มต้น แต่การมีส่วนร่วมของชุมชนที่กระตือรือร้นและการแก้ปัญหาอย่างสร้างสรรค์บ่งชี้ว่าโครงการนี้มีศักยภาพที่จะสร้างช่องทางเฉพาะสำหรับผู้ใช้ที่ชอบ workflow แบบ terminal แต่ไม่ต้องการเสียสละความสะดวกสบายในการอ่านหรือความสามารถด้านเสียง