RisingWave ได้รับความสนใจเพิ่มขึ้นเมื่อนักพัฒนาแสวงหาทางเลือกที่ง่ายกว่าสำหรับการประมวลผลสตรีมที่ซับซ้อน

ทีมชุมชน BigGo
RisingWave ได้รับความสนใจเพิ่มขึ้นเมื่อนักพัฒนาแสวงหาทางเลือกที่ง่ายกว่าสำหรับการประมวลผลสตรีมที่ซับซ้อน

ภูมิทัศน์การประมวลผลสตรีมกำลังเห็นความสนใจที่เพิ่มขึ้นใน RisingWave แพลตฟอร์มที่เข้ากันได้กับ PostgreSQL ซึ่งสัญญาว่าจะทำให้การวิเคราะห์ข้อมูลแบบเรียลไทม์ง่ายขึ้น ขณะที่องค์กรต่างๆ ต่อสู้กับไปป์ไลน์ข้อมูลที่ซับซ้อนมากขึ้น นักพัฒนากำลังหารือกันอย่างแข็งขันว่าผู้เข้าร่วมใหม่รายนี้สามารถทำตามสัญญาของการประมวลผลสตรีมที่ง่ายขึ้นโดยไม่สูญเสียประสิทธิภาพได้หรือไม่

คุณสมบัติหลักของ RisingWave:

  • อินเทอร์เฟซ SQL ที่เข้ากันได้กับ PostgreSQL และอินเทอร์เฟซ Python แบบ DataFrame
  • ความสามารถในการรับข้อมูล: หลายล้านเหตุการณ์ต่อวินาที
  • การจัดเก็บข้อมูล: การจัดเก็บหลักแบบ S3 พร้อมแคชดิสก์แบบยืดหยุ่น
  • การรวมระบบ: รองรับ Apache Iceberg แบบเนทีฟ
  • การติดตั้ง: มีให้ใช้แบบสแตนด์อโลน, Docker, Kubernetes หรือบริการคลาวด์แบบจัดการ
ภาพหน้าจอของ repository GitHub ของ RisingWave ที่แสดงการมีส่วนร่วมที่กระตือรือร้นและรายละเอียดของโครงการ
ภาพหน้าจอของ repository GitHub ของ RisingWave ที่แสดงการมีส่วนร่วมที่กระตือรือร้นและรายละเอียดของโครงการ

ประสบการณ์การใช้งานจริงยังคงมีจำกัดแม้จะมีความสนใจเพิ่มขึ้น

ความกังวลที่เร่งด่วนที่สุดในหมู่ผู้ที่อาจนำไปใช้คือการขาดรายงานประสบการณ์การใช้งานจริงอย่างแพร่หลาย แม้ว่า RisingWave จะนำเสนอคุณสมบัติทางเทคนิคที่น่าสนใจ แต่นักพัฒนายังระมัดระวังเกี่ยวกับการใช้งานโซลูชันโดยไม่มีการตรวจสอบในโลกแห่งความเป็นจริงอย่างเพียงพอ อย่างไรก็ตาม ผู้ใช้งานในระยะแรกบางรายเริ่มแบ่งปันประสบการณ์ของตน โดยผู้ใช้รายงานการปรับใช้ที่ประสบความสำเร็จสำหรับการดำเนินการ SQL แบบสตรีมและแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ที่เรียกใช้การกระทำตามการมีอยู่หรือไม่มีข้อมูล

การปรากฏตัวที่ค่อนข้างใหม่ของแพลตฟอร์มหมายความว่ากรณีศึกษาที่ครอบคลุมและรายงานความเสถียรระยะยาวยังคงอยู่ในระหว่างการพัฒนา สิ่งนี้สร้างปัญหาคลาสสิกของผู้ใช้งานในระยะแรกที่องค์กรต้องชั่งน้ำหนักผลประโยชน์ที่อาจเกิดขึ้นกับความเสี่ยงของการใช้งานเทคโนโลยีที่ได้รับการพิสูจน์น้อยกว่า

การจัดตำแหน่งการแข่งขันกับโซลูชันที่มีอยู่

RisingWave เผชิญการเปรียบเทียบกับผู้เล่นที่มีชื่อเสียงหลายรายในพื้นที่การประมวลผลสตรีม นักพัฒนามักกล่าวถึง Materialize เป็นคู่แข่งโดยตรง แม้ว่าความพร้อมใช้งานหลักของ Materialize ในรูปแบบ SaaS เท่านั้นจะสร้างโอกาสสำหรับทางเลือกที่โฮสต์เอง องค์กรบางแห่งกำลังประสบความสำเร็จกับโซลูชันที่ง่ายกว่าเช่น materialized views ของ ClickHouse ซึ่งให้การตั้งค่าที่ง่ายกว่าแม้จะมีความสามารถที่อาจซับซ้อนน้อยกว่า

materialized views ของ ClickHouse ยอดเยี่ยมเพราะคุณไม่จำเป็นต้องเป็นผู้เชี่ยวชาญในการใช้งาน และแม้กระนั้น ประสิทธิภาพยังคงดีมาก

การเลือกมักจะขึ้นอยู่กับการสร้างสมดุลระหว่างความหลากหลายของคุณสมบัติกับความซับซ้อนในการดำเนินงาน ในขณะที่ RisingWave เสนอความสามารถการประมวลผลสตรีมขั้นสูง ทีมบางทีมชอบโซลูชันที่ต้องการความรู้เฉพาะทางน้อยกว่าในการบำรุงรักษา

ทางเลือกคู่แข่งที่กล่าวถึง:

  • Materialize: คู่แข่งโดยตรง ให้บริการแบบ SaaS เป็นหลัก
  • ClickHouse: materialized views ที่เรียบง่าย ติดตั้งง่าย
  • Apache Flink: stream processing ที่มีชื่อเสียงพร้อมรองรับ SQL
  • Timescale: continuous aggregates ที่มีประสิทธิภาพดี

กรณีการใช้งานนอกเหนือจากการวิเคราะห์แบบดั้งเดิม

การหารือเผยให้เห็นการประยุกต์ใช้ที่น่าสนใจนอกเหนือจากการวิเคราะห์แบบเรียลไทม์มาตรฐาน องค์กรกำลังสำรวจ RisingWave สำหรับการบำรุงรักษาวิวแบบเพิ่มหน่วย การแทนที่งานประมวลผลแบบแบทช์ที่มีราคาแพงด้วยการอัปเดตแบบต่อเนื่อง และการสร้างระบบที่ขับเคลื่อนด้วยเหตุการณ์สำหรับการตรวจจับการฉ้อโกงและการตรวจสอบความผิดปกติ ความเข้ากันได้ของ PostgreSQL ทำให้แพลตฟอร์มนี้น่าสนใจเป็นพิเศษสำหรับทีมที่คุ้นเคยกับเวิร์กโฟลว์ที่ใช้ SQL อยู่แล้ว

การสร้างคุณสมบัติสำหรับการเรียนรู้ของเครื่องแสดงถึงกรณีการใช้งานที่เกิดขึ้นใหม่อีกประการหนึ่ง ซึ่งความสามารถในการประมวลผลทั้งข้อมูลแบบแบทช์และสตรีมผ่านอินเทอร์เฟซแบบรวมทำให้ไปป์ไลน์การพัฒนาโมเดลง่ายขึ้น

กรณีการใช้งานหลัก:

  • การวิเคราะห์แบบสตรีมมิงที่มีความสดใหม่ของข้อมูลในระดับวินาทีย่อย
  • แอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ (การตรวจจับการฉ้อโกง การตรวจสอบความผิดปกติ)
  • การเสริมข้อมูลแบบเรียลไทม์จากแหล่งข้อมูลที่หลากหlaย
  • การสร้างฟีเจอร์สำหรับโมเดลแมชชีนเลิร์นนิง
  • การบำรุงรักษาวิวแบบเพิ่มหน่วยที่มาแทนที่งานแบบแบทช์

สถาปัตยกรรมทางเทคนิคได้รับคำชม

การตัดสินใจในการออกแบบของ RisingWave กำลังสร้างความคิดเห็นเชิงบวกจากชุมชนเทคนิค การใช้ S3 เป็นที่เก็บข้อมูลหลักของแพลตฟอร์ม รวมกับการแคชดิสก์แบบยืดหยุ่น ตอบสนองทั้งความกังวลเรื่องต้นทุนและความต้องการด้านประสิทธิภาพ การรวม Apache Iceberg แบบเนทีฟให้ความสามารถในการทำงานร่วมกันกับสถาปัตยกรรมเดทาเลคที่มีอยู่ ทำให้การนำไปใช้รบกวนน้อยกว่าสำหรับองค์กรที่มีโครงสร้างพื้นฐานข้อมูลที่มีอยู่แล้ว

ความเข้ากันได้ของโปรโตคอล PostgreSQL wire ช่วยขจัดความจำเป็นในการใช้เครื่องมือเฉพาะทาง ทำให้ทีมสามารถใช้ประโยชน์จากทักษะและเครื่องมือการจัดการฐานข้อมูลที่มีอยู่ การเลือกสถาปัตยกรรมนี้ช่วยลดเส้นโค้งการเรียนรู้อย่างมีนัยสำคัญเมื่อเปรียบเทียบกับแพลตฟอร์มที่ต้องการแนวทางการดำเนินงานใหม่ทั้งหมด

อ้างอิง: risingwave/risingwave