Claude 4 Sonnet เอาชนะ GPT-5 ในการทดสอบการเขียนโค้ดภายในของ Microsoft
การเรียนรู้ของเครื่อง
1 สัปดาห์ที่ผ่านมา
Claude 4 Sonnet เอาชนะ GPT-5 ในการทดสอบการเขียนโค้ดภายในของ Microsoft
งานวิจัยของ OpenAI เผยสาเหตุที่โมเดลภาษาเกิดภาพหลอนและเสนอแนวทางแก้ไข
การประมวลผลภาษาธรรมชาติ
2 สัปดาห์ที่ผ่านมา
งานวิจัยของ OpenAI เผยสาเหตุที่โมเดลภาษาเกิดภาพหลอนและเสนอแนวทางแก้ไข
นักพัฒนาอ้างว่าคณิตศาสตร์ระดับมัธยมปลายเพียงพอต่อการเข้าใจการทำงานของ LLMs
การเรียนรู้ของเครื่อง
3 สัปดาห์ที่ผ่านมา
นักพัฒนาอ้างว่าคณิตศาสตร์ระดับมัธยมปลายเพียงพอต่อการเข้าใจการทำงานของ LLMs
SpaCy เผชิญความท้าทายใหม่ขณะที่นักพัฒนาถกเถียงอนาคตของ NLP แบบดั้งเดิมเทียบกับ LLMs
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
SpaCy เผชิญความท้าทายใหม่ขณะที่นักพัฒนาถกเถียงอนาคตของ NLP แบบดั้งเดิมเทียบกับ LLMs
ชุมชนนักวิจัย AI ถกเถียงคุณภาพเนื้อหาที่สร้างโดย LLM ขณะที่วิธี DeepConf แสดงศักยภาพ
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
ชุมชนนักวิจัย AI ถกเถียงคุณภาพเนื้อหาที่สร้างโดย LLM ขณะที่วิธี DeepConf แสดงศักยภาพ
โมเดล AI เก่งโจทย์คณิตศาสตร์โอลิมปิก แต่ล้มเหลวในเลขคณิตพื้นฐานและเกม Tic-Tac-Toe
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
โมเดล AI เก่งโจทย์คณิตศาสตร์โอลิมปิก แต่ล้มเหลวในเลขคณิตพื้นฐานและเกม Tic-Tac-Toe
ชุมชนเทคโนโลยีถกเถียงว่า LLMs "เข้าใจ" จริงหรือเพียงเลียนแบบความฉลาดผ่านการจับคู่รูปแบบ
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
ชุมชนเทคโนโลยีถกเถียงว่า LLMs "เข้าใจ" จริงหรือเพียงเลียนแบบความฉลาดผ่านการจับคู่รูปแบบ
นักวิจัย AI ถกเถียงกันว่า Chain-of-Thought Reasoning เป็นการใช้เหตุผลจริงหรือเป็นแค่การจับรูปแบบ
การเรียนรู้ของเครื่อง
1 เดือนที่ผ่านมา
นักวิจัย AI ถกเถียงกันว่า Chain-of-Thought Reasoning เป็นการใช้เหตุผลจริงหรือเป็นแค่การจับรูปแบบ
การถกเถียงเรื่องความแน่นอนของ LLM: เหตุใดการทำซ้ำที่สมบูรณ์แบบจึงยังคงเป็นไปไม่ได้แม้จะตั้งค่าอุณหภูมิเป็นศูนย์
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
การถกเถียงเรื่องความแน่นอนของ LLM: เหตุใดการทำซ้ำที่สมบูรณ์แบบจึงยังคงเป็นไปไม่ได้แม้จะตั้งค่าอุณหภูมิเป็นศูนย์
GPT-5 แสดงความก้าวหน้าอย่างมากในคำถามท้าทาย ChatGPT ฉบับดั้งเดิมของ Knuth
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
GPT-5 แสดงความก้าวหน้าอย่างมากในคำถามท้าทาย ChatGPT ฉบับดั้งเดิมของ Knuth
Attention Sinks: กลไกที่ซ่อนอยู่ซึ่งป้องกันไม่ให้โมเดลภาษาพังทลาย
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
Attention Sinks: กลไกที่ซ่อนอยู่ซึ่งป้องกันไม่ให้โมเดลภาษาพังทลาย
โมเดลภาษาขนาดเล็กที่ปรับแต่งอย่างละเอียดท้าทายยักษ์ใหญ่ด้วยการลดต้นทุน 5-30 เท่า
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
โมเดลภาษาขนาดเล็กที่ปรับแต่งอย่างละเอียดท้าทายยักษ์ใหญ่ด้วยการลดต้นทุน 5-30 เท่า
LLM แสดงประสิทธิภาพที่ไม่ดีในการทดสอบการระบุฟอนต์ ทำให้เกิดคำถามเกี่ยวกับความสามารถของโมเดล
การประมวลผลภาษาธรรมชาติ
1 เดือนที่ผ่านมา
LLM แสดงประสิทธิภาพที่ไม่ดีในการทดสอบการระบุฟอนต์ ทำให้เกิดคำถามเกี่ยวกับความสามารถของโมเดล