แนะนำ, 2024

ตัวเลือกของบรรณาธิการ

ความแตกต่างระหว่างการจำแนกและการถดถอย

การจำแนกประเภทและการถดถอยเป็นปัญหาการทำนายที่สำคัญสองประการซึ่งโดยปกติจะกระทำใน Data mining การสร้างแบบจำลองการทำนายเป็นเทคนิคของการพัฒนาแบบจำลองหรือฟังก์ชั่นโดยใช้ข้อมูลประวัติเพื่อคาดการณ์ข้อมูลใหม่ ความแตกต่างที่สำคัญระหว่างการจำแนกประเภทและการถดถอยคือการจัดประเภทแผนที่วัตถุข้อมูลเข้ากับฉลากแยก ในทางกลับกันการถดถอยแผนที่วัตถุข้อมูลเข้ากับค่าจริงอย่างต่อเนื่อง

แผนภูมิเปรียบเทียบ

พื้นฐานสำหรับการเปรียบเทียบการจัดหมวดหมู่การถอยหลัง
ขั้นพื้นฐาน
การค้นพบรูปแบบหรือฟังก์ชั่นที่การทำแผนที่วัตถุจะทำในชั้นเรียนที่กำหนดไว้ล่วงหน้าโมเดลที่คิดค้นขึ้นซึ่งการแม็พของอ็อบเจ็กต์ถูกทำลงในค่า
เกี่ยวข้องกับการทำนายของค่าไม่ต่อเนื่องค่าต่อเนื่อง
อัลกอริทึมต้นไม้การตัดสินใจการถดถอยโลจิสติก ฯลฯต้นไม้ถดถอย (ป่าสุ่ม), การถดถอยเชิงเส้นเป็นต้น
ธรรมชาติของข้อมูลที่ทำนายไว้เรียงลำดับสั่งซื้อ
วิธีการคำนวณการวัดความแม่นยำการวัดความคลาดเคลื่อนกำลังสองเฉลี่ยของรูท

ความหมายของการจำแนกประเภท

การจัดหมวดหมู่ เป็นกระบวนการในการค้นหาหรือค้นพบแบบจำลอง (ฟังก์ชัน) ซึ่งช่วยในการแยกข้อมูลออกเป็นคลาสเด็ดขาดหลายคลาส ในการจัดหมวดหมู่สมาชิกกลุ่มของปัญหาจะถูกระบุซึ่งหมายความว่าข้อมูลจะถูกจัดหมวดหมู่ภายใต้ป้ายกำกับที่แตกต่างกันตามพารามิเตอร์บางตัวและจากนั้นจะมีการทำนายป้ายกำกับสำหรับข้อมูล

แบบจำลองที่ได้มาสามารถแสดงให้เห็นในรูปแบบของกฎ“ IF-THEN”, ต้นไม้ตัดสินใจหรือโครงข่ายประสาทเทียมเป็นต้น ต้นไม้ตัดสินใจ เป็นพื้นฐานแผนภูมิการไหลซึ่งคล้ายกับโครงสร้างต้นไม้ที่แต่ละโหนดภายในแสดงการทดสอบคุณลักษณะ และกิ่งก้านของมันแสดงผลการทดสอบ กระบวนการจำแนกประเภทจะจัดการกับปัญหาที่ข้อมูลสามารถแบ่งออกเป็นสองฉลากแยกกันหรือมากกว่าในคำอื่น ๆ ชุดที่แยกจากกันสองชุดขึ้นไป

ลองมาเป็น ตัวอย่าง สมมติว่าเราต้องการทำนายความเป็นไปได้ของฝนในบางภูมิภาคโดยใช้พารามิเตอร์บางตัว จากนั้นจะมีฝนสองป้ายและไม่มีฝนภายใต้ซึ่งสามารถจำแนกภูมิภาคได้

นิยามของการถดถอย

การถดถอย เป็นกระบวนการในการค้นหาแบบจำลองหรือฟังก์ชั่นสำหรับแยกข้อมูลออกเป็นค่าจริงต่อเนื่องแทนที่จะใช้คลาส ในทางคณิตศาสตร์กับปัญหาการถดถอยเราพยายามหาฟังก์ชั่นการประมาณด้วยการเบี่ยงเบนข้อผิดพลาดขั้นต่ำ ในการถดถอยการพึ่งพาตัวเลขของข้อมูลจะถูกทำนายเพื่อแยกความแตกต่าง

การวิเคราะห์การถดถอยเป็นตัวแบบทางสถิติที่ใช้ในการทำนายข้อมูลตัวเลขแทนฉลาก นอกจากนี้ยังสามารถระบุความเคลื่อนไหวของการแจกจ่ายโดยขึ้นอยู่กับข้อมูลที่มีอยู่หรือข้อมูลประวัติ

ลองมา ตัวอย่างที่ คล้ายกันในการถดถอยด้วยซึ่งเรากำลังค้นหาความเป็นไปได้ของฝนในบางพื้นที่โดยใช้พารามิเตอร์บางตัว ในกรณีนี้มีความน่าจะเป็นที่เกี่ยวข้องกับฝน ที่นี่เราไม่ได้จำแนกภูมิภาคที่อยู่ในสายฝนและไม่มีป้ายฝนแทนเราจะจำแนกพวกมันด้วยความน่าจะเป็นที่เกี่ยวข้อง

ความแตกต่างที่สำคัญระหว่างการจำแนกและการถดถอย

  1. กระบวนการจัดประเภทเป็นฟังก์ชันที่ข้อมูลถูกทำนายในเลเบลของคลาสที่ไม่ต่อเนื่อง ในทางกลับกันการถดถอยเป็นกระบวนการสร้างแบบจำลองที่ทำนายปริมาณอย่างต่อเนื่อง
  2. อัลกอริธึมการจัดหมวดหมู่เกี่ยวข้องกับต้นไม้ตัดสินใจการถดถอยโลจิสติกส์เป็นต้นตรงกันข้ามต้นไม้ถดถอย (เช่นป่าสุ่ม) และการถดถอยเชิงเส้นเป็นตัวอย่างของอัลกอริธึมถดถอย
  3. การจำแนกประเภททำนายข้อมูลที่ไม่ได้เรียงลำดับขณะที่การถดถอยทำนายข้อมูลที่สั่งไว้
  4. การถดถอยสามารถถูกประเมินได้โดยใช้รูทค่าเฉลี่ยของรูทข้อผิดพลาด ในทางตรงกันข้ามการจำแนกประเภทจะถูกประเมินโดยการวัดความแม่นยำ

ข้อสรุป

เทคนิคการจัดหมวดหมู่ให้แบบจำลองการทำนายหรือฟังก์ชั่นที่ทำนายข้อมูลใหม่ในหมวดหมู่หรือฉลากแยกด้วยความช่วยเหลือของข้อมูลในอดีต ในทางกลับกันวิธีการถดถอยแบบจำลองฟังก์ชันที่มีค่าต่อเนื่องซึ่งหมายความว่ามันทำนายข้อมูลในข้อมูลตัวเลขอย่างต่อเนื่อง

Top