แผนภูมิเปรียบเทียบ
พื้นฐานสำหรับการเปรียบเทียบ | การจัดหมวดหมู่ | การถอยหลัง |
---|---|---|
ขั้นพื้นฐาน | การค้นพบรูปแบบหรือฟังก์ชั่นที่การทำแผนที่วัตถุจะทำในชั้นเรียนที่กำหนดไว้ล่วงหน้า | โมเดลที่คิดค้นขึ้นซึ่งการแม็พของอ็อบเจ็กต์ถูกทำลงในค่า |
เกี่ยวข้องกับการทำนายของ | ค่าไม่ต่อเนื่อง | ค่าต่อเนื่อง |
อัลกอริทึม | ต้นไม้การตัดสินใจการถดถอยโลจิสติก ฯลฯ | ต้นไม้ถดถอย (ป่าสุ่ม), การถดถอยเชิงเส้นเป็นต้น |
ธรรมชาติของข้อมูลที่ทำนายไว้ | เรียงลำดับ | สั่งซื้อ |
วิธีการคำนวณ | การวัดความแม่นยำ | การวัดความคลาดเคลื่อนกำลังสองเฉลี่ยของรูท |
ความหมายของการจำแนกประเภท
การจัดหมวดหมู่ เป็นกระบวนการในการค้นหาหรือค้นพบแบบจำลอง (ฟังก์ชัน) ซึ่งช่วยในการแยกข้อมูลออกเป็นคลาสเด็ดขาดหลายคลาส ในการจัดหมวดหมู่สมาชิกกลุ่มของปัญหาจะถูกระบุซึ่งหมายความว่าข้อมูลจะถูกจัดหมวดหมู่ภายใต้ป้ายกำกับที่แตกต่างกันตามพารามิเตอร์บางตัวและจากนั้นจะมีการทำนายป้ายกำกับสำหรับข้อมูล
แบบจำลองที่ได้มาสามารถแสดงให้เห็นในรูปแบบของกฎ“ IF-THEN”, ต้นไม้ตัดสินใจหรือโครงข่ายประสาทเทียมเป็นต้น ต้นไม้ตัดสินใจ เป็นพื้นฐานแผนภูมิการไหลซึ่งคล้ายกับโครงสร้างต้นไม้ที่แต่ละโหนดภายในแสดงการทดสอบคุณลักษณะ และกิ่งก้านของมันแสดงผลการทดสอบ กระบวนการจำแนกประเภทจะจัดการกับปัญหาที่ข้อมูลสามารถแบ่งออกเป็นสองฉลากแยกกันหรือมากกว่าในคำอื่น ๆ ชุดที่แยกจากกันสองชุดขึ้นไป
ลองมาเป็น ตัวอย่าง สมมติว่าเราต้องการทำนายความเป็นไปได้ของฝนในบางภูมิภาคโดยใช้พารามิเตอร์บางตัว จากนั้นจะมีฝนสองป้ายและไม่มีฝนภายใต้ซึ่งสามารถจำแนกภูมิภาคได้
นิยามของการถดถอย
การถดถอย เป็นกระบวนการในการค้นหาแบบจำลองหรือฟังก์ชั่นสำหรับแยกข้อมูลออกเป็นค่าจริงต่อเนื่องแทนที่จะใช้คลาส ในทางคณิตศาสตร์กับปัญหาการถดถอยเราพยายามหาฟังก์ชั่นการประมาณด้วยการเบี่ยงเบนข้อผิดพลาดขั้นต่ำ ในการถดถอยการพึ่งพาตัวเลขของข้อมูลจะถูกทำนายเพื่อแยกความแตกต่าง
การวิเคราะห์การถดถอยเป็นตัวแบบทางสถิติที่ใช้ในการทำนายข้อมูลตัวเลขแทนฉลาก นอกจากนี้ยังสามารถระบุความเคลื่อนไหวของการแจกจ่ายโดยขึ้นอยู่กับข้อมูลที่มีอยู่หรือข้อมูลประวัติ
ลองมา ตัวอย่างที่ คล้ายกันในการถดถอยด้วยซึ่งเรากำลังค้นหาความเป็นไปได้ของฝนในบางพื้นที่โดยใช้พารามิเตอร์บางตัว ในกรณีนี้มีความน่าจะเป็นที่เกี่ยวข้องกับฝน ที่นี่เราไม่ได้จำแนกภูมิภาคที่อยู่ในสายฝนและไม่มีป้ายฝนแทนเราจะจำแนกพวกมันด้วยความน่าจะเป็นที่เกี่ยวข้อง
ความแตกต่างที่สำคัญระหว่างการจำแนกและการถดถอย
- กระบวนการจัดประเภทเป็นฟังก์ชันที่ข้อมูลถูกทำนายในเลเบลของคลาสที่ไม่ต่อเนื่อง ในทางกลับกันการถดถอยเป็นกระบวนการสร้างแบบจำลองที่ทำนายปริมาณอย่างต่อเนื่อง
- อัลกอริธึมการจัดหมวดหมู่เกี่ยวข้องกับต้นไม้ตัดสินใจการถดถอยโลจิสติกส์เป็นต้นตรงกันข้ามต้นไม้ถดถอย (เช่นป่าสุ่ม) และการถดถอยเชิงเส้นเป็นตัวอย่างของอัลกอริธึมถดถอย
- การจำแนกประเภททำนายข้อมูลที่ไม่ได้เรียงลำดับขณะที่การถดถอยทำนายข้อมูลที่สั่งไว้
- การถดถอยสามารถถูกประเมินได้โดยใช้รูทค่าเฉลี่ยของรูทข้อผิดพลาด ในทางตรงกันข้ามการจำแนกประเภทจะถูกประเมินโดยการวัดความแม่นยำ
ข้อสรุป
เทคนิคการจัดหมวดหมู่ให้แบบจำลองการทำนายหรือฟังก์ชั่นที่ทำนายข้อมูลใหม่ในหมวดหมู่หรือฉลากแยกด้วยความช่วยเหลือของข้อมูลในอดีต ในทางกลับกันวิธีการถดถอยแบบจำลองฟังก์ชันที่มีค่าต่อเนื่องซึ่งหมายความว่ามันทำนายข้อมูลในข้อมูลตัวเลขอย่างต่อเนื่อง