ให้เราตรวจสอบความแตกต่างระหว่าง data mining และ data data ด้วยความช่วยเหลือของกราฟเปรียบเทียบที่แสดงด้านล่าง
แผนภูมิเปรียบเทียบ
พื้นฐานสำหรับการเปรียบเทียบ | การขุดข้อมูล | คลังข้อมูล |
---|---|---|
ขั้นพื้นฐาน | Data mining เป็นกระบวนการในการดึงหรือดึงข้อมูลที่มีความหมายจากฐานข้อมูล / คลังข้อมูล | คลังข้อมูลเป็นพื้นที่เก็บข้อมูลที่เก็บข้อมูลจากหลายแหล่งภายใต้สคีมาเดียว |
ความหมายของการขุดข้อมูล
การขุดข้อมูลเป็นกระบวนการ ค้นพบความรู้ ซึ่งคุณ ไม่เคยคาดหวังว่า จะ มีอยู่ในฐานข้อมูลของคุณ การใช้เครื่องมือ Query แบบดั้งเดิมคุณสามารถดึงข้อมูลที่ทราบจากข้อมูลเท่านั้น แต่ Data mining เป็นวิธีการในการ ดึงข้อมูลที่ซ่อนอยู่ออกจากข้อมูล การขุดข้อมูลจะดึงข้อมูลที่มีความหมายจากฐานข้อมูลที่สามารถใช้สำหรับ การตัดสินใจ
การค้นพบความรู้ในฐานข้อมูลที่เรียกว่า KDD จะ แสดง ความสัมพันธ์ และ รูปแบบ ความสัมพันธ์อาจอยู่ระหว่างวัตถุสองชิ้นหรือมากกว่านั้นระหว่างคุณสมบัติของวัตถุเดียวกัน แพทเทิร์นเป็นผลมาจากการขุดข้อมูลที่แสดงลำดับของข้อมูลที่เข้าใจได้ง่ายซึ่งช่วยในการตัดสินใจ
ขั้นตอนที่เกี่ยวข้องใน KDD คือการค้นพบความรู้ในฐานข้อมูลสามารถสรุปได้เป็นครั้งแรกการ เลือก ชุดข้อมูลที่จะต้องดำเนินการขุดข้อมูล ถัดไปคือ การประมวลผลล่วงหน้า ที่เกี่ยวข้องกับการลบข้อมูลที่ไม่สอดคล้องกัน จากนั้นการ แปลงข้อมูล ที่ซึ่งข้อมูลถูกแปลงเป็นรูปแบบที่เหมาะสมสำหรับการขุดข้อมูล ถัดไปคือ data mining ขั้นตอนวิธี data mining นำไปใช้กับข้อมูล ในที่สุด การตีความและการประเมินผล ที่เกี่ยวข้องกับการแยกความสัมพันธ์หรือรูปแบบระหว่างข้อมูล
การขุดข้อมูลนั้นเหมาะสมในสภาพแวดล้อมคลังข้อมูลที่เก็บข้อมูลในลักษณะรวมและสรุป มันกลายเป็นเรื่องง่ายที่จะขุดข้อมูลในคลังข้อมูล
การกำหนดคลังข้อมูล
Data Warehouse เป็นตำแหน่งศูนย์กลางที่ข้อมูลที่ รวบรวมจากหลายแหล่งจะถูกเก็บไว้ภายใต้ schema แบบรวมศูนย์เดียว การรวบรวมข้อมูลเริ่มต้นแหล่งต่าง ๆ ขององค์กรจากนั้นทำความสะอาดและแปลงและจัดเก็บในคลังข้อมูล เมื่อมีการป้อนข้อมูลในคลังข้อมูลข้อมูลนั้นจะอยู่ที่นั่นเป็นเวลานานและสามารถเข้าถึงได้เกินเวลา
Data Warehouse เป็นการผสมผสานกันอย่างลงตัวของเทคโนโลยีเช่น การสร้างแบบจำลองข้อมูลการเก็บข้อมูลการจัดการข้อมูลการจัดการข้อมูลเมตาการจัดการร้านเครื่องมือในการพัฒนา เทคโนโลยีทั้งหมดเหล่านี้รองรับฟังก์ชั่นเช่นการ แยกข้อมูลการแปลงข้อมูลการจัดเก็บข้อมูลให้ส่วนต่อประสานผู้ใช้สำหรับการเข้าถึงข้อมูล
คลังข้อมูลไม่ใช่ผลิตภัณฑ์หรือซอฟต์แวร์ แต่เป็นสภาพแวดล้อมข้อมูลที่ให้ข้อมูลเช่นมุมมองแบบรวมขององค์กร คุณสามารถเข้าถึงข้อมูลปัจจุบันและข้อมูลย้อนหลังขององค์กรซึ่งช่วยในการตัดสินใจ สนับสนุนธุรกรรมที่ทำเพื่อการตัดสินใจโดยไม่กระทบต่อระบบปฏิบัติการ มันเป็นทรัพยากรที่มีความยืดหยุ่นในการรับข้อมูลเชิงกลยุทธ์
ความแตกต่างที่สำคัญระหว่างการทำเหมืองข้อมูลและคลังข้อมูล
- มีความแตกต่างพื้นฐานที่แยก data mining และ data warehousing ที่ data mining เป็นกระบวนการของการแยกข้อมูลที่มีความหมายจากฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล อย่างไรก็ตามคลังข้อมูลจัดให้มีสภาพแวดล้อมที่ข้อมูลถูกเก็บไว้ในรูปแบบบูรณาการซึ่งช่วยให้การขุดข้อมูลง่ายขึ้นเพื่อดึงข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น
สรุป:
การขุดข้อมูลสามารถทำได้ก็ต่อเมื่อมีฐานข้อมูลขนาดใหญ่ที่รวมอยู่ในตัวเช่นคลังข้อมูล ดังนั้นคลังข้อมูลจะต้องเสร็จสิ้นก่อนทำการขุดข้อมูล คลังข้อมูลจะต้องมีข้อมูลในรูปแบบที่รวมเข้าด้วยกันเพื่อให้การขุดข้อมูลสามารถดึงความรู้ออกมาได้อย่างมีประสิทธิภาพ