จุดที่แยกความแตกต่างของตารางข้อเท็จจริงและตารางมิติคือ ตารางมิติ ประกอบด้วยคุณลักษณะที่ใช้ในการวัด จริงตาราง มีปัจจัยอื่น ๆ ที่สร้างความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติเพื่อดูพวกเรามาดูแผนภูมิเปรียบเทียบด้านล่างกัน
แผนภูมิเปรียบเทียบ
พื้นฐานสำหรับการเปรียบเทียบ | ตารางข้อเท็จจริง | ตารางมิติข้อมูล |
---|---|---|
ขั้นพื้นฐาน | ตารางข้อเท็จจริงประกอบด้วยการวัดตามคุณลักษณะของตารางมิติ | ตารางส่วนข้อมูลประกอบด้วยแอตทริบิวต์ตามที่ตารางความเป็นจริงคำนวณเมตริก |
คุณสมบัติและบันทึก | ตารางข้อเท็จจริงประกอบด้วยแอตทริบิวต์น้อยลงและบันทึกเพิ่มเติม | ตารางส่วนข้อมูลมีคุณลักษณะมากขึ้นและบันทึกน้อยลง |
ขนาดโต๊ะ | ตารางข้อเท็จจริงเติบโตในแนวตั้ง | ตารางมิติเติบโตในแนวนอน |
สำคัญ | ตารางข้อเท็จจริงประกอบด้วยคีย์หลักซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติทั้งหมด | ตารางมิติข้อมูลแต่ละตารางมีคีย์หลัก |
การสร้าง | ตารางข้อเท็จจริงสามารถสร้างได้เมื่อตารางมิติเสร็จสมบูรณ์เท่านั้น | ตารางมิติจำเป็นต้องสร้างขึ้นก่อน |
schema | สคีมามีจำนวนตารางข้อเท็จจริงน้อยกว่า | สคีมามีตารางมิติจำนวนมากขึ้น |
แอตทริบิวต์ | ตารางข้อเท็จจริงสามารถมีข้อมูลเป็นตัวเลขและรูปแบบข้อความ | ตารางมิติประกอบด้วยแอตทริบิวต์ในรูปแบบข้อความเสมอ |
คำจำกัดความของตารางข้อเท็จจริง
ตารางข้อเท็จจริงเป็นตารางที่มี การวัด ตามคุณลักษณะของตารางมิติ สามารถมีข้อมูลในระดับต่ำสุดที่เป็นไปได้ ตารางความเป็นจริงบางอย่างมีข้อมูลสรุปที่เรียกว่าเป็น ตารางความจริงรวม ตารางข้อเท็จจริงเกือบจะมีข้อมูลที่ ประทับวัน ที่ ให้เราคุยถึงลักษณะของตารางข้อเท็จจริง
รหัสตัดแบ่ง
ตารางข้อเท็จจริงประกอบด้วยคีย์ Concatenated ซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติข้อมูลทั้งหมด คีย์การตัดแบ่งข้อมูลของตารางข้อเท็จจริงจะต้องระบุแถวในตารางข้อเท็จจริง
Data Grain
ข้อมูลข้าวแสดงให้เห็นว่าการจัดเก็บข้อมูลการวัดจริงในตารางนั้นลึกเพียงใด Data data ต้องอยู่ในระดับสูงสุดที่เป็นไปได้
มาตรการเพิ่มเติม
คุณสมบัติของตารางข้อเท็จจริงสามารถ เติมเต็ม หรือ สารเติมแต่ง กึ่ง มาตรการเติมแต่งอย่างสมบูรณ์คือมาตรการที่สามารถสรุปได้ง่ายสำหรับทุกมิติในตารางข้อเท็จจริง ตัวอย่างเช่น Quantity_ordered เป็นแอ็ตทริบิวต์ที่สามารถสรุปได้สำหรับทุกมิติ เช่นเดียวกับที่เราสามารถนำปริมาณทั้งหมดออกมาสำหรับลูกค้าเฉพาะภูมิภาควันที่ยี่ห้อ ฯลฯ มาตรการแบบกึ่งเสริมคือมาตรการที่สามารถสรุปรวมตามมิติข้อมูลบางส่วนของตาราง แต่ไม่ใช่มิติทั้งหมด เช่นยอดคงเหลือไม่สามารถสรุปรวมตามมิติเวลาได้เมื่อมันเปลี่ยนแปลงตลอดเวลา
ข้อมูลเบาบาง
บางครั้งเราอาจเห็นบันทึกในตารางข้อเท็จจริงที่มี คุณลักษณะที่มีการ วัดค่าว่าง ตัวอย่างเช่นอาจไม่มีการสั่งซื้อใด ๆ ในวันหยุด ดังนั้นแอตทริบิวต์สำหรับวันนี้จะมีค่าเป็นศูนย์ เราไม่จำเป็นต้องจัดเก็บการวัดสำหรับบันทึกประเภทนี้เนื่องจากไม่ได้ให้ข้อมูลใด ๆ
ขนาดที่เสื่อมโทรม
บางครั้งคุณอาจพบมิติบางอย่างในตารางข้อเท็จจริงซึ่งไม่ได้เติมแต่งเลย ตัวอย่างเช่น order_number, customer_id คุณไม่สามารถเพิ่มมิติข้อมูลประเภทนี้ได้ อย่างไรก็ตามในกรณีที่คุณต้องการค้นหาคำสั่งซื้อจากลูกค้ารายใดรายหนึ่งในเดือนนี้ จากนั้นคุณจะต้องมี customer_id เพื่อเชื่อมโยงการค้นหาของคุณ ชนิดเหล่านี้หากคุณลักษณะหรือขนาดของตารางข้อเท็จจริงเรียกว่า มิติที่ลดขนาด
คำจำกัดความของ Dimension Table
Dimension Table เป็นองค์ประกอบสำคัญสำหรับตารางเริ่มต้น Schema.A ขนาดประกอบด้วยคุณลักษณะที่แสดงมิติพร้อมกับการวัดที่นำมาใช้ในตารางความเป็นจริง นอกจากนี้เราจะพูดถึงคุณลักษณะบางอย่างของตารางมิติ
คุณสมบัติและกุญแจ
ทุกตารางมิติจะต้องมี คีย์หลัก ที่ระบุแต่ละระเบียนของตาราง เป็นที่สังเกตกันโดยทั่วไปว่าตารางมิติประกอบด้วยคุณลักษณะมากมาย ดังนั้นมันจะ กว้าง เช่นเมื่อคุณสร้างตารางมิติคุณจะพบว่ามันแพร่กระจายใน แนวนอน
ค่าคุณสมบัติ
ค่าของแอตทริบิวต์ในตารางมิติไม่ค่อยเป็นตัวเลขส่วนใหญ่คุณจะพบค่าในแอตทริบิวต์อยู่ใน รูปแบบข้อความ ตัวอย่างเช่นชื่อผลิตภัณฑ์แบรนด์หมวดหมู่หมวดหมู่ย่อย ฯลฯ
ความสัมพันธ์ระหว่างคุณสมบัติ
บ่อยครั้งที่คุณสามารถสังเกตเห็นแอตทริบิวต์ที่คุณเจอในตารางมิติไม่เกี่ยวข้องโดยตรง เช่นเดียวกับ Product_brand ไม่ต้องทำอะไรกับ package_date แต่ทั้งคู่ก็อาจเป็นคุณลักษณะของตารางส่วนข้อมูลผลิตภัณฑ์
normalization
ตารางขนาด ไม่ ควรจะเป็น ปกติ นี่เป็นเพราะ normalizing ตารางจะสร้างตารางกลางจำนวนมาก เมื่อแบบสอบถามหยิบคุณลักษณะจากตารางมิติและกู้คืนการวัดตามที่สำหรับตารางข้อเท็จจริงแบบสอบถามจะต้องผ่านตารางกลางเหล่านั้นซึ่งไม่มีประสิทธิภาพ ดังนั้นตารางมิติจึงไม่ถูกทำให้เป็นมาตรฐาน
เจาะลงกลิ้งขึ้น
แอททริบิวของตารางส่วนข้อมูลช่วยให้คุณสามารถรับรายละเอียดโดยการข้ามจากระดับที่สูงขึ้นของแอททริบิวต์รวมไปยังแอททริบิวระดับล่าง ตัวอย่างเช่นหากคุณต้องการค้นหายอดขายทั้งหมดในภูมิภาคคุณสามารถเจาะลึกเพื่อค้นหายอดขายตามรัฐเมืองรหัสไปรษณีย์ คุณสามารถม้วนขึ้นเพื่อค้นหายอดขายก่อนจากซิปจากนั้นตามเมืองแล้วระบุ
หลายลำดับชั้น
บ่อยครั้งที่ตารางมิติมีหลายลำดับชั้น ตัวอย่างเช่นเรามีตารางมิติผลิตภัณฑ์สำหรับห้างสรรพสินค้า ขณะนี้เรามีแผนกการตลาดและแผนกบัญชีสองแผนก
ฝ่ายการตลาดจะเจาะลึกระหว่างคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แน่นอนเพื่อรับการวัดสำหรับตารางข้อเท็จจริง
ในทางกลับกันแผนกบัญชีจะเจาะลึกระหว่างคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แตกต่างกันเพื่อขอรับการวัดสำหรับตารางข้อเท็จจริง
ดังนั้นตารางมิติต้องมีหลายลำดับชั้นหรือระดับของการรวมคุณลักษณะเพื่อให้ผู้ใช้เจาะลึกตามลำดับชั้นหลาย ๆ
ประวัติ
แม้ว่าตารางขนาดจะมีแอตทริบิวต์มากเกินไป แต่ก็มีบันทึกน้อยกว่า
ความแตกต่างที่สำคัญระหว่างตารางข้อเท็จจริงและตารางมิติข้อมูล
- ตารางข้อเท็จจริงประกอบด้วยการวัดตามมิติ / คุณลักษณะของตารางมิติ
- ตารางข้อเท็จจริงมีระเบียนมากขึ้นและแอตทริบิวต์น้อยลงเมื่อเปรียบเทียบกับตารางมิติในขณะที่ตารางข้อมูลมิติมีแอตทริบิวต์มากขึ้นและบันทึกน้อยลง
- ขนาดตารางของตารางข้อเท็จจริงเพิ่มขึ้นในแนวตั้งในขณะที่ขนาดตารางของตารางมิติเติบโตในแนวนอน
- แต่ละตารางมิติประกอบด้วยคีย์หลักเพื่อระบุแต่ละระเบียนในตารางในขณะที่ตารางข้อเท็จจริงประกอบด้วยคีย์ที่ต่อกันซึ่งเป็นการรวมกันของคีย์หลักทั้งหมดของตารางมิติทั้งหมด
- ต้องบันทึกตารางมิติก่อนการสร้างตารางข้อเท็จจริง
- สคีมามีตารางข้อเท็จจริงน้อยลง แต่มีมิติข้อมูลเพิ่มเติม
- แอ็ตทริบิวต์ในตารางข้อเท็จจริงเป็นตัวเลขเช่นเดียวกับต้นฉบับ แต่คุณลักษณะของตารางมิติมีแอตทริบิวต์ที่เป็นข้อความเท่านั้น
สรุป:
ทั้งสองมีความสำคัญเท่าเทียมกันสำหรับการสร้าง schema แต่ตารางมิติต้องถูกบันทึกก่อนตารางข้อเท็จจริง เนื่องจากเป็นไปไม่ได้ที่จะสร้างตารางข้อเท็จจริงโดยไม่ต้องมีมิติ