แนะนำ, 2024

ตัวเลือกของบรรณาธิการ

ความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติ

ตารางข้อเท็จจริงและตารางมิติเป็นปัจจัยสำคัญในการสร้าง สคีมา บันทึกของตารางข้อเท็จจริงคือการรวมกันของแอตทริบิวต์จากตารางมิติที่แตกต่างกัน ตารางข้อเท็จจริงช่วยให้ผู้ใช้สามารถวิเคราะห์มิติทางธุรกิจที่ช่วยเขาในการตัดสินใจในการปรับปรุงธุรกิจของเขา ในทางกลับกันตารางมิติช่วยตารางข้อเท็จจริงในการรวบรวมมิติตามมาตรการที่จะต้องดำเนินการ

จุดที่แยกความแตกต่างของตารางข้อเท็จจริงและตารางมิติคือ ตารางมิติ ประกอบด้วยคุณลักษณะที่ใช้ในการวัด จริงตาราง มีปัจจัยอื่น ๆ ที่สร้างความแตกต่างระหว่างตารางข้อเท็จจริงและตารางมิติเพื่อดูพวกเรามาดูแผนภูมิเปรียบเทียบด้านล่างกัน

แผนภูมิเปรียบเทียบ

พื้นฐานสำหรับการเปรียบเทียบตารางข้อเท็จจริงตารางมิติข้อมูล
ขั้นพื้นฐานตารางข้อเท็จจริงประกอบด้วยการวัดตามคุณลักษณะของตารางมิติตารางส่วนข้อมูลประกอบด้วยแอตทริบิวต์ตามที่ตารางความเป็นจริงคำนวณเมตริก
คุณสมบัติและบันทึกตารางข้อเท็จจริงประกอบด้วยแอตทริบิวต์น้อยลงและบันทึกเพิ่มเติมตารางส่วนข้อมูลมีคุณลักษณะมากขึ้นและบันทึกน้อยลง
ขนาดโต๊ะตารางข้อเท็จจริงเติบโตในแนวตั้งตารางมิติเติบโตในแนวนอน
สำคัญตารางข้อเท็จจริงประกอบด้วยคีย์หลักซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติทั้งหมดตารางมิติข้อมูลแต่ละตารางมีคีย์หลัก
การสร้างตารางข้อเท็จจริงสามารถสร้างได้เมื่อตารางมิติเสร็จสมบูรณ์เท่านั้นตารางมิติจำเป็นต้องสร้างขึ้นก่อน
schemaสคีมามีจำนวนตารางข้อเท็จจริงน้อยกว่าสคีมามีตารางมิติจำนวนมากขึ้น
แอตทริบิวต์ตารางข้อเท็จจริงสามารถมีข้อมูลเป็นตัวเลขและรูปแบบข้อความตารางมิติประกอบด้วยแอตทริบิวต์ในรูปแบบข้อความเสมอ

คำจำกัดความของตารางข้อเท็จจริง

ตารางข้อเท็จจริงเป็นตารางที่มี การวัด ตามคุณลักษณะของตารางมิติ สามารถมีข้อมูลในระดับต่ำสุดที่เป็นไปได้ ตารางความเป็นจริงบางอย่างมีข้อมูลสรุปที่เรียกว่าเป็น ตารางความจริงรวม ตารางข้อเท็จจริงเกือบจะมีข้อมูลที่ ประทับวัน ที่ ให้เราคุยถึงลักษณะของตารางข้อเท็จจริง

รหัสตัดแบ่ง
ตารางข้อเท็จจริงประกอบด้วยคีย์ Concatenated ซึ่งเป็นการเชื่อมโยงคีย์หลักของตารางมิติข้อมูลทั้งหมด คีย์การตัดแบ่งข้อมูลของตารางข้อเท็จจริงจะต้องระบุแถวในตารางข้อเท็จจริง

Data Grain
ข้อมูลข้าวแสดงให้เห็นว่าการจัดเก็บข้อมูลการวัดจริงในตารางนั้นลึกเพียงใด Data data ต้องอยู่ในระดับสูงสุดที่เป็นไปได้

มาตรการเพิ่มเติม
คุณสมบัติของตารางข้อเท็จจริงสามารถ เติมเต็ม หรือ สารเติมแต่ง กึ่ง มาตรการเติมแต่งอย่างสมบูรณ์คือมาตรการที่สามารถสรุปได้ง่ายสำหรับทุกมิติในตารางข้อเท็จจริง ตัวอย่างเช่น Quantity_ordered เป็นแอ็ตทริบิวต์ที่สามารถสรุปได้สำหรับทุกมิติ เช่นเดียวกับที่เราสามารถนำปริมาณทั้งหมดออกมาสำหรับลูกค้าเฉพาะภูมิภาควันที่ยี่ห้อ ฯลฯ มาตรการแบบกึ่งเสริมคือมาตรการที่สามารถสรุปรวมตามมิติข้อมูลบางส่วนของตาราง แต่ไม่ใช่มิติทั้งหมด เช่นยอดคงเหลือไม่สามารถสรุปรวมตามมิติเวลาได้เมื่อมันเปลี่ยนแปลงตลอดเวลา

ข้อมูลเบาบาง
บางครั้งเราอาจเห็นบันทึกในตารางข้อเท็จจริงที่มี คุณลักษณะที่มีการ วัดค่าว่าง ตัวอย่างเช่นอาจไม่มีการสั่งซื้อใด ๆ ในวันหยุด ดังนั้นแอตทริบิวต์สำหรับวันนี้จะมีค่าเป็นศูนย์ เราไม่จำเป็นต้องจัดเก็บการวัดสำหรับบันทึกประเภทนี้เนื่องจากไม่ได้ให้ข้อมูลใด ๆ

ขนาดที่เสื่อมโทรม
บางครั้งคุณอาจพบมิติบางอย่างในตารางข้อเท็จจริงซึ่งไม่ได้เติมแต่งเลย ตัวอย่างเช่น order_number, customer_id คุณไม่สามารถเพิ่มมิติข้อมูลประเภทนี้ได้ อย่างไรก็ตามในกรณีที่คุณต้องการค้นหาคำสั่งซื้อจากลูกค้ารายใดรายหนึ่งในเดือนนี้ จากนั้นคุณจะต้องมี customer_id เพื่อเชื่อมโยงการค้นหาของคุณ ชนิดเหล่านี้หากคุณลักษณะหรือขนาดของตารางข้อเท็จจริงเรียกว่า มิติที่ลดขนาด

คำจำกัดความของ Dimension Table

Dimension Table เป็นองค์ประกอบสำคัญสำหรับตารางเริ่มต้น Schema.A ขนาดประกอบด้วยคุณลักษณะที่แสดงมิติพร้อมกับการวัดที่นำมาใช้ในตารางความเป็นจริง นอกจากนี้เราจะพูดถึงคุณลักษณะบางอย่างของตารางมิติ

คุณสมบัติและกุญแจ
ทุกตารางมิติจะต้องมี คีย์หลัก ที่ระบุแต่ละระเบียนของตาราง เป็นที่สังเกตกันโดยทั่วไปว่าตารางมิติประกอบด้วยคุณลักษณะมากมาย ดังนั้นมันจะ กว้าง เช่นเมื่อคุณสร้างตารางมิติคุณจะพบว่ามันแพร่กระจายใน แนวนอน

ค่าคุณสมบัติ
ค่าของแอตทริบิวต์ในตารางมิติไม่ค่อยเป็นตัวเลขส่วนใหญ่คุณจะพบค่าในแอตทริบิวต์อยู่ใน รูปแบบข้อความ ตัวอย่างเช่นชื่อผลิตภัณฑ์แบรนด์หมวดหมู่หมวดหมู่ย่อย ฯลฯ

ความสัมพันธ์ระหว่างคุณสมบัติ
บ่อยครั้งที่คุณสามารถสังเกตเห็นแอตทริบิวต์ที่คุณเจอในตารางมิติไม่เกี่ยวข้องโดยตรง เช่นเดียวกับ Product_brand ไม่ต้องทำอะไรกับ package_date แต่ทั้งคู่ก็อาจเป็นคุณลักษณะของตารางส่วนข้อมูลผลิตภัณฑ์

normalization
ตารางขนาด ไม่ ควรจะเป็น ปกติ นี่เป็นเพราะ normalizing ตารางจะสร้างตารางกลางจำนวนมาก เมื่อแบบสอบถามหยิบคุณลักษณะจากตารางมิติและกู้คืนการวัดตามที่สำหรับตารางข้อเท็จจริงแบบสอบถามจะต้องผ่านตารางกลางเหล่านั้นซึ่งไม่มีประสิทธิภาพ ดังนั้นตารางมิติจึงไม่ถูกทำให้เป็นมาตรฐาน

เจาะลงกลิ้งขึ้น
แอททริบิวของตารางส่วนข้อมูลช่วยให้คุณสามารถรับรายละเอียดโดยการข้ามจากระดับที่สูงขึ้นของแอททริบิวต์รวมไปยังแอททริบิวระดับล่าง ตัวอย่างเช่นหากคุณต้องการค้นหายอดขายทั้งหมดในภูมิภาคคุณสามารถเจาะลึกเพื่อค้นหายอดขายตามรัฐเมืองรหัสไปรษณีย์ คุณสามารถม้วนขึ้นเพื่อค้นหายอดขายก่อนจากซิปจากนั้นตามเมืองแล้วระบุ

หลายลำดับชั้น
บ่อยครั้งที่ตารางมิติมีหลายลำดับชั้น ตัวอย่างเช่นเรามีตารางมิติผลิตภัณฑ์สำหรับห้างสรรพสินค้า ขณะนี้เรามีแผนกการตลาดและแผนกบัญชีสองแผนก

ฝ่ายการตลาดจะเจาะลึกระหว่างคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แน่นอนเพื่อรับการวัดสำหรับตารางข้อเท็จจริง

ในทางกลับกันแผนกบัญชีจะเจาะลึกระหว่างคุณลักษณะของตารางมิติผลิตภัณฑ์ในลำดับชั้นที่แตกต่างกันเพื่อขอรับการวัดสำหรับตารางข้อเท็จจริง

ดังนั้นตารางมิติต้องมีหลายลำดับชั้นหรือระดับของการรวมคุณลักษณะเพื่อให้ผู้ใช้เจาะลึกตามลำดับชั้นหลาย ๆ

ประวัติ
แม้ว่าตารางขนาดจะมีแอตทริบิวต์มากเกินไป แต่ก็มีบันทึกน้อยกว่า

ความแตกต่างที่สำคัญระหว่างตารางข้อเท็จจริงและตารางมิติข้อมูล

  1. ตารางข้อเท็จจริงประกอบด้วยการวัดตามมิติ / คุณลักษณะของตารางมิติ
  2. ตารางข้อเท็จจริงมีระเบียนมากขึ้นและแอตทริบิวต์น้อยลงเมื่อเปรียบเทียบกับตารางมิติในขณะที่ตารางข้อมูลมิติมีแอตทริบิวต์มากขึ้นและบันทึกน้อยลง
  3. ขนาดตารางของตารางข้อเท็จจริงเพิ่มขึ้นในแนวตั้งในขณะที่ขนาดตารางของตารางมิติเติบโตในแนวนอน
  4. แต่ละตารางมิติประกอบด้วยคีย์หลักเพื่อระบุแต่ละระเบียนในตารางในขณะที่ตารางข้อเท็จจริงประกอบด้วยคีย์ที่ต่อกันซึ่งเป็นการรวมกันของคีย์หลักทั้งหมดของตารางมิติทั้งหมด
  5. ต้องบันทึกตารางมิติก่อนการสร้างตารางข้อเท็จจริง
  6. สคีมามีตารางข้อเท็จจริงน้อยลง แต่มีมิติข้อมูลเพิ่มเติม
  7. แอ็ตทริบิวต์ในตารางข้อเท็จจริงเป็นตัวเลขเช่นเดียวกับต้นฉบับ แต่คุณลักษณะของตารางมิติมีแอตทริบิวต์ที่เป็นข้อความเท่านั้น

สรุป:

ทั้งสองมีความสำคัญเท่าเทียมกันสำหรับการสร้าง schema แต่ตารางมิติต้องถูกบันทึกก่อนตารางข้อเท็จจริง เนื่องจากเป็นไปไม่ได้ที่จะสร้างตารางข้อเท็จจริงโดยไม่ต้องมีมิติ

Top