From 9b93595657f7ee09d2941b194b0842b26ceab866 Mon Sep 17 00:00:00 2001 From: thinh Date: Mon, 22 Dec 2025 03:33:03 +0100 Subject: [PATCH] Update README_reconciled.md --- README_reconciled.md | 64 +++++++++++++++++++++++++++++--------------- 1 file changed, 42 insertions(+), 22 deletions(-) diff --git a/README_reconciled.md b/README_reconciled.md index e729a7d..5fc544b 100644 --- a/README_reconciled.md +++ b/README_reconciled.md @@ -55,15 +55,33 @@ Y chuẩn hóa: 0.72, 0.80, 0.85, 0.75, 0.85, 0.60, 0.65, 0.68, 0.90, 0.85, 0.55 #### **Phương pháp 2: Min-Max Normalization** -**Công thức:** x' = (x - min) / (max - min) - -**X:** Min = 4.5, Max = 9.1, Range = 4.6 +**Công thức tổng quát:** ``` -Ví dụ: 7.0 → (7.0 - 4.5) / 4.6 = 0.543 +x' = (x - min) / (max - min) × (new_max - new_min) + new_min +``` + +Khi chuẩn hóa về [0, 1]: new_min = 0, new_max = 1 +``` +x' = (x - min) / (max - min) +``` + +##### **Ví dụ 1: Chuẩn hóa X về [0, 1]** + +Min = 4.5, Max = 9.1, Range = 4.6 +``` +7.0 → (7.0 - 4.5) / 4.6 = 0.543 Kết quả: 0.543, 0.870, 0.891, 0.478, 0.435, 0.543, 0.326, 0.217, 0.543, 1.000, 0.000, 0.174 ``` -**Y:** Min = 5.5, Max = 9.0, Range = 3.5 +##### **Ví dụ 2: Chuẩn hóa X về [-1, 1]** + +``` +x' = (x - 4.5) / 4.6 × 2 - 1 +7.0 → 0.543 × 2 - 1 = 0.087 +Kết quả: 0.087, 0.739, 0.783, -0.043, -0.130, 0.087, -0.348, -0.565, 0.087, 1.000, -1.000, -0.652 +``` + +**Y về [0, 1]:** Min = 5.5, Max = 9.0 ``` Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.857, 0.000, 0.143 ``` @@ -74,15 +92,15 @@ Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.85 **Công thức:** x' = (x - μ) / σ -**X:** μ = 6.81, σ = 1.398 +**X:** μ = 6.81, σ = 1.339 ``` -Ví dụ: 7.0 → (7.0 - 6.81) / 1.398 = 0.136 -Kết quả: 0.136, 1.209, 1.280, -0.079, -0.222, 0.136, -0.579, -0.937, 0.136, 1.638, -1.652, -1.080 +Ví dụ: 7.0 → (7.0 - 6.81) / 1.339 = 0.142 +Kết quả: 0.142, 1.262, 1.337, -0.082, -0.231, 0.142, -0.605, -0.978, 0.142, 1.710, -1.725, -1.128 ``` -**Y:** μ = 7.33, σ = 1.177 +**Y:** μ = 7.33, σ = 1.127 ``` -Kết quả: -0.110, 0.569, 0.993, 0.144, 0.993, -1.130, -0.705, -0.450, 1.417, 0.993, -1.555, -1.130 +Kết quả: -0.115, 0.595, 1.038, 0.151, 1.038, -1.180, -0.737, -0.470, 1.482, 1.038, -1.624, -1.180 ``` --- @@ -193,17 +211,19 @@ r = 12.164 / √(21.508 × 15.248) = 12.164 / 18.110 = 0.672 #### **Phương pháp 2: Qua Covariance và Standard Deviation** -**Lưu ý:** Có 2 công thức covariance: -- **Population:** Cov(A,B) = Σ(ai - Ā)(bi - B̄) / **n** -- **Sample:** Cov(X,Y) = Σ(xi - x̄)(yi - ȳ) / **(n-1)** - -Vì đây là dữ liệu mẫu (12 điểm), dùng công thức **sample** (chia cho n-1): - +**Công thức (theo sách giáo khoa):** ``` -Cov(X,Y) = 12.164 / 11 = 1.106 -σx = √(21.508 / 11) = 1.398 -σy = √(15.248 / 11) = 1.177 -r = 1.106 / (1.398 × 1.177) = 0.672 +Cov(A,B) = Σ(ai - Ā)(bi - B̄) / n +σ = √[Σ(ai - Ā)² / n] +r = Cov(A,B) / (σA × σB) +``` + +**Tính toán:** +``` +Cov(X,Y) = 12.164 / 12 = 1.014 +σx = √(21.508 / 12) = √1.792 = 1.339 +σy = √(15.248 / 12) = √1.271 = 1.127 +r = 1.014 / (1.339 × 1.127) = 1.014 / 1.509 = 0.672 ``` **Kết luận:** r ≈ **0.67** → Tương quan dương khá mạnh @@ -466,7 +486,7 @@ d(A, C3) = √[(2-1)² + (10-2)²] = 8.06 | Kỹ thuật | Phương pháp | Khi nào dùng | |----------|-------------|--------------| | **Chuẩn hóa** | Decimal Scaling | Nhanh, đơn giản | -| | Min-Max | Neural networks, [0,1] | +| | Min-Max [a,b] | Neural networks, cần khoảng cụ thể (vd: [0,1], [-1,1]) | | | Z-Score | So sánh nhiều biến, phát hiện outliers | | **Binning** | Equal-Width + Means | Dữ liệu phân phối đều | | | Equal-Frequency | Dữ liệu lệch, có outliers | @@ -484,4 +504,4 @@ d(A, C3) = √[(2-1)² + (10-2)²] = 8.06 - **Entropy:** -Σ p_i log₂(p_i) - **Gain:** Entropy(S) - Σ (|Sv|/|S|) × Entropy(Sv) - **Confidence:** Support(X∪Y) / Support(X) -- **SSE:** Σ distance²(điểm, tâm) +- **SSE:** Σ distance²(điểm, tâm) \ No newline at end of file