Update README_reconciled.md

This commit is contained in:
2025-12-22 03:33:03 +01:00
parent 74b12fa731
commit 9b93595657

View File

@@ -55,15 +55,33 @@ Y chuẩn hóa: 0.72, 0.80, 0.85, 0.75, 0.85, 0.60, 0.65, 0.68, 0.90, 0.85, 0.55
#### **Phương pháp 2: Min-Max Normalization** #### **Phương pháp 2: Min-Max Normalization**
**Công thức:** x' = (x - min) / (max - min) **Công thức tổng quát:**
**X:** Min = 4.5, Max = 9.1, Range = 4.6
``` ```
Ví dụ: 7.0 → (7.0 - 4.5) / 4.6 = 0.543 x' = (x - min) / (max - min) × (new_max - new_min) + new_min
```
Khi chuẩn hóa về [0, 1]: new_min = 0, new_max = 1
```
x' = (x - min) / (max - min)
```
##### **Ví dụ 1: Chuẩn hóa X về [0, 1]**
Min = 4.5, Max = 9.1, Range = 4.6
```
7.0 → (7.0 - 4.5) / 4.6 = 0.543
Kết quả: 0.543, 0.870, 0.891, 0.478, 0.435, 0.543, 0.326, 0.217, 0.543, 1.000, 0.000, 0.174 Kết quả: 0.543, 0.870, 0.891, 0.478, 0.435, 0.543, 0.326, 0.217, 0.543, 1.000, 0.000, 0.174
``` ```
**Y:** Min = 5.5, Max = 9.0, Range = 3.5 ##### **Ví dụ 2: Chuẩn hóa X về [-1, 1]**
```
x' = (x - 4.5) / 4.6 × 2 - 1
7.0 → 0.543 × 2 - 1 = 0.087
Kết quả: 0.087, 0.739, 0.783, -0.043, -0.130, 0.087, -0.348, -0.565, 0.087, 1.000, -1.000, -0.652
```
**Y về [0, 1]:** Min = 5.5, Max = 9.0
``` ```
Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.857, 0.000, 0.143 Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.857, 0.000, 0.143
``` ```
@@ -74,15 +92,15 @@ Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.85
**Công thức:** x' = (x - μ) / σ **Công thức:** x' = (x - μ) / σ
**X:** μ = 6.81, σ = 1.398 **X:** μ = 6.81, σ = 1.339
``` ```
Ví dụ: 7.0 → (7.0 - 6.81) / 1.398 = 0.136 Ví dụ: 7.0 → (7.0 - 6.81) / 1.339 = 0.142
Kết quả: 0.136, 1.209, 1.280, -0.079, -0.222, 0.136, -0.579, -0.937, 0.136, 1.638, -1.652, -1.080 Kết quả: 0.142, 1.262, 1.337, -0.082, -0.231, 0.142, -0.605, -0.978, 0.142, 1.710, -1.725, -1.128
``` ```
**Y:** μ = 7.33, σ = 1.177 **Y:** μ = 7.33, σ = 1.127
``` ```
Kết quả: -0.110, 0.569, 0.993, 0.144, 0.993, -1.130, -0.705, -0.450, 1.417, 0.993, -1.555, -1.130 Kết quả: -0.115, 0.595, 1.038, 0.151, 1.038, -1.180, -0.737, -0.470, 1.482, 1.038, -1.624, -1.180
``` ```
--- ---
@@ -193,17 +211,19 @@ r = 12.164 / √(21.508 × 15.248) = 12.164 / 18.110 = 0.672
#### **Phương pháp 2: Qua Covariance và Standard Deviation** #### **Phương pháp 2: Qua Covariance và Standard Deviation**
**Lưu ý:** Có 2 công thức covariance: **Công thức (theo sách giáo khoa):**
- **Population:** Cov(A,B) = Σ(ai - Ā)(bi - B̄) / **n**
- **Sample:** Cov(X,Y) = Σ(xi - x̄)(yi - ȳ) / **(n-1)**
Vì đây là dữ liệu mẫu (12 điểm), dùng công thức **sample** (chia cho n-1):
``` ```
Cov(X,Y) = 12.164 / 11 = 1.106 Cov(A,B) = Σ(ai - Ā)(bi - B̄) / n
σx = √(21.508 / 11) = 1.398 σ = √[Σ(ai - Ā)² / n]
σy = √(15.248 / 11) = 1.177 r = Cov(A,B) / (σA × σB)
r = 1.106 / (1.398 × 1.177) = 0.672 ```
**Tính toán:**
```
Cov(X,Y) = 12.164 / 12 = 1.014
σx = √(21.508 / 12) = √1.792 = 1.339
σy = √(15.248 / 12) = √1.271 = 1.127
r = 1.014 / (1.339 × 1.127) = 1.014 / 1.509 = 0.672
``` ```
**Kết luận:** r ≈ **0.67** → Tương quan dương khá mạnh **Kết luận:** r ≈ **0.67** → Tương quan dương khá mạnh
@@ -466,7 +486,7 @@ d(A, C3) = √[(2-1)² + (10-2)²] = 8.06
| Kỹ thuật | Phương pháp | Khi nào dùng | | Kỹ thuật | Phương pháp | Khi nào dùng |
|----------|-------------|--------------| |----------|-------------|--------------|
| **Chuẩn hóa** | Decimal Scaling | Nhanh, đơn giản | | **Chuẩn hóa** | Decimal Scaling | Nhanh, đơn giản |
| | Min-Max | Neural networks, [0,1] | | | Min-Max [a,b] | Neural networks, cần khoảng cụ thể (vd: [0,1], [-1,1]) |
| | Z-Score | So sánh nhiều biến, phát hiện outliers | | | Z-Score | So sánh nhiều biến, phát hiện outliers |
| **Binning** | Equal-Width + Means | Dữ liệu phân phối đều | | **Binning** | Equal-Width + Means | Dữ liệu phân phối đều |
| | Equal-Frequency | Dữ liệu lệch, có outliers | | | Equal-Frequency | Dữ liệu lệch, có outliers |
@@ -484,4 +504,4 @@ d(A, C3) = √[(2-1)² + (10-2)²] = 8.06
- **Entropy:** -Σ p_i log₂(p_i) - **Entropy:** -Σ p_i log₂(p_i)
- **Gain:** Entropy(S) - Σ (|Sv|/|S|) × Entropy(Sv) - **Gain:** Entropy(S) - Σ (|Sv|/|S|) × Entropy(Sv)
- **Confidence:** Support(XY) / Support(X) - **Confidence:** Support(XY) / Support(X)
- **SSE:** Σ distance²(điểm, tâm) - **SSE:** Σ distance²(điểm, tâm)