Update README_reconciled.md
This commit is contained in:
@@ -55,15 +55,33 @@ Y chuẩn hóa: 0.72, 0.80, 0.85, 0.75, 0.85, 0.60, 0.65, 0.68, 0.90, 0.85, 0.55
|
|||||||
|
|
||||||
#### **Phương pháp 2: Min-Max Normalization**
|
#### **Phương pháp 2: Min-Max Normalization**
|
||||||
|
|
||||||
**Công thức:** x' = (x - min) / (max - min)
|
**Công thức tổng quát:**
|
||||||
|
|
||||||
**X:** Min = 4.5, Max = 9.1, Range = 4.6
|
|
||||||
```
|
```
|
||||||
Ví dụ: 7.0 → (7.0 - 4.5) / 4.6 = 0.543
|
x' = (x - min) / (max - min) × (new_max - new_min) + new_min
|
||||||
|
```
|
||||||
|
|
||||||
|
Khi chuẩn hóa về [0, 1]: new_min = 0, new_max = 1
|
||||||
|
```
|
||||||
|
x' = (x - min) / (max - min)
|
||||||
|
```
|
||||||
|
|
||||||
|
##### **Ví dụ 1: Chuẩn hóa X về [0, 1]**
|
||||||
|
|
||||||
|
Min = 4.5, Max = 9.1, Range = 4.6
|
||||||
|
```
|
||||||
|
7.0 → (7.0 - 4.5) / 4.6 = 0.543
|
||||||
Kết quả: 0.543, 0.870, 0.891, 0.478, 0.435, 0.543, 0.326, 0.217, 0.543, 1.000, 0.000, 0.174
|
Kết quả: 0.543, 0.870, 0.891, 0.478, 0.435, 0.543, 0.326, 0.217, 0.543, 1.000, 0.000, 0.174
|
||||||
```
|
```
|
||||||
|
|
||||||
**Y:** Min = 5.5, Max = 9.0, Range = 3.5
|
##### **Ví dụ 2: Chuẩn hóa X về [-1, 1]**
|
||||||
|
|
||||||
|
```
|
||||||
|
x' = (x - 4.5) / 4.6 × 2 - 1
|
||||||
|
7.0 → 0.543 × 2 - 1 = 0.087
|
||||||
|
Kết quả: 0.087, 0.739, 0.783, -0.043, -0.130, 0.087, -0.348, -0.565, 0.087, 1.000, -1.000, -0.652
|
||||||
|
```
|
||||||
|
|
||||||
|
**Y về [0, 1]:** Min = 5.5, Max = 9.0
|
||||||
```
|
```
|
||||||
Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.857, 0.000, 0.143
|
Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.857, 0.000, 0.143
|
||||||
```
|
```
|
||||||
@@ -74,15 +92,15 @@ Kết quả: 0.486, 0.714, 0.857, 0.571, 0.857, 0.143, 0.286, 0.371, 1.000, 0.85
|
|||||||
|
|
||||||
**Công thức:** x' = (x - μ) / σ
|
**Công thức:** x' = (x - μ) / σ
|
||||||
|
|
||||||
**X:** μ = 6.81, σ = 1.398
|
**X:** μ = 6.81, σ = 1.339
|
||||||
```
|
```
|
||||||
Ví dụ: 7.0 → (7.0 - 6.81) / 1.398 = 0.136
|
Ví dụ: 7.0 → (7.0 - 6.81) / 1.339 = 0.142
|
||||||
Kết quả: 0.136, 1.209, 1.280, -0.079, -0.222, 0.136, -0.579, -0.937, 0.136, 1.638, -1.652, -1.080
|
Kết quả: 0.142, 1.262, 1.337, -0.082, -0.231, 0.142, -0.605, -0.978, 0.142, 1.710, -1.725, -1.128
|
||||||
```
|
```
|
||||||
|
|
||||||
**Y:** μ = 7.33, σ = 1.177
|
**Y:** μ = 7.33, σ = 1.127
|
||||||
```
|
```
|
||||||
Kết quả: -0.110, 0.569, 0.993, 0.144, 0.993, -1.130, -0.705, -0.450, 1.417, 0.993, -1.555, -1.130
|
Kết quả: -0.115, 0.595, 1.038, 0.151, 1.038, -1.180, -0.737, -0.470, 1.482, 1.038, -1.624, -1.180
|
||||||
```
|
```
|
||||||
|
|
||||||
---
|
---
|
||||||
@@ -193,17 +211,19 @@ r = 12.164 / √(21.508 × 15.248) = 12.164 / 18.110 = 0.672
|
|||||||
|
|
||||||
#### **Phương pháp 2: Qua Covariance và Standard Deviation**
|
#### **Phương pháp 2: Qua Covariance và Standard Deviation**
|
||||||
|
|
||||||
**Lưu ý:** Có 2 công thức covariance:
|
**Công thức (theo sách giáo khoa):**
|
||||||
- **Population:** Cov(A,B) = Σ(ai - Ā)(bi - B̄) / **n**
|
|
||||||
- **Sample:** Cov(X,Y) = Σ(xi - x̄)(yi - ȳ) / **(n-1)**
|
|
||||||
|
|
||||||
Vì đây là dữ liệu mẫu (12 điểm), dùng công thức **sample** (chia cho n-1):
|
|
||||||
|
|
||||||
```
|
```
|
||||||
Cov(X,Y) = 12.164 / 11 = 1.106
|
Cov(A,B) = Σ(ai - Ā)(bi - B̄) / n
|
||||||
σx = √(21.508 / 11) = 1.398
|
σ = √[Σ(ai - Ā)² / n]
|
||||||
σy = √(15.248 / 11) = 1.177
|
r = Cov(A,B) / (σA × σB)
|
||||||
r = 1.106 / (1.398 × 1.177) = 0.672
|
```
|
||||||
|
|
||||||
|
**Tính toán:**
|
||||||
|
```
|
||||||
|
Cov(X,Y) = 12.164 / 12 = 1.014
|
||||||
|
σx = √(21.508 / 12) = √1.792 = 1.339
|
||||||
|
σy = √(15.248 / 12) = √1.271 = 1.127
|
||||||
|
r = 1.014 / (1.339 × 1.127) = 1.014 / 1.509 = 0.672
|
||||||
```
|
```
|
||||||
|
|
||||||
**Kết luận:** r ≈ **0.67** → Tương quan dương khá mạnh
|
**Kết luận:** r ≈ **0.67** → Tương quan dương khá mạnh
|
||||||
@@ -466,7 +486,7 @@ d(A, C3) = √[(2-1)² + (10-2)²] = 8.06
|
|||||||
| Kỹ thuật | Phương pháp | Khi nào dùng |
|
| Kỹ thuật | Phương pháp | Khi nào dùng |
|
||||||
|----------|-------------|--------------|
|
|----------|-------------|--------------|
|
||||||
| **Chuẩn hóa** | Decimal Scaling | Nhanh, đơn giản |
|
| **Chuẩn hóa** | Decimal Scaling | Nhanh, đơn giản |
|
||||||
| | Min-Max | Neural networks, [0,1] |
|
| | Min-Max [a,b] | Neural networks, cần khoảng cụ thể (vd: [0,1], [-1,1]) |
|
||||||
| | Z-Score | So sánh nhiều biến, phát hiện outliers |
|
| | Z-Score | So sánh nhiều biến, phát hiện outliers |
|
||||||
| **Binning** | Equal-Width + Means | Dữ liệu phân phối đều |
|
| **Binning** | Equal-Width + Means | Dữ liệu phân phối đều |
|
||||||
| | Equal-Frequency | Dữ liệu lệch, có outliers |
|
| | Equal-Frequency | Dữ liệu lệch, có outliers |
|
||||||
|
|||||||
Reference in New Issue
Block a user