Hướng dẫn Xác suất và Thống kê Cơ bản cho Học Máy

Từ khóa chính: xác suất thống kê

Xác suất và Tổ hợp

Không gian mẫu: Tập hợp tất cả các kết quả có thể xảy ra của một phép thử, ký hiệu là S.

Sự kiện (Biến cố): Tập con E của không gian mẫu S. Sự kiện E xảy ra khi kết quả phép thử nằm trong E.

Tiên đề xác suất: Xác suất của sự kiện E được ký hiệu là P(E).

  • Tiên đề 1: Xác suất luôn nằm trong khoảng từ 0 đến 1: 0 ≤ P(E) ≤ 1

  • Tiên đề 2: Xác suất của không gian mẫu là 1: P(S) = 1

  • Tiên đề 3: Với các sự kiện xung khắc E1, …, En:

    P(⋃ni=1Ei) = Σni=1P(Ei)

Hoán vị: Sắp xếp r phần tử từ n phần tử theo thứ tự nhất định. Số hoán vị là P(n, r):

P(n, r) = n! / (n-r)!

Tổ hợp: Sắp xếp r phần tử từ n phần tử mà không quan tâm đến thứ tự. Số tổ hợp là C(n, r):

C(n, r) = P(n, r) / r! = n! / (r!(n-r)!)

Lưu ý: Với 0 ≤ rn, P(n, r)C(n, r).

Xác suất có Điều kiện

Định lý Bayes: Với sự kiện AB sao cho P(B) > 0:

P(A|B) = (P(B|A)P(A)) / P(B)

Lưu ý: P(A ∩ B) = P(A)P(B|A) = P(A|B)P(B)

Phân vùng: Tập hợp {$Ai$, i ∈ [[1, n]]] là phân vùng của S nếu:

  • ∀i ≠ j, Ai ∩ Aj = ∅ và ⋃ni=1Ai = S*
Xem Thêm:  Cảm Nhận Về Cảm Hứng và Bút Pháp Lãng Mạn Của Bài Thơ Tây Tiến

Lưu ý: Với sự kiện B bất kỳ, P(B) = Σni=1P(B|Ai)P(Ai).

Định lý Bayes mở rộng: Với {$Ai$, i ∈ [[1, n]]] là phân vùng của S:

P(Ak|B) = (P(B|Ak)P(Ak)) / (Σni=1P(B|Ai)P(Ai))

Sự kiện độc lập: AB độc lập khi:

P(A ∩ B) = P(A)P(B)

Biến Ngẫu nhiên

Biến ngẫu nhiên: Hàm ánh xạ mỗi phần tử trong không gian mẫu thành một số thực.

Hàm phân phối tích lũy (CDF): Hàm đơn điệu không giảm F(x) = P(X ≤ x), với limx→-∞F(x) = 0 và limx→+∞F(x) = 1.

Lưu ý: P(a < X ≤ b) = F(b) – F(a).

Hàm mật độ xác suất (PDF): Xác suất X nhận giá trị giữa hai giá trị thực liền kề.

(D) Rời rạc:

  • CDF: F(x) = Σxi ≤ xP(X = xi)
  • PDF: f(xj) = P(X = xj)
  • Thuộc tính PDF: 0 ≤ f(xj) ≤ 1 và Σjf(xj) = 1

(C) Liên tục:

  • CDF: F(x) = ∫x-∞f(y)dy
  • PDF: f(x) = dF/dx
  • Thuộc tính PDF: f(x) ≥ 0 và ∫+∞-∞f(x)dx = 1

Kỳ vọng:

(D): E[X] = Σni=1xif(xi)

(C): E[X] = ∫+∞-∞xf(x)dx

Phương sai (Var(X) hoặc σ2): E[(X – E[X])2] = E[X2] – E[X]2

Độ lệch chuẩn (σ): √Var(X)

Phân phối Xác suất

Bất đẳng thức Chebyshev: Với X có kỳ vọng μ, k, σ > 0:

P(|X – μ| ≥ kσ) ≤ 1/k2

Phân phối Đồng thời Biến Ngẫu nhiên

Mật độ biên (D): fX(xi) = ΣjfXY(xi, yj)

Mật độ biên (C): fX(x) = ∫+∞-∞fXY(x, y)dy

Mật độ có điều kiện: fX|Y(x) = fXY(x, y) / fY(y)

Tính chất độc lập: fXY(x, y) = fX(x)fY(y)

Hiệp phương sai (Cov(X, Y) hoặc σ2XY): E[(X – μX)(Y – μY)] = E[XY] – μXμY

Hệ số tương quan (ρXY): σ2XY / (σXσY). Lưu ý: -1 ≤ ρXY ≤ 1. Nếu XY độc lập, ρXY = 0.

Xem Thêm:  Hộ chiếu Trung Quốc có đường lưỡi bò: Giải đáp mọi thắc mắc

Ước lượng Tham số

Mẫu ngẫu nhiên: Tập hợp n biến ngẫu nhiên độc lập và phân phối giống hệt nhau.

Công cụ ước tính: Hàm của dữ liệu dùng để suy ra tham số chưa biết.

Thiên vị: Bias(θ^) = E[θ^] – θ. Công cụ ước tính không thiên vị khi E[θ^] = θ.

Trung bình mẫu (X̅): (1/n)Σni=1Xi. Không thiên vị: E[X̅] = μ.

Định lý giới hạn trung tâm: X̅ ~ N(μ, σ/√n) khi n → +∞.

Phương sai mẫu (s2 hoặc σ^2): (1/(n-1))Σni=1(Xi – X̅)2. Không thiên vị: E[s2] = σ2.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *