Các yêu cầu của các loại câu hỏi này đánh tôi là một chút kỳ quái. Đây là một khái niệm / công thức toán học , nhưng tôi muốn nói về nó trong một số bối cảnh hoàn toàn không có ký hiệu toán học. Tôi cũng nghĩ rằng cần phải nói rằng đại số thực tế cần thiết để hiểu các công thức, tôi nghĩ, nên được dạy cho hầu hết các cá nhân trước khi học cao hơn (không cần hiểu về đại số ma trận, chỉ cần đại số đơn giản là đủ).
Vì vậy, lúc đầu thay vì bỏ qua hoàn toàn công thức và nói về nó trong một số loại tương tự ma thuật và heuristic, chúng ta chỉ cần nhìn vào công thức và cố gắng giải thích các thành phần riêng lẻ trong các bước nhỏ. Sự khác biệt về hiệp phương sai và tương quan, khi nhìn vào các công thức, sẽ trở nên rõ ràng. Trong khi nói về mặt tương tự và heuristic tôi nghi ngờ sẽ làm mờ đi hai khái niệm tương đối đơn giản và sự khác biệt của chúng trong nhiều tình huống.
Vì vậy, hãy bắt đầu với một công thức cho hiệp phương sai mẫu (những cái tôi vừa lấy và chấp nhận từ wikipedia);
1n - 1Σviết sai rồii = 1( xTôi- x¯) ( yTôi- y¯)
Để giúp mọi người tăng tốc, hãy xác định rõ ràng tất cả các yếu tố và thao tác trong công thức.
- và y i là mỗi phép đo của hai thuộc tính riêng biệt của cùng một quan sátxTôiyTôi
- và ˉ y là phương tiện (hoặc trung bình) của mỗi thuộc tínhx¯y¯
- Cho , hãy nói điều này có nghĩa là chúng ta chia kết quả cuối cùng chon-1.1n - 1n - 1
- có thể là ký hiệu nước ngoài đối với một số người, vì vậy có thể hữu ích để giải thích thao tác này. Nó chỉ đơn giản là tổng của tất cả cácquan sát riêng biệt của tôi và n đại diện cho tổng số quan sát.Σviết sai rồii = 1Tôiviết sai rồi
Tại thời điểm này, tôi có thể giới thiệu một ví dụ đơn giản, để nói về các yếu tố và hoạt động để nói. Vì vậy, ví dụ, hãy tạo một bảng, trong đó mỗi hàng tương ứng với một quan sát (và và y được dán nhãn thích hợp). Người ta có thể làm cho các ví dụ này cụ thể hơn (ví dụ: x đại diện cho tuổi và y đại diện cho trọng lượng), nhưng đối với cuộc thảo luận của chúng tôi ở đây thì không thành vấn đề.xyxy
x y
---
2 5
4 8
9 3
5 6
0 8
Tại thời điểm này nếu bạn cảm thấy thao tác tổng trong công thức có thể chưa được hiểu đầy đủ, bạn có thể giới thiệu lại nó trong ngữ cảnh đơn giản hơn nhiều. Nói chỉ cần trình bày rằng giống như nói trong ví dụ này;Σviết sai rồii = 1( xTôi)
x
--
2
4
9
5
+ 0
--
20
Bây giờ lộn xộn cần được xoá sổ, và chúng ta có thể làm việc theo cách của chúng tôi vào phần thứ hai của công thức, . Bây giờ, giả sử người đã biết những gì giá trị trung bình, ˉ x và ° y đứng cho, và tôi sẽ nói, là đạo đức giả của ý kiến riêng của tôi trước đó trong bài viết, người ta chỉ có thể tham khảo giá trị trung bình về mặt chẩn đoán đơn giản (ví dụ giữa của phân phối). Người ta có thể thực hiện quy trình này một lần tại một thời điểm. Câu lệnh ( x i - ˉ x )( xTôi- x¯) ( yTôi- y¯)x¯y¯( xTôi- x¯)chỉ là kiểm tra độ lệch / khoảng cách giữa mỗi lần quan sát và giá trị trung bình của tất cả các quan sát cho thuộc tính cụ thể đó. Do đó, khi quan sát xa hơn giá trị trung bình, thao tác này sẽ được cung cấp giá trị cao hơn. Sau đó, người ta có thể tham khảo lại bảng ví dụ đã cho và chỉ cần trình bày thao tác trên vectơ quan sát .x
x x_bar (x - x_bar)
2 4 -2
4 4 0
9 4 5
5 4 1
0 4 -4
Hoạt động là tương tự cho vectơ , nhưng chỉ để gia cố, bạn cũng có thể trình bày thao tác đó.y
y y_bar (y - y_bar)
5 6 -1
8 6 2
3 6 -3
6 6 0
8 6 2
( xTôi- x¯)( yTôi- y¯)( xTôi- x¯) ⋅ ( yTôi- y¯)
Lưu ý về những gì xảy ra khi nhân, nếu hai quan sát đều có khoảng cách lớn hơn giá trị trung bình, thì quan sát kết quả sẽ có giá trị dương thậm chí còn lớn hơn (điều tương tự là đúng nếu cả hai quan sát đều có khoảng cách lớn dưới giá trị trung bình, vì nhân hai âm bằng một tích cực). Cũng lưu ý rằng nếu một quan sát cao hơn giá trị trung bình và khác quan sát thấp hơn giá trị trung bình, giá trị kết quả sẽ lớn (về mặt tuyệt đối) và âm (như một lần dương một số âm bằng một số âm). Cuối cùng lưu ý rằng khi một giá trị rất gần với giá trị trung bình của một trong hai lần quan sát, nhân hai giá trị sẽ dẫn đến một số nhỏ. Một lần nữa chúng ta chỉ có thể trình bày thao tác này trong một bảng.
(x - x_bar) (y - y_bar) (x - x_bar)*(y - y_bar)
-2 -1 2
0 2 0
5 -3 -15
1 0 0
-4 2 -8
n - 1
(x - x_bar)*(y - y_bar)
-----------------------
2
0
-15
0
+ -8
-----
-21
-21/(5-1) = -5.25
Tại thời điểm này, bạn có thể muốn củng cố nơi 5 đến từ đâu, nhưng điều đó sẽ đơn giản như tham khảo lại bảng và đếm số lượng quan sát (hãy để lại sự khác biệt giữa mẫu và dân số sang thời điểm khác).
ρ
ρ = Co v ( x , y)Vmột r ( x ) Vmột r ( y)√
Co v ( x , x ) = Vmột r ( x )). Và tất cả các khái niệm tương tự mà bạn đã giới thiệu với hiệp phương sai được áp dụng (nghĩa là nếu một chuỗi có nhiều giá trị khác xa so với ý nghĩa của nó, nó sẽ có phương sai cao). Có thể lưu ý ở đây rằng một chuỗi không thể có phương sai âm (cũng nên theo logic của toán học đã trình bày trước đó).
Vmột r ( x ) Vmột r ( y)Vmột r ( x ) Vmột r ( y)-----------√
Tôi hiểu trong một số trường hợp mức độ điều trị này sẽ không phù hợp. Thượng viện cần bản tóm tắt điều hành . Trong trường hợp đó, bạn có thể tham khảo lại các heuristic đơn giản mà mọi người đã sử dụng trong các ví dụ khác, nhưng Rome không được xây dựng trong một ngày. Và với thượng viện, người yêu cầu tóm tắt điều hành, nếu bạn có quá ít thời gian, có lẽ bạn chỉ nên lấy lời của tôi cho nó, và phân phát với các thủ tục tương tự và gạch đầu dòng.