Đầu tiên, tôi nên nói rằng tôi đã tìm kiếm trên trang web này để tìm câu trả lời. Tôi không tìm thấy câu hỏi nào trả lời câu hỏi của mình hoặc trình độ hiểu biết của tôi quá thấp Tôi không nhận ra mình đã đọc câu trả lời.
Tôi đang học cho kỳ thi Thống kê AP. Tôi phải học hồi quy tuyến tính và một trong những chủ đề là phần dư. Tôi có một bản Giới thiệu về Thống kê và Phân tích Dữ liệu ở trang 253.
Các điểm bất thường trong tập dữ liệu bivariate là những điểm nằm cách xa hầu hết các điểm khác trong biểu đồ phân tán theo hướng hoặc hướng
Một quan sát có khả năng là một quan sát có ảnh hưởng nếu nó có giá trị nằm cách xa phần còn lại của dữ liệu (tách biệt với phần còn lại của dữ liệu theo hướng ). Để xác định xem quan sát trên thực tế có ảnh hưởng hay không, chúng tôi đánh giá xem việc loại bỏ quan sát này có ảnh hưởng lớn đến giá trị của độ dốc hoặc chặn của đường vuông góc nhỏ nhất hay không.
Một quan sát là một ngoại lệ nếu nó có số dư lớn. Quan sát xa hơn nằm cách xa đường vuông góc nhỏ nhất theo hướng .
Stattreck.com nêu bốn phương pháp để xác định ngoại lệ từ phần dư:
Các điểm dữ liệu phân kỳ theo cách lớn từ mẫu tổng thể được gọi là các ngoại lệ. Có bốn cách mà một điểm dữ liệu có thể được coi là ngoại lệ.
- Nó có thể có giá trị X cực cao so với các điểm dữ liệu khác.
- Nó có thể có giá trị Y cực cao so với các điểm dữ liệu khác.
- Nó có thể có các giá trị X và Y cực đoan.
- Nó có thể cách xa phần còn lại của dữ liệu, ngay cả khi không có giá trị X hoặc Y cực đoan.
Hai nguồn này dường như mâu thuẫn với nhau. Bất cứ ai có thể giúp làm sáng tỏ sự nhầm lẫn của tôi. Ngoài ra, làm thế nào để xác định cực đoan. Thống kê AP sử dụng quy tắc nếu điểm dữ liệu nằm ngoài (Q1-1.5IQR, Q3 + 1.5IQR) thì đó là một ngoại lệ. Tôi không biết làm thế nào để áp dụng điều đó từ chỉ một biểu đồ ra khỏi phần dư.