Gói MASS đi kèm với R của bạn đã được cài đặt, có boxcox()
chức năng mà bạn có thể sử dụng: Sau khi đọc dữ liệu, hãy thực hiện:
library(MASS)
boxcox(y ~ x)
Sau đó nhìn vào biểu đồ mà nó tạo ra, cho thấy đồ họa khoảng tin cậy 95% cho tham số biến đổi boxcox. Nhưng bạn không thực sự có đủ dữ liệu (n = 10) để thực hiện việc này, khoảng tin cậy kết quả sẽ gần như từ -2 đến 2!, Với ước tính khả năng tối đa là khoảng 0 (một biến đổi log, như đã nói trước đó). Nếu dữ liệu thực của bạn có nhiều quan sát hơn, bạn nên thử điều này.
Như những người khác đã nói, sự chuyển đổi này thực sự đang cố gắng ổn định phương sai. Điều này không thực sự rõ ràng từ lý thuyết, những gì nó làm, là cố gắng tối đa hóa một hàm khả năng dựa trên phân phối bình thường, giả định phương sai không đổi. Người ta có thể nghĩ rằng tối đa hóa khả năng dựa trên bình thường sẽ cố gắng bình thường hóa phân phối phần dư, nhưng trên thực tế, đóng góp chính trong việc tối đa hóa khả năng đến từ việc ổn định phương sai. Điều này có lẽ không quá ngạc nhiên, vì khả năng chúng tôi tối đa hóa dựa trên một gia đình phân phối bình thường không đổi!
Tôi đã từng viết một bản demo dựa trên thanh trượt trong XLispStat, điều này đã thể hiện rõ điều này!