Nó đã được nóirằng bình phương tối thiểu thông thường trong y (OLS) là tối ưu trong lớp các công cụ ước lượng không thiên vị tuyến tính khi các lỗi là homoscedastic và serorrated không tương quan. Về phần dư homoscedastic, phương sai của phần dư là độc lập tương tự với nơi chúng ta sẽ đo sự thay đổi của cường độ dư trên trục x. Ví dụ: giả sử rằng sai số của phép đo của chúng tôi tăng tỷ lệ thuận với việc tăng giá trị y. Sau đó chúng ta có thể lấy logarit của các giá trị y đó trước khi thực hiện hồi quy. Nếu điều đó được thực hiện, chất lượng của sự phù hợp tăng lên so với việc phù hợp với một mô hình lỗi tỷ lệ mà không cần lấy logarit. Nói chung để có được tính đồng nhất, chúng ta có thể phải lấy đối ứng của dữ liệu trục y hoặc trục x, logarit, căn bậc hai hoặc căn bậc hai hoặc áp dụng hàm mũ. Một thay thế cho điều này là sử dụng chức năng cân,( y- mô hình )2y2( y- mô hình )2
Đã nói rất nhiều, điều thường xuyên xảy ra là làm cho phần dư trở nên đồng nhất hơn làm cho chúng được phân phối bình thường hơn, nhưng thường xuyên, tài sản homoscedastic là quan trọng hơn. Điều đó sau đó sẽ phụ thuộc vào lý do tại sao chúng ta đang thực hiện hồi quy. Ví dụ: nếu căn bậc hai của dữ liệu được phân phối bình thường hơn so với lấy logarit, nhưng lỗi là loại tỷ lệ, thì việc kiểm tra logarit sẽ hữu ích trong việc phát hiện sự khác biệt giữa các quần thể hoặc phép đo, nhưng để tìm ra dự kiến giá trị chúng ta nên sử dụng căn bậc hai của dữ liệu, bởi vì chỉ căn bậc hai của dữ liệu là phân phối đối xứng mà giá trị trung bình, chế độ và trung bình được dự kiến là bằng nhau.
Hơn nữa, điều thường xảy ra là chúng tôi không muốn có câu trả lời cho chúng tôi ít dự đoán lỗi nhất về các giá trị trục y và các hồi quy đó có thể bị sai lệch nhiều. Ví dụ, đôi khi chúng ta có thể muốn hồi quy ít nhất là lỗi trong x. Hoặc đôi khi chúng ta mong muốn khám phá mối quan hệ giữa y và x, sau đó không phải là vấn đề hồi quy thông thường. Sau đó, chúng ta có thể sử dụng Theil, nghĩa là độ dốc trung bình, hồi quy, như một sự thỏa hiệp đơn giản nhất giữa hồi quy lỗi x và y ít nhất. Hoặc nếu chúng ta biết phương sai của các biện pháp lặp lại là gì đối với cả x và y, chúng ta có thể sử dụng hồi quy Deming. Hồi quy Theil tốt hơn khi chúng ta có những điểm vượt trội, điều làm những điều khủng khiếp đối với kết quả hồi quy thông thường. Và, đối với hồi quy độ dốc trung bình, vấn đề nhỏ là phần dư có được phân phối bình thường hay không.
BTW, tính quy phạm của phần dư không nhất thiết phải cung cấp cho chúng tôi bất kỳ thông tin hồi quy tuyến tính hữu ích nào.Ví dụ: giả sử chúng ta đang thực hiện các phép đo lặp lại của hai phép đo độc lập. Vì chúng ta có tính độc lập, nên mối tương quan dự kiến là 0 và độ dốc đường hồi quy có thể là bất kỳ số ngẫu nhiên nào không có độ dốc hữu ích. Chúng tôi thực hiện các phép đo lặp lại để thiết lập ước tính vị trí, nghĩa là trung bình (hoặc trung vị (phân phối Cauchy hoặc Beta với một đỉnh) hoặc nói chung là giá trị kỳ vọng của dân số) và từ đó tính toán phương sai theo x và phương sai trong y, sau đó có thể được sử dụng cho hồi quy Deming, hoặc bất cứ điều gì. Hơn nữa, giả định rằng sự chồng chất do đó là bình thường ở cùng một nghĩa nếu dân số ban đầu là bình thường dẫn chúng ta đến không có hồi quy tuyến tính hữu ích. Để thực hiện điều này hơn nữa, giả sử sau đó tôi thay đổi các tham số ban đầu và thiết lập một phép đo mới với các vị trí tạo hàm Monte-x và y-value khác nhau và đối chiếu dữ liệu đó với lần chạy đầu tiên. Sau đó, phần dư là bình thường theo hướng y ở mọi giá trị x, nhưng, theo hướng x, biểu đồ sẽ có hai đỉnh, không phù hợp với các giả định OLS, và độ dốc và giao thoa của chúng ta sẽ bị sai lệch vì một không có dữ liệu khoảng bằng nhau trên trục x. Tuy nhiên, hồi quy của dữ liệu đối chiếu bây giờ có độ dốc và chặn nhất định, trong khi trước đó thì không. Hơn nữa, vì chúng tôi chỉ thực sự kiểm tra hai điểm với lấy mẫu lặp lại, chúng tôi không thể kiểm tra tính tuyến tính. Thật vậy, hệ số tương quan sẽ không phải là phép đo đáng tin cậy cho cùng một lý do,
Ngược lại, đôi khi người ta cũng cho rằng các lỗi có điều kiện phân phối bình thường trên các biến hồi quy. Giả định này là không cần thiết cho tính hợp lệ của phương pháp OLS, mặc dù một số thuộc tính mẫu hữu hạn bổ sung có thể được thiết lập trong trường hợp khi nó (đặc biệt là trong lĩnh vực kiểm định giả thuyết), xem tại đây. Khi nào thì OLS trong hồi quy đúng ya? Ví dụ, nếu chúng ta thực hiện các phép đo giá cổ phiếu đóng cửa mỗi ngày vào cùng một thời điểm chính xác, thì không có phương sai trục t (Think x-trục). Tuy nhiên, thời gian của giao dịch cuối cùng (thanh toán) sẽ được phân phối ngẫu nhiên và hồi quy để khám phá mối quan hệ giữa các biến sẽ phải kết hợp cả hai phương sai. Trong trường hợp đó, OLS trong y sẽ chỉ ước tính ít sai số nhất trong giá trị y, đó sẽ là một lựa chọn kém cho ngoại suy giá giao dịch cho một khoản thanh toán, vì thời gian của thỏa thuận đó cũng cần được dự đoán. Ngoài ra, lỗi phân phối thông thường có thể kém hơn Mô hình định giá Gamma .
Hiện có vấn đề gì? Chà, một số cổ phiếu giao dịch nhiều lần trong một phút và những người khác không giao dịch mỗi ngày hoặc thậm chí mỗi tuần, và nó có thể tạo ra sự khác biệt lớn về mặt số. Vì vậy, nó phụ thuộc vào những thông tin chúng ta mong muốn. Nếu chúng ta muốn hỏi thị trường sẽ hành xử như thế nào vào ngày mai khi đóng cửa, đó là câu hỏi "loại" OLS, nhưng, câu trả lời có thể là phi tuyến, phần dư không bình thường và yêu cầu hàm phù hợp có hệ số hình dạng phù hợp với độ dẫn phù hợp (và / hoặc khoảnh khắc cao hơn) để thiết lập độ cong chính xác cho phép ngoại suy . (Người ta có thể phù hợp với các công cụ phái sinh cũng như một chức năng, ví dụ như sử dụng các khối vuông, vì vậy khái niệm thỏa thuận phái sinh không nên gây ngạc nhiên, mặc dù nó hiếm khi được khám phá.) Nếu chúng ta muốn biết liệu chúng ta có kiếm được tiền hay không. trên một cổ phiếu cụ thể, sau đó chúng tôi không sử dụng OLS, vì vấn đề là sau đó là chia nhỏ.