Tôi sẽ giải quyết vấn đề này mặc dù tôi không phải là một nhà thống kê bằng bất kỳ cách nào nhưng lại tiếp tục thực hiện nhiều 'mô hình hóa' - thống kê và không thống kê.
Trước tiên hãy bắt đầu với những điều cơ bản:
Mô hình chính xác là gì?
Một mô hình là một đại diện của thực tế mặc dù rất đơn giản. Hãy nghĩ về một 'mô hình' sáp / gỗ cho một ngôi nhà. Bạn có thể chạm / cảm nhận / ngửi nó. Bây giờ một mô hình toán học là một đại diện của thực tế bằng cách sử dụng các con số.
'Thực tế' này tôi nghe bạn hỏi là gì? Được chứ. Vì vậy, hãy nghĩ về tình huống đơn giản này: Thống đốc tiểu bang của bạn thực hiện một chính sách nói rằng giá của một bao thuốc lá bây giờ sẽ có giá 100 đô la cho năm tới. "Mục đích" là ngăn cản người dân mua thuốc lá do đó giảm hút thuốc, do đó làm cho người hút thuốc khỏe mạnh hơn (vì họ đã bỏ thuốc lá).
Sau 1 năm, thống đốc hỏi bạn - đây có phải là một thành công? Sao bạn lại có thể nói điều đó? Vâng, bạn nắm bắt dữ liệu như số lượng gói được bán / ngày hoặc mỗi năm, phản hồi khảo sát, bất kỳ dữ liệu có thể đo lường nào bạn có thể có trong tay có liên quan đến vấn đề. Bạn mới bắt đầu 'mô hình hóa' vấn đề. Bây giờ bạn muốn phân tích những gì 'mô hình' này nói . Đó là nơi mô hình thống kê có ích. Bạn có thể chạy một biểu đồ tương quan / phân tán đơn giản để xem mô hình 'trông như thế nào'. Bạn có thể thích thú để xác định quan hệ nhân quả, ví dụ, nếu việc tăng giá dẫn đến giảm hút thuốc hoặc có các yếu tố gây nhiễu khác khi chơi (có thể đó là một cái gì đó khác hoàn toàn và mô hình của bạn có lẽ đã bỏ lỡ?).
Bây giờ, việc xây dựng mô hình này được thực hiện bởi một 'bộ quy tắc' (giống như hướng dẫn hơn), nghĩa là những gì / không hợp pháp hoặc những gì không / không có ý nghĩa. Bạn nên biết những gì bạn đang làm và làm thế nào để giải thích kết quả của mô hình này. Xây dựng / Thi công / Phiên dịch mô hình này đòi hỏi kiến thức cơ bản về thống kê. Trong ví dụ trên, bạn cần biết về các ô tương quan / phân tán, hồi quy (uni và multivariate) và các công cụ khác. Tôi khuyên bạn nên đọc niềm vui / thông tin tuyệt đối để đọc số liệu thống kê bằng trực giác: Dù sao giá trị p là một giới thiệu hài hước về thống kê và sẽ dạy bạn 'mô hình hóa' trong suốt quá trình từ đơn giản đến nâng cao (ví dụ, hồi quy tuyến tính). Sau đó, bạn có thể tiếp tục và đọc những thứ khác.
Vì vậy, hãy nhớ một mô hình là một đại diện của thực tế và rằng "Tất cả các mô hình đều sai nhưng một số mô hình hữu ích hơn các mô hình khác" . Mô hình là một đại diện đơn giản của thực tế và bạn không thể xem xét mọi thứ nhưng bạn phải biết những gì nên làm và không nên xem xét để có một mô hình tốt có thể mang lại cho bạn kết quả có ý nghĩa.
Nó không dừng lại ở đây. Bạn có thể tạo mô hình để mô phỏng thực tế quá! Đó là cách một loạt các số sẽ thay đổi theo thời gian (nói). Những con số này ánh xạ đến một số giải thích có ý nghĩa trong miền của bạn. Bạn cũng có thể tạo các mô hình này để khai thác dữ liệu của mình để xem các biện pháp khác nhau liên quan đến nhau như thế nào (ứng dụng thống kê ở đây có thể gây nghi ngờ, nhưng đừng lo lắng ngay bây giờ). Ví dụ: Bạn nhìn vào doanh số bán hàng tạp hóa cho một cửa hàng mỗi tháng và nhận ra rằng bất cứ khi nào bia được mua, đó là một gói tã (bạn xây dựng một mô hình chạy qua bộ dữ liệu và hiển thị cho bạn liên kết này). Nó có thể là lạ nhưng nó có thể ngụ ý rằng hầu hết các ông bố mua này vào cuối tuần khi em bé ngồi con của họ? Đặt tã gần bia và bạn có thể tăng doanh số bán hàng của bạn! À! Người mẫu :)
Đây chỉ là những ví dụ và không có nghĩa là một tài liệu tham khảo cho công việc chuyên nghiệp. Về cơ bản, bạn xây dựng các mô hình để hiểu / ước tính thực tế sẽ hoạt động như thế nào và thực hiện các quyết định tốt hơn dựa trên các kết quả đầu ra. Thống kê hay không, có lẽ bạn đã làm người mẫu suốt đời mà không nhận ra điều đó. May mắn nhất :)