Tôi đang tìm kiếm một số thống kê (và xác suất, tôi đoán) các câu hỏi phỏng vấn, từ cơ bản nhất đến nâng cao hơn. Câu trả lời là không cần thiết (mặc dù liên kết đến các câu hỏi cụ thể trên trang web này sẽ làm tốt).
Tôi đang tìm kiếm một số thống kê (và xác suất, tôi đoán) các câu hỏi phỏng vấn, từ cơ bản nhất đến nâng cao hơn. Câu trả lời là không cần thiết (mặc dù liên kết đến các câu hỏi cụ thể trên trang web này sẽ làm tốt).
Câu trả lời:
Không chắc chắn công việc là gì, nhưng tôi nghĩ "Giải thích x cho người mới" có lẽ sẽ tốt-
a) bởi vì họ có thể sẽ cần phải làm điều này trong công việc
b) đó là một bài kiểm tra tốt về sự hiểu biết, tôi nghĩ.
Tiêu chuẩn Q nơi tôi làm việc nằm dọc theo dòng:
Hãy xem kết quả này của hồi quy logistic nhiều từ gói thống kê mà bạn cho là đã sử dụng (tốt nhất là chúng tôi cũng sử dụng). XXX là biến độc lập của lãi suất gốc. Làm thế nào bạn có thể giải thích kết quả cho một đồng nghiệp có kiến thức về vấn đề này nhưng không được đào tạo thống kê chính thức? (Nếu cần nhắc để giải thích riêng về ước tính điểm, CI, giá trị p).
Bạn cũng có thể muốn suy nghĩ xem cuộc phỏng vấn có phải là phương tiện tốt nhất để đo lường mức độ quan tâm hay không. Nếu bạn muốn đo lường kiến thức trước về xác suất hoặc thống kê, bạn có thể tốt hơn nên dựa nhiều hơn vào bài kiểm tra viết. Bạn có thể đặt nhiều câu hỏi hơn, và do đó làm tăng độ tin cậy của phép đo. Nó được chuẩn hóa hơn cả về quản trị và ghi bàn. Và một khi công cụ được phát triển, nó có thể sử dụng ít tài nguyên hơn để quản trị.
Sau đó, bạn có thể sử dụng cuộc phỏng vấn như một công cụ tập trung hơn vào các yếu tố như kỹ năng nói và giao tiếp.
Hai câu hỏi tôi đã được hỏi:
1) Bạn phù hợp với hồi quy bội để kiểm tra ảnh hưởng của một biến cụ thể mà một công nhân ở bộ phận khác quan tâm. Biến này trở lại không đáng kể, nhưng đồng nghiệp của bạn nói rằng điều này là không thể vì nó được biết là có hiệu lực. Bạn sẽ nói / làm gì?
2) Bạn có 1000 biến và 100 quan sát. Bạn muốn tìm các biến quan trọng cho một phản ứng cụ thể. Bạn sẽ làm gì?
Đây là một bộ dữ liệu lớn. Kế hoạch của bạn để đối phó với các ngoại lệ là gì? Làm thế nào về các giá trị thiếu? Làm thế nào về biến đổi?
Họ có thể đối phó với dữ liệu trong thế giới thực?
Nhiều câu hỏi / câu trả lời trên trang web này có thể đưa ra ý tưởng cho câu hỏi hay. Tôi sẽ đưa ra một danh sách với một số liên kết như vậy mà tôi nghĩ là tốt. Bài viết mà tôi trả lời là quá đáng, bởi vì tôi biết những bài đăng đó tốt hơn, không phải vì chúng nhất thiết phải là tốt nhất! Tôi đưa ra nhận xét ngắn cho mỗi liên kết, vì vậy bạn có thể quyết định nếu bạn muốn theo liên kết.
Trực giác đằng sau SVD là gì? "Bạn có thể giải thích cho một trong những khách hàng của chúng tôi về cách thức hoạt động của SVD không?"
Ước tính khả năng tối đa (MLE) theo thuật ngữ giáo dân "Bạn có thể giải thích bằng ngôn ngữ phi kỹ thuật ý tưởng về ước tính khả năng tối đa không?"
Taleb và Thiên nga đen "Hãy cho tôi biết, một con thiên nga đen là gì và tại sao nó có liên quan? Khi nào nó có liên quan?"
Suy luận thống kê khi mẫu "là" dân số "Bạn có thể nói gì về suy luận thống kê khi mẫu là toàn bộ dân số?"
Mức độ phù hợp và mô hình nào để chọn hồi quy tuyến tính hoặc Poisson "Chúng tôi có vấn đề hồi quy trong đó phản hồi là biến đếm. Bạn sẽ chọn phương án nào trong bình phương này, bình phương tối thiểu bình thường hoặc hồi quy Poisson (hoặc có thể là một số khác)? , sự khác biệt chính giữa các mô hình này là gì? "
Sự khác biệt giữa phương sai hữu hạn và vô hạn "Bạn có thể giải thích, bằng ngôn ngữ đơn giản nhất có thể, ý nghĩa của một biến ngẫu nhiên có kỳ vọng vô hạn hoặc phương sai vô hạn? Tầm quan trọng thực tế của sự khác biệt này là gì? thí dụ."
Các lựa chọn hiện đại, dễ sử dụng để hồi quy từng bước là gì? "Làm thế nào bạn sẽ xây dựng một mô hình hồi quy phức tạp khi có nhiều biến dự đoán có thể xảy ra? Mô tả các chiến lược có thể khác nhau và nói về các vấn đề với từng biến số đó"
Làm thế nào để đối phó với sự tách biệt hoàn hảo trong hồi quy logistic? "Vấn đề tách trong hồi quy logistic, nguyên nhân, triệu chứng của nó là gì? Bạn có thể làm gì để giải quyết nó, nếu nó thực sự là một vấn đề?"
Tại sao ma trận tương quan cần phải là bán xác định dương và nó có nghĩa là gì hoặc không có nghĩa là bán xác định dương? và
ma trận hiệp phương sai xác định không tích cực cho tôi biết gì về dữ liệu của tôi? "Giải thích tại sao một ma trận hiệp phương sai phải dương (bán) xác định và điều đó có nghĩa là gì. Làm thế nào thực tế đó có thể được sử dụng?"
Các phiên bản đa chiều của trung vị "Bạn có thể đề xuất một số cách để khái quát hóa trung bình cho dữ liệu đa biến?"
Giải thích các thuật ngữ tương tác trong hồi quy logit với các biến phân loại và thực tiễn tốt nhất trong việc xác định các hiệu ứng tương tác là gì? và Hai tác động chính tiêu cực nhưng hiệu ứng tương tác tích cực? và Bao gồm các tương tác nhưng không phải là các hiệu ứng chính trong một mô hình và Làm thế nào để diễn giải các hiệu ứng chính khi hiệu ứng tương tác không đáng kể? "Giải thích ý nghĩa của sự tương tác trong các mô hình hồi quy. Cụ thể, điều đó có nghĩa gì nếu tương tác có ý nghĩa trong khi các hiệu ứng chính thì không? Có sự khác biệt nào trong việc giải thích tương tác giữa hồi quy tuyến tính thông thường và hồi quy logistic không?"
Điều gì có thể là lý do cho việc sử dụng chuyển đổi căn bậc hai trên dữ liệu? và chuyển đổi dữ liệu phù hợp "Khi nào, làm thế nào và tại sao bạn chuyển đổi biến trả lời trong mô hình hồi quy (hoặc ANOVA)? Có cách nào khác không?
Tôi có thể tin tưởng kết quả ANOVA cho một DV không được phân phối bình thường không? "Làm thế nào bạn sẽ điều trị ANOVA với phần dư không bình thường?
Tại sao số liệu thống kê hữu ích khi nhiều thứ quan trọng là một thứ bắn?
Làm thế nào tôi có thể mô hình hiệu quả tổng các biến ngẫu nhiên Bernoulli?
Khi nào nên sử dụng các phương trình ước lượng tổng quát so với các mô hình hiệu ứng hỗn hợp?
Điều gì đang xảy ra ở đây, khi tôi sử dụng mất bình phương trong cài đặt hồi quy logistic? "Tại sao chúng ta sử dụng khả năng maximul cho hồi quy logistic? Tại sao không phải là bình phương nhỏ nhất?"
Tôi đã được hỏi một lần về cách tôi sẽ giải thích sự liên quan của định lý giới hạn trung tâm với một lớp sinh viên năm nhất trong các ngành khoa học xã hội mà hầu như không có kiến thức về thống kê.
Làm thế nào để bạn số hóa một cái gì đó không phải là số?
Ví dụ: "Trích xuất tính năng tự động để phân loại dữ liệu âm thanh"
Đặt vấn đề: Họ có thể tìm ra cách phân tích thứ gì đó theo thống kê chưa có trong một bảng lớn không?
Làm thế nào để bạn ngăn chặn sự phù hợp quá mức khi bạn đang tạo một mô hình thống kê?
Câu trả lời hay: xác nhận chéo
Tôi thường hỏi "làm thế nào bạn sẽ xác định / giải thích dự báo là gì?"
Trả lời loại câu hỏi rất chung chung đó giúp tôi xem mọi người có liên quan đến một trường hợp dự báo cụ thể không. Không có câu trả lời đúng nhưng trả lời tổng hợp này trong một cuộc phỏng vấn không phải lúc nào cũng dễ dàng :)
Làm thế nào bạn sẽ đếm số lượng cây gỗ đàn hương ở Bangalore?
Trong tiêu đề Nhân quả và tương quan :
Việc sử dụng sự tham gia của khách hàng / người dùng làm tính năng cho một mô hình dự đoán là điều phổ biến. Ví dụ: những người nhấp vào nút này có nhiều khả năng đăng ký hơn những người không đăng ký. Những người mua sắm vào thứ Hai có nhiều khả năng mua sắm hơn so với những người mua sắm vào thứ ba.
Nếu chúng tôi thực hiện điều này đến mức cực đoan: Người dùng nhấp vào "mua hàng" có nhiều khả năng mua sản phẩm hơn người dùng không nhấp vào mua hàng.
Nhưng rõ ràng điều đó không hữu ích lắm trong việc giải thích lý do tại sao một số người dùng đăng ký và một số thì không.
Làm thế nào bạn sẽ đi về việc cân bằng sử dụng các tính năng của khách hàng, điều này giải thích tại sao họ đăng ký so với những tính năng có tương quan cao với đăng ký, nhưng cần thiết để hoàn thành nhiệm vụ?
Đây là một bộ TinkerToy . Chỉ cho tôi cách khoảng cách Euclide hoạt động theo ba chiều. Bây giờ chỉ cho tôi làm thế nào nhiều hồi quy hoạt động.
Họ có thể giải thích làm thế nào thống kê hoạt động trong thế giới vật lý?
Chúng tôi đang điều hành một trung tâm dịch vụ khách hàng. Chúng tôi đang nhận được 1 triệu cuộc gọi mỗi tháng. Làm thế nào để chúng ta giảm nó xuống mười ngàn?
Rất nhiều câu hỏi chúng tôi hỏi tương tự như những câu hỏi đã được mô tả. Nhưng một số mà tôi chưa đọc, được sử dụng: bạn có thể được yêu cầu phác thảo một chương trình trên bảng trắng để làm một cái gì đó như: mô phỏng một con súc sắc hoặc vấn đề xác suất khác, hoặc tính một loạt các số nguyên tố (ví dụ: tất cả các số nguyên tố nhỏ hơn 1.000.000) - bạn có thể thực hiện điều này bằng bất kỳ ngôn ngữ nào bạn muốn, nhưng hầu hết mọi người chọn R và một số chọn Python (tôi tin), nhưng tôi đoán bạn có thể chọn Stata, SAS, SPSS , Matlab, v.v. Có lẽ bạn sẽ được hỏi các câu hỏi để tìm hiểu sâu kiến thức về ngôn ngữ lập trình bạn chọn - ví dụ tại sao sử dụng áp dụng thay vì vòng lặp for trong R chẳng hạn.
Bạn cũng có thể được yêu cầu thiết kế một thí nghiệm hoặc nghiên cứu khác để điều tra một cái gì đó - thường là một cái gì đó thực tế - đôi khi điều này sẽ liên quan đến công việc chúng ta làm, nhưng thường thì không. (Bạn không cần phải có kiến thức về công việc chúng tôi làm, nhưng bạn sẽ có thể nắm bắt được ý chính của vấn đề mà bạn chưa từng nghe và suy đoán về nó một cách thông minh, ngay cả khi có kiến thức về miền nhất định mà bạn biết điều đó là sai - không sao, bạn không cần phải có kiến thức về miền). Bạn có thể được yêu cầu đưa những thứ như sức mạnh vào tài khoản.
Trong khi thực hiện phân tích phương sai của biến định lượng, đôi khi nhận thấy tần số của biến rất cao (> 5), sau đó chúng tôi sử dụng phép thử chính xác của Fisher để tìm ra tính độc lập của biến.
Số người tham dự trung bình tại các trò chơi Yankees năm ngoái là 55.000. Bạn ngẫu nhiên hỏi một nhóm người ở NYC nếu họ đến một trò chơi Yankees mùa trước, và nếu họ đã làm, bạn ghi lại số người tham dự được trả tiền. Tỷ lệ tham dự trung bình cho các trò chơi mà những người bạn hỏi đã tham gia một trò chơi là gì?
Tôi sẽ cung cấp cho bạn gợi ý cho câu trả lời của tôi (gợi ý không được cung cấp): lấy mẫu theo chiều dài. Tôi đã ghi được một giải chạy về nhà, nhưng nó không đủ để giành chiến thắng trong trò chơi, ha ha. Lưu ý: Tôi đã đề cập đến nhiều cảnh báo liên quan đến cách lấy mẫu và người phỏng vấn nói với tôi rằng hãy bỏ qua tất cả chúng.