Câu hỏi phỏng vấn thống kê


65

Tôi đang tìm kiếm một số thống kê (và xác suất, tôi đoán) các câu hỏi phỏng vấn, từ cơ bản nhất đến nâng cao hơn. Câu trả lời là không cần thiết (mặc dù liên kết đến các câu hỏi cụ thể trên trang web này sẽ làm tốt).



Sẽ rất thú vị nếu ai đó có thể đưa ra ví dụ mà họ đã tự đưa ra khi được phỏng vấn ...
kjetil b halvorsen

Câu trả lời:


40

Không chắc chắn công việc là gì, nhưng tôi nghĩ "Giải thích x cho người mới" có lẽ sẽ tốt-

a) bởi vì họ có thể sẽ cần phải làm điều này trong công việc

b) đó là một bài kiểm tra tốt về sự hiểu biết, tôi nghĩ.


8
(+1): Tôi không thể đếm số lần tôi nghĩ rằng tôi đã hiểu điều gì đó, nhưng sau đó tôi đã không thể giải thích nó cho người khác bằng những từ dễ hiểu. Ví dụ: p-value;)
steffen

6
"Nếu bạn không thể giải thích điều đó với một đứa trẻ sáu tuổi, thì có lẽ bạn không thể tự hiểu nó" - Albert Einstein. Có thể không phải là cực đoan, nhưng bạn có được điểm ... :)
JM không phải là một thống kê

1
Tôi thích "Giải thích giá trị p", có hoặc không có phần "cho người mới".
shabbychef

đây là lý do tại sao xác nhận chéo là tuyệt vời. rất nhiều câu hỏi và câu trả lời "giáo dân".
Neil McGuigan

Lời khuyên thực sự tốt cho dù bạn đang phỏng vấn hay không!
JMS

21

Tiêu chuẩn Q nơi tôi làm việc nằm dọc theo dòng:

Hãy xem kết quả này của hồi quy logistic nhiều từ gói thống kê mà bạn cho là đã sử dụng (tốt nhất là chúng tôi cũng sử dụng). XXX là biến độc lập của lãi suất gốc. Làm thế nào bạn có thể giải thích kết quả cho một đồng nghiệp có kiến ​​thức về vấn đề này nhưng không được đào tạo thống kê chính thức? (Nếu cần nhắc để giải thích riêng về ước tính điểm, CI, giá trị p).


15
Trong các bối cảnh học thuật hơn, người ta cũng có thể hỏi: 'hãy xem kết quả đầu ra của mô hình này trong bài báo này mà bạn (đồng tác giả) . Nói cho tôi biết ý nghĩa của nó. ' Các câu trả lời áp đảo sau đó gây tử vong vì không có lý do lạ lẫm nào có sẵn, nhưng lại rất phổ biến.
liên hợp chiến binh

4
@conjugatep Warrior Không đúng. Miễn là có ít nhất một đồng tác giả không có mặt, đó là khu vực không có đồng tác giả. Công dụng chính của kỹ thuật này là tại các buổi thuyết trình hội nghị.
Mark L. Stone

18

Bạn cũng có thể muốn suy nghĩ xem cuộc phỏng vấn có phải là phương tiện tốt nhất để đo lường mức độ quan tâm hay không. Nếu bạn muốn đo lường kiến ​​thức trước về xác suất hoặc thống kê, bạn có thể tốt hơn nên dựa nhiều hơn vào bài kiểm tra viết. Bạn có thể đặt nhiều câu hỏi hơn, và do đó làm tăng độ tin cậy của phép đo. Nó được chuẩn hóa hơn cả về quản trị và ghi bàn. Và một khi công cụ được phát triển, nó có thể sử dụng ít tài nguyên hơn để quản trị.

Sau đó, bạn có thể sử dụng cuộc phỏng vấn như một công cụ tập trung hơn vào các yếu tố như kỹ năng nói và giao tiếp.


1
đây là một quan điểm tốt. Tôi đã tìm thấy trong quá khứ rằng rất khó để biết liệu một ứng cử viên nhất định sẽ làm việc, trừ khi bạn đã làm việc với họ trong quá khứ.
shabbychef

15

Hai câu hỏi tôi đã được hỏi:

1) Bạn phù hợp với hồi quy bội để kiểm tra ảnh hưởng của một biến cụ thể mà một công nhân ở bộ phận khác quan tâm. Biến này trở lại không đáng kể, nhưng đồng nghiệp của bạn nói rằng điều này là không thể vì nó được biết là có hiệu lực. Bạn sẽ nói / làm gì?

2) Bạn có 1000 biến và 100 quan sát. Bạn muốn tìm các biến quan trọng cho một phản ứng cụ thể. Bạn sẽ làm gì?


Bạn có thể gửi câu trả lời là tốt? Đối với 1) Tôi giả sử, có thể có một số biến phụ thuộc gây ra vấn đề. Đối với 2) Tôi có thể sẽ đi kiểm tra thống kê χ² (chi bình phương)
Rishi Dua

2
Có nhiều câu trả lời hợp lý cho cả hai, đây là những suy nghĩ nhanh của tôi: 1) mô hình hồi quy là từ một mẫu, mẫu này có biến thể ngẫu nhiên và do đó mô hình chỉ là ước tính và có thể dẫn đến lỗi loại 1 hoặc loại 2. Cũng có thể có sự cộng tác nặng nề giữa những người dự đoán. Đối với 2) đó là vấn đề P lớn và N nhỏ. Có nhiều kỹ thuật để xử lý tình huống này, chẳng hạn như giảm kích thước và Lasso.
Glen

2) thực hiện các biến số đơn biến và xác định các biến có ý nghĩa nhất để giảm tập biến
adam

11

Đây là một bộ dữ liệu lớn. Kế hoạch của bạn để đối phó với các ngoại lệ là gì? Làm thế nào về các giá trị thiếu? Làm thế nào về biến đổi?

Họ có thể đối phó với dữ liệu trong thế giới thực?


Kính gửi người dùng ẩn danh, vui lòng không sử dụng chỉnh sửa cho các bình luận (nó không dành cho bạn, Neil).

10

Nhiều câu hỏi / câu trả lời trên trang web này có thể đưa ra ý tưởng cho câu hỏi hay. Tôi sẽ đưa ra một danh sách với một số liên kết như vậy mà tôi nghĩ là tốt. Bài viết mà tôi trả lời là quá đáng, bởi vì tôi biết những bài đăng đó tốt hơn, không phải vì chúng nhất thiết phải là tốt nhất! Tôi đưa ra nhận xét ngắn cho mỗi liên kết, vì vậy bạn có thể quyết định nếu bạn muốn theo liên kết.

Trực giác đằng sau SVD là gì? "Bạn có thể giải thích cho một trong những khách hàng của chúng tôi về cách thức hoạt động của SVD không?"

Ước tính khả năng tối đa (MLE) theo thuật ngữ giáo dân "Bạn có thể giải thích bằng ngôn ngữ phi kỹ thuật ý tưởng về ước tính khả năng tối đa không?"

Taleb và Thiên nga đen "Hãy cho tôi biết, một con thiên nga đen là gì và tại sao nó có liên quan? Khi nào nó có liên quan?"

Suy luận thống kê khi mẫu "là" dân số "Bạn có thể nói gì về suy luận thống kê khi mẫu là toàn bộ dân số?"

Mức độ phù hợp và mô hình nào để chọn hồi quy tuyến tính hoặc Poisson "Chúng tôi có vấn đề hồi quy trong đó phản hồi là biến đếm. Bạn sẽ chọn phương án nào trong bình phương này, bình phương tối thiểu bình thường hoặc hồi quy Poisson (hoặc có thể là một số khác)? , sự khác biệt chính giữa các mô hình này là gì? "

Sự khác biệt giữa phương sai hữu hạn và vô hạn "Bạn có thể giải thích, bằng ngôn ngữ đơn giản nhất có thể, ý nghĩa của một biến ngẫu nhiên có kỳ vọng vô hạn hoặc phương sai vô hạn? Tầm quan trọng thực tế của sự khác biệt này là gì? thí dụ."

Các lựa chọn hiện đại, dễ sử dụng để hồi quy từng bước là gì? "Làm thế nào bạn sẽ xây dựng một mô hình hồi quy phức tạp khi có nhiều biến dự đoán có thể xảy ra? Mô tả các chiến lược có thể khác nhau và nói về các vấn đề với từng biến số đó"

Làm thế nào để đối phó với sự tách biệt hoàn hảo trong hồi quy logistic? "Vấn đề tách trong hồi quy logistic, nguyên nhân, triệu chứng của nó là gì? Bạn có thể làm gì để giải quyết nó, nếu nó thực sự là một vấn đề?"

Tại sao ma trận tương quan cần phải là bán xác định dương và nó có nghĩa là gì hoặc không có nghĩa là bán xác định dương?
ma trận hiệp phương sai xác định không tích cực cho tôi biết gì về dữ liệu của tôi? "Giải thích tại sao một ma trận hiệp phương sai phải dương (bán) xác định và điều đó có nghĩa là gì. Làm thế nào thực tế đó có thể được sử dụng?"

Các phiên bản đa chiều của trung vị "Bạn có thể đề xuất một số cách để khái quát hóa trung bình cho dữ liệu đa biến?"

Giải thích các thuật ngữ tương tác trong hồi quy logit với các biến phân loạithực tiễn tốt nhất trong việc xác định các hiệu ứng tương tác là gì? Hai tác động chính tiêu cực nhưng hiệu ứng tương tác tích cực? Bao gồm các tương tác nhưng không phải là các hiệu ứng chính trong một mô hìnhLàm thế nào để diễn giải các hiệu ứng chính khi hiệu ứng tương tác không đáng kể? "Giải thích ý nghĩa của sự tương tác trong các mô hình hồi quy. Cụ thể, điều đó có nghĩa gì nếu tương tác có ý nghĩa trong khi các hiệu ứng chính thì không? Có sự khác biệt nào trong việc giải thích tương tác giữa hồi quy tuyến tính thông thường và hồi quy logistic không?"

Điều gì có thể là lý do cho việc sử dụng chuyển đổi căn bậc hai trên dữ liệu? chuyển đổi dữ liệu phù hợp "Khi nào, làm thế nào và tại sao bạn chuyển đổi biến trả lời trong mô hình hồi quy (hoặc ANOVA)? Có cách nào khác không?

Tôi có thể tin tưởng kết quả ANOVA cho một DV không được phân phối bình thường không? "Làm thế nào bạn sẽ điều trị ANOVA với phần dư không bình thường?

Tại sao số liệu thống kê hữu ích khi nhiều thứ quan trọng là một thứ bắn?

Làm thế nào tôi có thể mô hình hiệu quả tổng các biến ngẫu nhiên Bernoulli?

Khi nào nên sử dụng các phương trình ước lượng tổng quát so với các mô hình hiệu ứng hỗn hợp?

Điều gì đang xảy ra ở đây, khi tôi sử dụng mất bình phương trong cài đặt hồi quy logistic? "Tại sao chúng ta sử dụng khả năng maximul cho hồi quy logistic? Tại sao không phải là bình phương nhỏ nhất?"


9

Tôi đã được hỏi một lần về cách tôi sẽ giải thích sự liên quan của định lý giới hạn trung tâm với một lớp sinh viên năm nhất trong các ngành khoa học xã hội mà hầu như không có kiến ​​thức về thống kê.


4
Sự liên quan của Định lý giới hạn trung tâm là làm cho mọi người nghĩ rằng mọi thứ đều bình thường, trong khi thực tế không có gì. Và do đó dẫn đến nhiều kết luận sai lầm.
Mark L. Stone


8

Làm thế nào để bạn ngăn chặn sự phù hợp quá mức khi bạn đang tạo một mô hình thống kê?

Câu trả lời hay: xác nhận chéo


6

Tôi thường hỏi "làm thế nào bạn sẽ xác định / giải thích dự báo là gì?"

Trả lời loại câu hỏi rất chung chung đó giúp tôi xem mọi người có liên quan đến một trường hợp dự báo cụ thể không. Không có câu trả lời đúng nhưng trả lời tổng hợp này trong một cuộc phỏng vấn không phải lúc nào cũng dễ dàng :)


5

Đối với bối cảnh dữ liệu quan sát:

Xem xét mô hình hồi quy này áp dụng cho vấn đề thực chất này. Điều gì, nếu bất cứ điều gì, trong đó có thể được giải thích nguyên nhân? [Thăm dò thêm] Bạn cần học gì để thay đổi ý kiến?


4

Làm thế nào bạn sẽ đếm số lượng cây gỗ đàn hương ở Bangalore?


1
Điều đó có nghĩa là một loại câu hỏi Fermi ?
Thies Heidecke

2
Câu hỏi hay. Tôi đã sử dụng một phiên bản này trong lớp (cây trong công viên). Họ lấy ý tưởng lấy mẫu, nhưng có xu hướng bỏ lỡ nhu cầu định nghĩa hoạt động: khi nào bạn bắt đầu gọi nó là cây?
zbicyclist

4

Trong tiêu đề Nhân quả và tương quan :

Việc sử dụng sự tham gia của khách hàng / người dùng làm tính năng cho một mô hình dự đoán là điều phổ biến. Ví dụ: những người nhấp vào nút này có nhiều khả năng đăng ký hơn những người không đăng ký. Những người mua sắm vào thứ Hai có nhiều khả năng mua sắm hơn so với những người mua sắm vào thứ ba.

Nếu chúng tôi thực hiện điều này đến mức cực đoan: Người dùng nhấp vào "mua hàng" có nhiều khả năng mua sản phẩm hơn người dùng không nhấp vào mua hàng.

Nhưng rõ ràng điều đó không hữu ích lắm trong việc giải thích lý do tại sao một số người dùng đăng ký và một số thì không.

Làm thế nào bạn sẽ đi về việc cân bằng sử dụng các tính năng của khách hàng, điều này giải thích tại sao họ đăng ký so với những tính năng có tương quan cao với đăng ký, nhưng cần thiết để hoàn thành nhiệm vụ?


3

Đây là một bộ TinkerToy . Chỉ cho tôi cách khoảng cách Euclide hoạt động theo ba chiều. Bây giờ chỉ cho tôi làm thế nào nhiều hồi quy hoạt động.

Họ có thể giải thích làm thế nào thống kê hoạt động trong thế giới vật lý?


1
NN

1
nếu bạn muốn phân tán biểu đồ hai biến với 100 quan sát, bạn chỉ cần 2 chiều, không phải 100 :), v.v.
Neil McGuigan

3

Chúng tôi đang điều hành một trung tâm dịch vụ khách hàng. Chúng tôi đang nhận được 1 triệu cuộc gọi mỗi tháng. Làm thế nào để chúng ta giảm nó xuống mười ngàn?


5
loại bỏ 99% điện thoại của bạn!
shabbychef

5
Ngừng thanh toán hóa đơn điện thoại.
Glen

3
Mất phí cho cuộc gọi. (một số 900 ở Mỹ ...)
gWaldo

7
Câu hỏi này là về 80 quy tắc2020. Đó là một quy tắc phổ biến trong kinh doanh; ví dụ: "80% doanh số của bạn đến từ 20% khách hàng của bạn". Microsoft lưu ý rằng bằng cách sửa 20% lỗi được báo cáo hàng đầu, 80% lỗi và sự cố sẽ được loại bỏ. Vì vậy, điều đó có nghĩa là thiết lập Câu hỏi thường gặp để xác định 20% vấn đề này
Rishi Dua

3

Rất nhiều câu hỏi chúng tôi hỏi tương tự như những câu hỏi đã được mô tả. Nhưng một số mà tôi chưa đọc, được sử dụng: bạn có thể được yêu cầu phác thảo một chương trình trên bảng trắng để làm một cái gì đó như: mô phỏng một con súc sắc hoặc vấn đề xác suất khác, hoặc tính một loạt các số nguyên tố (ví dụ: tất cả các số nguyên tố nhỏ hơn 1.000.000) - bạn có thể thực hiện điều này bằng bất kỳ ngôn ngữ nào bạn muốn, nhưng hầu hết mọi người chọn R và một số chọn Python (tôi tin), nhưng tôi đoán bạn có thể chọn Stata, SAS, SPSS , Matlab, v.v. Có lẽ bạn sẽ được hỏi các câu hỏi để tìm hiểu sâu kiến ​​thức về ngôn ngữ lập trình bạn chọn - ví dụ tại sao sử dụng áp dụng thay vì vòng lặp for trong R chẳng hạn.

Bạn cũng có thể được yêu cầu thiết kế một thí nghiệm hoặc nghiên cứu khác để điều tra một cái gì đó - thường là một cái gì đó thực tế - đôi khi điều này sẽ liên quan đến công việc chúng ta làm, nhưng thường thì không. (Bạn không cần phải có kiến ​​thức về công việc chúng tôi làm, nhưng bạn sẽ có thể nắm bắt được ý chính của vấn đề mà bạn chưa từng nghe và suy đoán về nó một cách thông minh, ngay cả khi có kiến ​​thức về miền nhất định mà bạn biết điều đó là sai - không sao, bạn không cần phải có kiến ​​thức về miền). Bạn có thể được yêu cầu đưa những thứ như sức mạnh vào tài khoản.


2

Trong khi thực hiện phân tích phương sai của biến định lượng, đôi khi nhận thấy tần số của biến rất cao (> 5), sau đó chúng tôi sử dụng phép thử chính xác của Fisher để tìm ra tính độc lập của biến.


Điều này có lẽ sẽ được giảm bớt dưới câu trả lời của Chris.
JM không phải là một thống kê

4
Có câu trả lời đúng cho câu hỏi này bao gồm việc biết rằng có một cuộc tranh cãi về việc liệu các lề cố định có ý nghĩa và có một ý kiến ​​thông tin về chủ đề này không?
Ben Bolker

1

Số người tham dự trung bình tại các trò chơi Yankees năm ngoái là 55.000. Bạn ngẫu nhiên hỏi một nhóm người ở NYC nếu họ đến một trò chơi Yankees mùa trước, và nếu họ đã làm, bạn ghi lại số người tham dự được trả tiền. Tỷ lệ tham dự trung bình cho các trò chơi mà những người bạn hỏi đã tham gia một trò chơi là gì?

Tôi sẽ cung cấp cho bạn gợi ý cho câu trả lời của tôi (gợi ý không được cung cấp): lấy mẫu theo chiều dài. Tôi đã ghi được một giải chạy về nhà, nhưng nó không đủ để giành chiến thắng trong trò chơi, ha ha. Lưu ý: Tôi đã đề cập đến nhiều cảnh báo liên quan đến cách lấy mẫu và người phỏng vấn nói với tôi rằng hãy bỏ qua tất cả chúng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.