Những lĩnh vực thống kê toán học có khả năng sử dụng cao?


13

Tôi sắp hoàn thành danh dự về thống kê và tôi thực sự muốn làm tiến sĩ vì tôi thấy thống kê toán học cực kỳ thú vị. Các lĩnh vực nghiên cứu tôi muốn làm tiến sĩ nhất là các quá trình ngẫu nhiên và chuỗi thời gian.

Tuy nhiên tôi cũng muốn theo đuổi sự nghiệp trong khu vực tư nhân sau khi học tiến sĩ. Tôi đã tự hỏi những lĩnh vực thống kê toán học được sử dụng nhiều nhất trong khu vực tư nhân, và trong các loại công việc?

Rõ ràng tôi sẽ không làm tiến sĩ chỉ vì nó có thể tuyển dụng được, nhưng tôi cảm thấy đó chắc chắn là điều tôi cần xem xét và vì vậy tôi muốn có một lời khuyên.


4
Chào mừng đến với CV! Trên trang web này không cần phải nói "cảm ơn" ở cuối bài đăng của bạn - ban đầu có vẻ thô lỗ, nhưng đó là một phần trong triết lý của trang web này ( tham quan ) để "Đặt câu hỏi, nhận câu trả lời, không làm phiền" và nó có nghĩa là những người đọc tương lai của câu hỏi của bạn không cần phải đọc qua những điều dễ chịu. Tương tự như vậy, không cần phải ký tên của bạn - tên người dùng và liên kết đến trang người dùng của bạn sẽ tự động xuất hiện ở cuối mỗi bài đăng
Silverfish

6
Câu hỏi bạn nên đặt ra là "lĩnh vực nào sẽ có nhu cầu trong 5-6 năm nữa?" Câu trả lời đúng là: "Chúng tôi không có manh mối."
Aksakal

@Aksakal, câu hỏi đó không nên được cho phép trên CV vì đó là ý kiến ​​dựa trên những gì bạn đã chỉ ra. Câu trả lời cho câu hỏi này nên khách quan và dựa trên số liệu thống kê việc làm nếu có thể. Cục Thống kê Lao động ở Mỹ có thể là một nơi tốt để OP bắt đầu.
StatsStudent 27/8/2016

2
Tôi nhận thấy có một chút mất kết nối ở đây giữa một câu hỏi dường như tập trung vào các chủ đề thống kê toán học và các câu trả lời chủ yếu tập trung vào các kỹ năng . Tôi không chắc đó có phải là vì câu hỏi không rõ ràng về những gì nó muốn, mọi người không đọc câu hỏi hay đây là cách mọi người nói rằng các kỹ năng quan trọng hơn chủ đề!
Cá bạc

2
@Silverfish, nếu câu trả lời sai thì sao? OP sẽ mất 6 năm cuộc đời sau đó. Đó là một mức giá cao đến mức tôi thậm chí sẽ không thử trả lời anh ta. Điều này cũng nên nói với anh ta rằng có lẽ anh ta không nên hỏi câu hỏi này. Có lẽ anh ta nên chọn khu vực thú vị nhất với anh ta. Cuộc đời của ông sẽ không dừng lại trong 6 năm của Tiến sĩ. Điều quan trọng là anh ấy sống những năm này, thích những gì anh ấy làm. Ai biết được chúng ta có bao lâu trên Trái đất này, mỗi khoảnh khắc đều có giá trị
Aksakal

Câu trả lời:


22

Tôi đang trả lời như một người thường xuyên đánh giá và thuê các nhà khoa học dữ liệu.

Là một người chuyển từ nghiên cứu học thuật sang sự nghiệp của khu vực tư nhân, bạn sẽ không được tuyển dụng dựa trên sức mạnh của bất kỳ kỹ năng cụ thể nào bạn có. Thế giới nghiên cứu học thuật về thống kê và lĩnh vực của bất kỳ vấn đề nào của một công ty cụ thể là quá rộng lớn để thuê trên cơ sở các kỹ năng cụ thể được xác định rất chính xác.

Thay vào đó, bạn sẽ được tuyển dụng bởi vì bạn có thể thể hiện năng khiếu chung về tư duy chính xác, khao khát và tài năng giải quyết vấn đề, khả năng hiểu và truyền đạt những ý tưởng trừu tượng và phức tạp, và một loạt các kỹ năng thực tế và lý thuyết.

Vì vậy, lời khuyên của tôi, và tôi chỉ là một chàng trai, hãy làm những gì bạn yêu thích và phát triển khát khao giải quyết vấn đề, sắc thái và sự phức tạp. Học một nhóm kỹ năng đa dạng và hiểu rõ các nguyên tắc cơ bản của bạn (tốt hơn so với chủ đề nghiên cứu của bạn)

Oh, và học cách lập trình.

Điều đó rất có ý nghĩa, cảm ơn rất nhiều vì đã trả lời chu đáo. Có ngôn ngữ lập trình cụ thể nào bạn muốn giới thiệu không

Câu hỏi khó trả lời mà không được quan điểm.

Ý kiến ​​cá nhân của tôi là nó không thực sự quan trọng, vì vậy hãy học cái bạn thích và điều đó thúc đẩy bạn tiếp tục học. Học ngôn ngữ đầu tiên của bạn thực sự tốt là trở ngại lớn. Sau lần đầu tiên học cái khác (và cái khác, và cái khác) dễ dàng hơn nhiều, vì bạn đã xử lý các thách thức khái niệm khó khăn.

Nhưng học tốt ngôn ngữ , học cách ngôn ngữ hoạt động và tại sao nó được thiết kế theo cách của nó. Viết mã sạch mà bạn không sợ quay lại. Lấy mã viết là một trách nhiệm nghiêm trọng, không phải là một thực tế đáng tiếc. Điều này làm cho nó vừa bổ ích hơn, vừa là một kỹ năng thực sự mà bạn có thể quảng cáo.

Nếu bạn vẫn muốn có lời khuyên cụ thể, tôi sẽ lặp lại @ssdecontrol, thích một ngôn ngữ có mục đích chung có thể thực hiện các số liệu thống kê trên một ngôn ngữ thống kê có thể (loại) làm mục đích chung.


3
@Patty Biết một ngôn ngữ có mục đích chung là một tài sản lớn tại các công ty công nghệ vì nó cho phép bạn "nói cùng một ngôn ngữ" như các nhà phát triển. Python là một lựa chọn tuyệt vời vì bạn cũng có thể sử dụng nó để phân tích dữ liệu và đó là phần giới thiệu tuyệt vời cho lập trình "thực". SAS sẽ không có giá trị bên ngoài các doanh nghiệp lớn. Và bất kể bạn đi đâu, có lẽ bạn sẽ cần biết một số SQL. Shell scripting cũng là một công cụ tốt để ít nhất là nhận thức được.
bóng tối

4
Liên quan đến cả lập trình và giải quyết vấn đề trong thế giới thực, một khuyến nghị sẽ là đảm bảo bạn có thể giải quyết một số dự án bằng dữ liệu "thô" (nghĩa là không phải tất cả được thu thập & xử lý trước cho bạn). Nếu bạn có thể thực hiện tổng hợp dữ liệu / làm sạch / kiểm soát chất lượng khi cần, thì kỹ năng lập trình của bạn sẽ được chuẩn bị tốt, bất kể ngôn ngữ nào bạn chọn.
GeoMatt22

2
"Thế giới của nghiên cứu học thuật về thống kê và lĩnh vực của bất kỳ vấn đề nào của một công ty nhất định là quá rộng lớn để thuê trên cơ sở các kỹ năng cụ thể được xác định rất chính xác." Có và không. Bạn chắc chắn có thể có một công việc mà không cần bất kỳ kỹ năng thống kê cụ thể nào (tức là bằng tiến sĩ chắc chắn là đủ, bất kể chủ đề nghiên cứu), nhưng bạn cũng có thể được tuyển dụng tích cực cho một nhóm kỹ năng cụ thể. Là một giai thoại, tôi biết một người đã từ chối 4 đề nghị riêng biệt từ Google vì họ quan tâm đến công việc của anh ta.
Vách đá AB

2
@CliffAB Điều đó công bằng. Nhưng tôi sẽ nghĩ rằng thật sai lầm khi nghiên cứu sâu về một cái gì đó chỉ để một công ty tích cực tuyển dụng bạn.
Matthew Drury

2
Haha về "nghiên cứu sâu", Matthew: Tôi chắc chắn người @CliffAB biết ai đã nhận được bốn lời đề nghị từ Google đang nghiên cứu sâu.
amip nói phục hồi Monica

4

Nếu bạn quan tâm đến các kỹ năng "có thể bán được", tôi sẽ nói rằng hãy tìm hiểu về một loạt các kỹ thuật mô hình (GLM, mô hình sinh tồn cả liên tục và rời rạc, rừng ngẫu nhiên, cây được tăng cường) với sự nhấn mạnh vào dự đoán. Thống kê toán học đôi khi có thể bị sa lầy vào ước lượng theo các mô hình tham số, cố gắng trả lời các câu hỏi trở nên không liên quan khi mô hình không đúng theo nghĩa đen. Vì vậy, trước khi đi sâu vào một vấn đề, hãy xem xét liệu nó có còn thú vị và có thể áp dụng được không khi mô hình không giữ được, bởi vì nó sẽ không bao giờ tồn tại. Bạn sẽ có thể tìm thấy nhiều câu hỏi như vậy trong lĩnh vực chuỗi thời gian, nếu đó là một trong những sở thích của bạn.

Cũng đánh giá cao rằng có những thách thức liên quan đến việc phân tích dữ liệu trong thế giới thực mà một mình giáo dục thống kê có thể không chuẩn bị cho bạn, vì vậy tôi sẽ xem xét bổ sung giáo dục của bạn vào nghiên cứu các chủ đề như cơ sở dữ liệu quan hệ và tính toán chung. Các lĩnh vực này cũng có thể rất hấp dẫn và cung cấp một quan điểm mới mẻ về dữ liệu.

Cuối cùng, như Matthew Drury đã chỉ ra rằng nó rất cần thiết để có thể lập trình. Tôi sẽ làm việc để trở nên mạnh mẽ với R và / hoặc Python và bắt đầu tìm hiểu về SQL, điều mà bạn sẽ gặp phải. Rất nhiều công ty vẫn sử dụng SAS, nhưng bạn có thực sự muốn làm việc cho một công ty không? Một ngôn ngữ được biên dịch như C hoặc Java cũng không bị tổn thương, nhưng điều này không thực sự quan trọng.


1
Tôi chắc chắn đồng ý rằng "Tất cả các mô hình đều sai, một số mô hình là hữu ích". Tuy nhiên, bạn có đồng ý rằng có thể có giá trị trong việc xây dựng các mô hình giải thích cơ học (thế hệ), có thể bao gồm các tham số tiềm ẩn (không quan sát được) không? Ví dụ, trong việc xác định chiến lược tạo / thu thập dữ liệu. Ấn tượng của tôi là đây có lẽ là một phân chia (mềm?) Giữa thống kê và học máy. Hoặc tôi có thể sai. (Tôi làm trong ngành công nghiệp, nhưng về mặt kỹ thuật không phải là "nhà khoa học dữ liệu".)
GeoMatt22

3

Là một người đã dành sự nghiệp sau tiến sĩ trong ngành công nghiệp, tôi sẽ nói điều này.

  1. Phản ứng của Matthew Drury là hạng nhất. Nhận xét của DSaxton về dự đoán so với ước tính cũng tốt.
  2. Học cách lập trình bằng bất cứ điều gì sẽ giúp bạn vượt qua trường cấp tốc với tốc độ. Hãy giỏi về nó. Một khi bạn rất thông thạo một ngôn ngữ, những ngôn ngữ khác rất dễ tiếp thu và bạn có thể làm như vậy với chi phí của chủ lao động.
  3. Các cơ sở dữ liệu sẽ không nhận được bất kỳ nhỏ hơn và có thể sẽ không nhận được bất kỳ sạch hơn. Tôi dự đoán rằng các kỹ thuật để đối phó với dữ liệu khổng lồ, lộn xộn / thiếu là một sự đánh cược xứng đáng trong hai hoặc ba thập kỷ tới.

2

Hầu hết các câu trả lời hiện tại đều theo định hướng "khoa học dữ liệu", đây chắc chắn là một lĩnh vực có thể sử dụng cao. Vì áp phích ban đầu đề cập đến mối quan tâm đặc biệt đối với các quá trình ngẫu nhiên và chuỗi thời gian, một lĩnh vực thống kê toán học khác * có thể có liên quan là ước tính không gian nhà nước .

Điều này được sử dụng để ước tính các mô hình trong đó hệ thống phát triển do phản hồi giữa các quy trình xác định có cấu trúc cao (gần đúng) và cưỡng bức ngẫu nhiên. Ví dụ, ước tính không gian nhà nước có mặt khắp nơi trong các phương tiện tự trị .

(* Khu vực này thường được coi là một phần của kỹ thuật hoặc các lĩnh vực khác , nhưng chắc chắn liên quan đến thống kê toán học.)


1

Tôi sẽ không đề xuất một cái gì đó hoàn toàn mới, nhưng với tư cách là một người quét dữ liệu chuyên nghiệp, tôi muốn nhấn mạnh một vài điểm.

  1. Tất cả các kỹ năng thị trường không chỉ là một nhóm các kỹ năng đơn lẻ mà còn là một gói hoàn toàn đồng bộ. Và theo gói, ý tôi là,

  2. Một tập hợp các kỹ năng thực tế, với trình độ cực kỳ cao. Giống như bạn có thể hình thành phán đoán có ý nghĩa cho một đống dữ liệu. Và đối với một anh chàng trình độ tiến sĩ (hoặc cho bất kỳ ai đến với họ), các nhà tuyển dụng sẽ quan tâm hơn đến việc mang lại sự phù hợp về nhận thức trong thế giới thực mà bạn có thể mang theo với một bộ dữ liệu nhất định. Để làm rõ, như một ví dụ,

  3. Tập hợp các kỹ năng mà bạn có thể sử dụng để trích xuất dữ liệu từ API, viết codec và trình điều khiển trong quy trình nếu bạn thấy quy trình này không thể chịu đựng được đến mức bạn không thể phát huy hết tiềm năng của mình. Sau đó sử dụng các yếu tố của phân tích thống kê để chuyển đổi dữ liệu thành thông tin. Quá trình này rất thô sơ và xác thực đến mức việc học của bạn càng đa dạng và sâu sắc, bạn càng có thể lấy thông tin tốt hơn nhiều. Tôi đã được nói một lần, rằng toán học thành thạo có thể đưa ra câu trả lời cho vấn đề là một điều nhưng để giải thích câu trả lời đó trong thế giới thực, chỉ là một kỹ năng khác.

  4. Cuối cùng và cực kỳ quan trọng, bạn có thể trình bày trực quan hóa kết luận của mình để mọi người cùng xem và hiểu mà không có ai không thuộc lĩnh vực liên quan của bạn không hỏi quá 3 câu hỏi tiếp theo. Và đây là nơi bạn sẽ đưa ra sự tương tự của bạn với quá trình trong thế giới thực. Có một chút khó khăn nhưng một khi thành thạo, nó thường trả cổ tức tốt, trong suốt sự nghiệp của bạn.

Đối với tất cả những điều này, theo quan điểm của tôi, một mẹo hữu ích là hãy tự hỏi bản thân một cách nhất quán trong khi nghiên cứu những điều mới mà làm thế nào nó có thể được sử dụng trong thế giới thực. Vâng, đôi khi nó trở nên lúng túng khi người ta đào sâu vào sự trừu tượng nhưng tuy nhiên đó là một thói quen rất đáng giá và thường nó tách biệt siêu có thể sử dụng được với trình độ học vấn cao. Chúc may mắn!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.