Toán tiến sĩ (lập trình phi tuyến) chuyển sang khoa học dữ liệu?


9

Tôi là một tiến sĩ toán học. sinh viên quan tâm đến việc trở thành một nhà khoa học dữ liệu sau khi tốt nghiệp. Tôi sẽ cung cấp ngắn gọn một số nền tảng về giáo dục của tôi trước khi đặt câu hỏi của tôi, để nó được hiểu rõ hơn:

Khóa học toán:

Điều này chủ yếu là trong toán học thuần túy: cấu trúc liên kết, phân tích chức năng, v.v., nhưng cũng bao gồm nhiều ứng dụng hơn (trên đó tôi chuyên về luận án): tối ưu hóa lồi, lập trình phi tuyến, phân tích số, lập trình tuyến tính, tối ưu hóa đa hướng. Ngoài ra, hiện tại tôi có 0 kiến ​​thức về chỉ số suy luận, nhưng tôi tự tin vào lý thuyết xác suất.

Lập trình:

Tôi mới tham gia một khóa học kéo dài một năm ở Cử nhân, nhưng chủ yếu là Mathicala và một số Java, trong đó tôi không nhớ gì một cách trung thực. Trong khóa học này, nội dung không bao gồm bất cứ điều gì về cấu trúc dữ liệu hoặc thiết kế và phân tích thuật toán, cũng như hệ thống quản lý cơ sở dữ liệu. Tôi cũng tự học Matlab để thực hiện các thuật toán trong luận án cử nhân.

Bối cảnh trên là trong chương trình Cử nhân và Thạc sĩ. Bây giờ, trong tiến sĩ. chương trình, tôi phát hiện ra rằng Machine Learning là sự pha trộn hoàn hảo (đối với tôi) giữa Tối ưu hóa phi tuyến tính, Lập trình và các ứng dụng trong thế giới thực, nghĩa là nó vừa thú vị về mặt lý thuyết vừa hướng đến ứng dụng. Đây là lý do tại sao tôi trở nên rất hào hứng để đi đến ngành công nghiệp. Do đó, tôi bắt đầu tự học mọi thứ (trong thời gian rảnh ít ỏi) trong 3 năm qua.

Tóm tắt ngắn gọn những điều đã học:

  • Python: Tôi thoải mái thực hiện các thuật toán tối ưu hóa, làm việc với máy tính xách tay jupyter và thư viện gọn gàng (thực tế, tôi phải làm điều này cho luận án) và thực hiện các thao tác dữ liệu cơ bản và làm sạch các tác vụ trong gấu trúc. Điều này tôi đã học trực tuyến, trong một nền tảng được gọi là dataquest ( https://app.dataquest.io ). Tuy nhiên, tôi không nghĩ mình có đủ kiến ​​thức để vượt qua một cuộc phỏng vấn về cấu trúc dữ liệu và thuật toán (xem ở trên).

  • Học máy: Tôi đã tham gia một khóa học thạc sĩ trong chủ đề tại đại học (vì tôi ở Đức, chúng tôi không có các khóa học trong Tiến sĩ, vì vậy đây là tất cả trong thời gian cá nhân của tôi), điều mà tôi thực sự rất thích. Các chủ đề bao gồm: k-NN, PCA, SVM, NN, v.v.

  • Tham gia một khóa học về Cơ sở dữ liệu trong học kỳ này, tập trung vào SQL.

  • Tham gia học chuyên sâu về Coursera trong học kỳ này.

Cuối cùng, tôi muốn nói rằng tôi cảm thấy hoàn toàn có khả năng học các chủ đề. Trên thực tế, với thời gian tôi dự định sẽ có nhiều khóa học sau đại học có sẵn trực tuyến hơn (ví dụ, Stanford CS231N, CS234, v.v.) bởi vì, theo tôi, các khóa học trực tuyến có thể không đủ nghiêm ngặt. Hy vọng, sau khi phòng thủ, tôi sẽ có thể tập trung toàn thời gian vào việc này.

Do đó các câu hỏi:

  • Tôi vẫn có thể được thuê vào thời điểm này (ý tôi là, sau khi kết thúc học kỳ này với kiến ​​thức được mô tả ở trên)? Thành thật tôi nghĩ rằng tôi chưa sẵn sàng, nhưng tôi cảm thấy tự tin rằng tôi có thể trở nên tốt trong một năm.

  • Có phải tôi đã quá ngây thơ khi nghĩ rằng một công ty sẽ cho tôi cơ hội?

  • Tôi nên làm gì để trở nên ham muốn hơn trong mọi trường hợp?


1
Khi tôi nộp đơn xin việc (ở Đức), có ít nhất hai công ty chỉ xem xét kiến ​​thức toán học. Họ không quan tâm đến bất cứ điều gì khác. Lập trình sẽ là một lợi ích nhưng họ có các lập trình viên chuyên dụng để chuyển đổi những thứ chủ yếu là các nhà toán học và vật lý học làm việc thành phần mềm.
Ben

Câu trả lời:


4

Tôi không đồng ý với các câu trả lời khác, nhưng đây là một quan điểm khác mà bạn nên ghi nhớ. Ngoài ra, tôi có thể đưa ra câu trả lời cho các câu hỏi cụ thể của bạn với tư cách là người rời khỏi học viện (toán ứng dụng / CS) cho khoa học dữ liệu.

Nói tóm lại, hiểu được nhu cầu cơ bản và các trường hợp sử dụng cho một vấn đề kinh doanh là điều tối quan trọng đối với bất kỳ dự án nào, và vì vậy việc phát triển ý thức kinh doanh mạnh mẽ và kỹ năng giao tiếp đa chức năng là rất quan trọng nếu bạn muốn tiếp cận rộng nhất trong sự nghiệp khoa học dữ liệu.

  • Tôi vẫn có thể được thuê vào thời điểm này (ý tôi là, sau khi kết thúc học kỳ này với kiến ​​thức được mô tả ở trên)? Thành thật tôi nghĩ rằng tôi chưa sẵn sàng, nhưng tôi cảm thấy tự tin rằng tôi có thể trở nên tốt trong một năm.
  • Có phải tôi đã quá ngây thơ khi nghĩ rằng một công ty sẽ cho tôi cơ hội?

Tôi sẽ trả lời những điều này cùng nhau. Nó phụ thuộc mạnh mẽ vào công ty và nhu cầu hiện tại của nó. Đối với bạn, điều này có thể thay đổi theo các chiều "khởi động" thành "doanh nghiệp" và "cửa hàng ML" thành "doanh nghiệp dựa trên dữ liệu chung". Về sau, ý tôi là có những công ty có mục đích duy nhất là bán sản phẩm hoặc dịch vụ ML cho khách hàng, so với các công ty công nghệ nói chung muốn khai thác mô hình hóa trong kinh doanh của họ. Có thể bạn sẽ tìm thấy sự phù hợp nhanh hơn / dễ dàng hơn với một công ty đã có các trường hợp sử dụng ML được xây dựng hoặc ra lệnh bởi những người khác, bởi vì bạn không có khả năng được trang bị để lên chiến lược cho dự án mới.

Vì vậy, điều đó có thể đúng với một doanh nghiệp lớn hơn có bộ phận chuyên nghiên cứu về kỹ thuật mô hình ML trong khi các bộ phận khác của công ty xác định chiến lược kinh doanh và thiết kế, hoặc trong một doanh nghiệp có quy mô tập trung vào ML là sản phẩm của mình / dịch vụ.

Trong ngắn hạn, có thể bạn có thể thuyết phục ai đó có bạn làm thực tập sinh hoặc trợ lý cho một số dự án, nhưng tiến sĩ của bạn có thể sẽ bị coi là một nhược điểm tiềm năng nếu bạn nói chuyện với các công ty vừa và nhỏ muốn thuê tổng giám đốc / jack cắm của tất cả các ngành nghề ...

  • Tôi nên làm gì để trở nên ham muốn hơn trong mọi trường hợp?

Điều này mang lại cho tôi điều này. Bạn có thể chọn cuộc phiêu lưu của riêng mình vì có rất nhiều loại vai trò, nhưng bạn nên biết loại vai trò và tình huống mà mỗi nhà tuyển dụng tiềm năng đang tìm kiếm, và hãy thực tế về cách bạn có thể phù hợp với nó. Có rất nhiều nhà tuyển dụng không thể hiện rõ ràng những gì họ muốn hoặc cần, hoặc thậm chí không biết bản thân họ là gì . Bạn sẽ làm tốt việc tìm ra điều đó với họ để tránh sự thất vọng nặng nề.

Nếu bạn muốn mở rộng tầm nhìn của mình về khoa học dữ liệu và đảm bảo bạn có tác động kinh doanh và cơ hội phát triển nghề nghiệp cao nhất, bạn muốn tìm hiểu thêm về các ứng dụng kinh doanh của khoa học dữ liệu. Những thứ này rất đa dạng và cả không chính thức trong thực tế và có tác động lớn hơn đến toàn bộ doanh nghiệp hơn là lo lắng về việc tối ưu hóa cho ma trận đảo ngược giả.

Mặc dù có những ý kiến ​​hợp lý trong các câu trả lời được đăng khác về thị trường, theo tôi, có một thâm hụt thị trường rất lớn đối với các nhà khoa học dữ liệu:

  • Thực sự hiểu nhu cầu kinh doanh và có thể giao tiếp hiệu quả với những người phi kỹ thuật
  • Phát triển và thực hiện các kế hoạch liên quan đến giải quyết vấn đề dựa trên dữ liệu chung, có thể có hoặc không liên quan đến việc xây dựng các mô hình "mát mẻ" (và thật lòng mà nói có lẽ họ sẽ không, ít nhất là cho đến khi vấn đề được hiểu rõ hơn bằng các phương pháp thăm dò truyền thống hơn).

câu trả lời rất hay
pcko1

Tôi (học thạc sĩ toán mới) tin rằng tôi ở thuyền đối diện với tư cách là OP. Một chút lập trình ở đó, một chút toán học ở đây, nhưng không có gì quá sâu ở bất cứ đâu. Giáo dục của tôi quá chung chung, vì vậy thật khó để nổi bật. Tôi có nhiều kỹ năng mềm như bạn đã đề cập trong viên đạn thứ hai đến viên đạn cuối cùng. Một khi tôi hiểu một khái niệm kỹ thuật đầy đủ, tôi khá giỏi trong việc giải thích nó cho giáo dân. Tôi cũng là một sĩ quan trong hải quân, vì vậy tôi có nhiều kinh nghiệm làm việc với mọi người và phóng chiếu một "hình ảnh", mà tôi nghĩ rằng đã vượt qua trong một tư duy kinh doanh.
đáNwaves

10

Các công việc khoa học dữ liệu bao gồm một loạt các hoạt động khác nhau nên bất kỳ câu trả lời nào cũng có thể là chủ quan. Tôi đang ở trong học viện nên kiến ​​thức về thị trường việc làm của tôi còn hạn chế, nhưng từ những gì tôi có thể thấy:

  • Bối cảnh hiện tại rất thuận lợi cho các nhà khoa học dữ liệu đang tìm kiếm một công việc, vì vậy bất kỳ ai có kiến ​​thức cơ bản về ML đều có cơ hội. Bạn đã ở trên mức này nên không phải lo lắng về điều này. Xu hướng hợp lý có khả năng tiếp tục như thế này, nhưng không ai biết tương lai.
  • Lý tưởng nhất là tăng cơ hội của bạn, bạn sẽ có thể chứng minh rằng bạn có một số kinh nghiệm thực tiễn: ví dụ như các dự án github, tham gia vào một cuộc thi ML, loại điều này.
  • Đừng bỏ bê tiến sĩ toán học của bạn: bạn dường như có rất nhiều thời gian rảnh để học khoa học dữ liệu, tốt cho bạn ... Nhưng hãy chắc chắn rằng tiến sĩ là ưu tiên hàng đầu của bạn, nó sẽ là một tài sản tuyệt vời trong hồ sơ của bạn ngay cả khi nó không liên quan đến khoa học dữ liệu.

cảm ơn câu trả lời
John D

3

Erwan đóng đinh nó (+1). Nhưng tôi nghĩ rằng sự bổ sung của tôi là một chút quá dài cho một nhận xét.

Bạn dường như đi trước nơi tôi ở khi tôi tìm được công việc DS. Tôi học toán thuần túy, một vài postdocs và chỉ có một thời gian ngắn tự học khi tôi nộp đơn vào ngành khoa học dữ liệu công nghiệp.

Mặt khác, tôi đã có các bài kiểm tra chuyên sâu trong khóa học của mình, điều này có lẽ đã giúp tôi vào không gian fintech. Khi đăng ký, hãy nhấn mạnh những gì bạn đã biết và thừa nhận những gì bạn sẽ cần học trong vài tháng đầu (lập trình mạnh hơn? Sử dụng git? ...).

(Ngoài ra, bạn đã không đề cập đến các mô hình dựa trên cây trong khóa học ML của mình: Tôi đoán đó chỉ là một thiếu sót, nhưng chúng dường như là mô hình quan trọng nhất để hiểu trừ khi bạn cố gắng tham gia vào các ngành công nghiệp có mạng lưới thần kinh là chuẩn mực.)


Cảm ơn câu trả lời! Thật tốt khi biết đây không phải là lần đầu tiên một nhà toán học thuần túy đến với khoa học dữ liệu.
John D

Tôi có thể hỏi ý kiến ​​của bạn về các khóa học trực tuyến như chuyên ngành Deep Learning về Coursera là gì không? Loại khóa học này thực sự chuẩn bị cho bạn làm việc trong ngành công nghiệp?
John D

Thay vì đến Coresera hãy thử các khóa học nhanh. Chúng phù hợp hơn với các ứng dụng thực tế, coursera rất tốt khi thấy bất kỳ khóa học nào MOOC họ sẽ dạy cho bạn các chủ đề và chủ đề và các khái niệm sau đó tùy thuộc vào bạn bao nhiêu sử dụng những công cụ đã học vào các ứng dụng cần thiết của bạn. Chỉ cần không lật đổ nó chỉ cần tham gia và tôi đảm bảo với bạn rằng bạn sẽ tìm thấy niềm đam mê của mình.
khwaja khôn ngoan

3

Đừng mù quáng đưa ra lời khuyên này: Các môn bạn đã đề cập trong toán học là cốt lõi để giải quyết vấn đề bằng cách sử dụng máy học / Học sâu, lập trình là một công cụ để thực hiện tất cả lý thuyết này mà bạn học và trên cơ sở đó bạn tạo ra các giả thuyết của mình và sau đó kiểm tra bằng cách triển khai nó trong mã cho rằng bạn không cần kỹ năng mã hóa của một lập trình viên, bạn nên biết cấu trúc dữ liệu sử dụng của mình, đặc biệt là các khung dữ liệu và thao tác kéo căng và phần còn lại bạn sẽ học trong khi thực hiện. Phần tốt nhất với bạn là bạn có kiến ​​thức cơ bản về toán học (Tôi giả sử bạn biết thống kê xác suất tính toán đa biến, phân tích chức năng và phần còn lại của các môn bạn đã đề cập tôi sẽ không đi sâu vào chi tiết vì bạn đã làm bằng tiến sĩ. .

Tôi muốn đề nghị bạn trải qua tất cả các khóa học từ Fast.ai được dạy bởi Jeremy Howard (anh ấy đúng nghĩa là thần học sâu) khóa học của anh ấy về học sâu thực tế cho các lập trình viên được tích hợp kiến ​​thức ngoài việc hiểu biết cốt lõi về toán học đằng sau mạng lưới thần kinh bạn có thể đến và đọc một blog của Michael Nielsen có tên là neuralnetworksanddeeplearning.com thực sự là một cuốn sách và một cuốn sách tuyệt vời và bạn sẽ thích giải thích toán học và để hiểu rõ hơn, bạn luôn có thể đọc và đọc blog của Chris olah.

Vì vậy, bây giờ vấn đề là bạn vẫn có thể nhận được nhiều thực tập nghiên cứu và học và học ở đó trong môi trường công nghiệp, nhưng tôi muốn đề nghị bạn, hãy dành thời gian cho các khóa học này để nắm bắt vấn đề và với toán học đằng sau bạn, bạn sẵn sàng làm bất cứ điều gì Hãy xem, khoa học dữ liệu ngay bây giờ giống như mọi người đều muốn trở thành một và chỉ nhận mức lương 6 chữ số đó và được thực hiện nhưng không phải là khoa học dữ liệu không phải là thứ bạn có thể học được ngay lập tức.

Vì vậy, hãy dành cho mình một chút thời gian kiên nhẫn và tiếp tục giải quyết tiếp tục đọc các tài liệu văn học về các chủ đề mới nhất hiện có sẵn miễn phí, vì vậy hãy tiếp tục.


cảm ơn câu trả lời sẽ làm.
John D
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.