Bạn nghĩ gì về chứng chỉ Khoa học dữ liệu?


35

Bây giờ tôi đã thấy hai chương trình chứng nhận khoa học dữ liệu - chương trình John Hopkins có sẵn tại CourseraCloudera .

Tôi chắc chắn có những người khác ở ngoài đó.

Tập hợp các lớp John Hopkins tập trung vào R dưới dạng bộ công cụ, nhưng bao gồm một loạt các chủ đề:

  • Lập trình R
  • làm sạch và lấy dữ liệu
  • Phân tích dữ liệu
  • Nghiên cứu sinh sản
  • Suy luận thống kê
  • Mô hình hồi quy
  • Học máy
  • Phát triển sản phẩm dữ liệu
  • Và những gì có vẻ là một nhiệm vụ hoàn thành dựa trên Dự án tương tự như Thử thách Khoa học Dữ liệu của Cloudera

Chương trình Cloudera trông mỏng manh trên bề mặt, nhưng dường như để trả lời hai câu hỏi quan trọng - "Bạn có biết các công cụ", "Bạn có thể áp dụng các công cụ trong thế giới thực". Chương trình của họ bao gồm:

  • Giới thiệu về Khoa học dữ liệu
  • Bài kiểm tra khoa học dữ liệu
  • Thử thách khoa học dữ liệu (kịch bản dự án khoa học dữ liệu thế giới thực)

Tôi không tìm kiếm một khuyến nghị về một chương trình hoặc so sánh chất lượng.

Tôi tò mò về các chứng chỉ khác ngoài kia, các chủ đề mà họ đề cập và mức độ nghiêm túc của các chứng chỉ DS được cộng đồng xem tại thời điểm này.

EDIT: Đây là tất cả các câu trả lời tuyệt vời. Tôi đang chọn câu trả lời đúng bằng phiếu bầu.


4
Điều này là quá rộng và chủ yếu dựa trên ý kiến. Vui lòng xem datascience.stackexchange.com/help/dont-ask
asheeshr

3
@AsheeshR - Chúng tôi có trung bình 2 câu hỏi mỗi ngày và 2 câu trả lời cho mỗi câu hỏi. Tại thời điểm này, trọng tâm cần phải được khuyến khích tham gia và tăng sự quan tâm.
Steve Kallestad

10
Tham gia với chi phí chất lượng trang web không phải là giải pháp. Tham gia là nhất thời. Chất lượng là khó khăn hơn nhiều để thay đổi sau này.
asheeshr

4
Xe đạp , Nơi làm việc , Tài chính & Tiền bạc cá nhân , Những người hoài nghi , Phát triển trò chơi đều ra mắt với ít hơn 10 câu hỏi mỗi ngày. Xe đạp được ra mắt với 4 chiếc mỗi ngày vì nó được coi là một trang web chất lượng cao.
asheeshr

3
Chà ... tôi đoán tôi phải tuyên bố bạn là người chiến thắng vào thời điểm này. :)
Steve Kallestad

Câu trả lời:


13

Tôi đã học 2 khóa đầu tiên và tôi cũng dự định làm tất cả các khóa khác. Nếu bạn không biết R, đó là một chương trình thực sự tốt. Có bài tập và câu hỏi mỗi tuần. Nhiều người tìm thấy một số khóa học rất khó khăn. Bạn sẽ có thời gian khó khăn nếu bạn không có bất kỳ kinh nghiệm lập trình nào (ngay cả khi họ nói rằng điều đó không bắt buộc).

Chỉ cần nhớ .. không phải vì bạn có thể lái xe mà bạn là phi công F1;)


32

Là một người quản lý phân tích trước đây và là một nhà khoa học dữ liệu hàng đầu hiện tại, tôi rất không cần phải có chứng chỉ khoa học dữ liệu. Thuật ngữ nhà khoa học dữ liệu khá mơ hồ và lĩnh vực khoa học dữ liệu đang ở giai đoạn sơ khai. Một chứng chỉ ngụ ý một số loại tiêu chuẩn thống nhất chỉ thiếu về khoa học dữ liệu, nó vẫn còn rất nhiều ở phía tây hoang dã.

Mặc dù chứng chỉ có thể sẽ không làm tổn thương bạn, tôi nghĩ rằng thời gian của bạn sẽ tốt hơn dành cho việc phát triển kinh nghiệm để biết khi nào nên sử dụng một cách tiếp cận nhất định và hiểu biết sâu sắc để có thể giải thích cách tiếp cận đó cho khán giả phi kỹ thuật.


2
Đôi khi kinh nghiệm khó có được nếu công việc hiện tại của bạn không tập trung vào khoa học dữ liệu mà vào một số lĩnh vực liên quan (theo thống kê trường hợp của tôi). Tôi sử dụng các khóa học để có được một số kiến ​​thức và tiếp tục chủ đề, điều mà tôi không thể làm trong công việc ban ngày của mình.
Christian Sauer

1
Tôi hoàn toàn đồng ý, các khóa học rất có giá trị để cung cấp cho bạn một điểm khởi đầu và một số cấu trúc để có được kinh nghiệm đó. Để tận dụng tối đa Mooc, tôi khuyên bạn nên lấy một ví dụ rất cụ thể, giả sử hồi quy logistic và thực sự làm việc với nó bằng một bộ dữ liệu khác, thưởng gấp đôi nếu bạn thực hiện bằng ngôn ngữ khác với ngôn ngữ mà khóa học được dạy .
neone4373

Đó là một ý kiến ​​hay. Những gì còn thiếu cho thống kê nói chung là một trang web đào tạo. Ví dụ: một bộ cơ sở dữ liệu, cùng với các mục tiêu và kết quả có thể có ở cuối. Một cái gì đó giống như khancademy, nhưng mạnh hơn;)
Christian Sauer

11

Các chương trình chứng nhận mà bạn đề cập là các khóa học cấp thực sự. Cá nhân, tôi nghĩ những chứng chỉ này chỉ thể hiện sự kiên trì của người đó và chúng chỉ có thể hữu ích cho những người đang xin thực tập, chứ không phải những công việc khoa học dữ liệu thực sự.


Tôi đồng ý. Các tài liệu khóa học là tốt để giúp bạn bắt đầu nhưng nó chủ yếu là cấp nhập cảnh.
Shagun Sodhani

10

Tôi lãnh đạo các nhóm khoa học dữ liệu cho một công ty Internet lớn và tôi đã sàng lọc hàng trăm hồ sơ và phỏng vấn hàng chục người cho các nhóm của chúng tôi trên khắp thế giới. Nhiều ứng viên đã vượt qua các khóa học và chương trình nói trên hoặc mang lại thông tin tương tự. Cá nhân tôi cũng đã tham gia các khóa học, một số tốt, một số khác thì thất vọng nhưng không ai trong số họ biến bạn thành "nhà khoa học dữ liệu".

Nói chung, tôi đồng ý với những người khác ở đây. Giấy chứng nhận từ Coursera hoặc Cloudera chỉ báo hiệu sự quan tâm nhưng nó không di chuyển kim. Có rất nhiều điều cần xem xét và bạn có thể có tác động lớn hơn bằng cách cung cấp kho lưu trữ toàn diện cho công việc của bạn (ví dụ như hồ sơ github) và bằng cách kết nối với các nhà khoa học dữ liệu khác. Bất cứ ai tuyển dụng cho một hồ sơ khoa học dữ liệu sẽ luôn thích nhìn thấy công việc và phong cách / khả năng mã hóa trước đây của bạn.


8

Có nhiều chứng chỉ đang diễn ra, nhưng chúng có phạm vi tập trung và phong cách giảng dạy khác nhau.

Tôi thích The Edge Edge trên eDX hơn nhiều so với chuyên môn của John Hopkins, vì nó chuyên sâu hơn và thực hành. Kỳ vọng trong chuyên môn hóa của John Hopkins là đưa vào 3 - 4 giờ một tuần so với 11 - 12 giờ một tuần trên Analytics Edge.

Từ góc độ ngành công nghiệp, tôi lấy những chứng chỉ này như một dấu hiệu quan tâm và không phải là mức độ kiến ​​thức mà một người sở hữu. Có quá nhiều người bỏ học trong các MOOCs này. Tôi đánh giá cao trải nghiệm khác (như tham gia các cuộc thi Kaggle) nhiều hơn là trải qua chứng nhận XYZ trên MOOC.


2
Và những gì về số liệu thống kê.SE, datascience.SE. Bạn có nghĩ rằng họ có thể nói nhiều về trình độ kiến ​​thức liên quan?
IharS

Những người bỏ học phải làm gì với nó? Có lẽ, chứng nhận phụ thuộc vào việc hoàn thành khóa học, không chỉ đơn thuần là đăng ký trên sàn
Gala

Có nhiều người đề cập rằng họ đang trải qua chứng nhận bằng cách thực hiện một khóa học về các MOOCs này. Bạn cần phải cẩn thận với điều đó.
Kunal

@Kunal Điều đó có ý nghĩa nhưng câu trả lời của bạn nhảy từ chứng nhận trực tuyến và sang bỏ học trực tuyến (có lẽ không có chứng nhận ). Chìa khóa ở đây đang trải qua . Nó giống như được đăng ký như một sinh viên hoặc có tài khoản Kaggle. Không ai trong số này cho chúng tôi biết bạn nên đánh giá cao một người thực sự có được bằng cấp, hoàn thành khóa học hay tham gia một cuộc thi đến cùng.
Gala

6

Không chắc chắn về kỷ nguyên đám mây, nhưng một trong những người bạn của tôi đã tham gia John Hopkins và theo lời anh ta, "thật tuyệt vời khi bạn bắt đầu". Nó cũng đã được đề xuất bởi rất nhiều người. Tôi đang lên kế hoạch tham gia nó trong vài tuần nữa. Về mức độ nghiêm trọng, tôi không nghĩ những chứng chỉ này sẽ giúp bạn có được một công việc, nhưng họ chắc chắn sẽ giúp bạn học hỏi.


4

@OP: Chọn câu trả lời bằng phiếu bầu là ý tưởng TUYỆT VỜI.

Câu hỏi của bạn trở thành một cuộc thi phổ biến. Bạn nên tìm kiếm câu trả lời đúng, tôi nghi ngờ bạn biết những gì bạn đang hỏi, biết những gì bạn đang tìm kiếm.

Để trả lời câu hỏi của bạn:
Q: cộng đồng xem các chứng chỉ DS nghiêm túc như thế nào.

A: Mục tiêu của bạn khi tham gia các khóa học này là gì? Đối với công việc, cho trường học, để tự cải thiện, vv? Các lớp học Coursera rất được áp dụng, bạn sẽ không học được nhiều lý thuyết, chúng được dành riêng cho lớp học.

Tuy nhiên, các lớp Coursera rất hữu ích. Tôi muốn nói rằng nó tương đương với một năm học lớp tốt nghiệp, trong chương trình Thạc sĩ hai năm.

Tôi không chắc chắn về sự công nhận ngành công nghiệp của nó chưa, bởi vì vấn đề làm thế nào bạn thực sự tham gia khóa học? Bạn đã dành bao nhiêu thời gian Việc đạt điểm A trong các khóa học này dễ dàng hơn nhiều so với kỳ thi bút chì trên lớp. Vì vậy, có một sự thay đổi chất lượng rất lớn từ người này sang người khác.


Một phần của câu hỏi có nghĩa là để đánh giá liệu cộng đồng có đặt giá trị lên chứng nhận hay không. Trong một số lĩnh vực, chứng nhận là một điều cần thiết tuyệt đối. Ở những người khác, chứng nhận hoàn toàn không thành vấn đề. Trong những người khác, chứng chỉ của một công ty cụ thể được tổ chức trong sự quan tâm cao và chứng chỉ cạnh tranh thì không. Phần khác là để hiểu sự khác biệt trong trọng tâm chủ đề của các chứng chỉ ngoài kia. Khoa học dữ liệu là một thuật ngữ rộng. Giấy chứng nhận thường tập trung hơn. Đây là một câu hỏi tồi cho định dạng QA - đó là một cuộc thảo luận nhiều hơn, tùy thuộc vào ý kiến.
Steve Kallestad

Mục đích của tôi khi lưu ý rằng tôi đã chọn câu trả lời bằng phiếu bầu là làm cho nó rõ ràng rằng tất cả các câu trả lời xứng đáng được đọc. Mọi người đều làm cho điểm tốt, bao gồm cả bạn xuống ở đây ở phía dưới. Ai đó đang tự hỏi về những điều này không nên giới hạn bản thân trong một hoặc hai câu trả lời hàng đầu.
Steve Kallestad

Bỏ phiếu để tìm câu trả lời đúng là một ý tưởng khủng khiếp. Đó là cách sai để tiếp cận toán học. Bạn rõ ràng đã bỏ lỡ quan điểm của tôi.
dùng13985

2

Tôi nghĩ rằng hiệu quả của chứng nhận từ coursera phụ thuộc vào từng cá nhân cũng như các lớp học. Yêu cầu nói tối thiểu 3-5 giờ một tuần, nếu bạn đặt nhiều hơn và tài liệu mở ra nhiều hơn 3-5 giờ, thì các lớp học và chứng chỉ này có thể tương đương với nền tảng kiến ​​thức và kinh nghiệm mạnh mẽ trong lĩnh vực này . Khoa học đến với những người yêu cầu nó.


2

Tôi gần như đã hoàn thành với Chuyên ngành Khoa học Dữ liệu của Johns Hopkins trên Coursera (Một khóa học và một viên đá còn lại để tốt nghiệp). Tôi sẽ chỉ cung cấp cho bạn những ưu và nhược điểm của nó, cố gắng giữ cho nó khách quan nhất có thể:

Ưu điểm :

  • Cấu trúc xung quanh quá trình học tập
  • Bạn sẽ xây dựng một danh mục đầu tư theo thời gian

Nhược điểm :

  • Nền tảng khác nhau cần thiết cho các khóa học khác nhau. Một vài khóa học đầu tiên không thừa nhận kiến ​​thức trước đó. Nó đột nhiên không dễ hiểu trong các khóa học khái niệm. (Suy luận thống kê, phân tích hồi quy)
  • Giảng dạy bởi 3 giáo sư. Tôi nghĩ rằng họ không ở cùng một trang về đối tượng tiềm năng và khả năng / nhu cầu / sở thích của họ.

2

Cách tốt nhất để thành công khi nhận được công việc mà bạn muốn nó cho thấy rằng bạn có thể làm được.

Các MOOCs mà bạn đề cập sẽ cung cấp cho bạn một nền tảng tốt về những điều cơ bản và đủ để bạn bắt đầu giải quyết các vấn đề về khoa học dữ liệu / máy học của riêng bạn. Hãy thử một hoặc hai cuộc thi Kaggle, đó là một cách tuyệt vời để cải thiện kỹ năng của bạn, và một lớp tốt sẽ có mối quan tâm đối với một nhà tuyển dụng tiềm năng. Xuất bản kết quả của bạn trên Github bằng cách sử dụng một cái gì đó như iPython Notebook, điều này sẽ cho phép công việc của bạn dễ dàng được nhìn thấy và đánh giá.

Hãy thử phân tích trên các bộ dữ liệu công khai khác, như Bộ dữ liệu chia sẻ xe đạp UCI hoặc Bộ dữ liệu điều trị bệnh tiểu đường UCI rất thú vị để thử, và cho thấy rằng bạn rất quan tâm và sẵn sàng phát triển các kỹ năng của mình.


2

Nó thực sự phụ thuộc vào uy tín của tổ chức cấp giấy chứng nhận. Ví dụ, Chứng nhận Khoa học Dữ liệu từ một công ty có trụ sở tại Harvard được nhiều đối tác trong ngành công nhận và có thể là một lựa chọn tốt. Bạn đã không nói loại chứng chỉ bạn đang tìm kiếm?


1

Giá trị cho sinh viên, túi hỗn hợp. Trả vài trăm đô la cho một chương trình hoặc một trăm pop cho một khóa học là một động lực.

Tôi đã hoàn thành một loạt, từ MITx. Đây là một khóa khảo sát tốt nghiệp về các phương pháp và công cụ nhằm vào những người cần "biết về" một cách chi tiết. Thế là đủ, tôi đã cảm thấy thoải mái khi áp dụng những gì tôi đã học được.

Một khóa học HarvardX độc lập về phương pháp đồ thị theo chu kỳ được định hướng giống như một hội thảo tốt nghiệp về thống kê về phương pháp Judea Pearl. Nó đã có một thời gian dài trước khi tôi nghe về nó, nếu không.

Sê-ri HarvardX là một trại khởi động cấp sau đại học nhằm định hướng cho sinh viên mới đến bộ công cụ và ứng dụng R.

Sê-ri BerkeleyX là một khóa khảo sát đại học sử dụng lớp Python được xây dựng có mục đích gần như là một ngôn ngữ cụ thể của miền.

Về giá trị của các chứng chỉ, tôi chỉ có thể báo cáo rằng kinh nghiệm giáo dục liên quan duy nhất của tôi là thạc sĩ địa vật lý và tôi có khoảng một năm kinh nghiệm được trả lương ngoài mô tả công việc của mình (luật sư ngân hàng cao cấp).

Có lẽ do kết quả của các chứng chỉ, tôi đã bị từ chối là "đủ điều kiện" cho ít nhất hai công việc mà tôi biết. Vì vậy, lời khuyên của tôi là nếu bạn có chứng chỉ, đừng đề cập đến nó nếu từ "Excel" xuất hiện trong bài đăng công việc.


1

Một số tài nguyên về edX cho các khóa học khoa học dữ liệu từ Harvard, MIT, Microsoft và nhiều hơn nữa có thể được nhóm này quan tâm.

Ví dụ, chúng tôi có một chương trình chứng chỉ chuyên nghiệp từ Harvard bao gồm 8 khóa học và một kỳ thi capstone ở đây .

Đối với các nghiên cứu nâng cao hơn, chúng tôi có chương trình MicroMasters từ MIT tại đây .

cũng như một từ UC San Diego ở đây . Để có cái nhìn tổng quan về Khoa học dữ liệu, chúng tôi có một chương trình từ Microsoft. Đối với tất cả các chương trình của chúng tôi, bạn có thể kiểm tra ở đây .

Hi vọng điêu nay co ich,

Josh từ edX

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.