Khoa học dữ liệu

3

Tôi muốn có thể ước tính liệu một mô hình được đề xuất có đủ nhỏ để được đào tạo về GPU với một lượng bộ nhớ nhất định không Nếu tôi có một kiến trúc CNN đơn giản như thế này: Input: 50x50x3 C1: 32 hạt nhân 3x3, có …

9 machine-learning neural-network convnet parameter-estimation gpu

4

Hiệu suất xác thực chéo sẽ là một dấu hiệu chính xác để dự đoán hiệu suất thực trên tập dữ liệu độc lập?

Tôi cảm thấy rằng câu hỏi này có liên quan đến lý thuyết đằng sau xác nhận chéo. Tôi trình bày phát hiện thực nghiệm của mình ở đây và đã viết một câu hỏi liên quan đến lý thuyết xác nhận chéo ở đó . Tôi có hai mô …

9 cross-validation

1

Tính toán độ tương tự cosin trong Apache Spark

Tôi có một DataFrame với IDF của một số từ nhất định được tính toán. Ví dụ (10,[0,1,2,3,4,5],[0.413734499590671,0.4244680552337798,0.4761400657781007, 1.4004620708967006,0.37876590175292424,0.48374466516332]) .... and so on Bây giờ đưa ra một truy vấn Q, tôi có thể tính TF-IDF của truy vấn này. Làm cách nào để tính toán độ tương tự cosin …

9 machine-learning nlp apache-spark cosine-distance

2

Máy học thực tiễn tốt nhất cho bộ dữ liệu lớn

Tôi sắp tốt nghiệp Thạc sĩ và đã học về học máy cũng như thực hiện các dự án nghiên cứu với nó. Tôi tự hỏi về các thực tiễn tốt nhất trong ngành khi thực hiện các tác vụ học máy với Bộ dữ liệu lớn (như 100 GB …

9 machine-learning predictive-modeling bigdata

2

Danh sách các kỹ thuật tính năng

Có tài nguyên nào với một danh sách các kỹ thuật kỹ thuật tính năng không? Một bản đồ về loại dữ liệu, mô hình và kỹ thuật tính năng sẽ là một mỏ vàng

9 feature-selection feature-extraction feature-engineering feature-construction featurization

6

Python: Xử lý các lớp mất cân bằng trong python Machine Learning

Tôi có một bộ dữ liệu mà tôi đang cố gắng dự đoán các biến mục tiêu. Col1 Col2 Col3 Col4 Col5 1 2 23 11 1 2 22 12 14 1 22 11 43 38 3 14 22 25 19 3 12 42 11 14 1 22 11 43 …

9 machine-learning python data-mining dataset pandas

1

Hiểu về học tập củng cố với mạng lưới thần kinh (Q-learning)

Tôi đang cố gắng tìm hiểu quá trình học tập củng cố và các quy trình quyết định markov (MDP) trong trường hợp mạng lưới thần kinh đang được sử dụng làm công cụ xấp xỉ hàm. Tôi đang gặp khó khăn với mối quan hệ giữa MDP nơi môi …

9 machine-learning neural-network q-learning

2

Các bước học máy

Lựa chọn nào trong các bước dưới đây là tùy chọn chính xác khi tạo mô hình dự đoán? Lựa chọn 1: Trước tiên, loại bỏ các yếu tố dự đoán xấu rõ ràng nhất và tiền xử lý còn lại nếu cần, sau đó huấn luyện các mô hình …

9 machine-learning predictive-modeling

1

Tại sao Tái cấu trúc trong Bộ tạo tự động sử dụng Chức năng kích hoạt tương tự như Kích hoạt chuyển tiếp mà không phải là nghịch đảo?

Giả sử bạn có một lớp đầu vào với n nơ-ron và lớp ẩn đầu tiên có nơ-ron, với điển hình là . Sau đó, bạn tính toán hoạt động của nơron thứ trong lớp ẩn bằng cáchm < n a j jmmmm<nm<nm < najaja_jjjj f tanh sigmoidaj=f(∑i=1..nwi,jxi+bj)aj=f(∑i=1..nwi,jxi+bj)a_j = f\left(\sum\limits_{i=1..n} …

9 machine-learning visualization deep-learning autoencoder

1

Python Seaborn: các thanh lỗi được tính trong barplots như thế nào?

Tôi đang sử dụng thư viện seaborn để tạo ra các lô bar trong python. Tôi đang tự hỏi những số liệu thống kê nào được sử dụng để tính toán các thanh lỗi, nhưng không thể tìm thấy bất kỳ tài liệu tham khảo nào về tài liệu này …

9 python visualization

1

Hiểu về bỏ học và giảm độ dốc

Tôi đang xem xét làm thế nào để thực hiện bỏ học trên mạng lưới thần kinh sâu sắc và tôi đã tìm thấy một cái gì đó phản trực quan. Trong kích hoạt mặt nạ bỏ qua pha phía trước với một thang đo ngẫu nhiên 1 và 0 …

9 neural-network deep-learning gradient-descent

2

Kích thước cấm của rừng ngẫu nhiên khi lưu vào đĩa

Khi được lưu vào đĩa bằng cPickle: /programming/20662023/save-python-random-forest-model-to-file , khu rừng ngẫu nhiên của tôi là 6,57 GB. with open('rforest.cpickle', 'wb') as f: cPickle.dump(rforest, f) Tôi muốn sử dụng chính khu rừng để đưa ra dự đoán thông qua API python được lưu trữ trên Heroku - tất nhiên, kích …

9 python random-forest

4

Phân cụm cho dữ liệu rời rạc số và danh nghĩa hỗn hợp

Dữ liệu của tôi bao gồm các câu trả lời khảo sát là nhị phân (số) và danh nghĩa / phân loại. Tất cả các câu trả lời là rời rạc và ở cấp độ cá nhân. Dữ liệu có hình dạng (n = 7219, p = 105). Vài điều …

9 clustering k-means scikit-learn categorical-data

1

Sử dụng SVM làm phân loại nhị phân, nhãn có phải là điểm dữ liệu được chọn bởi sự đồng thuận không?

Tôi đang học Support Vector Machines và tôi không thể hiểu làm thế nào một nhãn lớp được chọn cho một điểm dữ liệu trong trình phân loại nhị phân. Có phải nó được lựa chọn bởi sự đồng thuận liên quan đến việc phân loại theo từng chiều của …

9 svm classification binary

3

API dự đoán của Google: Phương pháp đào tạo / dự đoán nào Google Dự đoán API sử dụng?

Chi tiết về API dự đoán của Google có trên trang này , nhưng tôi không thể tìm thấy bất kỳ chi tiết nào về các thuật toán dự đoán chạy phía sau API. Cho đến nay tôi đã tập hợp rằng họ cho phép bạn cung cấp các bước …

9 tools