Tôi hy vọng câu hỏi này là phù hợp nhất trong trang web này ...
Trong Python, thông thường tên lớp được định nghĩa bằng chữ in hoa làm ký tự đầu tiên của nó, ví dụ
class Vehicle:
...
Tuy nhiên, trong lĩnh vực máy học, thường thì dữ liệu đào tạo và kiểm tra được định nghĩa là X
và Y
- không x
và y
. Ví dụ: tôi hiện đang đọc hướng dẫn này trên Keras , nhưng nó sử dụng X
và Y
như các biến của nó:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
Tại sao chúng được định nghĩa là chữ in hoa? Có bất kỳ quy ước nào (ít nhất là trong Python) trong lĩnh vực máy học rằng tốt hơn là sử dụng chữ in hoa để xác định các biến này?
Hoặc có thể mọi người phân biệt các biến chữ hoa và chữ thường trong máy học?
Trong thực tế, cùng một hướng dẫn sau này phân biệt các biến này như sau:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)
Y
cũng là chữ hoa mặc dù nó là một vector? (Y.shape
trả lại(1797,)
, FYI)