Tên biến tốt là:
a) ngắn / dễ gõ
b) dễ nhớ,
c) dễ hiểu / giao tiếp.
Tôi có quên gì không? Tính nhất quán là một cái gì đó để tìm kiếm. Cách tôi muốn nói là các quy ước đặt tên nhất quán đóng góp vào các phẩm chất trên. Tính nhất quán góp phần làm cho (b) dễ nhớ lại và (c) dễ hiểu, mặc dù các yếu tố khác thường quan trọng hơn. Có một sự đánh đổi rõ ràng giữa (a) độ dài tên / dễ gõ (ví dụ: tất cả chữ thường) và (c) dễ hiểu.
Tôi đang đầu tư một chút suy nghĩ vào những vấn đề này bởi vì hàng ngàn người đang sử dụng dữ liệu và tôi hy vọng nhiều người sẽ sử dụng mã của tôi để chuẩn bị dữ liệu và tạo điều kiện cho một số loại phân tích. Dữ liệu từ Nghiên cứu dài hạn về sức khỏe vị thành niên, được chia thành nhiều bộ dữ liệu. Bước đầu tiên của tôi là lấy 227 biến trong bộ dữ liệu được sử dụng phổ biến nhất, mã hóa lại chúng, đặt cho chúng những cái tên có ý nghĩa hơn. Tên biến ban đầu là những thứ như "Aid", "s1", "s2", mà tôi đã đổi tên thành "Aid2", "age" và "male.is". Có hàng ngàn biến số khác trong các bộ dữ liệu khác có thể được hợp nhất tùy thuộc vào mục tiêu của nhà nghiên cứu.
Miễn là tôi đổi tên các biến, tôi muốn làm cho chúng hữu ích nhất có thể. Đây là một số vấn đề tôi đã xem xét. Cho đến nay, tôi chỉ sử dụng chữ thường và tránh sử dụng bất kỳ dấu gạch ngang hoặc dấu gạch dưới nào và tôi chỉ sử dụng các khoảng thời gian cho một mục đích rất cụ thể. Điều này có ưu điểm của sự đơn giản và nhất quán và không gây ra vấn đề gì cho hầu hết các biến. Nhưng khi mọi thứ trở nên phức tạp hơn, tôi muốn phá vỡ tính nhất quán của mình. Lấy ví dụ, biến "talkprobmsum" của tôi, sẽ dễ đọc hơn là "talkProbMSum" hoặc tốt hơn là "talk.prob.m.sum", nhưng nếu tôi sẽ sử dụng chữ in hoa hoặc dấu chấm để phân tách các từ thì Tôi không nên làm điều đó cho tất cả các biến?
Một số biến được ghi lại nhiều lần, ví dụ: các biến chủng tộc nên tôi đã thêm .is hoặc .ih để cho biết liệu chúng đến từ bảng câu hỏi trong trường hay trong nhà. Nhưng chắc chắn có một số lần lặp lại mà tôi chưa biết, liệu có tốt hơn để nối một tham chiếu đến tập dữ liệu vào tên của mỗi biến không?
Tôi cần phải tập trung vào nhóm và chuẩn hóa rất nhiều biến số, cách tôi đã làm là bằng cách nối thêm .zms có nghĩa là điểm z của nam và theo trường.
Bất kỳ suy nghĩ hoặc tài nguyên chung hoặc cụ thể được đánh giá rất cao. Xem kho lưu trữ này để biết một số mã của tôi và thống kê mô tả với danh sách các tên biến. Tôi đã mô tả ngắn gọn lý do chia sẻ mã này ở đây và nó đã được công khai một chút ở đây , nhưng hai liên kết cuối cùng này không thực sự liên quan đến vấn đề quy ước đặt tên biến. Đã thêm: Tôi đã chỉnh sửa điều này một cách nhẹ nhàng, chủ yếu chỉ là di chuyển một đoạn văn, để cố gắng tránh một số sự nhầm lẫn rõ ràng trong các bình luận. Cảm ơn những suy nghĩ!
Đã thêm 2016-09-05: Đáng chú ý là Hướng dẫn về Phong cách R của Hadley Wickham và Hướng dẫn về Phong cách R của Google ... Hadley nói:
Tên biến và hàm nên viết thường. Sử dụng dấu gạch dưới (_) để phân tách các từ trong tên.
Google nói:
Không sử dụng dấu gạch dưới (_) hoặc dấu gạch ngang (-) trong mã định danh. Định danh nên được đặt tên theo các quy ước sau. Hình thức ưa thích cho tên biến là tất cả các chữ cái viết thường và các từ được phân tách bằng dấu chấm (biến.name), nhưng biến Tên cũng được chấp nhận; tên hàm có chữ in hoa ban đầu và không có dấu chấm (FunctionName); các hằng số được đặt tên giống như các hàm nhưng với k ban đầu.
R
, mà là về các thực tiễn thích hợp để ghi chép và sử dụng dữ liệu.