Câu hỏi được gắn thẻ «hadoop»

Hadoop là một dự án mã nguồn mở Apache cung cấp phần mềm cho máy tính phân tán đáng tin cậy và có thể mở rộng. Phần lõi bao gồm hệ thống tệp phân tán (HDFS) và trình quản lý tài nguyên (YARN). Nhiều dự án mã nguồn mở khác, chẳng hạn như Apache Hive sử dụng Apache Hadoop làm lớp bền vững.


6
sự khác biệt giữa lệnh shell “hadoop fs” và lệnh shell “hdfs dfs” là gì?
Chúng được cho là bình đẳng? nhưng, tại sao hadoop fslệnh "" hiển thị hdfs filestrong khi hdfs dfslệnh "" hiển thị tệp cục bộ? đây là thông tin phiên bản hadoop: Hadoop 2.0.0-mr1-cdh4.2.1 Subversion git: //ubuntu-slave07.jenkins.cloudera.com/var/lib/jenkins/workspace/CDH4.2.1-Packaging-MR1/build/cdh4/mr1/2.0.0 -mr1-cdh4.2.1 / source -r Được tổng hợp bởi jenkins vào Thứ Hai ngày …
109 hadoop  hdfs 



18
hadoop Không có FileSystem cho lược đồ: tệp
Tôi đang cố gắng chạy đơn giản NaiveBayesClassiferbằng hadoop, gặp lỗi này Exception in thread "main" java.io.IOException: No FileSystem for scheme: file at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:1375) at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:66) at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:1390) at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:196) at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:95) at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:180) at org.apache.hadoop.fs.Path.getFileSystem(Path.java:175) at org.apache.mahout.classifier.naivebayes.NaiveBayesModel.materialize(NaiveBayesModel.java:100) Mã: Configuration configuration = new Configuration(); NaiveBayesModel model = NaiveBayesModel.materialize(new Path(modelPath), configuration);// …
96 java  hadoop  io 



7
Avro vs. Parquet
Tôi dự định sử dụng một trong các định dạng tệp hadoop cho dự án liên quan đến hadoop của mình. Tôi hiểu rằng parquet hiệu quả cho truy vấn dựa trên cột và avro để quét toàn bộ hoặc khi chúng tôi cần tất cả dữ liệu cột! Trước …
91 hadoop  avro  parquet 


5
Parquet vs ORC vs ORC với Snappy
Tôi đang chạy một vài thử nghiệm trên các định dạng lưu trữ có sẵn với Hive và sử dụng Parquet và ORC làm các tùy chọn chính. Tôi đã bao gồm ORC một lần với nén mặc định và một lần với Snappy. Tôi đã đọc nhiều tài liệu …
87 hadoop  hive  parquet  snappy  orc 

28
kết nối với máy chủ localhost cổng 22: Kết nối bị từ chối
Trong khi cài đặt hadoop trong máy cục bộ của mình, tôi gặp lỗi sau ssh -vvv localhost OpenSSH_5.5p1, OpenSSL 1.0.0e-fips 6 Sep 2011 debug1: Reading configuration data /etc/ssh/ssh_config debug1: Applying options for * debug2: ssh_connect: needpriv 0 debug1: Connecting to localhost [127.0.0.1] port 22. debug1: connect to address 127.0.0.1 …
86 linux  hadoop  ssh 



8
Khi nào các tác vụ giảm bắt đầu trong Hadoop?
Trong Hadoop khi nào các tác vụ giảm bắt đầu? Chúng có bắt đầu sau khi hoàn thành một tỷ lệ phần trăm (ngưỡng) nhất định của người lập bản đồ không? Nếu vậy, ngưỡng này có cố định không? Loại ngưỡng nào thường được sử dụng?


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.