API dữ liệu / nguồn cấp dữ liệu có sẵn dưới dạng các gói trong R


53

EDIT: Chế độ xem tác vụ CRAN của Công nghệ và Dịch vụ Web chứa danh sách nguồn dữ liệu và API toàn diện hơn nhiều trong R. Bạn có thể gửi yêu cầu kéo trên github nếu bạn muốn thêm gói vào chế độ xem tác vụ.


Tôi đang lập danh sách các nguồn cấp dữ liệu khác nhau đã được nối vào R hoặc dễ cài đặt. Đây là danh sách các gói ban đầu của tôi và tôi đã tự hỏi tôi còn thiếu gì nữa.

Tôi đang cố gắng giới hạn danh sách này thành các nguồn cấp dữ liệu / API "thời gian thực" hoặc "gần với thời gian thực", trong đó dữ liệu cơ bản có thể thay đổi giữa các lần tải xuống. Có rất nhiều danh sách ngoài kia cho các bộ dữ liệu tĩnh, chỉ yêu cầu một lần tải xuống.

Danh sách này hiện đang thiên về dữ liệu chuỗi tài chính / thời gian và tôi có thể sử dụng một số trợ giúp để mở rộng nó sang các miền khác.

Dữ liệu miễn phí:
Data Source - Gói
Google Finance lịch sử dữ liệu - quantmod
bảng cân đối kế Google Finance - quantmod
Yahoo Finance lịch sử dữ liệu - quantmod
Yahoo Finance dữ liệu lịch sử - Tseries
Yahoo Finance lựa chọn hiện tại chuỗi - quantmod
Yahoo Finance dự toán phân tích lịch sử - fImport
Yahoo Finance liệu thống kê chính hiện tại - fImport - dường như bị phá vỡ
tỷ giá hối đoái / giá kim loại lịch sử của OANDA -
các chỉ số kinh tế vĩ mô lịch sử FRED -
các chỉ số kinh tế vĩ mô lịch sử của Ngân hàng Thế giới - WDI
Google Trends tìm kiếm lịch sử khối lượng dữ liệu - RGoogleTrends
Google Documents - RGoogleDocs
Google lưu trữ - RGoogleStorage
Twitter - Twitter
Zillow - Zillow
New York Times - RNYTimes
điều tra dân số Hoa Kỳ năm 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - yêu cầu tài khoản miễn phí
Factual.com - factualR
địa chỉ Mã hóa địa lý - RDSTK
Bản đồ tọa độ đến các ranh giới chính trị - RDSTK
Weather ngầm - Cuộn của riêng bạn
Google News - Cuộn dữ liệu netCDF của riêng bạn về
Khoa học Trái đất - Cuộn dữ liệu khí hậu của riêng bạn - Cuộn dữ liệu sức khỏe cộng đồng của riêng bạn - Cuộn máy thu thập OAI của riêng bạn - Máy gặt đập khởi tạo lưu trữ RAmazonS3 - S3 Máy chủ lưu trữ Amazon Rflikr - Flikr api




Yêu cầu đăng ký:
Bloomberg - RBloomberg
LIM - LIM
Giao dịch và báo giá từ NYSE - Nhà
môi giới tương tác RTAQ - IBrokers


1
phụ thuộc vào ý của bạn là 'dễ thiết lập' ... Tôi có một số tập lệnh tùy chỉnh 'dễ cài đặt'
David LeBauer

2
Ngay bây giờ tôi đang xác định "dễ cài đặt" là "gói tồn tại" hoặc "ai đó đã đăng / xuất bản một chức năng để tải xuống dữ liệu"
Zach

Tôi sẽ định nghĩa thêm "các gói tồn tại" là "gói nằm trên CRAN" hoặc "gói nằm trên R Forge", "gói nằm trên một kho lưu trữ công khai, giống như CRAN".
Zach

Ngoài ra: API đăng ký liên bang (đang hoạt động).
Cha

Câu trả lời:


8
  1. Hướng dẫn sử dụng R để tải xuống dữ liệu netCDF có thể tìm thấy ở đây , một định dạng phổ biến được sử dụng để lưu trữ dữ liệu khoa học Trái đất, ví dụ như trong dữ liệu không gian địa lý biển từ OpenEarth hoặc trình điều khiển mô hình khí hậu và dự báo từ UCAR

  2. rnpn (đang được phát triển) cho phép bạn lấy dữ liệu từ Mạng Hiện tượng Quốc gia - một dự án khoa học công dân để theo dõi thời gian của cây xanh, ra hoa và lão hóa. Xem bài viết trên blog của nhà phát triển .

  3. -obsolete- RClimate cung cấp các công cụ để tải xuống và thao tác dữ liệu khí hậu tệp phẳng (có hướng dẫn, bao gồm cả ở đây -

  4. Tải xuống dữ liệu tài chính lịch sử với tseries::get.hist.quote

  5. Tài liệu của Michael Samuel tải dữ liệu y tế công cộng

  6. raster::getData cung cấp quyền truy cập vào các biến khí hậu thông qua worldclim


"Dữ liệu netCDF là gì?"
Zach

@Zach NetCDF là một loại cấu trúc phổ biến để lưu trữ các bộ dữ liệu lớn. Một cách tiếp cận khác phụ thuộc vào định dạng HDF5 .
chl

@David (+1) Rất cám ơn về điểm thứ tư!
chl

Điều gì xảy ra với RClimate? Tôi không thể tìm thấy gói hàng ở bất cứ đâu
Daniel Ryback

bây giờ có một thư viện ncdf4 trên R để xử lý netcdf4. Nó phức tạp hơn để cài đặt hơn ncdf nhưng sau đó tôi không dùng nữa. Vài năm trước tôi thậm chí đã quản lý để cài đặt netcdf4 với Min GW64 để làm cho gói này hoạt động trên windows :) nếu tôi làm điều đó, điều đó có nghĩa là khả thi ... và có vẻ như D. Pierce (tác giả của gói) đang cung cấp nguồn trên trang web của mình cirrus.ucsd.edu/~pierce/ncdf
robin girard

8

Có một dự án nhằm tạo ra các gói R với mục tiêu này (giao diện R cho các API thời gian thực) được gọi là rOpenSci , hiện có 18 gói hiện có hoặc đang được phát triển. Một số (rnpn, rfishbase) đã có trong danh sách của bạn.

Danh sách tuyệt vời! và công bố đầy đủ - Tôi là một phần của dự án rOpenSci.


1
  1. ONETr - tương tác hiệu quả với API O * NET ™, cung cấp dữ liệu mô tả nghề nghiệp từ Bộ Lao động Hoa Kỳ.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.