Một vài từ về API mạng xã hội. Khoảng một năm trước tôi đã viết một bài đánh giá về API của các mạng xã hội phổ biến cho các nhà nghiên cứu. Thật không may, nó là tiếng Nga. Đây là một bản tóm tắt:
Twitter ( https://dev.twitter.com/docs/api/1.1 )
- hầu như tất cả dữ liệu về tweet / văn bản và người dùng đều có sẵn;
- thiếu dữ liệu xã hội học;
- API phát trực tuyến tuyệt vời: hữu ích cho xử lý văn bản theo thời gian thực;
- rất nhiều hàm bao cho các ngôn ngữ lập trình;
- có được cấu trúc mạng (kết nối) là có thể, nhưng tốn thời gian (1 yêu cầu mỗi 1 phút).
Facebook ( https://developers.facebook.com/docs/reference/api/ )
- giới hạn tốc độ: khoảng 1 yêu cầu mỗi giây;
- tài liệu tốt, hiện tại hộp cát;
- FQL (giống như SQL) và «Nghỉ ngơi thường xuyên» API đồ thị;
- dữ liệu hữu nghị và các tính năng xã hội học hiện tại;
- rất nhiều dữ liệu nằm ngoài phạm vi sự kiện : chỉ có dữ liệu bạn bè và bạn bè mới hoàn thành ít nhiều, hầu như không có gì có thể được điều tra về người dùng ngẫu nhiên;
- một số lỗi API lạ và có vẻ như không ai quan tâm đến nó (ví dụ: một số tính năng có sẵn thông qua FQL, nhưng không thông qua từ đồng nghĩa API đồ thị).
Instagram ( http://instagram.com/developer/ )
- giới hạn tỷ lệ: 5000 yêu cầu mỗi giờ;
- API thời gian thực (như API phát trực tuyến cho Twitter, nhưng có ảnh) - kết nối với nó hơi khó khăn một chút: gọi lại được sử dụng;
- thiếu dữ liệu xã hội học;
- hình ảnh, bộ lọc dữ liệu có sẵn;
- sự không hoàn hảo bất ngờ (ví dụ: chỉ có thể thu thập 150 bình luận để đăng / ảnh).
Foursquare ( https: //developer.fiến.com/overview/ )
- giới hạn tỷ lệ: 5000 yêu cầu mỗi giờ;
- vương quốc dữ liệu địa lý xã hội :)
- khá kín từ các nghiên cứu vì vấn đề riêng tư. Để thu thập dữ liệu đăng nhập, người ta cần xây dựng trình phân tích cú pháp tổng hợp làm việc với các API 4sq, bit.ly và twitter cùng một lúc;
- một lần nữa: thiếu dữ liệu xã hội học.
Google+ ( https://developers.google.com/+/api/latest/ )
- khoảng 5 yêu cầu mỗi giây (cố gắng xác minh);
- phương pháp chính: hoạt động và con người;
- Giống như trên Facebook, rất nhiều dữ liệu cá nhân cho người dùng ngẫu nhiên bị ẩn đi;
- thiếu dữ liệu kết nối người dùng.
Và ngoài cuộc thi: Tôi đã xem xét các mạng xã hội dành cho độc giả Nga và mạng số 1 ở đây là vk.com . Nó được dịch sang nhiều ngôn ngữ, nhưng chỉ phổ biến ở Nga và các nước CIS khác. Liên kết tài liệu API: http://vk.com/dev/ . Và theo quan điểm của tôi, đó là sự lựa chọn tốt nhất cho nghiên cứu truyền thông xã hội homebrew. Ít nhất, ở Nga. Đó là lý do:
- giới hạn tốc độ: 3 yêu cầu mỗi giây;
- dữ liệu công cộng và dữ liệu truyền thông có sẵn;
- dữ liệu xã hội học có sẵn: đối với mức độ sẵn có của người dùng ngẫu nhiên là khoảng 60-70%;
- kết nối giữa những người dùng cũng có sẵn: hầu như tất cả dữ liệu kết bạn cho người dùng ngẫu nhiên đều khả dụng;
- một số phương pháp đặc biệt: ví dụ: có một phương pháp để có trạng thái trực tuyến / ngoại tuyến cho người dùng chính xác trong thời gian thực và người ta có thể xây dựng lịch trình cho khán giả của mình.