Đối với hầu hết các trang web, bạn có các trang HTML mà bạn truy cập khi bạn sử dụng trình duyệt của mình. Đây là những trang có thể đọc được bằng con người (một khi được hiển thị trong trình duyệt của bạn), nơi rất nhiều dữ liệu có thể được nhồi nhét cùng nhau, bởi vì nó có ý nghĩa đối với con người.
Bây giờ hãy tưởng tượng rằng ai đó muốn sử dụng một số dữ liệu đó. Họ có thể tải xuống trang của bạn và bắt đầu lọc tất cả "nhiễu" để lấy dữ liệu họ muốn, nhưng hầu hết các trang web không được xây dựng theo cách mà dữ liệu chắc chắn 100% được đặt ở cùng một vị trí cho tất cả các yếu tố, ngoài ra trở nên cồng kềnh nó cũng trở nên không đáng tin cậy.
Nhập dịch vụ web.
Dịch vụ web là thứ mà một trang web chọn cung cấp cho những người muốn đọc, cập nhật và / hoặc xóa dữ liệu khỏi trang web của bạn. Bạn có thể gọi nó là "cửa hậu" cho dữ liệu của bạn. Thay vì trình bày dữ liệu như một phần của trang web, nó được cung cấp theo cách được xác định trước trong đó một số phổ biến hơn là XML và JSON. Có một số cách để giao tiếp với dịch vụ web, một số sử dụng SOAP, một số cách khác có dịch vụ web REST'ful, v.v.
Điều phổ biến cho tất cả các dịch vụ web là chúng là chất tương tự có thể đọc được bằng máy với các trang web mà trang web cung cấp. Điều này có nghĩa là những người khác muốn sử dụng dữ liệu có thể gửi yêu cầu để lấy lại dữ liệu nhất định, dễ phân tích và sử dụng. Một số trang web có thể yêu cầu bạn cung cấp tên người dùng / mật khẩu trong yêu cầu, đối với dữ liệu nhạy cảm, trong khi các trang web khác cho phép mọi người trích xuất bất kỳ dữ liệu nào họ có thể cần.