Tôi có thể tải xuống vốn hóa thị trường lịch sử và dữ liệu doanh thu hàng ngày cho cổ phiếu ở đâu?


11

Có rất nhiều nguồn cung cấp dữ liệu chứng khoán lịch sử nhưng chúng chỉ cung cấp các trường OHLC cùng với khối lượng và được điều chỉnh gần. Ngoài ra, một số nguồn tôi tìm thấy cung cấp các bộ dữ liệu giới hạn thị trường nhưng chúng bị hạn chế đối với chứng khoán Mỹ. Yahoo Finance cung cấp dữ liệu này trực tuyến nhưng không có tùy chọn nào để tải xuống (hoặc không có gì tôi biết).

  • Tôi có thể tải dữ liệu này ở đâu cho các cổ phiếu thuộc các sàn giao dịch chứng khoán hàng đầu khác nhau trên khắp các quốc gia bằng cách sử dụng tên mã của họ?
  • Có cách nào để tải xuống thông qua Yahoo Finance hoặc Google Finance không?

Tôi cần dữ liệu trong thập kỷ qua hoặc lâu hơn và do đó cần một số tập lệnh hoặc API sẽ làm điều này.

Câu trả lời:



3

Khi thu thập dữ liệu, bạn có thể kiểm tra Quandl (có hướng dẫn sử dụng dữ liệu này với R trên DataCamp nếu bạn quan tâm).

Ngoài ra, trang web của Aswath Damodaran chứa rất nhiều bộ dữ liệu hữu ích. Mặc dù chúng không được cập nhật thường xuyên, nhưng chúng vẫn có thể hữu ích, đặc biệt là một điểm chuẩn để so sánh đầu ra của chính bạn (từ các tập lệnh mà bạn chắc chắn sẽ cần phải viết để tính các số liệu cần thiết).

Và, một lần nữa, Quant SE có lẽ là một nơi tốt hơn để tìm kiếm ...


1

Trang web này liệt kê vốn hóa thị trường lịch sử và giá trị doanh nghiệp cho các công ty S & P 100 và NASDAQ-100 trong 10 năm qua. Bạn có thể xuất các tập dữ liệu sang Excel.

http://marketcapitalizes.com/historical-data/historical-data-c chuyên / valuations /

Bạn cũng có thể thử liên hệ với họ để lấy dữ liệu trong một khoảng thời gian dài hơn.


Bạn có liên kết với trang web này BTW?
Sean Owen

1

Tôi sẽ làm theo cách này.

import requests
from bs4 import BeautifulSoup

base_url = 'https://finviz.com/screener.ashx?v=152&s=ta_topgainers&o=price&c=1,2,6,7,25,65,67'
html = requests.get(base_url)
soup = BeautifulSoup(html.content, "html.parser")
main_div = soup.find('div', attrs = {'id':'screener-content'})

light_rows = main_div.find_all('tr', class_="table-light-row-cp")
dark_rows = main_div.find_all('tr', class_="table-dark-row-cp")

data = []
for rows_set in (light_rows, dark_rows):
    for row in rows_set:
        row_data = []
        for cell in row.find_all('td'):
            val = cell.a.get_text()
            row_data.append(val)
        data.append(row_data)

#   sort rows to maintain original order
data.sort(key=lambda x: int(x[0]))

import pandas
pandas.DataFrame(data).to_csv("AAA.csv", header=False)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.