Thuật toán học máy nào có thể được sử dụng để dự đoán thị trường chứng khoán?


15

Ngoài ra, để dự đoán thị trường ngoại hối. Tôi biết điều này có thể trở nên khá phức tạp, vì vậy như một lời giới thiệu, tôi đang tìm kiếm một thuật toán dự đoán đơn giản có độ chính xác.

(Đó là cho một dự án đại học Hoa Kỳ kéo dài bốn tháng)

Tôi đã đọc được rằng một mạng lưới thần kinh nhiều lớp có thể hữu ích. Bạn có suy nghĩ gì về điều đó không? Ngoài ra, phân tích ngữ nghĩa của phương tiện truyền thông xã hội có thể cung cấp cái nhìn sâu sắc về hành vi thị trường có ảnh hưởng đến thị trường chứng khoán. Tuy nhiên, phân tích ngữ nghĩa là một chút bên ngoài phạm vi của dự án tại thời điểm này.


15
Của tôi, nhưng vì lý do rõ ràng tôi đang giữ tất cả cho riêng mình!
babelproofreader

7
Nếu một người tin vào giả thuyết thị trường hiệu quả, không thể đạt được mức cao hơn lợi nhuận thị trường trung bình (không có kiến ​​thức nội bộ), được xây dựng theo giá / giá hiện tại. Rất nhiều người không đồng ý với điều này, nhưng hầu như mọi người đều đồng ý rằng điều đó đúng với một nhà đầu tư bình thường. Nói cách khác, mô hình 3 dòng dựa trên rand () có thể gần như tốt như nhà đầu tư thông thường: P
rm999

5
Có vẻ như không chắc rằng bất cứ ai sẽ sẵn sàng chia sẻ một thuật toán có bất kỳ chính xác out-of-mẫu. Ngoại trừ, có lẽ, một số công việc học thuật được công bố trong đó sự bất thường là nhỏ và không bao gồm chi phí giao dịch.
NPE

2
Đối với công việc học tập, có thể đáng để mô hình hóa giá hơn là cố gắng dự đoán nó. Dự đoán có thể sẽ chứng minh là không thành công, nhưng mô hình hóa ít nhất có thể cung cấp một số cái nhìn sâu sắc về cách mọi thứ thực sự hoạt động, và về mặt lý thuyết có thể được mở rộng để dự đoán.
highBandWidth

2
@wayne I don't think it's about overfitting, it's about allowing predictors that cannot be used for predictions, for example variables that occur during/after stock movements - if you find that apple and microsoft stock tend to correlate, this fact cannot be used to predict msft stock but can be very informative.
rm999

Câu trả lời:


17

As babelproofreader mentioned, those that have a successful algorithm tend to be very secretive about it. Thus it's unlikely that any widely available algorithm is going to be very useful out of the box unless you are doing something clever with it (at which point it sort of stops being widely available since you are adding to it).

That said, learning about autoregressive integerated moving average (ARIMA) models might be a useful start for forecasting time-series data. Don't expect better than random results though.


5
+1: How many times I've been reading or been in a class and heard people who believe that if they have a complicated-enough algorithm, they could get rich in the stock/electricity/commodities markets. You try to explain overfitting, etc, but to no avail. Heck, as far as I know, not being an insider, successful stock-trading software has depended on no transaction fees, arbitrage, and high speed. The cutting edge now is to use loopholes in automated trading rules and high-speed proposal/withdrawl of bids to sucker-punch other automated traders.
Wayne

1
The other issue is where multiple people end up with the same algorithm because they did their training on exactly the same data, then put volume sales/purchases through. Would any algorithm be expected to have long-run accuracy?
Michelle

@Wayne there are strategies for reducing over-fitting, though they're difficult to implement on time series data.
Zach

1
@Zach: yes, there are ways to penalize overfitting, but it's the attitude I'm reflecting on: the folks who have done some basic (probably erroneous) curve fitting in Excel and feel that they could've made money with their secret sauce, but what they really need is one of those cutting-edge, sophisticated algorithms that the professor just won't share with the class. That algorithm would fit the data like a glove, and then predict so much better than all those other speculators using Excel spreadsheets... but the professor keeps droning on about overfitting and the limitations of data. Sigh.
Wayne

12

I think for your purposes, you should pick a machine learning algorithm you find interesting and try it.

Về lý thuyết thị trường hiệu quả, thị trường không hiệu quả, trong bất kỳ quy mô thời gian nào. Ngoài ra, một số người (cả trong học viện và người đi thực tế) được thúc đẩy bởi thử thách trí tuệ, không chỉ làm giàu nhanh, và họ công bố kết quả thú vị (và tôi coi kết quả thất bại là một kết quả thú vị). Nhưng hãy đối xử với mọi thứ bạn đọc bằng một nhúm muối; nếu kết quả thực sự tốt, có lẽ phương pháp khoa học của họ là không.

Data Mining With R might be a useful book for you; it is pricey, so try and find it in your university library. Chapter 2 covers just what you want to do, and he gets best results with a neural net. But be warned that he gets poor results, and spends a lot of CPU time to get them. The Amazon reviews point out the book costs $20 more because that chapter mentions the word finance; when reading it I got the impression the publisher had pushed him to write it. He's done his homework, read the docs, perused the right mailing lists, but his heart was not in it. I got some useful R knowledge from it, but won't be beating the market with it :-)


@Darren - I like your style.
rolando2

1
A draft version (May 2003) of Data Mining with R can be found here. (I don't have the book, so I can't say what's the gap between the two versions.)
chl

@chi Thanks! I took a quick look, and only two of the four chapters are there. But the bigger difference is that the Predicting Stock Market Returns chapter is very different. No mention of xts or quantmod and instead using the ts package, and using acf and the MARS package for predictions. It is almost like a bonus chapter, and I'm going to make time to read it properly. He is still using neural nets, but not comparing them to SVMs as in the published book.
Darren Cook

10

To my mind, any run-of-the-mill strong AI that could do all of the following might easily produce a statistically significant prediction:

  • Gather and understand rumours

  • Access and interpret all government knowledge

  • Do so in every relevant country

  • Make relevant predictions about:

    • Weather conditions

    • Terrorist activity

    • Thoughts and feelings of individuals

    • Everything else that affects trade

Statistical analysis is the least of your worries, really.


4

You could try the auto.arima and ets functions in R. You might also have some success with the rugarch package, but there's no existing functions for automated parameters selection. Maybe you could get parameters for the mean model from auto.arima, then pass them to rugarch and add garch(1,1)?

There's all sorts of blogs out there that claim some success doing this. Here's a system using an arima model (and later a garch model) and system using an SVM model. You'll find a lot of good info on FOSS trading, particularly if you start reading the blogs on his blogroll.

Whatever model you use, be sure to cross-validate and benchmark! I'd be very surprised if you found an arima, ets, or even garch model that could consistantly beat a naive model out-of-sample. Examples of time series cross-validation can be found here and here. Keep in mind that what you REALLY want to forecast is returns, not prices.


2

I know of one machine learning approach which is currently in use by at least one hedge fund. numer.ai is using an ensemble of user-provided machine learning algorithms to direct the actions of the fund.

Nói cách khác: Một quỹ phòng hộ cung cấp quyền truy cập mở vào một phiên bản dữ liệu được mã hóa trên một vài trăm phương tiện đầu tư, rất có thể là cổ phiếu. Hàng ngàn nhà khoa học dữ liệu và tương tự đào tạo tất cả các loại thuật toán học máy chống lại dữ liệu đó và tải kết quả lên bảng điểm. Những người ghi bàn cao nhất nhận được một số tiền nhỏ tùy thuộc vào độ chính xác của kết quả và thời gian kết quả của họ có sẵn trên mạng.

Các dự đoán tốt nhất được cho là được thực hiện bởi các nhóm thuật toán.

Vì vậy, bạn có rất nhiều nhà khoa học cung cấp các dự đoán được đào tạo, một số trong đó là các dự đoán và quỹ phòng hộ sử dụng tập hợp tất cả các dự đoán được cung cấp để chỉ đạo các khoản đầu tư của họ.

Kết quả của quỹ phòng hộ khá thú vị này đã dạy tôi hai điều:

  1. Đồng phục thường được xem là một cách tốt để đưa ra dự đoán trên thị trường chứng khoán.
  2. Dự đoán tốt đòi hỏi nhiều thành tích hơn là tôi sẵn sàng xây dựng bản thân ...

Nếu bạn muốn đi, hãy truy cập: https://numer.ai/ Không, tôi KHÔNG liên kết với họ, rất có thể tôi không dành thời gian trực tuyến của mình khi tôi kết nối với một quỹ phòng hộ có hàng ngàn người , nhưng chỉ trả tiền cho những người cung cấp kết quả có thể đo lường :)

Cộng đồng Num.ai có một diễn đàn nơi họ thảo luận về cách tiếp cận của họ để bạn CÓ THỂ học hỏi từ những người khác đang cố gắng làm điều tương tự.

Cá nhân tôi nghĩ rằng bất cứ ai có thuật toán tốt sẽ giữ bí mật.


1

Bạn nên thử các mạng thần kinh loại GMDH. Tôi biết rằng một số gói thương mại thành công để dự đoán thị trường chứng khoán đang sử dụng nó, nhưng chỉ đề cập đến nó trong phần sâu của tài liệu. Tóm lại, nó là một mạng lưới thần kinh lặp nhiều lớp, vì vậy bạn đang đi đúng hướng.


0

I think hidden markov models are popular in stock market. The most important thing to keep in mind is that you want an algorithm that preserves the temporal aspect of your data.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.