vitamin_luv
Junior Member
Đây là project cá nhân, mình có tập kết quả trả về theo thời gian của 1 bài toán phân loại thị trường Forex, muốn áp dụng thêm cơ chế phản hồi/ đánh giá lên tập kết quả trả về đó, tìm hiểu thì thấy actor-critic trong RL sẽ là bước tiếp tục với vấn đề của mình.Bên mình cũng có một số phần đang làm deep q-learning nhưng về mặt business thì chưa thấy hiệu quả cao lắm (chi phí/ hiệu quả).
Không rõ bài toán cụ thể của bạn như nào nhỉ, RL mình thấy số lượng bài toán áp dụng được không quá phổ biến?
Bạn có thể nói rõ hơn về chi phí/ hiệu quả không? Chi phí gì vậy?
Bôi đậm: có lẽ là do môi trường mô phỏng đạt được liên kết chặt giữa các tham số, môi trường thực tế thì không, phải không?!