Machine Learning 48

~ing[Survey리뷰]Deep Reinforcement Learning for Trading—A Critical Survey

Deep Reinforcement Learning for Trading—A Critical Survey 논문 내용 중 몇개만 선정해서 논문 비교 진행 no / 논문 명 Data State Space // Performance 논문 Deep Reinforcement Learning for Automated Stock Trading: An Ensemble Strategy [47] 30 stocks daily, 7 years balance, shares, price technical indicators (MACD, RSI, CCI, ADX). // Sharpe=1.3 Annual return=13% https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3690996 🧞‍..

계층적 강화 학습이란?

https://arxiv.org/pdf/2104.00620.pdf TradeR: Practical Deep Hierarchical Reinforcement Learning for TradeExecution 논문을 읽다가 우선적으로 계층적 강화학습 에 대해서 찾아보게 되었다. 계층적 강화 학습이란? 참조 ( https://bluediary8.tistory.com/4 ) Hierarchical Deep Reinforcement Learning (HDQN) 본 포스팅은 기본적은 강화학습인 Q-learning과 DQN(Deep Q-network)에 대해 알고 있으셔야 읽기 수월합니다. Q-learning과 DQN에 대한 내용은 김성교수님의 모두를 위한 RL 강의를 참고하시기 바랍니다. (http bluediar..

[ppo]Proximal policy optimization algorithms

2022.01.18 - [ReinforcementLearning] - TRPO와 PRO 구현 - 연속행동으로 에이전트를 제어하기 위해 폴리시 그래디언트 알고리즘을 로보스쿨이라는 환경이 적용 - 쉬운 구현과 상징성의 이유로 아직까지 제일 유명한 알고리즘. - first-order optimization 만을 이용해 구현이 매우 쉬우며, TRPO만큼의 성능을 지니면서 data effciency 문제와 TRPO의 복잡하고,noise를 포함한 구조의 문제점들을 해결하였다. PPO의 주요 장점은 무엇인가? PPO는 TRPO와 유사하지만 1차 최적화 메서드만 사용해 목적함수를 최적화 한다. PPO는 목표함수가 너무 커지면 목적함수를 정리 Clipping해 폴리시가 너무 큰 스텝을 취하지 않게 한다. PPO가 좋은 ..

[Book][doit_2]분산 학습

분산 학습 환경 분산 학습은 분산 컴퓨팅을 기반으로 함. 분산 학습 환경의 큰 축 : 클러스터 컴퓨팅과 클라우드 컴퓨팅 : 컴퓨터를 여러 대 연결하여 컴퓨팅 자원을 늘려 줌 멀티스레드와 멀티코어 : 한번에 여러 작업을 진행 할 수 있도록 함 하드웨어 가속기(GPU) 클러스터 컴퓨팅과 클라우드 컴퓨팅 클러스터 컴퓨팅 cluster computing은 컴퓨터 여러대를 하나의 커다란 그룹으로 묶어 연산력을 높이는 컴퓨팅 환경 클러스터 컴퓨팅에서 컴퓨터 자원 하나는 특별히 노드라고 표현 클러스터 컴퓨팅은 클라우드 컴퓨팅cloud computing으로 발전함 클라우드 컴퓨팅은 원하는 자원을 주문한 즉시 바로 사용하고, 비용을 사용한 시간과 자원만큼만 지불하는 매우 유연한 컴퓨팅 환경 두 컴퓨팅 환경 모두 네트워크..

Machine Learning 2022.02.06
반응형