300x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- kick start
- 구글 킥스타트
- 프로그래밍
- 파이썬
- 킥스타트
- BFS
- nlp
- 딥러닝
- 운영체제
- 동적프로그래밍
- 프로그래머스
- 브루트포스
- google coding competition
- AI
- 그래프
- linux
- 알고리즘
- 순열
- 동적 프로그래밍
- dp
- 백준
- 네트워크
- DFS
- OS
- PYTHON
- 코딩 테스트
- 코딩테스트
- 코딩
- 리눅스
- CSS
Archives
- Today
- Total
목록Feedback (1)
오뚝이개발자
강화학습(Reinforcement learning)의 방향성
강화학습은 근래 들어 많은 발전이 이루어진 학습 방법이다. 간단히 설명하자면, agent와 environment를 두고 agent가 어떠한 action을 할 때마다 환경으로부터의 피드백(긍정/부정)이 온다. 이를 기반으로 학습을 하는 것이 바로 강화학습(RL)이다. 그런데 이러한 강화학습이 게임 분야에서는 매우 많이 사용이 되지만 왜 현실적인 문제들(예컨대, 자율주행)에서는 실적용이 어려울까? 다른 말로는, 왜 practical하게 적용하지 못할까? RL은 근본적으로 trial-and-error 방식으로 작동한다. 즉, 어떠한 시도(action)를 해보고 이에 대한 에러를 feedback을 통해 수정하는 방식으로 학습이 진행된다. 하지만, 현실세계에선 이러한 실패(error)가 일어나선 안되는 경우가 많..
AI/AI 개념
2021. 10. 7. 16:31