개소리 왈왈/인공지능
큐 러닝(학습, 강화학습 방법) Q learning - a kind of reinforcement learning
구차니
2009. 4. 29. 12:57
Q learning은 Q값을 바탕으로 강화학습을 하는 학습방법이다.
fuzzy-Q-learning이라는것도 있다는데.. 머가 먼지..
아무튼 강화학습 법은 일종의 '수렴'을 이용하는 학습방법으로
매번 반복시 weight 값(가중치)이 있어 어느 정도 값이 되면(수렴되면) 학습이 되어,
유사한 값들에 대해서는 같은 결과가 나오게 된다.
좋게 말하면 학습이고, 나쁘게 말하면, 그냥 수학일 뿐이다..
(신경망 역시 수렴이라는 수학을 기반으로 작동하므로.. 그리고 신경망은 뉴런을 시뮬레이션 한거니..)
가끔은 이런생각이 든다.
굳이 구조적으로 다른 인간의 뉴런과, cpu의 논리회로를 왜 인간의 뉴런에 맞추어서 지능이라는 것을 구현해야 하는 것일까?
비록 인간의 형상과 인간의 사고방식을 따르지 않더라도, 그에 맞는 지능이 생겨날수 있을텐데 왜
'인간'이라는 것에 강조를 하고 강요를 해야 하는걸까..
[참고 : http://en.wikipedia.org/wiki/Q-learning]
[참고 : http://bi.snu.ac.kr/Publications/Conferences/Domestic/KISS01F_LeeSJ.pdf]
fuzzy-Q-learning이라는것도 있다는데.. 머가 먼지..
아무튼 강화학습 법은 일종의 '수렴'을 이용하는 학습방법으로
매번 반복시 weight 값(가중치)이 있어 어느 정도 값이 되면(수렴되면) 학습이 되어,
유사한 값들에 대해서는 같은 결과가 나오게 된다.
좋게 말하면 학습이고, 나쁘게 말하면, 그냥 수학일 뿐이다..
(신경망 역시 수렴이라는 수학을 기반으로 작동하므로.. 그리고 신경망은 뉴런을 시뮬레이션 한거니..)
가끔은 이런생각이 든다.
굳이 구조적으로 다른 인간의 뉴런과, cpu의 논리회로를 왜 인간의 뉴런에 맞추어서 지능이라는 것을 구현해야 하는 것일까?
비록 인간의 형상과 인간의 사고방식을 따르지 않더라도, 그에 맞는 지능이 생겨날수 있을텐데 왜
'인간'이라는 것에 강조를 하고 강요를 해야 하는걸까..
[참고 : http://en.wikipedia.org/wiki/Q-learning]
[참고 : http://bi.snu.ac.kr/Publications/Conferences/Domestic/KISS01F_LeeSJ.pdf]