Q learning은 Q값을 바탕으로 강화학습을 하는 학습방법이다.
fuzzy-Q-learning이라는것도 있다는데.. 머가 먼지..


아무튼 강화학습 법은 일종의 '수렴'을 이용하는 학습방법으로
매번 반복시 weight 값(가중치)이 있어 어느 정도 값이 되면(수렴되면) 학습이 되어,
유사한 값들에 대해서는 같은 결과가 나오게 된다.

좋게 말하면 학습이고, 나쁘게 말하면, 그냥 수학일 뿐이다..
(신경망 역시 수렴이라는 수학을 기반으로 작동하므로.. 그리고 신경망은 뉴런을 시뮬레이션 한거니..)



가끔은 이런생각이 든다.
굳이 구조적으로 다른 인간의 뉴런과, cpu의 논리회로를 왜 인간의 뉴런에 맞추어서 지능이라는 것을 구현해야 하는 것일까?
비록 인간의 형상과 인간의 사고방식을 따르지 않더라도, 그에 맞는 지능이 생겨날수 있을텐데 왜
'인간'이라는 것에 강조를 하고 강요를 해야 하는걸까..

[참고 : http://en.wikipedia.org/wiki/Q-learning]
[참고 : http://bi.snu.ac.kr/Publications/Conferences/Domestic/KISS01F_LeeSJ.pdf]
Posted by 구차니

댓글을 달아 주세요

  1. 그게아니라

    그게 아니라 인간의 뉴런에서 영감을 얻어 해보니 잘되더라 입니다.
    자연의 놀라움이죠.
    (비슷한 예로 나노 사이즈의 전기모터를 만들어 봤더니 미생물 편모에 이미 존재하더라 같은..)

    2010.01.10 23:47 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 그게 아니라, VMware 같이 에뮬레이션 기능은 필연적으로 생길수밖에 없는 성능저하가 있습니다.
      즉, 탄소유기체를 기반한 유기생명체인 인류와 무기물을 기반으로한 반도체를 굳이 비슷하거나 같은 방법으로 만들어서 지능이나 생명을 만들 필요는 없다는거죠.

      인형이 사람의 모습을 굳이 본딸 필요는 없다는 딜레마 이기도 하구요.(이름 자체가 사람의 형상이죠)

      2010.01.11 00:35 신고 [ ADDR : EDIT/ DEL ]
  2. 그게아니라

    그렇게 만들 필요는 없는데 여러가지 시도를 하다하다 안되서 유기생명체에 착안해서 해보니 잘 되더라 라니까요..-_-

    2010.01.18 12:24 신고 [ ADDR : EDIT/ DEL : REPLY ]