본문 바로가기

위키백과

(3)
[위키백과] 강화이론 https://ko.wikipedia.org/wiki/%EC%A1%B0%EC%9E%91%EC%A0%81_%EC%A1%B0%EA%B1%B4%ED%99%94 강화이론[편집] 스키너는 유기체가 어떤 행동을 한 결과가 스스로에게 유리하면 그 행동을 더 자주 하게 된다고 보았다(1953). 이때 그 행동의 결과로 주어진 것으로 행동의 빈도를 높이는 자극을 강화인(Reinforcer)이라고 하는데(Chance,1999), 이런 강화인은 일차적 강화인과 이차적 강화인으로 나누어 볼 수 있다. 먼저 일차적 강화인(Primary Reinforcer)은 유기체의 행동을 직접적으로 증가시킬 수 있는 강화인이다. 예를 들면 음식이나 물과 같은 것이 되겠는데, 당장 배고픈 유기체에게 음식으로 만족을 주는 것으로써 바로 다음 행..
[IT월드] "알파고를 만든" 강화 학습 이해하기 2019.06.11 http://www.itworld.co.kr/news/124052#csidx5c277278451c9f9a8b9ba142a334a9f "알파고를 만든" 강화 학습 이해하기 - ITWorld Korea 구글 딥마인드(DeepMind)의 알파고(AlphaGo)는 사람들에게 친숙한 이름이다. 알파고는 2015년 프로 2단 바둑 기사와의 시합에서 승리하면서 유명세를 탄 이후, 개선된 알파고 버전은 세계적인 프로 바둑 기사인 이세돌 9단과의 시합에서도 승리하고 2017년 5월에는 세계 랭킹 1위인 커제 바둑 기사와의 상대로도 이겼다. 2017년 후반 새로운 세대의 소프트웨어로 나온 알파제로(AlphaZero)는 기존 알파고보다 더욱 강력했으며 바둑뿐만 아니라 www.itworld.co.kr 구글 딥마인드(DeepM..
[위키백과] 변수 (컴퓨터 과학) https://ko.wikipedia.org/wiki/%EB%B3%80%EC%88%98_(%EC%BB%B4%ED%93%A8%ED%84%B0_%EA%B3%BC%ED%95%99) 변수 (컴퓨터 과학) - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. ko.wikipedia.org 컴퓨터 프로그래밍에서 변수(變數, variable) 또는 스칼라(scalar)는 아직 알려지지 않거나 어느 정도까지만 알려져 있는 양이나 정보에 대한 상징적인 이름이다. 컴퓨터 소스 코드에서의 변수 이름은 일반적으로 데이터 저장 위치와 그 안의 내용물과 관련되어 있으며 이러한 것들은 프로그램 실행 도중에 변경될 수 있다. 프로그래밍에서의 변수는 수학에서 말하는 변수의 개념과 완전히 일치하지 않을 수도 있다. 컴퓨..