Changes

← Older edit

Yasuhiro Osaki

16 bytes added, 14:20, 7 March 2019

no edit summary

=TD(λ)-MC=

Yasuhiro Osaki's research was about [[Reinforcement Learning|reinforcement learning]] and the application of [[Temporal Difference Learning#TDLamba|TD(λ)]] based on [https://en.wikipedia.org/wiki/Monte_Carlo_method Monte-Carlo simulations] in computer games. The program committee of the [[Conferences#~~GPW~~GPW12|12th Game Programming Workshop 2007]] gave the best presentation award to Yasuhiro Osaki on '''TD(λ)-MC''', a reinforcement learning approach with Monte-carlo simulations <ref>[[Yasuhiro Osaki]], [[Kazutomo Shibahara]], [[Yasuhiro Tajima]], [[Yoshiyuki Kotani]] ('''2007'''). ''Reinforcement Learning of Evaluation Functions Using Temporal Difference-Monte Carlo learning method''. [[Conferences#~~GPW~~GPW12|12th Game Programming Workshop]]</ref> <ref>[https://en.wikipedia.org/wiki/Temporal_difference_learning#Mathematical_formulation TD-Lamda from Wikipedia]</ref>.

=Selected Publications=

<ref>[https://dblp.uni-trier.de/pers/hd/o/Osaki:Yasuhiro dblp: Yasuhiro Osaki]</ref>

* [[Yasuhiro Osaki]], [[Kazutomo Shibahara]], [[Yasuhiro Tajima]], [[Yoshiyuki Kotani]] ('''2007'''). ''Reinforcement Learning of Evaluation Functions Using Temporal Difference-Monte Carlo learning method''. [[Conferences#~~GPW~~GPW12|12th Game Programming Workshop]]

* [[Yasuhiro Osaki]], [[Kazutomo Shibahara]], [[Yasuhiro Tajima]], [[Yoshiyuki Kotani]] ('''2008'''). ''An Othello Evaluation Function Based on Temporal Difference Learning using Probability of Winning''. [http://www.csse.uwa.edu.au/cig08/Proceedings/toc.html CIG'08], [http://www.csse.uwa.edu.au/cig08/Proceedings/papers/8010.pdf pdf]

* [[Yasuhiro Osaki]], [[Yoshiyuki Kotani]] ('''2009'''). ''A Learning Method of Evaluation Function Based on Selective Simulations''. [[Conferences#~~GPW~~GPW14|14th Game Programming Workshop]]

=External Links=

GerdIsenberg

Bureaucrats, Administrators

25,161

edits

Changes

Yasuhiro Osaki

Navigation menu

Personal tools

Namespaces

Variants

Views

More

Search

Navigation

Tools