György Csippán, István Péter, Bálint Kövári, Tamás Bécsi: MCTS-Based Policy Improvement for Reinforcement Learning. Mach. Learn. Knowl. Extr. 7(3): 98 (2025)