(1)

Philip Kensington; Scott Whitfield. Enhancing Logical Reasoning Depth via Monte Carlo Tree Search Integrated Reinforcement Learning for Advanced Large Language Model Thinking Processes. IJAIR 2026, 1.