Frederick Ellsworth. “Improving Exploration Efficiency in Complex Reasoning Tasks via Guided Reinforcement Learning and Large Language Model Heuristic Search Strategies”. International Journal of Artificial Intelligence Research 1, no. 2 (May 14, 2026). Accessed May 17, 2026. https://www.isipress.org/index.php/IJAIR/article/view/157.