{"id":166,"date":"2026-01-12T07:28:34","date_gmt":"2026-01-12T07:28:34","guid":{"rendered":"https:\/\/wordpress.cs.vt.edu\/rylai\/?page_id=166"},"modified":"2026-01-12T07:28:34","modified_gmt":"2026-01-12T07:28:34","slug":"smart","status":"publish","type":"page","link":"https:\/\/wordpress.cs.vt.edu\/rylai\/smart\/","title":{"rendered":"SMART"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><strong>Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories.<\/strong><\/p>\n\n\n\n<figure class=\"wp-block-gallery has-nested-images columns-default is-cropped wp-block-gallery-1 is-layout-flex wp-block-gallery-is-layout-flex\">\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"547\" data-id=\"170\" src=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_1-1-1024x547.png\" alt=\"\" class=\"wp-image-170\" srcset=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_1-1-1024x547.png 1024w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_1-1-300x160.png 300w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_1-1-768x410.png 768w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_1-1.png 1224w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"681\" height=\"672\" data-id=\"167\" src=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_2-1.png\" alt=\"\" class=\"wp-image-167\" srcset=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_2-1.png 681w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_2-1-300x296.png 300w\" sizes=\"auto, (max-width: 681px) 100vw, 681px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"716\" data-id=\"169\" src=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_3-1-1024x716.png\" alt=\"\" class=\"wp-image-169\" srcset=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_3-1-1024x716.png 1024w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_3-1-300x210.png 300w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_3-1-768x537.png 768w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_3-1.png 1371w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"681\" height=\"306\" data-id=\"168\" src=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_4-1.png\" alt=\"\" class=\"wp-image-168\" srcset=\"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_4-1.png 681w, https:\/\/wordpress.cs.vt.edu\/rylai\/wp-content\/uploads\/sites\/250\/2026\/01\/SMART_4-1-300x135.png 300w\" sizes=\"auto, (max-width: 681px) 100vw, 681px\" \/><\/figure>\n<\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Despite the remarkable capabilities of large language models, current training paradigms inadvertently foster sycophancy, i.e., the tendency of a model to agree with or reinforce user-provided information even when it\u2019s factually incorrect.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">To address this challenge, we introduce SMART (Sycophancy Mitigation through Adaptive Reasoning Trajectories), which reframes sycophancy as a reasoning optimization problem rather than an output alignment issue. SMART is a two-stage framework comprising: (1) Uncertainty-Aware Adaptive Monte Carlo Tree Search (UA-MCTS), which dynamically adjusts model exploration based onstate-level uncertainty to collect high-quality, diverse reasoning trajectories alongside both stepwise progress and final outcome rewards; and (2) progress-based reinforcement learning, which fine-tunes the model using the collected trajectories and reward signals to reinforce effective reasoning patterns.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Through extensive experiments, we show that SMART significantly reduces sycophantic behavior while preserving strong performance on out-of-distribution inputs and maintaining general capabilities. These results underscore the importance of optimizing internal reasoning mechanisms to build more truthful and aligned AI assistants.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Publications<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Beigi, Mohammad, Ying Shen, Parshin Shojaee, Qifan Wang, Zichao Wang, Chandan K. Reddy, Ming Jin, and Lifu Huang. &#8220;Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories.&#8221; In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, pp. 13090-13103. 2025.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/aclanthology.org\/2025.emnlp-main.661.pdf\">Paper<\/a><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/github.com\/PLUM-Lab\/sycophancy_mitigation\">Code<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories. Despite the remarkable capabilities of large language models, current training paradigms inadvertently foster sycophancy, i.e., the tendency of a model to agree with or reinforce user-provided information even when it\u2019s factually incorrect. To address this challenge, we introduce SMART (Sycophancy Mitigation through Adaptive Reasoning Trajectories), [&hellip;]<\/p>\n","protected":false},"author":501,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-166","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/pages\/166","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/users\/501"}],"replies":[{"embeddable":true,"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/comments?post=166"}],"version-history":[{"count":1,"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/pages\/166\/revisions"}],"predecessor-version":[{"id":171,"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/pages\/166\/revisions\/171"}],"wp:attachment":[{"href":"https:\/\/wordpress.cs.vt.edu\/rylai\/wp-json\/wp\/v2\/media?parent=166"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}