← ListarXivPDFRaw MD

#6 Chain-of-Authorization: Internalizing Authorization into Large Language Models via Reasoning Trajectories

Score: 26.8 | Matched keywords: ai, artificial intelligence, fine-tuning, large language models, prompt, reasoning

Detailed Summary (EN)

Problem definition

Core idea & method

Experimental setup & results

Limitations & risks

Read-like-fullpaper digest

This paper addresses Chain-of-Authorization: Internalizing Authorization into Large Language Models via Reasoning Trajectories Yang Li1, Yule Liu2, Xinlei He3, Youjian Zhao1, Qi Li1, Ke Xu1* 1* Department of Computer Science and Technology, Tsinghua University. The core method is a secure training and reasoning paradigm that internalizes authorization logic into LLMs’ core capabilities. Key empirical findings include show that, compared to baseline methods, CoA maintains comparable accuracy in authorized scenarios and achieves a very high compliance rejection rate in unauthorized scenarios.

상세 요약 (KO)

문제 정의

핵심 아이디어/방법

실험 설정/결과

한계/리스크

전체 논문 읽은 느낌 요약

이 문서에서는 권한 부여: 추론 궤적을 통해 대규모 언어 모델에 권한 부여 내부화 Yang Li1, Yule Liu2, Xinlei He3, Youjian Zhao1, Qi Li1, Ke Xu1* 1* Department of Computer Science and Technology, Tsinghua University. 핵심 방법은 인증 논리를 LLM의 핵심 기능에 내재화하는 안전한 교육 및 추론 패러다임입니다. 주요 경험적 결과에는 기본 방법과 비교하여 CoA가 승인된 시나리오에서 비슷한 정확도를 유지하고 승인되지 않은 시나리오에서 매우 높은 준수 거부율을 달성한다는 사실이 포함됩니다.