← ListarXivPDFRaw MD

#7 Privacy Guard & Token Parsimony by Prompt and Context Handling and LLM Routing

Score: 21.2 | Matched keywords: benchmark, large language models, llm, prompt, token

Detailed Summary (EN)

Read-like-fullpaper digest

This paper tackles Our approach segregates knowledge into a Personal Vault (protecting individual secrets, sensitive data, and unpublished ideas from both external entities and the institution’s internal monitoring) and an Institutional Vault (protecting firm secrets, algorithms, and project details from external 1 [cs.CR] 30 Mar 2026 leakage). 2 State of the Art: Privacy, Routing and Context Management in LLMs The large-scale adoption of Large Language Models (LLMs) in corporate and personal contexts has raised critical and interconnected challenges regarding the optimisation of operational costs (OpEx) and privacy protection. Finally, we present a rigorous benchmark structure to quantify both economic savings (Token Parsimony) and sanitisation efficacy, including a LIFO-optimised context compacting mechanism, laying the groundwork for Zero-Trust and cost-effective LLM orchestrations.

The core proposal is (SLM)— that performs abstractive summarisation and Automatic Prompt Optimisation (APO) to decompose prompts into focused sub-tasks, re-routing high-risk queries to ZeroTrust or NDA-covered models. Institutional secrets) on a 1,000-sample dataset, achieving a 45% blended OpEx reduction, 100% redaction success on personal secrets, and—via LLM-as-a-Judge This dual mechanism simultaneously eliminates sensitive inference vectors (Zero Leakage) and reduces cloud token payloads (OpEx Reduction). A LIFO-based context compacting mechanism further bounds working memory, limiting the emergent leakage surface.

The empirical case is built around —an 85% preference rate for APO-compressed responses over raw baselines. Finally, we present a rigorous benchmark structure to quantify both economic savings (Token Parsimony) and sanitisation efficacy, including a LIFO-optimised context compacting mechanism, laying the groundwork for Zero-Trust and cost-effective LLM orchestrations. —an 85% preference rate for APO-compressed responses over raw baselines.

The central reported finding is Finally, we present a rigorous benchmark structure to quantify both economic savings (Token Parsimony) and sanitisation efficacy, including a LIFO-optimised context compacting mechanism, laying the groundwork for Zero-Trust and cost-effective LLM orchestrations.

The paper also makes it clear that 2.2 LLM Vulnerabilities: Direct and Emergent Leakage Sending rich contexts to cloud LLMs exposes them to severe data leakage risks. Overall, the paper is most convincing where its proposed method is directly supported by the reported comparisons, but the scope of the claim should still be read in light of the evaluation setup and stated limitations.

Final takeaway

Problem definition

Core idea & method

Actual findings

How the conclusion was reached

Experimental setup & results

Limitations & risks

상세 요약 (KO)

전체 논문 읽은 느낌 요약

이 문서에서는 지식을 개인 금고(외부 기관과 기관의 내부 모니터링 모두에서 개인 비밀, 민감한 데이터 및 미발표 아이디어 보호)와 기관 금고(외부 1 [cs.CR] 2026년 3월 30일 유출로부터 회사 비밀, 알고리즘 및 프로젝트 세부 정보 보호)로 분리하는 접근 방식을 다루고 있습니다. 2 최신 기술: LLM의 개인 정보 보호, 라우팅 및 컨텍스트 관리 기업 및 개인 환경에서 LLM(대규모 언어 모델)이 대규모로 채택되면서 운영 비용(OpEx) 최적화 및 개인 정보 보호와 관련하여 중요하고 상호 연결된 문제가 제기되었습니다. 마지막으로, 제로 트러스트 및 비용 효과적인 LLM 오케스트레이션을 위한 토대를 마련하는 LIFO 최적화 컨텍스트 압축 메커니즘을 포함하여 경제적 절감(토큰 절약)과 삭제 효율성을 모두 정량화하기 위한 엄격한 벤치마크 구조를 제시합니다. 핵심 제안은 (SLM)입니다. 이는 추상적 요약 및 자동 프롬프트 최적화(APO)를 수행하여 프롬프트를 집중된 하위 작업으로 분해하고 고위험 쿼리를 ZeroTrust 또는 NDA 적용 모델로 다시 라우팅합니다. 기관 비밀)을 1,000개 샘플 데이터세트에서 혼합 OpEx 감소 45%, 개인 비밀 수정 성공률 100% 및 판사로서의 LLM을 통해 달성합니다. 이 이중 메커니즘은 동시에 민감한 추론 벡터를 제거하고(Zero Leakage) 클라우드 토큰 페이로드를 줄입니다(OpEx Reduction). LIFO 기반 컨텍스트 압축 메커니즘은 작업 메모리를 더욱 제한하여 긴급 누출 표면을 제한합니다. 경험적 사례는 원시 기준에 비해 APO 압축 응답에 대한 선호도가 85%라는 점을 중심으로 구축되었습니다. 마지막으로, 제로 트러스트 및 비용 효과적인 LLM 오케스트레이션을 위한 토대를 마련하는 LIFO 최적화 컨텍스트 압축 메커니즘을 포함하여 경제적 절감(토큰 절약)과 삭제 효율성을 모두 정량화하기 위한 엄격한 벤치마크 구조를 제시합니다. —원시 기준선에 비해 APO 압축 응답에 대한 선호도가 85%입니다. 보고된 핵심 결과는 마지막으로 LIFO에 최적화된 컨텍스트 압축 메커니즘을 포함하여 경제적 절감(토큰 절약)과 삭제 효율성을 정량화하기 위한 엄격한 벤치마크 구조를 제시하여 제로 트러스트 및 비용 효과적인 LLM 오케스트레이션을 위한 토대를 마련한다는 것입니다. 또한 이 문서에서는 2.2 LLM 취약성: 직접 및 긴급 유출 풍부한 컨텍스트를 클라우드 LLM으로 전송하면 심각한 데이터 유출 위험에 노출된다는 점을 분명히 밝혔습니다. 전반적으로, 이 논문은 제안된 방법이 보고된 비교에 의해 직접적으로 뒷받침된다는 점에서 가장 설득력이 있지만, 청구 범위는 평가 설정 및 명시된 제한 사항을 고려하여 읽어야 합니다.

핵심 결론

문제 정의

핵심 아이디어/방법

실제 결과

결론이 나온 과정

실험 설정/결과

한계/리스크