← ListarXivPDFRaw MD

#10 KARMA: Knowledge-Action Regularized Multimodal Alignment for Personalized Search at Taobao

Score: 24.8 | Matched keywords: alignment, fine-tuning, large language models, llm, multimodal, token

Detailed Summary (EN)

Problem definition

Core idea & method

Experimental setup & results

Limitations & risks

Read-like-fullpaper digest

This paper addresses In personalized search systems, ranking models are predominantly optimized using post-hoc user feedback(e.g. The core method is that treats semantic reconstruction as a train-only regularizer. Key empirical findings include We attribute this bottleneck to a critical Knowledge–Action Gap: the inherent conflict between preserving pre-trained semantic knowledge and aligning with specific personalized actions by discriminative objectives.

상세 요약 (KO)

문제 정의

핵심 아이디어/방법

실험 설정/결과

한계/리스크

전체 논문 읽은 느낌 요약

이 논문은 개인화된 검색 시스템에서 순위 모델은 주로 사후 사용자 피드백을 사용하여 최적화됩니다(예: 핵심 방법은 의미 체계 재구성을 열차 전용 정규화 도구로 처리하는 것입니다. 주요 경험적 연구 결과는 다음을 포함합니다. 이러한 병목 현상은 사전 훈련된 의미 체계 지식을 보존하는 것과 차별적 목표에 따라 특정 개인화된 행동과 얼라인먼트하는 것 사이의 내재된 충돌인 중요한 지식-행동 격차에 기인합니다.