Кэширование

#10

by borisssgrecchkin - opened Jul 16, 2025

Jul 16, 2025

Выполнил инференс на ГПУ через traformers. При запросе со списком passages длиной равной 5 (строки по 5-7 слов) кэш заполняет 7гб памяти. Из-за чего так происходит и можно ли как-то это обойти?

lossful

ai-sage org Sep 24, 2025

Скорее всего вы не используете контексный менеджер with torch.no_grad(): для инференса и из-за этого модель хранит все градиенты, требуемые для обучения, которые и забивают память. Можете попробовать инференс с ним или через sentence_transformers.

lossful changed discussion status to closed Nov 11, 2025

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment