Spaces:

francismurray
/

RAG

Sleeping

francismurray commited on May 22

Commit

cdba4d2

1 Parent(s): f5840a1

Add ZeroGPU compatibility

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
 title: RAG
-emoji: 🔥
 colorFrom: yellow
 colorTo: green
 sdk: gradio

 ---
 title: RAG
+emoji: 📄🔍
 colorFrom: yellow
 colorTo: green
 sdk: gradio

app.py CHANGED Viewed

@@ -2,9 +2,10 @@ import numpy as np
 import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, AutoModel
 # For embeddings using transformers models
 def get_embeddings(texts, model, tokenizer):
     encoded_input = tokenizer(texts, padding=True, truncation=True, return_tensors='pt')
     with torch.no_grad():
@@ -71,6 +72,7 @@ def retrieve(query, embeddings, documents, model, tokenizer, top_k=3):
     return [documents[idx] for idx in top_indices]
 # Generate answer
 def generate_answer(query, context, tokenizer, generator):
     if not context:
         return "No documents have been uploaded yet. Please upload some text files first."

 import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, AutoModel
+import spaces
 # For embeddings using transformers models
+@spaces.GPU
 def get_embeddings(texts, model, tokenizer):
     encoded_input = tokenizer(texts, padding=True, truncation=True, return_tensors='pt')
     with torch.no_grad():
     return [documents[idx] for idx in top_indices]
 # Generate answer
+@spaces.GPU
 def generate_answer(query, context, tokenizer, generator):
     if not context:
         return "No documents have been uploaded yet. Please upload some text files first."

requirements.txt CHANGED Viewed

@@ -1,4 +1,5 @@
 numpy<2.0
 torch
 transformers==4.26.0
-gradio==5.30.0

 numpy<2.0
 torch
 transformers==4.26.0
+gradio==5.30.0
+spaces