Smllm

Sleeping

App Files Files Community

ghosthets commited on Dec 3, 2025

Commit

4676ca6

verified ·

1 Parent(s): 9fd7b58

Update app.py

Browse files

Files changed (1) hide show

app.py +52 -41

app.py CHANGED Viewed

@@ -1,58 +1,69 @@
-from flask import Flask, request, jsonify
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
-import os
-app = Flask(__name__)
 model_id = "HuggingFaceH4/zephyr-7b-beta"
-print("🚀 Loading model:", model_id)
-tokenizer = AutoTokenizer.from_pretrained(model_id, use_fast=False)
-model = AutoModelForCausalLM.from_pretrained(model_id)
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-model.to(device)
-print("✅ Model Loaded Successfully")
-@app.route('/chat', methods=['POST'])
-def chat():
-    try:
-        data = request.get_json()
-        message = data.get("message", "").strip()
-        if not message:
-            return jsonify({"error": "Empty message"}), 400
-        # Simple clean prompt
-        prompt = f"Human: {message}\nAssistant:"
-        inputs = tokenizer(prompt, return_tensors="pt").to(device)
-        output = model.generate(
-            inputs.input_ids,
-            max_length=300,
-            do_sample=True,
-            top_k=40,
-            top_p=0.92,
-            temperature=0.72,
-            pad_token_id=tokenizer.eos_token_id
-        )
-        full = tokenizer.decode(output[0], skip_special_tokens=True)
-        reply = full.split("Assistant:")[-1].strip()
-        return jsonify({"reply": reply})
-    except Exception as e:
-        return jsonify({"error": str(e)}), 500
-@app.route('/')
-def home():
-    return "LLM Space Active."
-if __name__ == "__main__":
-    app.run(host="0.0.0.0", port=7860)

+import gradio as gr
+from transformers import pipeline
+import json
+# ===========================
+# LOAD MODEL
+# ===========================
 model_id = "HuggingFaceH4/zephyr-7b-beta"
+ai = pipeline("text-generation", model=model_id, max_new_tokens=200)
+# ===========================
+# API ENDPOINT (VERY IMPORTANT)
+# call.php expects: { "reply": "..." }
+# ===========================
+def chat_api(request):
+    try:
+        message = request["message"]
+    except:
+        return {"reply": "INVALID_REQUEST"}
+    # Run model
+    output = ai(message)[0]["generated_text"]
+    # Return exactly what call.php expects
+    return {"reply": output}
+# ===========================
+# NORMAL UI CHAT (optional)
+# ===========================
+def chat_ui(msg):
+    return ai(msg)[0]["generated_text"]
+# ===========================
+# GRADIO SETUP
+# ===========================
+with gr.Blocks() as app:
+    gr.Markdown("# 🚀 Space 1 — Ghost Model")
+    # UI for testing only
+    inp = gr.Textbox(label="Your Message")
+    out = gr.Textbox(label="Model Output")
+    btn = gr.Button("Send")
+    btn.click(chat_ui, inp, out)
+    # Real API needed for call.php
+    gr.JSON(
+        value={"message": "send JSON POST here to use"},
+        label="API Endpoint Information"
+    )
+app.launch(server_name="0.0.0.0", server_port=7860)
+# IMPORTANT!
+# Add an API endpoint for HF:
+import gradio as gr
+from fastapi import FastAPI, Request
+fastapi_app = FastAPI()
+@fastapi_app.post("/chat")
+async def chat_endpoint(request: Request):
+    data = await request.json()
+    return chat_api(data)
+app = gr.mount_gradio_app(fastapi_app, app, path="/")