Mixtral-8x7B-Instruct-v0.1

Runtime error

App Files Files Community

Leri777 commited on Oct 19, 2024

Commit

afdef50

verified ·

1 Parent(s): b04bbf8

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -59

app.py CHANGED Viewed

@@ -1,67 +1,52 @@
-import os
 import gradio as gr
-import torch
-import logging
-from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
-from dotenv import load_dotenv
-# Настройка логирования
-logging.basicConfig(level=logging.DEBUG, format='%(asctime)s - %(levelname)s - %(message)s')
-logger = logging.getLogger(__name__)
-# Загрузка переменных окружения
-load_dotenv()
-MODEL_NAME = os.getenv("MODEL_NAME", "mistralai/Mixtral-8x7B-Instruct-v0.1")
-HF_TOKEN = os.getenv("HF_TOKEN")
-# Проверка доступности токена
-if not HF_TOKEN:
-    logger.error("HF_TOKEN не задан. Пожалуйста, укажите токен доступа Hugging Face в файле .env.")
-    raise EnvironmentError("Отсутствует токен доступа Hugging Face.")
-try:
-    # Инициализация пайплайна для работы с моделью
-    logger.info(f"Попытка загрузить модель: {MODEL_NAME}")
-    pipe = pipeline(
-        "text-generation",
-        model=MODEL_NAME,
-        use_auth_token=HF_TOKEN,
-        device=0 if torch.cuda.is_available() else -1
-    )
-    logger.info("Модель успешно загружена.")
-except Exception as e:
-    logger.error(f"Ошибка при загрузке модели: {e}")
-    raise
-def generate_response(prompt):
-    """
-    Функция для генерации ответа с использованием модели.
-    Форматирует запрос в соответствии с требованиями модели.
-    """
-    try:
-        # Форматирование инструкции согласно требованиям модели
-        formatted_prompt = f"<s>[INST] {prompt} [/INST]</s>"
-        logger.debug(f"Сформированный запрос: {formatted_prompt}")
-        response = pipe(formatted_prompt, max_length=150, num_return_sequences=1)
-        logger.debug(f"Полученный ответ: {response}")
-        return response[0]['generated_text'].replace(formatted_prompt, "").strip()
-    except Exception as e:
-        logger.error(f"Ошибка при генерации ответа: {e}")
-        return "Произошла ошибка при генерации ответа. Пожалуйста, попробуйте еще раз."
-# Интерфейс Gradio для взаимодействия с моделью
-def main():
-    with gr.Blocks() as demo:
-        gr.Markdown("# Mixtral-8x7B Chat Interface")
-        with gr.Row():
-            with gr.Column():
-                prompt = gr.Textbox(label="Введите ваш запрос", placeholder="Введите текст сюда...")
-                submit_btn = gr.Button("Сгенерировать ответ")
-            with gr.Column():
-                response = gr.Textbox(label="Ответ модели")
-        submit_btn.click(fn=generate_response, inputs=prompt, outputs=response)
-    demo.queue().launch(server_name="0.0.0.0", server_port=7860)
-if __name__ == "__main__":
-    main()

+from huggingface_hub import InferenceClient
 import gradio as gr
+client = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
+def format_prompt(message, history):
+  prompt = "<s>"
+  for user_prompt, bot_response in history:
+    prompt += f"[INST] {user_prompt} [/INST]"
+    prompt += f" {bot_response}</s> "
+  prompt += f"[INST] {message} [/INST]"
+  return prompt
+def generate(
+    prompt, history, temperature=0.2, max_new_tokens=256, top_p=0.95, repetition_penalty=1.0,
+):
+    temperature = float(temperature)
+    if temperature < 1e-2:
+        temperature = 1e-2
+    top_p = float(top_p)
+    generate_kwargs = dict(
+        temperature=temperature,
+        max_new_tokens=max_new_tokens,
+        top_p=top_p,
+        repetition_penalty=repetition_penalty,
+        do_sample=True,
+        seed=42,
+    )
+    formatted_prompt = format_prompt(prompt, history)
+    stream = client.text_generation(formatted_prompt, **generate_kwargs, stream=True, details=True, return_full_text=False)
+    output = ""
+    for response in stream:
+        output += response.token.text
+        yield output
+    return output
+mychatbot = gr.Chatbot(
+    avatar_images=["./user.png", "./botm.png"], bubble_full_width=False, show_label=False, show_copy_button=True, likeable=True,)
+demo = gr.ChatInterface(fn=generate,
+                        chatbot=mychatbot,
+                        #title="WebpyGPT",
+                        retry_btn=None,
+                        undo_btn=None
+                       )
+demo.queue().launch(show_api=False)