legalrci

Runtime error

App Files Files Community

Docfile commited on May 15, 2024

Commit

510ec12

verified ·

1 Parent(s): 41b8d5c

Update app.py

Browse files

Files changed (1) hide show

app.py +100 -141

app.py CHANGED Viewed

@@ -1,146 +1,105 @@
 import gradio as gr
-import os
-import logging
-from llama_index.llms.gemini import Gemini
-import sys
-logging.basicConfig(stream=sys.stdout, level=logging.INFO)
-logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))
-GOOGLE_API_KEY = "AIzaSyDYhyRoOWBJWOb4bqY5wmFLrBo4HTwQDko"  # add your GOOGLE API key here
-os.environ["GOOGLE_API_KEY"] = GOOGLE_API_KEY
-from llama_index.core import SimpleDirectoryReader
-from g4f import Provider, models
-from langchain.llms.base import LLM
-from llama_index.llms.langchain import LangChainLLM
-from langchain_g4f import G4FLLM
-from llama_index.core import (
-    ServiceContext,
-    SimpleDirectoryReader,
-    StorageContext,
-    VectorStoreIndex,
-    set_global_service_context,
-)
-#from llama_index.llms import Gemini
-from llama_index.embeddings.gemini import GeminiEmbedding
-import g4f
-g4f.debug.logging = True
-from llama_index.core import Settings
-from langchain_google_genai import ChatGoogleGenerativeAI
-llm= LLM = G4FLLM(
-        model=models.gpt_35_turbo_16k,
-    )
-llm = LangChainLLM(llm=llm)
-safe = [
-    {
-        "category": "HARM_CATEGORY_HARASSMENT",
-        "threshold": "BLOCK_NONE",
-    },
-    {
-        "category": "HARM_CATEGORY_HATE_SPEECH",
-        "threshold": "BLOCK_NONE",
-    },
-    {
-        "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
-        "threshold": "BLOCK_NONE",
-    },
-    {
-        "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
-        "threshold": "BLOCK_NONE",
-    },
 ]
-#llm = Gemini(model="models/gemini-pro", safety_settings=safe)
-model_name = "models/embedding-001"
-#llm = Gemini()
-embed_model = GeminiEmbedding(
-    model_name=model_name, api_key=GOOGLE_API_KEY, title="this is a document"
-)
-Settings.embed_model = embed_model
-# Reads pdfs at "./" path
-"""
-parser = LlamaParse(
-    api_key="llx-KMCDGpt3Yn89wwOYJXaFDfJLHTbUQbnTKVccaGVHJLfAN96w",  # can also be set in your env as LLAMA_CLOUD_API_KEY
-    result_type="markdown",  # "markdown" and "text" are available
-    verbose=True
-)
-file_extractor = {".pdf": parser}
-documents = SimpleDirectoryReader("./data", file_extractor=file_extractor).load_data()
-"""
-documents = (
-    SimpleDirectoryReader(
-        input_dir = 'data',
-        required_exts = [".pdf"])
-        .load_data()
-)
-# ServiceContext is a bundle of commonly used
-# resources used during the indexing and
-# querying stage
-service_context = (
-    ServiceContext
-    .from_defaults(
-        llm=llm,
-        embed_model=embed_model,
-        chunk_size=8045
-    )
-)
-set_global_service_context(service_context)
-print("node passer11")
-# Node represents a “chunk” of a source Document
-nodes = (
-    service_context
-    .node_parser
-    .get_nodes_from_documents(documents)
-)
-print("node passer")
-# offers core abstractions around storage of Nodes,
-# indices, and vectors
-storage_context = StorageContext.from_defaults()
-storage_context.docstore.add_documents(nodes)
-print("node passer")
-# Create the vectorstore index
-index = (
-    VectorStoreIndex
-    .from_documents(
-        documents,
-        storage_context=storage_context,
-        llm=llm
-        )
-)
-print("node passer")
-query_engine = index.as_query_engine()
-# Query the index
-def greet(name):
-    ss = name + ".réponds en citant tes sources et articles"
-    response = query_engine.query(ss)
-    print("question :",name)
-    print("réponse :", response)
-    return response
-iface = gr.Interface(fn=greet, inputs=gr.Textbox(label="Question:", lines=4), outputs="text")
-iface.launch()

 import gradio as gr
+from pathlib import Path
+import hashlib
+import google.generativeai as genai
+from PyPDF2 import PdfReader
+import os
+token=os.environ.get("TOKEN")
+genai.configure(api_key=token)
+# Set up the model
+generation_config = {
+  "max_output_tokens": 8192,
+}
+safety_settings = [
+  {
+    "category": "HARM_CATEGORY_HARASSMENT","threshold": "BLOCK_NONE"
+  },
+  {
+    "category": "HARM_CATEGORY_HATE_SPEECH","threshold": "BLOCK_NONE"
+  },
+  {
+    "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT", "threshold": "BLOCK_NONE"
+  },
+  {
+    "category": "HARM_CATEGORY_DANGEROUS_CONTENT","threshold": "BLOCK_NONE"
+  },
 ]
+system_instruction = "Utillisez les éléments de contexte pour répondre. Si vous ne connaissez pas la réponse n'essayez pas d'inventer une réponse et preciser que vous ne la connaissez pas.  Je veux que tu agisses comme un profesionel du droit. Je pose une questiob  et tu reponds en te basant sur le contexte. Je ne veux aucune explication. Juste la réponse..réponds en citant tes sources et articles"
+model = genai.GenerativeModel(model_name="gemini-1.5-flash-latest",
+                              generation_config=generation_config,
+                              system_instruction=system_instruction,                           safety_settings=safety_settings)
+code_civil = "data/CODE_CIVIL_I_-_2023 (1).pdf"
+code_civil_II = "data/CODE_civil_II_-_2.pdf"
+Code_de_procedure_pénale = "data/Code_de_proc._pénale-2023.pdf"
+code_penal = "data/NOUVEAU_CODE_PENAL_2024.pdf"
+uploaded_files = []
+def upload_if_needed(pathname: str) -> list[str]:
+  path = Path(pathname)
+  hash_id = hashlib.sha256(path.read_bytes()).hexdigest()
+  try:
+    existing_file = genai.get_file(name=hash_id)
+    return [existing_file.uri]
+  except:
+    pass
+  uploaded_files.append(genai.upload_file(path=path, display_name=hash_id))
+  return [uploaded_files[-1].uri]
+def extract_pdf_pages(pathname: str) -> list[str]:
+    parts = [f"--- START OF PDF ${pathname} ---"]
+    try:
+        # Lecture du PDF avec PyPDF2
+        reader = PdfReader(pathname)
+        for page_num in range(len(reader.pages)):
+            page = reader.pages[page_num]
+            text = page.extract_text()
+            parts.append(f"--- PAGE {page_num} ---")
+            parts.append(text)
+    except FileNotFoundError:
+        print(f"Erreur: Fichier PDF '{pathname}' introuvable.")
+    return parts
+convo = model.start_chat(history=[
+  {
+    "role": "user",
+    "parts": extract_pdf_pages(code_civil)
+  },
+   {
+    "role": "user",
+    "parts": extract_pdf_pages(code_civil_II)
+  },
+   {
+    "role": "user",
+    "parts": extract_pdf_pages(Code_de_procedure_pénale)
+  },
+   {
+    "role": "user",
+    "parts": extract_pdf_pages(code_penal)
+  },
+  { "role": "model",
+    "parts": [""]
+    },
+])
+def respond(user_input):
+  convo.send_message(user_input)
+  response = convo.last.text
+  print(response)
+  return response
+iface = gr.Interface(fn=respond, inputs="text", outputs="text", title="Fang to French Translator")
+iface.launch()
+for uploaded_file in uploaded_files:
+  genai.delete_file(name=uploaded_file.name)