Spaces:

HBAB
/

proyecto

Sleeping

App Files Files Community

HBAB commited on May 12

Commit

f0c291f

verified ·

1 Parent(s): 553c93b

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -24

app.py CHANGED Viewed

@@ -1,43 +1,37 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import torch
-# Cargar modelo y tokenizer de CodeT5
-tokenizer = AutoTokenizer.from_pretrained("Salesforce/codet5-base")
-model = AutoModelForSeq2SeqLM.from_pretrained("Salesforce/codet5-base")
-# Función para generar explicación del código con CodeT5
 def analizar_codigo(codigo):
     errores = "⚠️ No se realizó análisis de sintaxis (solo compatible con Python)."
     try:
-        # Preparamos el prompt para explicación (puedes ajustar el prompt según la tarea)
-        prompt = f"Explain this JavaScript code:\n{codigo}\n"
-        inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=512)
         with torch.no_grad():
-            summary_ids = model.generate(
-                inputs.input_ids,
-                max_length=128,
-                num_beams=4,
-                early_stopping=True
-            )
-        explicacion = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
     except Exception as e:
-        explicacion = f"❌ Error al analizar el código: {str(e)}"
     return errores, explicacion
-# Interfaz con Gradio
 demo = gr.Interface(
     fn=analizar_codigo,
-    inputs=gr.Textbox(lines=15, label="Pega tu código JavaScript aquí"),
     outputs=[
         gr.Textbox(label="Estado de la sintaxis"),
-        gr.Textbox(label="Explicación generada por CodeT5")
     ],
-    title="🔍 Explicador de código JavaScript con CodeT5",
-    description=(
-        "Este Space utiliza CodeT5 para generar explicaciones automáticas de tu código JavaScript. "
-        "No se realiza análisis de sintaxis ni generación textual automática."
-    )
 )
 demo.launch()

 import gradio as gr
+from transformers import AutoTokenizer, AutoModel
 import torch
+# Cargar CodeBERT
+tokenizer = AutoTokenizer.from_pretrained("microsoft/codebert-base-mlm")
+model = AutoModel.from_pretrained("microsoft/codebert-base-mlm")
+# Función que usa CodeBERT para codificar y analizar
 def analizar_codigo(codigo):
     errores = "⚠️ No se realizó análisis de sintaxis (solo compatible con Python)."
     try:
+        inputs = tokenizer(codigo, return_tensors="pt", truncation=True, max_length=512)
         with torch.no_grad():
+            outputs = model(**inputs)
+        # Tomamos el embedding del primer token [CLS] como resumen
+        cls_embedding = outputs.last_hidden_state[0][0]
+        vector = cls_embedding.tolist()[:5]  # solo primeros 5 valores para mostrar
+        explicacion = f"Vector de representación del código (parcial): {vector}"
     except Exception as e:
+        explicacion = f"❌ Error al procesar el código: {str(e)}"
     return errores, explicacion
+# Interfaz Gradio
 demo = gr.Interface(
     fn=analizar_codigo,
+    inputs=gr.Textbox(lines=15, label="Pega tu código aquí"),
     outputs=[
         gr.Textbox(label="Estado de la sintaxis"),
+        gr.Textbox(label="Representación del código")
     ],
+    title="🔍 Representación de Código con CodeBERT",
+    description="Este Space usa CodeBERT (MLM) para generar una representación vectorial del código fuente."
 )
 demo.launch()