Spaces:

Docfile
/

y-video

Sleeping

App Files Files Community

Docfile commited on May 17, 2024

Commit

05588a0

verified ·

1 Parent(s): 6aa2b4e

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -106

app.py CHANGED Viewed

@@ -1,125 +1,51 @@
 import gradio as gr
 import google.generativeai as genai
-import cv2
-import os
-import shutil
-# Set up your API key
-genai.configure(api_key="AIzaSyDsrgHAnNWDJqWWzq3oFAbUy5W40cUT0dY")
-# Constants
-FRAME_EXTRACTION_DIRECTORY = "/content/frames"
-FRAME_PREFIX = "_frame"
-# Function to create/cleanup frame output directory
-def create_frame_output_dir(output_dir):
-    if not os.path.exists(output_dir):
-        os.makedirs(output_dir)
-    else:
-        shutil.rmtree(output_dir)
-        os.makedirs(output_dir)
-# Function to extract frames from video
-def extract_frame_from_video(video_file_path):
-    create_frame_output_dir(FRAME_EXTRACTION_DIRECTORY)
-    vidcap = cv2.VideoCapture(video_file_path)
-    fps = vidcap.get(cv2.CAP_PROP_FPS)
-    frame_duration = 1 / fps
-    output_file_prefix = os.path.basename(video_file_path).replace('.', '_')
-    frame_count = 0
-    count = 0
-    while vidcap.isOpened():
-        success, frame = vidcap.read()
-        if not success:
-            break
-        if int(count / fps) == frame_count:
-            min = frame_count // 60
-            sec = frame_count % 60
-            time_string = f"{min:02d}:{sec:02d}"
-            image_name = f"{output_file_prefix}{FRAME_PREFIX}{time_string}.jpg"
-            output_filename = os.path.join(FRAME_EXTRACTION_DIRECTORY, image_name)
-            cv2.imwrite(output_filename, frame)
-            frame_count += 1
-        count += 1
-    vidcap.release()
-    return frame_count
-# Class to represent a file
-class File:
-    def __init__(self, file_path: str, display_name: str = None):
-        self.file_path = file_path
-        if display_name:
-            self.display_name = display_name
-        self.timestamp = self.get_timestamp(file_path)
-    def set_file_response(self, response):
-        self.response = response
-    def get_timestamp(self, filename):
-        parts = filename.split(FRAME_PREFIX)
-        if len(parts) != 2:
-            return None
-        return parts[1].split('.')[0]
-# Function to upload files to Gemini
-def upload_files(files_to_upload):
-    uploaded_files = []
-    for file in files_to_upload:
-        response = genai.upload_file(path=file.file_path)
-        file.set_file_response(response)
-        uploaded_files.append(file)
-    return uploaded_files
-# Function to generate description using Gemini
-def generate_description(uploaded_files):
-    prompt = "Describe this video."
-    model = genai.GenerativeModel(model_name="models/gemini-1.5-flash-latest")
-    request = [prompt]
-    for file in uploaded_files:
-        request.append(file.timestamp)
-        request.append(file.response)
-    response = model.generate_content(request, request_options={"timeout": 600})
-    print(response)
-    return response
-# Function to delete files from Gemini
-def delete_files(uploaded_files):
-    pass
-    """
-    for file in uploaded_files:
-        genai.delete_file(file.response.name)
-    """
-# Gradio interface
-def process_video(video_file):
-    try:
-        # Extract frames
-        frame_count = extract_frame_from_video(video_file.name)
-        # Prepare files for upload
-        files = os.listdir(FRAME_EXTRACTION_DIRECTORY)
-        files = sorted(files)
-        files_to_upload = []
-        for file in files:
-            files_to_upload.append(
-                File(file_path=os.path.join(FRAME_EXTRACTION_DIRECTORY, file))
-            )
-        # Upload files to Gemini
-        uploaded_files = upload_files(files_to_upload)
-        # Generate description
-        description = generate_description(uploaded_files)
-        # Delete files from Gemini
-        delete_files(uploaded_files)
-        return f"Video processed successfully! Description:\n\n{description}"
     except Exception as e:
-        return f"An error occurred: {str(e)}"
-# Create Gradio interface
 iface = gr.Interface(
-    fn=process_video,
     inputs=gr.Video(),
     outputs=gr.Textbox(),
     title="Video Description with Gemini",

 import gradio as gr
 import google.generativeai as genai
+# API key input
+api_key = "AIzaSyDsrgHAnNWDJqWWzq3oFAbUy5W40cUT0dY"
+genai.configure(api_key=api_key)
+def describe_video(video_file):
+    try:
+        print(f"Uploading file...")
+        uploaded_video = genai.upload_file(path=video_file.name)
+        print(f"Completed upload: {uploaded_video.uri}")
+        import time
+        while uploaded_video.state.name == "PROCESSING":
+            print("Waiting for video to be processed.")
+            time.sleep(10)
+            uploaded_video = genai.get_file(uploaded_video.name)
+        if uploaded_video.state.name == "FAILED":
+            raise ValueError(uploaded_video.state.name)
+        print(f"Video processing complete: " + uploaded_video.uri)
+        prompt = "Describe this video."
+        # Set the model to Gemini 1.5 Pro.
+        model = genai.GenerativeModel(model_name="models/gemini-1.5-flash-latest")
+        # Make the LLM request.
+        print("Making LLM inference request...")
+        response = model.generate_content(
+            [prompt, uploaded_video], request_options={"timeout": 600}
+        )
+        print(response.text)
+        genai.delete_file(uploaded_video.name)
+        print(f"Deleted file {uploaded_video.uri}")
+        return response.text
     except Exception as e:
+        return f"An error occurred: {e}"
+# Create the Gradio interface
 iface = gr.Interface(
+    fn=describe_video,
     inputs=gr.Video(),
     outputs=gr.Textbox(),
     title="Video Description with Gemini",