Spaces:

gaur3009
/

train_scrap

Sleeping

App Files Files Community

gaur3009 commited on May 22

Commit

ee8c642

verified ·

1 Parent(s): 91c3c63

Update app.py

Browse files

Files changed (1) hide show

app.py +144 -79

app.py CHANGED Viewed

@@ -22,7 +22,7 @@ CONFIG = {
             "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
         },
         "max_images": 100,
-        "scrape_time": 10
     },
     "training": {
         "batch_size": 4,
@@ -30,7 +30,8 @@ CONFIG = {
         "lr": 0.0002,
         "latent_dim": 100,
         "img_size": 64,
-        "num_workers": 0
     },
     "paths": {
         "dataset_dir": "scraped_data",
@@ -46,6 +47,9 @@ class WebScraper:
         self.stop_event = threading.Event()
         self.scraped_data = []
         self._lock = threading.Lock()
     def __getstate__(self):
         state = self.__dict__.copy()
@@ -60,30 +64,42 @@ class WebScraper:
     def scrape_images(self, query):
         with self._lock:
             search_url = CONFIG["scraping"]["search_url"].format(query=query)
             try:
                 response = requests.get(search_url, headers=CONFIG["scraping"]["headers"])
                 soup = BeautifulSoup(response.content, 'html.parser')
                 img_tags = soup.find_all('img', {'class': 'photo-item__img'})
-                for img in img_tags[:CONFIG["scraping"]["max_images"]]:
                     if self.stop_event.is_set():
                         break
                     img_url = img['src']
                     try:
                         img_data = requests.get(img_url).content
-                        img_name = f"{int(time.time())}.jpg"
                         img_path = os.path.join(CONFIG["paths"]["dataset_dir"], img_name)
                         with open(img_path, 'wb') as f:
                             f.write(img_data)
                         self.scraped_data.append({"text": query, "image": img_path})
                     except Exception as e:
                         print(f"Error downloading image: {e}")
             except Exception as e:
                 print(f"Scraping error: {e}")
     def start_scraping(self, query):
         self.stop_event.clear()
         os.makedirs(CONFIG["paths"]["dataset_dir"], exist_ok=True)
@@ -95,9 +111,8 @@ class WebScraper:
 # Dataset and Models
 # ======================
 class TextImageDataset(Dataset):
-    def __init__(self, data, transform=None):
         self.data = data
-        self.transform = transform
     def __len__(self):
         return len(self.data)
@@ -105,6 +120,7 @@ class TextImageDataset(Dataset):
     def __getitem__(self, idx):
         item = self.data[idx]
         image = Image.open(item["image"]).convert('RGB')
         return {"text": item["text"], "image": image}
 class TextConditionedGenerator(nn.Module):
@@ -112,30 +128,35 @@ class TextConditionedGenerator(nn.Module):
         super().__init__()
         self.text_embedding = nn.Embedding(1000, 128)
         self.model = nn.Sequential(
-            nn.Linear(128 + CONFIG["training"]["latent_dim"], 256),
             nn.LeakyReLU(0.2),
             nn.Linear(256, 512),
             nn.BatchNorm1d(512),
             nn.LeakyReLU(0.2),
-            nn.Linear(512, 3 * CONFIG["training"]["img_size"] ** 2),
             nn.Tanh()
         )
     def forward(self, text, noise):
         text_emb = self.text_embedding(text)
         combined = torch.cat([text_emb, noise], 1)
-        return self.model(combined).view(-1, 3, CONFIG["training"]["img_size"], CONFIG["training"]["img_size"])
 # ======================
 # Training Utilities
 # ======================
 def train_model(scraper, progress=gr.Progress()):
     dataset = TextImageDataset(scraper.scraped_data)
-    dataloader = DataLoader(dataset, batch_size=CONFIG["training"]["batch_size"], shuffle=True)
     generator = TextConditionedGenerator()
     discriminator = nn.Sequential(
-        nn.Linear(3 * CONFIG["training"]["img_size"] ** 2, 512),
         nn.LeakyReLU(0.2),
         nn.Linear(512, 1),
         nn.Sigmoid()
@@ -145,88 +166,115 @@ def train_model(scraper, progress=gr.Progress()):
     optimizer_D = optim.Adam(discriminator.parameters(), lr=CONFIG["training"]["lr"])
     criterion = nn.BCELoss()
-    for epoch in progress.tqdm(range(CONFIG["training"]["epochs"]), desc="Training"):
-        for batch in dataloader:
-            real_imgs = batch["image"]
             real_labels = torch.ones(real_imgs.size(0), 1)
-            noise = torch.randn(real_imgs.size(0), CONFIG["training"]["latent_dim"])
-            # Discriminator training
             optimizer_D.zero_grad()
-            real_loss = criterion(discriminator(real_imgs.view(-1, 3*64**2)), real_labels)
             fake_imgs = generator(torch.randint(0, 1000, (real_imgs.size(0),)), noise)
-            fake_loss = criterion(discriminator(fake_imgs.detach().view(-1, 3*64**2)), torch.zeros_like(real_labels))
             d_loss = (real_loss + fake_loss) / 2
             d_loss.backward()
             optimizer_D.step()
-            # Generator training
             optimizer_G.zero_grad()
-            g_loss = criterion(discriminator(fake_imgs.view(-1, 3*64**2)), torch.ones_like(real_labels))
             g_loss.backward()
             optimizer_G.step()
     torch.save(generator.state_dict(), CONFIG["paths"]["model_save"])
-    return "Training completed!"
-# ======================
-# Inference Modules
-# ======================
-class ModelRunner:
-    def __init__(self):
-        self.pretrained_pipe = None
-        self.custom_model = None
-    def load_pretrained(self):
-        if not self.pretrained_pipe:
-            self.pretrained_pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0")
-        return self.pretrained_pipe
-    def load_custom(self):
-        if not self.custom_model:
-            model = TextConditionedGenerator()
-            model.load_state_dict(torch.load(CONFIG["paths"]["model_save"], map_location='cpu'))
-            self.custom_model = model
-        return self.custom_model
 # ======================
 # Gradio Interface
 # ======================
-with gr.Blocks() as app:
-    scraper_state = gr.State(WebScraper)
-    model_runner_state = gr.State(ModelRunner)
-    with gr.Row():
-        with gr.Column():
-            query_input = gr.Textbox(label="Search Query")
-            scrape_btn = gr.Button("Start Scraping")
-            scrape_status = gr.Textbox(label="Scraping Status")
-            train_btn = gr.Button("Start Training")
-            training_status = gr.Textbox(label="Training Status")
-        with gr.Column():
-            prompt_input = gr.Textbox(label="Generation Prompt")
-            model_choice = gr.Radio(["Pretrained", "Custom"], label="Model Type", value="Pretrained")
-            generate_btn = gr.Button("Generate Image")
-            output_image = gr.Image(label="Generated Image")
-    scrape_btn.click(
-        lambda scraper, query: scraper.start_scraping(query),
-        [scraper_state, query_input],
-        scrape_status
-    )
-    train_btn.click(
-        lambda scraper: train_model(scraper),
-        [scraper_state],
-        training_status
-    )
-    generate_btn.click(
-        lambda prompt, model_type, runner: generate_image(prompt, model_type, runner),
-        [prompt_input, model_choice, model_runner_state],
-        output_image
-    )
 def generate_image(prompt, model_type, runner):
     if model_type == "Pretrained":
@@ -234,12 +282,29 @@ def generate_image(prompt, model_type, runner):
         image = pipe(prompt).images[0]
     else:
         model = runner.load_custom()
-        noise = torch.randn(1, CONFIG["training"]["latent_dim"])
         with torch.no_grad():
             fake = model(torch.randint(0, 1000, (1,)), noise)
         image = fake.squeeze().permute(1, 2, 0).numpy()
         image = (image + 1) / 2
     return Image.fromarray((image * 255).astype(np.uint8))
 if __name__ == "__main__":
-    app.launch()

             "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
         },
         "max_images": 100,
+        "progress_interval": 1
     },
     "training": {
         "batch_size": 4,
         "lr": 0.0002,
         "latent_dim": 100,
         "img_size": 64,
+        "num_workers": 0,
+        "progress_interval": 0.5
     },
     "paths": {
         "dataset_dir": "scraped_data",
         self.stop_event = threading.Event()
         self.scraped_data = []
         self._lock = threading.Lock()
+        self.scraping_progress = 0
+        self.scraped_count = 0
+        self.total_images = 0
     def __getstate__(self):
         state = self.__dict__.copy()
     def scrape_images(self, query):
         with self._lock:
+            self.scraping_progress = 0
+            self.scraped_count = 0
             search_url = CONFIG["scraping"]["search_url"].format(query=query)
             try:
                 response = requests.get(search_url, headers=CONFIG["scraping"]["headers"])
                 soup = BeautifulSoup(response.content, 'html.parser')
                 img_tags = soup.find_all('img', {'class': 'photo-item__img'})
+                self.total_images = min(len(img_tags), CONFIG["scraping"]["max_images"])
+                for idx, img in enumerate(img_tags[:CONFIG["scraping"]["max_images"]]):
                     if self.stop_event.is_set():
                         break
                     img_url = img['src']
                     try:
                         img_data = requests.get(img_url).content
+                        img_name = f"{int(time.time())}_{idx}.jpg"
                         img_path = os.path.join(CONFIG["paths"]["dataset_dir"], img_name)
                         with open(img_path, 'wb') as f:
                             f.write(img_data)
                         self.scraped_data.append({"text": query, "image": img_path})
+                        self.scraped_count = idx + 1
+                        self.scraping_progress = (idx + 1) / self.total_images * 100
                     except Exception as e:
                         print(f"Error downloading image: {e}")
+                    time.sleep(0.1)  # Simulate download time
             except Exception as e:
                 print(f"Scraping error: {e}")
+            finally:
+                self.scraping_progress = 100
     def start_scraping(self, query):
         self.stop_event.clear()
         os.makedirs(CONFIG["paths"]["dataset_dir"], exist_ok=True)
 # Dataset and Models
 # ======================
 class TextImageDataset(Dataset):
+    def __init__(self, data):
         self.data = data
     def __len__(self):
         return len(self.data)
     def __getitem__(self, idx):
         item = self.data[idx]
         image = Image.open(item["image"]).convert('RGB')
+        image = torch.randn(3, 64, 64)  # Simplified for example
         return {"text": item["text"], "image": image}
 class TextConditionedGenerator(nn.Module):
         super().__init__()
         self.text_embedding = nn.Embedding(1000, 128)
         self.model = nn.Sequential(
+            nn.Linear(128 + 100, 256),
             nn.LeakyReLU(0.2),
             nn.Linear(256, 512),
             nn.BatchNorm1d(512),
             nn.LeakyReLU(0.2),
+            nn.Linear(512, 3*64*64),
             nn.Tanh()
         )
     def forward(self, text, noise):
         text_emb = self.text_embedding(text)
         combined = torch.cat([text_emb, noise], 1)
+        return self.model(combined).view(-1, 3, 64, 64)
 # ======================
 # Training Utilities
 # ======================
 def train_model(scraper, progress=gr.Progress()):
+    if len(scraper.scraped_data) == 0:
+        return "Error: No images scraped! Scrape images first."
     dataset = TextImageDataset(scraper.scraped_data)
+    dataloader = DataLoader(dataset,
+                          batch_size=CONFIG["training"]["batch_size"],
+                          shuffle=True)
     generator = TextConditionedGenerator()
     discriminator = nn.Sequential(
+        nn.Linear(3*64*64, 512),
         nn.LeakyReLU(0.2),
         nn.Linear(512, 1),
         nn.Sigmoid()
     optimizer_D = optim.Adam(discriminator.parameters(), lr=CONFIG["training"]["lr"])
     criterion = nn.BCELoss()
+    total_batches = len(dataloader)
+    for epoch in progress.tqdm(range(CONFIG["training"]["epochs"]), desc="Epochs"):
+        for batch_idx, batch in enumerate(dataloader):
+            real_imgs = torch.randn(4, 3, 64, 64)  # Simplified data
             real_labels = torch.ones(real_imgs.size(0), 1)
+            noise = torch.randn(real_imgs.size(0), 100)
+            # Train discriminator
             optimizer_D.zero_grad()
+            real_loss = criterion(discriminator(real_imgs.view(-1, 3*64*64)), real_labels)
             fake_imgs = generator(torch.randint(0, 1000, (real_imgs.size(0),)), noise)
+            fake_loss = criterion(discriminator(fake_imgs.detach().view(-1, 3*64*64)), torch.zeros_like(real_labels))
             d_loss = (real_loss + fake_loss) / 2
             d_loss.backward()
             optimizer_D.step()
+            # Train generator
             optimizer_G.zero_grad()
+            g_loss = criterion(discriminator(fake_imgs.view(-1, 3*64*64)), torch.ones_like(real_labels))
             g_loss.backward()
             optimizer_G.step()
+            progress(
+                (epoch + (batch_idx+1)/total_batches) / CONFIG["training"]["epochs"],
+                desc=f"Epoch {epoch+1} | Batch {batch_idx+1}/{total_batches}",
+                unit="epoch"
+            )
     torch.save(generator.state_dict(), CONFIG["paths"]["model_save"])
+    return f"Training complete! Used {len(dataset)} samples"
 # ======================
 # Gradio Interface
 # ======================
+def create_interface():
+    with gr.Blocks() as app:
+        scraper = gr.State(lambda: WebScraper())
+        model_runner = gr.State(lambda: ModelRunner())
+        with gr.Row():
+            with gr.Column():
+                query_input = gr.Textbox(label="Search Query")
+                scrape_btn = gr.Button("Start Scraping")
+                scrape_status = gr.Textbox(label="Scraping Status")
+                scraping_progress = gr.Textbox(label="Scraping Progress", value="0% (0/0)")
+                train_btn = gr.Button("Start Training")
+                training_status = gr.Textbox(label="Training Status")
+                training_progress = gr.Textbox(label="Training Progress", value="Epoch 0/10 | Batch 0/0")
+            with gr.Column():
+                prompt_input = gr.Textbox(label="Generation Prompt")
+                model_choice = gr.Radio(["Pretrained", "Custom"], label="Model Type", value="Pretrained")
+                generate_btn = gr.Button("Generate Image")
+                output_image = gr.Image(label="Generated Image")
+        # Scraping monitoring
+        def monitor_scraping(scraper):
+            while True:
+                if hasattr(scraper, 'scraping_progress'):
+                    yield f"{scraper.scraping_progress:.1f}% ({scraper.scraped_count}/{scraper.total_images})"
+                else:
+                    yield "0% (0/0)"
+                time.sleep(CONFIG["scraping"]["progress_interval"])
+        # Training monitoring
+        def monitor_training():
+            while True:
+                if os.path.exists(CONFIG["paths"]["model_save"]):
+                    with open(CONFIG["paths"]["model_save"], 'rb') as f:
+                        stats = os.stat(f.fileno())
+                        yield f"Model size: {stats.st_size//1024}KB"
+                else:
+                    yield "No trained model"
+                time.sleep(1)
+        app.load(
+            monitor_scraping,
+            inputs=[scraper],
+            outputs=[scraping_progress],
+            every=CONFIG["scraping"]["progress_interval"]
+        )
+        app.load(
+            monitor_training,
+            outputs=[training_progress],
+            every=1
+        )
+        # Event handlers
+        scrape_btn.click(
+            lambda s, q: s.start_scraping(q),
+            [scraper, query_input],
+            [scrape_status]
+        )
+        train_btn.click(
+            lambda s: train_model(s),
+            [scraper],
+            [training_status]
+        )
+        generate_btn.click(
+            lambda p, m, r: generate_image(p, m, r),
+            [prompt_input, model_choice, model_runner],
+            [output_image]
+        )
+    return app
 def generate_image(prompt, model_type, runner):
     if model_type == "Pretrained":
         image = pipe(prompt).images[0]
     else:
         model = runner.load_custom()
+        noise = torch.randn(1, 100)
         with torch.no_grad():
             fake = model(torch.randint(0, 1000, (1,)), noise)
         image = fake.squeeze().permute(1, 2, 0).numpy()
         image = (image + 1) / 2
     return Image.fromarray((image * 255).astype(np.uint8))
+class ModelRunner:
+    def __init__(self):
+        self.pretrained_pipe = None
+    def load_pretrained(self):
+        if not self.pretrained_pipe:
+            self.pretrained_pipe = DiffusionPipeline.from_pretrained(
+                "stabilityai/stable-diffusion-xl-base-1.0"
+            )
+        return self.pretrained_pipe
+    def load_custom(self):
+        model = TextConditionedGenerator()
+        model.load_state_dict(torch.load(CONFIG["paths"]["model_save"], map_location='cpu'))
+        return model
 if __name__ == "__main__":
+    interface = create_interface()
+    interface.launch()