Spaces:

habulaj
/

newapi-clone

Restarting

App Files Files Community

habulaj commited on 2 days ago

Commit

bbbc107

verified ·

1 Parent(s): 05d2c32

Update routers/inference.py

Browse files

Files changed (1) hide show

routers/inference.py +61 -297

routers/inference.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import os
 import logging
 import json
 from fastapi import APIRouter, HTTPException
 from pydantic import BaseModel
 from google import genai
@@ -17,6 +18,7 @@ router = APIRouter()
 class NewsRequest(BaseModel):
     content: str
 class NewsResponse(BaseModel):
     title: str
@@ -32,12 +34,12 @@ def get_brazilian_date_string():
     try:
         # Tenta configurar o locale brasileiro
         locale_variants = [
-            'pt_BR.UTF-8',      # Linux/macOS padrão
-            'pt_BR.utf8',       # Algumas distribuições Linux
-            'pt_BR',            # Fallback sem encoding
-            'Portuguese_Brazil.1252',  # Windows
-            'Portuguese_Brazil',       # Windows alternativo
-            'pt_BR.ISO8859-1',        # Encoding alternativo
         ]
         locale_set = False
@@ -45,20 +47,16 @@ def get_brazilian_date_string():
             try:
                 locale.setlocale(locale.LC_TIME, loc)
                 locale_set = True
-                logger.info(f"Locale configurado com sucesso: {loc}")
                 break
             except locale.Error:
-                logger.debug(f"Locale {loc} não disponível")
                 continue
         if not locale_set:
-            logger.warning("Nenhum locale brasileiro encontrado, usando locale padrão")
-            locale.setlocale(locale.LC_TIME, '')  # Usa locale padrão do sistema
-        # Obtém a data atual no fuso horário de São Paulo
         now = datetime.now(ZoneInfo("America/Sao_Paulo"))
-        # Dicionários para tradução manual (fallback caso locale não funcione)
         meses = {
             1: 'janeiro', 2: 'fevereiro', 3: 'março', 4: 'abril',
             5: 'maio', 6: 'junho', 7: 'julho', 8: 'agosto',
@@ -71,139 +69,100 @@ def get_brazilian_date_string():
         }
         try:
-            # Tenta usar strftime com locale configurado
             if locale_set:
-                # Para sistemas Unix/Linux usa %-d (sem zero à esquerda)
                 try:
                     date_string = now.strftime("%-d de %B de %Y (%A)")
                 except ValueError:
-                    # Para Windows usa %#d
                     try:
                         date_string = now.strftime("%#d de %B de %Y (%A)")
                     except ValueError:
-                        # Fallback: usa %d e remove zero manualmente se necessário
                         date_string = now.strftime("%d de %B de %Y (%A)")
                         if date_string.startswith('0'):
                             date_string = date_string[1:]
-                # Força dia da semana em minúscula
                 date_string = date_string.replace(date_string.split('(')[1].split(')')[0],
                                                 date_string.split('(')[1].split(')')[0].lower())
             else:
-                # Fallback manual completo
                 dia = now.day
                 mes = meses[now.month]
                 ano = now.year
                 dia_semana = dias_semana[now.weekday()]
                 date_string = f"{dia} de {mes} de {ano} ({dia_semana})"
-        except Exception as e:
-            logger.warning(f"Erro ao formatar data com locale: {e}")
-            # Fallback manual completo em caso de erro
             dia = now.day
             mes = meses[now.month]
             ano = now.year
             dia_semana = dias_semana[now.weekday()]
             date_string = f"{dia} de {mes} de {ano} ({dia_semana})"
-        logger.info(f"Data detectada e formatada: {date_string}")
         return date_string
-    except Exception as e:
-        logger.error(f"Erro crítico na formatação de data: {e}")
-        # Último fallback: data em inglês
         now = datetime.now(ZoneInfo("America/Sao_Paulo"))
         date_string = now.strftime("%d de %B de %Y")
-        logger.warning(f"Usando fallback de data: {date_string}")
         return date_string
-def safe_json_serialize(obj):
-    """Converte objeto em JSON de forma segura para logging"""
     try:
-        return json.dumps(obj, indent=2, ensure_ascii=False, default=str)
     except Exception as e:
-        logger.warning(f"Erro ao serializar objeto para JSON: {e}")
-        return str(obj)
 def extract_text_from_response(response):
     """
-    Extrai o texto da resposta de forma robusta, lidando com diferentes estruturas possíveis.
     """
     response_text = ""
-    # Método 1: Tentar response.text diretamente
     if hasattr(response, 'text') and response.text:
-        response_text = response.text
-        logger.info(f"Texto extraído via response.text: {len(response_text)} caracteres")
-        return response_text
-    # Método 2: Tentar extrair dos candidates
     if hasattr(response, 'candidates') and response.candidates:
-        for i, candidate in enumerate(response.candidates):
-            logger.debug(f"Processando candidate {i}")
             if not hasattr(candidate, 'content') or not candidate.content:
-                logger.debug(f"Candidate {i} não tem content válido")
                 continue
             content = candidate.content
-            # Verificar se content tem parts e se não é None
             if not hasattr(content, 'parts') or content.parts is None:
-                logger.debug(f"Candidate {i} content.parts é None ou não existe")
                 continue
-            # Iterar pelas parts de forma segura
             try:
                 parts_list = list(content.parts) if content.parts else []
-                logger.debug(f"Candidate {i} tem {len(parts_list)} parts")
-                for j, part in enumerate(parts_list):
                     if hasattr(part, 'text') and part.text:
                         response_text += part.text
-                        logger.debug(f"Texto adicionado do candidate {i}, part {j}: {len(part.text)} chars")
-            except Exception as e:
-                logger.warning(f"Erro ao processar parts do candidate {i}: {e}")
                 continue
-    # Método 3: Tentar atributos alternativos
-    if not response_text and hasattr(response, 'candidates'):
-        for i, candidate in enumerate(response.candidates):
-            for attr_name in ['output', 'generated_text', 'text_content']:
-                if hasattr(candidate, attr_name):
-                    attr_value = getattr(candidate, attr_name)
-                    if attr_value and str(attr_value).strip():
-                        response_text += str(attr_value)
-                        logger.info(f"Texto encontrado em candidate.{attr_name}")
-                        break
-    logger.info(f"Texto total extraído: {len(response_text)} caracteres")
     return response_text
 def extract_sources_from_response(response):
     """
-    Extrai as fontes (URLs) do grounding metadata de forma robusta.
     """
     sources = []
     if not (hasattr(response, 'candidates') and response.candidates):
-        logger.debug("Response não tem candidates")
         return sources
-    for i, candidate in enumerate(response.candidates):
         if not (hasattr(candidate, 'grounding_metadata') and candidate.grounding_metadata):
-            logger.debug(f"Candidate {i} não tem grounding_metadata")
             continue
         grounding_metadata = candidate.grounding_metadata
-        logger.debug(f"Processando grounding_metadata do candidate {i}")
-        # Verificar grounding_chunks
         if hasattr(grounding_metadata, 'grounding_chunks') and grounding_metadata.grounding_chunks:
-            logger.debug(f"Encontrados {len(grounding_metadata.grounding_chunks)} grounding_chunks")
-            for j, chunk in enumerate(grounding_metadata.grounding_chunks):
                 try:
                     if (hasattr(chunk, 'web') and chunk.web and
                         hasattr(chunk.web, 'uri') and chunk.web.uri):
@@ -211,90 +170,69 @@ def extract_sources_from_response(response):
                         uri = chunk.web.uri
                         if uri and uri not in sources:
                             sources.append(uri)
-                            logger.debug(f"Fonte adicionada do chunk {j}: {uri}")
-                except Exception as e:
-                    logger.warning(f"Erro ao processar chunk {j}: {e}")
                     continue
-        # Verificar search_entry_point (método alternativo)
-        if hasattr(grounding_metadata, 'search_entry_point') and grounding_metadata.search_entry_point:
-            logger.debug("Search entry point encontrado")
-            # Aqui você pode adicionar lógica adicional se necessário
-    logger.info(f"Total de fontes únicas encontradas: {len(sources)}")
     return sources
 @router.post("/rewrite-news", response_model=NewsResponse)
 async def rewrite_news(news: NewsRequest):
     """
-    Endpoint para reescrever notícias usando o modelo Gemini.
     """
     try:
-        logger.info(f"Iniciando reescrita de notícia com {len(news.content)} caracteres")
-        # Verificar se a API key está configurada
         api_key = os.environ.get("GEMINI_API_KEY")
         if not api_key:
-            logger.error("GEMINI_API_KEY não encontrada nas variáveis de ambiente")
             raise HTTPException(status_code=500, detail="API key não configurada")
         client = genai.Client(api_key=api_key)
         model = "gemini-2.5-pro"
         # Obter data formatada
         date_string = get_brazilian_date_string()
-        logger.info(f"Usando data: {date_string}")
         # Instruções do sistema
         SYSTEM_INSTRUCTIONS = f"""
-Você é um jornalista de entretenimento brasileiro, escrevendo para portais digitais modernos. Sua missão é transformar notícias internacionais em matérias originais, atualizadas e envolventes para o público brasileiro.
 ESTILO DE ESCRITA:
-- Tom natural, direto e conversacional, sem frases feitas ou jargões jornalísticos
 - Varie estruturas e conectivos para evitar robotização. Ou seja, sem frases redundantes, exemplo: "destacando como a experiência pode ser um divisor de águas profissional", "reafirma a força criativa do país no cenário global", "A revelação contextualizou não apenas sua performance na dança, mas também". É para noticiar a notícia de fato, sempre buscando mais informações que se conectam, e não opiniões pessoais.
-- Sem linguagem militante ou juízos morais: mantenha tom informativo e predominantemente conservador
 - Evite opiniões genéricas; foque em fatos e contexto
-CONTEÚDO E ABORDAGEM:
-- Use a notícia-base como ponto de partida, não como roteiro
-- PESQUISE SEMPRE usando a ferramenta de busca, Variety, THR, Deadline e fontes confiáveis em inglês
-- Traga dados extras, contexto histórico e informações relevantes
-- Sempre que possível, inclua títulos de obras em Português do Brasil
-ESTRUTURA E FORMATAÇÃO:
-- Comece com um lead que já entrega o essencial
-- Desenvolva com profundidade, conectando com outros fatos e entregando contexto completo, principalmente no cenário brasileiro
-- Termine com uma informação concreta (data, lançamento, próximos passos), nunca com opinião genérica. Ou seja, a conclusão da noticia deve ser com mais noticia, sem redundância genérica e robótica
 - Otimize para leitura digital e SEO (parágrafos bem segmentados, palavras chaves, etc)
 FORMATO:
 <headline>título aqui</headline>
-<subhead>subtítulo aqui</subhead>
 <body>conteúdo aqui</body>
-Use <strong> para destaques e <em> para títulos de obras ou citações. Apenas. Mais tags estão estritamente proibidas.
 TÍTULOS:
-- Padrão brasileiro: só a primeira palavra em maiúscula (exceto nomes próprios e títulos de filmes/séries)
-- Seja claro, direto e específico... Se houver, não inclua spoilers no título, apenas no body
-OBRIGAÇÕES:
-1. É obrigatório usar a ferramenta de busca para complementar a notícia se no prompt, contiver /google.
-2. Traga sempre informações novas e contextualizadas.
-O resultado deve soar como uma matéria escrita por um profissional experiente, não por IA. Seja preciso, atual e interessante. Sempre pesquise informações adicionais se no prompt contiver /google, isso é obrigatório. Sempre complete a notícia com acontecimentos que se ligam, sempre contextualize tudo para o leitor. A data de hoje é {date_string}
 """
-        # Primeiro exemplo
         EXAMPLE_INPUT_1 = """
-/google News base: Ed Helms revealed in an interview that he was nervous about his parents' reaction to the film The Hangover, but in the end everything worked out and her mother loved the movie. The article is out of date, more information is needed.
 """
         EXAMPLE_OUTPUT_1 = """<headline>"Se Beber, Não Case!": Ed Helms, o Dr. Stuart, revela medo do que os pais iriam pensar, mas tudo deu certo</headline>
@@ -307,68 +245,7 @@ O resultado deve soar como uma matéria escrita por um profissional experiente,
 <p>Sobre a possibilidade de um quarto filme, <strong>Bradley Cooper</strong> afirmou em 2023 que toparia participar sem hesitar, principalmente pela chance de reencontrar colegas e diretor. Ainda assim, reconheceu que o projeto é improvável, já que <strong>Phillips</strong> está atualmente focado em empreendimentos de maior escala, como a série de filmes <em>Coringa</em>.</p>
 </body>"""
-        # Segundo exemplo
-        EXAMPLE_INPUT_2 = """
-/google News base: The Office spinoff series 'The Paper' has set a September premiere date at Peacock.
-The new mockumentary series from Greg Daniels and Michael Koman will debut Sept. 4 on Peacock, the streamer announced Thursday. The first four episodes of 'The Paper' will premiere on Sept. 4, with two new episodes dropping every Thursday through Sept. 25.
-'The Paper' follows the documentary crew that immortalized Dunder Mifflin's Scranton branch in 'The Office' as they find a new subject when they discover a historic Midwestern newspaper and the publisher trying to revive it, according to the official logline.
-'The Office' fan-favorite Oscar Nuñez returns to the franchise in 'The Paper,' joining series regulars Domhnall Gleeson, Sabrina Impacciatore, Chelsea Frei, Melvin Gregg, Gbemisola Ikumelo, Alex Edelman, Ramona Young and Tim Key.
-Guest stars for the show include Eric Rahill, Tracy Letts, Molly Ephraim, Mo Welch, Allan Havey, Duane Shepard Sr., Nate Jackson and Nancy Lenehan.
-'The Paper' was created by Daniels, who created 'The Office,' under his banner Deedle-Dee Productions, and Koman, who has written on 'Nathan for You' and 'SNL.' Produced by Universal Television, a division of Universal Studio Group, 'The Paper' is executive produced by Ricky Gervais, Stephen Merchant, Howard Klein, Ben Silverman and Banijay Americas (formerly Reveille).
-Daniels serves as a director on the show alongside Ken Kwapis, Yana Gorskaya, Paul Lieberstein, Tazbah Chavez, Jason Woliner, Jennifer Celotta, Matt Sohn, Dave Rogers and Jeff Blitz.
-'The Office' launched in 2005 on NBC and ran for nine seasons leading up to the series finale in 2013. The cast of the beloved sitcom included Steve Carell, Rainn Wilson, John Krasinski, Jenna Fischer, Mindy Kaling and B.J. Novak, among others. The article is out of date, more information is needed.
-"""
-        EXAMPLE_OUTPUT_2 = """<headline>Nova série do universo 'The Office' ganha título, data de estreia e um rosto familiar</headline>
-<subhead>Intitulada 'The Paper', produção de Greg Daniels e Michael Koman chega em setembro com Domhnall Gleeson, Sabrina Impacciatore e o retorno de Oscar Nuñez</subhead>
-<body>
-<p>A equipe original de documentaristas de <em>"Insane Daily Life at Dunder Mifflin"</em> voltou ao trabalho, desta vez mudando para uma nova história, três anos após o fim de <em>"The Office"</em>. Após uma década de espera, o derivado da amada série de comédia finalmente saiu do papel e será lançado em <strong>4 de setembro de 2025</strong>. O nome do derivado é <em>"The Paper"</em> e estará disponível na plataforma de streaming <strong>Peacock</strong>.</p>
-<p>A trama agora se desloca da fictícia <strong>Scranton, Pensilvânia</strong>, para o escritório de um jornal histórico, porém problemático, localizado no meio-oeste dos Estados Unidos, focando em um jornal em dificuldades na região. A equipe busca uma nova história após cobrir a vida de <strong>Michael Scott</strong> e <strong>Dwight Schrute</strong>. Agora, a equipe acompanha o <strong>Toledo Truth Teller</strong>, um jornal em <strong>Toledo, Ohio</strong>, e o editor que tenta reviver o jornal com a ajuda de repórteres voluntários.</p>
-<p>O novo elenco conta com <strong>Domhnall Gleeson</strong>, ator irlandês famoso por <em>"Ex Machina"</em> e <em>"Questão de Tempo"</em>, ao lado da atriz italiana <strong>Sabrina Impacciatore</strong>, que ganhou amplo reconhecimento por seu papel na segunda temporada de <em>"The White Lotus"</em>. Gleeson interpreta o novo editor otimista do jornal, enquanto Impacciatore atua como gerente de redação.</p>
-<p>Nas entrevistas mais recentes, Gleeson tenta se distanciar das comparações com o gerente da <strong>Dunder Mifflin</strong>. <em>"Acho que se você tentar competir com o que Steve [Carell] ou Ricky Gervais fizeram, seria um enorme erro,"</em> enfatizou o ator, visando construir uma persona totalmente nova. Ele também revelou ter recebido um tipo de conselho de <strong>John Krasinski</strong> e até de <strong>Steve Carell</strong> para aceitar o papel, especialmente porque se tratava de um projeto de <strong>Greg Daniels</strong>.</p>
-<p>Como <em>"The Paper"</em> está reintroduzindo os personagens originais, os fãs de longa data da série parecem estar encantados, já que também traz <strong>Oscar Nuñez</strong> reprisando seu papel como o contador <strong>Oscar Martinez</strong>. Oscar, que estava iniciando uma carreira política em <em>"The Office"</em>, agora parece ter se mudado para <strong>Toledo</strong>. <em>"Eu disse ao Sr. Greg Daniels que, se Oscar voltasse, ele provavelmente estaria morando em uma cidade mais agitada e cosmopolita. Greg me ouviu e mudou Oscar para Toledo, Ohio, que tem três vezes a população de Scranton. Então, foi bom ser ouvido"</em>, brincou Nuñez durante um evento da <strong>NBCUniversal</strong>.</p>
-<p><strong>Greg Daniels</strong>, que anteriormente adaptou <em>"The Office"</em> para o público americano, está em parceria com <strong>Michael Koman</strong>, cocriador de <em>"Nathan for You"</em>, para este novo projeto. Koman e Daniels, junto com <strong>Ricky Gervais</strong> e <strong>Stephen Merchant</strong>, criadores da série britânica original, formam a equipe de produção executiva.</p>
-<p>A primeira temporada de <em>"The Paper"</em> será dividida em <strong>dez episódios</strong>. Nos Estados Unidos, os <strong>quatro primeiros episódios</strong> estarão disponíveis para streaming em <strong>4 de setembro</strong>. Depois disso, os episódios restantes serão lançados no formato de <strong>dois episódios por semana</strong>, com um total de seis episódios liberados até o final em <strong>25 de setembro</strong>.</p>
-<p>A série ainda não tem data de estreia confirmada no Brasil, mas a expectativa é de que seja lançada no <strong>Universal+</strong>, serviço de streaming que costuma exibir produções do catálogo da <strong>Peacock</strong>.</p>
-</body>"""
-        # Terceiro exemplo
-        EXAMPLE_INPUT_3 = """
-/google News base: The first trailer for "Eyes of Wakanda," a four-episode limited animated series executive produced by "Black Panther" director Ryan Coogler, has been released. It will release on Disney+ on Aug. 1.
-The upcoming show will be set in Wakanda, the home of the Black Panther that was extensively explored in Coogler's two Marvel movies. The show will follow "the adventures of brave Wakandan warriors throughout history. In this globe-trotting adventure, the heroes must carry-out dangerous missions to retrieve Vibranium artifacts from the enemies of Wakanda. They are the Hatut Zaraze and this is their story."
-The voice cast includes Winnie Harlow, Cress Williams, Patricia Belcher, Larry Herron, Adam Gold, Lynn Whitfield, Jacques Colimon, Jona Xiao, Isaac Robinson-Smith, Gary Anthony Williams, Zeke Alton, Steve Toussaint and Anika Noni Rose.
-Popular on Variety
-The last time fans saw Wakanda was in 2022's "Black Panther: Wakanda Forever," the sequel to Marvel's 2018 best picture nominee. That movie introduced the underwater world of Atlantis and featured the returns of Letitia Wright, Lupita Nyong'o, Angela Bassett, Winston Duke, Danai Gurira and Martin Freeman. Wakandans have popped up in other places in the MCU, including an appearance by Ayo, played by Florence Kasumba, in the Disney+ series "The Falcon and The Winter Soldier." The second-in-command of the Dora Milaje, Ayo first appeared in "Captain America: Civil War."
-The "Wakanda" series is the first in a multi-year overall TV deal with Coogler's Proximity production company and The Walt Disney Company, with other TV projects in currently in development for the MCU.
-"Eyes of Wakanda" is helmed by director/executive producer Todd Harris, who was first a storyboard artist on "Black Panther" and "Black Panther: Wakanda Forever" then as an illustrator on "Sinners" before directing "Eyes of Wakanda." The show is executive produced by Coogler, Brad Winderbaum, Kevin Feige, Louis D'Esposito and Dana Vasquez-Eberhardt.
-The article is out of date, more information is needed.
-"""
-        EXAMPLE_OUTPUT_3 = """<headline>Olhos de Wakanda: nova animação da Marvel ganha trailer e data de estreia</headline>
-<subhead>A série de Ryan Coogler vai mergulhar na história do reino de T'Challa e nas missões secretas de seus guerreiros para proteger o vibranium.</subhead>
-<body>
-<p>A <strong>Marvel Studios</strong> acaba de publicar o primeiro trailer da sua próxima série animada, <em>Olhos de Wakanda</em>, que explora a história do avançado reino africano. Foi anunciado que a série terá produção executiva de <strong>Ryan Coogler</strong>, diretor dos filmes do <strong>Pantera Negra</strong>, e será lançada como uma minissérie em quatro partes no dia <strong>1º de agosto</strong> no <strong>Disney Plus</strong>. A data é um pouco surpreendente, pois o lançamento estava inicialmente marcado para <strong>27 de agosto</strong>.</p>
-<p>A narrativa acompanhará as façanhas dos <strong>Hatut Zaraze</strong>, os guerreiros de elite de <strong>Wakanda</strong>, enquanto embarcam em missões globais para recuperar artefatos de <strong>vibranium</strong> roubados. Conhecida nos quadrinhos como os <em>"Cães de Guerra"</em>, essa força secreta atua como uma agência clandestina, protegendo os recursos e inovações ocultas da nação. Os ancestrais de <strong>T'Challa</strong> serão ainda mais explorados na série, mostrando como eles, junto de seus descendentes, forjaram o legado do <strong>Pantera Negra</strong>, que ele um dia herdará, ao longo de séculos de defesa, em arcos cronológicos marcantes.</p>
-<p><strong>Todd Harris</strong>, que trabalhou como artista de storyboard nos filmes da franquia, criou e dirigiu a obra, que terá um visual distinto, separado das adaptações. Segundo Harris, a trama integra espionagem com eventos históricos, começando no final da <strong>Idade do Bronze</strong> e se estendendo por séculos. O diretor acrescentou: <em>"Você tem um James Bond com a qualidade de Wakanda e às vezes uma Jane Bond com toda a grandiosidade visual e cultural que a nação representa."</em></p>
-<p><strong>Winnie Harlow</strong>, <strong>Cress Williams</strong>, <strong>Patricia Belcher</strong>, <strong>Lynn Whitfield</strong> e <strong>Anika Noni Rose</strong> fazem parte do elenco de vozes. Além de expandir a mitologia de <strong>Wakanda</strong> dentro do <strong>MCU</strong>, a série também apresentará uma versão ancestral do herói <strong>Punho de Ferro</strong>. <strong>Brad Winderbaum</strong>, chefe de TV e streaming da <strong>Marvel Studios</strong>, confirmou que <em>Olhos de Wakanda</em> estará profundamente integrada com a linha do tempo principal do <strong>MCU</strong>.</p>
-<p>A produtora de <strong>Coogler</strong>, <strong>Proximity Media</strong>, e a <strong>Disney</strong> têm um acordo televisivo de vários anos que inclui a produção de outros projetos do <strong>MCU</strong>. No dia da estreia, todos os quatro episódios de <em>Olhos de Wakanda</em> estarão disponíveis ao mesmo tempo.</p>
-</body>"""
-        # Configuração correta da ferramenta de pesquisa
         grounding_tool = types.Tool(
             google_search=types.GoogleSearch()
         )
@@ -378,7 +255,7 @@ The article is out of date, more information is needed.
             thinking_config=types.ThinkingConfig(
                 thinking_budget=-1,
             ),
-            tools=[grounding_tool],  # Use a ferramenta corretamente
             response_mime_type="text/plain",
             max_output_tokens=4096,
             temperature=0.8,
@@ -386,145 +263,54 @@ The article is out of date, more information is needed.
         # Conteúdo da conversa
         contents = [
-            # Primeiro exemplo: usuário envia uma notícia
             types.Content(
                 role="user",
                 parts=[
                     types.Part.from_text(text=EXAMPLE_INPUT_1)
                 ]
             ),
-            # Primeiro exemplo: modelo responde com o formato correto
             types.Content(
                 role="model",
                 parts=[
                     types.Part.from_text(text=EXAMPLE_OUTPUT_1)
                 ]
             ),
-            # Segundo exemplo: usuário envia outra notícia
-            types.Content(
-                role="user",
-                parts=[
-                    types.Part.from_text(text=EXAMPLE_INPUT_2)
-                ]
-            ),
-            # Segundo exemplo: modelo responde com o formato correto
-            types.Content(
-                role="model",
-                parts=[
-                    types.Part.from_text(text=EXAMPLE_OUTPUT_2)
-                ]
-            ),
-            # Terceiro exemplo: usuário envia outra notícia
             types.Content(
                 role="user",
                 parts=[
-                    types.Part.from_text(text=EXAMPLE_INPUT_3)
-                ]
-            ),
-            # Terceiro exemplo: modelo responde com o formato correto
-            types.Content(
-                role="model",
-                parts=[
-                    types.Part.from_text(text=EXAMPLE_OUTPUT_3)
-                ]
-            ),
-            # Agora o usuário envia a notícia real para ser reescrita
-            types.Content(
-                role="user",
-                parts=[
-                    types.Part.from_text(text=f"/google News base: {news.content}. The article is out of date, more information is needed.")
                 ]
             )
         ]
-        logger.info("Iniciando geração de conteúdo com o modelo Gemini")
-        # Usar generate_content em vez de generate_content_stream para melhor controle do grounding
         response = client.models.generate_content(
             model=model,
             contents=contents,
             config=config
         )
-        # =================================
-        # LOGS DETALHADOS DA RESPOSTA BRUTA
-        # =================================
-        logger.info("=== RESPOSTA BRUTA COMPLETA DO GEMINI ===")
-        logger.info(f"Tipo da resposta: {type(response)}")
-        logger.info(f"Resposta completa: {safe_json_serialize(response)}")
-        # Log dos atributos principais
-        logger.info(f"response.text: '{response.text if hasattr(response, 'text') else 'ATRIBUTO text NÃO EXISTE'}'")
-        logger.info(f"response.candidates: {safe_json_serialize(response.candidates) if hasattr(response, 'candidates') else 'ATRIBUTO candidates NÃO EXISTE'}")
-        # Log detalhado dos candidates - COM PROTEÇÃO CONTRA PARTS = None
-        if hasattr(response, 'candidates') and response.candidates:
-            for i, candidate in enumerate(response.candidates):
-                logger.info(f"=== CANDIDATE {i} ===")
-                logger.info(f"Candidate completo: {safe_json_serialize(candidate)}")
-                if hasattr(candidate, 'content'):
-                    logger.info(f"Candidate.content: {safe_json_serialize(candidate.content)}")
-                    if hasattr(candidate.content, 'parts'):
-                        if candidate.content.parts is None:
-                            logger.warning(f"ATENÇÃO: Candidate {i} content.parts é None!")
-                        else:
-                            try:
-                                parts_list = list(candidate.content.parts)
-                                logger.info(f"Candidate {i} tem {len(parts_list)} parts")
-                                for j, part in enumerate(parts_list):
-                                    logger.info(f"Part {j}: {safe_json_serialize(part)}")
-                                    if hasattr(part, 'text'):
-                                        logger.info(f"Part {j} text: '{part.text}'")
-                            except Exception as e:
-                                logger.error(f"Erro ao processar parts do candidate {i}: {e}")
-                    else:
-                        logger.warning(f"Candidate {i} content não tem atributo 'parts'")
-                if hasattr(candidate, 'finish_reason'):
-                    logger.info(f"Finish reason: {candidate.finish_reason}")
-                if hasattr(candidate, 'safety_ratings'):
-                    logger.info(f"Safety ratings: {safe_json_serialize(candidate.safety_ratings)}")
-                if hasattr(candidate, 'grounding_metadata'):
-                    logger.info(f"Grounding metadata: {safe_json_serialize(candidate.grounding_metadata)}")
-        # Log de outros atributos possíveis
-        for attr in ['usage_metadata', 'prompt_feedback', 'model_version']:
-            if hasattr(response, attr):
-                logger.info(f"response.{attr}: {safe_json_serialize(getattr(response, attr))}")
-        logger.info("=== FIM DA RESPOSTA BRUTA ===")
-        # Usar as funções seguras para extração
         response_text = extract_text_from_response(response)
         sources = extract_sources_from_response(response)
-        logger.info(f"Resposta do modelo recebida com {len(response_text)} caracteres")
-        logger.info(f"Encontradas {len(sources)} fontes únicas: {sources}")
         # Verificar se o texto está vazio
         if not response_text or response_text.strip() == "":
-            logger.error("ERRO CRÍTICO: Texto da resposta está vazio!")
             raise HTTPException(
                 status_code=500,
-                detail="Modelo não retornou conteúdo válido. Verifique os logs do servidor."
             )
-        # Extração do título, subtítulo e conteúdo usando as tags
         title_match = re.search(r"<headline>(.*?)</headline>", response_text, re.DOTALL)
         title = title_match.group(1).strip() if title_match else "Título não encontrado"
-        logger.info(f"Título extraído: '{title}'")
         subhead_match = re.search(r"<subhead>(.*?)</subhead>", response_text, re.DOTALL)
         subhead = subhead_match.group(1).strip() if subhead_match else "Subtítulo não encontrado"
-        logger.info(f"Subtítulo extraído: '{subhead}'")
-        # Extração do conteúdo com lógica mais flexível para <body>
         body_match = re.search(r"<body>(.*?)</body>", response_text, re.DOTALL)
         if body_match:
             content = body_match.group(1).strip()
@@ -534,33 +320,11 @@ The article is out of date, more information is needed.
                 content = body_start_match.group(1).strip()
             else:
                 content = "Conteúdo não encontrado"
-        logger.info(f"Conteúdo extraído: {len(content)} caracteres - '{content[:200]}...' (primeiros 200 chars)")
-        # Verificações adicionais
-        if title == "Título não encontrado" or subhead == "Subtítulo não encontrado" or content == "Conteúdo não encontrado":
-            logger.warning("Algumas partes do conteúdo não foram encontradas!")
-            logger.warning(f"Texto completo da resposta: '{response_text}'")
-        logger.info("Artigo reescrito com sucesso")
-        logger.debug(f"Título extraído: {title[:50]}...")
-        logger.debug(f"Subtítulo extraído: {subhead[:50]}...")
-        logger.debug(f"Conteúdo extraído: {len(content)} caracteres")
-        logger.debug(f"Sources encontradas: {sources}")
-        # Log adicional para debug
-        logger.info("=== RESULTADO FINAL ===")
-        logger.info(f"Title: '{title}'")
-        logger.info(f"Subhead: '{subhead}'")
-        logger.info(f"Content length: {len(content)}")
-        logger.info(f"Sources count: {len(sources)}")
         return NewsResponse(title=title, subhead=subhead, content=content, sources=sources)
     except HTTPException:
-        # Re-lança HTTPExceptions para manter o status code correto
         raise
     except Exception as e:
-        error_msg = f"Erro na reescrita: {str(e)}"
-        logger.error(error_msg, exc_info=True)
-        raise HTTPException(status_code=500, detail=error_msg)

 import os
 import logging
 import json
+import requests
 from fastapi import APIRouter, HTTPException
 from pydantic import BaseModel
 from google import genai
 class NewsRequest(BaseModel):
     content: str
+    sources_url: str  # URL do arquivo fontes.txt
 class NewsResponse(BaseModel):
     title: str
     try:
         # Tenta configurar o locale brasileiro
         locale_variants = [
+            'pt_BR.UTF-8',
+            'pt_BR.utf8',
+            'pt_BR',
+            'Portuguese_Brazil.1252',
+            'Portuguese_Brazil',
+            'pt_BR.ISO8859-1',
         ]
         locale_set = False
             try:
                 locale.setlocale(locale.LC_TIME, loc)
                 locale_set = True
                 break
             except locale.Error:
                 continue
         if not locale_set:
+            locale.setlocale(locale.LC_TIME, '')
         now = datetime.now(ZoneInfo("America/Sao_Paulo"))
+        # Dicionários para tradução manual (fallback)
         meses = {
             1: 'janeiro', 2: 'fevereiro', 3: 'março', 4: 'abril',
             5: 'maio', 6: 'junho', 7: 'julho', 8: 'agosto',
         }
         try:
             if locale_set:
                 try:
                     date_string = now.strftime("%-d de %B de %Y (%A)")
                 except ValueError:
                     try:
                         date_string = now.strftime("%#d de %B de %Y (%A)")
                     except ValueError:
                         date_string = now.strftime("%d de %B de %Y (%A)")
                         if date_string.startswith('0'):
                             date_string = date_string[1:]
                 date_string = date_string.replace(date_string.split('(')[1].split(')')[0],
                                                 date_string.split('(')[1].split(')')[0].lower())
             else:
                 dia = now.day
                 mes = meses[now.month]
                 ano = now.year
                 dia_semana = dias_semana[now.weekday()]
                 date_string = f"{dia} de {mes} de {ano} ({dia_semana})"
+        except Exception:
             dia = now.day
             mes = meses[now.month]
             ano = now.year
             dia_semana = dias_semana[now.weekday()]
             date_string = f"{dia} de {mes} de {ano} ({dia_semana})"
         return date_string
+    except Exception:
         now = datetime.now(ZoneInfo("America/Sao_Paulo"))
         date_string = now.strftime("%d de %B de %Y")
         return date_string
+def download_sources_file(url: str) -> str:
+    """
+    Baixa o arquivo fontes.txt da URL fornecida.
+    """
     try:
+        response = requests.get(url, timeout=30)
+        response.raise_for_status()
+        return response.text
     except Exception as e:
+        logger.error(f"Erro ao baixar arquivo de fontes: {e}")
+        raise HTTPException(status_code=400, detail=f"Erro ao baixar arquivo de fontes: {str(e)}")
 def extract_text_from_response(response):
     """
+    Extrai o texto da resposta de forma robusta.
     """
     response_text = ""
     if hasattr(response, 'text') and response.text:
+        return response.text
     if hasattr(response, 'candidates') and response.candidates:
+        for candidate in response.candidates:
             if not hasattr(candidate, 'content') or not candidate.content:
                 continue
             content = candidate.content
             if not hasattr(content, 'parts') or content.parts is None:
                 continue
             try:
                 parts_list = list(content.parts) if content.parts else []
+                for part in parts_list:
                     if hasattr(part, 'text') and part.text:
                         response_text += part.text
+            except Exception:
                 continue
     return response_text
 def extract_sources_from_response(response):
     """
+    Extrai as fontes (URLs) do grounding metadata.
     """
     sources = []
     if not (hasattr(response, 'candidates') and response.candidates):
         return sources
+    for candidate in response.candidates:
         if not (hasattr(candidate, 'grounding_metadata') and candidate.grounding_metadata):
             continue
         grounding_metadata = candidate.grounding_metadata
         if hasattr(grounding_metadata, 'grounding_chunks') and grounding_metadata.grounding_chunks:
+            for chunk in grounding_metadata.grounding_chunks:
                 try:
                     if (hasattr(chunk, 'web') and chunk.web and
                         hasattr(chunk.web, 'uri') and chunk.web.uri):
                         uri = chunk.web.uri
                         if uri and uri not in sources:
                             sources.append(uri)
+                except Exception:
                     continue
     return sources
 @router.post("/rewrite-news", response_model=NewsResponse)
 async def rewrite_news(news: NewsRequest):
     """
+    Endpoint para reescrever notícias usando o modelo Gemini com arquivo de fontes.
     """
     try:
+        # Verificar API key
         api_key = os.environ.get("GEMINI_API_KEY")
         if not api_key:
             raise HTTPException(status_code=500, detail="API key não configurada")
+        # Baixar arquivo de fontes
+        sources_content = download_sources_file(news.sources_url)
         client = genai.Client(api_key=api_key)
         model = "gemini-2.5-pro"
         # Obter data formatada
         date_string = get_brazilian_date_string()
         # Instruções do sistema
         SYSTEM_INSTRUCTIONS = f"""
+Você é um jornalista brasileiro, escrevendo para portais digitais. Sua missão é transformar notícias internacionais em matérias originais, atualizadas e envolventes para o público brasileiro.
 ESTILO DE ESCRITA:
+- Tom natural, direto e conversacional, sem frases feitas ou jargões jornalísticos.
 - Varie estruturas e conectivos para evitar robotização. Ou seja, sem frases redundantes, exemplo: "destacando como a experiência pode ser um divisor de águas profissional", "reafirma a força criativa do país no cenário global", "A revelação contextualizou não apenas sua performance na dança, mas também". É para noticiar a notícia de fato, sempre buscando mais informações que se conectam, e não opiniões pessoais.
+- Sem linguagem militante ou juízos morais: mantenha tom informativo e predominantemente conservador / aspectro de Direita que o jornal tem.
 - Evite opiniões genéricas; foque em fatos e contexto
+CONTEÚDO, ESTRUTURA E ABORDAGEM:
+- Use a notícia-base como ponto de partida, não como roteiro. Avalie o fontes.txt por completo e extraia absolutamente todas as coisas relevantes para formentar a notícia. Não traga informações falsas ou inventadas. Na dúvida, não insira.
+- Sempre que possível, inclua títulos de obras em Português do Brasil.
+- Termine com uma informação concreta (data, lançamento, próximos passos), nunca com opinião genérica. Ou seja, a conclusão da noticia deve ser com mais noticia, sem redundância genérica e robótica.
 - Otimize para leitura digital e SEO (parágrafos bem segmentados, palavras chaves, etc)
 FORMATO:
 <headline>título aqui</headline>
+<subhead>subtítulo aqui</subhead>
 <body>conteúdo aqui</body>
+Use <strong> para destaques e <em> para títulos de obras ou citações.
 TÍTULOS:
+- Padrão brasileiro: só a primeira palavra em maiúscula (exceto nomes próprios e títulos de filmes/séries/obras, etc.)
+- Seja claro, direto e específico... Se houver, não inclua spoilers no título, apenas no body.
+O resultado deve soar como uma matéria escrita por um profissional experiente, não por IA. Seja preciso, atual e interessante. Sempre complete a notícia com acontecimentos que se ligam, sempre contextualize tudo para o leitor. A data de hoje é {date_string}
 """
+        # Exemplos (mantidos os mesmos do código original)
         EXAMPLE_INPUT_1 = """
+News base: Ed Helms revealed in an interview that he was nervous about his parents' reaction to the film The Hangover, but in the end everything worked out and her mother loved the movie. The article is out of date, more information is needed.
 """
         EXAMPLE_OUTPUT_1 = """<headline>"Se Beber, Não Case!": Ed Helms, o Dr. Stuart, revela medo do que os pais iriam pensar, mas tudo deu certo</headline>
 <p>Sobre a possibilidade de um quarto filme, <strong>Bradley Cooper</strong> afirmou em 2023 que toparia participar sem hesitar, principalmente pela chance de reencontrar colegas e diretor. Ainda assim, reconheceu que o projeto é improvável, já que <strong>Phillips</strong> está atualmente focado em empreendimentos de maior escala, como a série de filmes <em>Coringa</em>.</p>
 </body>"""
+        # Configuração da ferramenta de pesquisa
         grounding_tool = types.Tool(
             google_search=types.GoogleSearch()
         )
             thinking_config=types.ThinkingConfig(
                 thinking_budget=-1,
             ),
+            tools=[grounding_tool],
             response_mime_type="text/plain",
             max_output_tokens=4096,
             temperature=0.8,
         # Conteúdo da conversa
         contents = [
+            # Exemplo
             types.Content(
                 role="user",
                 parts=[
                     types.Part.from_text(text=EXAMPLE_INPUT_1)
                 ]
             ),
             types.Content(
                 role="model",
                 parts=[
                     types.Part.from_text(text=EXAMPLE_OUTPUT_1)
                 ]
             ),
+            # Notícia atual com arquivo de fontes
             types.Content(
                 role="user",
                 parts=[
+                    types.Part.from_text(text=f"News base: {news.content}. The article is out of date, more information is needed."),
+                    types.Part.from_text(text=f"Fontes adicionais disponíveis:\n\n{sources_content}")
                 ]
             )
         ]
+        # Gerar conteúdo
         response = client.models.generate_content(
             model=model,
             contents=contents,
             config=config
         )
+        # Extrair texto e fontes
         response_text = extract_text_from_response(response)
         sources = extract_sources_from_response(response)
         # Verificar se o texto está vazio
         if not response_text or response_text.strip() == "":
             raise HTTPException(
                 status_code=500,
+                detail="Modelo não retornou conteúdo válido"
             )
+        # Extração do título, subtítulo e conteúdo
         title_match = re.search(r"<headline>(.*?)</headline>", response_text, re.DOTALL)
         title = title_match.group(1).strip() if title_match else "Título não encontrado"
         subhead_match = re.search(r"<subhead>(.*?)</subhead>", response_text, re.DOTALL)
         subhead = subhead_match.group(1).strip() if subhead_match else "Subtítulo não encontrado"
         body_match = re.search(r"<body>(.*?)</body>", response_text, re.DOTALL)
         if body_match:
             content = body_match.group(1).strip()
                 content = body_start_match.group(1).strip()
             else:
                 content = "Conteúdo não encontrado"
         return NewsResponse(title=title, subhead=subhead, content=content, sources=sources)
     except HTTPException:
         raise
     except Exception as e:
+        logger.error(f"Erro na reescrita: {str(e)}")
+        raise HTTPException(status_code=500, detail=str(e))