Spaces:

optimization-hashira
/

Multi-Agent-Financial-Assitant

Paused

File size: 9,407 Bytes

3f43e82

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel, validator, Field
from typing import List, Dict, Any, Union
import google.generativeai as genai
import os
from dotenv import load_dotenv
import logging
import time

load_dotenv()
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

app = FastAPI(title="Language Agent (Gemini Pro - Generalized)")

GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")
GEMINI_MODEL_NAME = os.getenv("GEMINI_MODEL_NAME", "gemini-1.5-flash-latest")

if not GOOGLE_API_KEY:
    logger.warning("GOOGLE_API_KEY not found.")
else:
    try:
        genai.configure(api_key=GOOGLE_API_KEY)
        logger.info(f"Google Generative AI configured for model {GEMINI_MODEL_NAME}.")
    except Exception as e:
        logger.error(f"Failed to configure Google Generative AI: {e}")


class EarningsSummaryLLM(BaseModel):
    ticker: str
    surprise_pct: float


class AnalysisDataLLM(BaseModel):
    target_label: str = "the portfolio"
    current_allocation: float = 0.0
    yesterday_allocation: float = 0.0
    allocation_change_percentage_points: float = 0.0

    earnings_surprises: List[EarningsSummaryLLM] = Field(
        default_factory=list, alias="earnings_surprises_for_target"
    )


class BriefRequest(BaseModel):
    user_query: str
    analysis: AnalysisDataLLM
    retrieved_docs: List[str] = Field(default_factory=list)


def construct_gemini_prompt(
    user_query: str, analysis_data: AnalysisDataLLM, docs_context: str
) -> str:

    alloc_change_str = ""
    if analysis_data.allocation_change_percentage_points > 0.01:
        alloc_change_str = f"up by {analysis_data.allocation_change_percentage_points:.1f} percentage points from yesterday (approx. {analysis_data.yesterday_allocation*100:.0f}%)."
    elif analysis_data.allocation_change_percentage_points < -0.01:
        alloc_change_str = f"down by {abs(analysis_data.allocation_change_percentage_points):.1f} percentage points from yesterday (approx. {analysis_data.yesterday_allocation*100:.0f}%)."
    else:
        alloc_change_str = f"remaining stable around {analysis_data.yesterday_allocation*100:.0f}% yesterday."

    analysis_summary_str = f"For {analysis_data.target_label}, the current allocation is {analysis_data.current_allocation*100:.0f}% of AUM, {alloc_change_str}\n"

    if analysis_data.earnings_surprises:
        earnings_parts = []
        for e in analysis_data.earnings_surprises:
            direction = (
                "beat estimates by" if e.surprise_pct >= 0 else "missed estimates by"
            )
            earnings_parts.append(f"{e.ticker} {direction} {abs(e.surprise_pct):.1f}%")
        if earnings_parts:
            analysis_summary_str += (
                "Key earnings updates: " + ", ".join(earnings_parts) + "."
            )
        else:
            analysis_summary_str += (
                "No specific earnings surprises to highlight for this segment."
            )
    else:
        analysis_summary_str += (
            "No notable earnings surprises reported for this segment."
        )

    prompt = (
        f"You are a professional financial assistant. Based on the user's query and the provided data, "
        f"deliver a concise, spoken-style morning market brief for a portfolio manager. "
        f"The brief should start with 'Good morning.'\n\n"
        f"User Query: {user_query}\n\n"
        f"Key Portfolio and Market Analysis:\n{analysis_summary_str}\n\n"
        f"Relevant Filings Context (if any):\n{docs_context}\n\n"
        f"If the user's query mentions a specific region or sector not covered by the 'Key Portfolio and Market Analysis', "
        f"you can state that specific data for that exact query aspect was not available in the analysis provided. "
        f"Mention any specific company earnings surprises from the analysis clearly (e.g., 'TSMC beat estimates by X%, Samsung missed by Y%')."
        f"If there's information about broad regional sentiment or rising yields in the 'docs_context', incorporate it naturally. Otherwise, focus on the provided analysis."
    )
    return prompt


generation_config = genai.types.GenerationConfig(
    temperature=0.6, max_output_tokens=1024
)
safety_settings = [
    {"category": c, "threshold": "BLOCK_MEDIUM_AND_ABOVE"}
    for c in [
        "HARM_CATEGORY_HARASSMENT",
        "HARM_CATEGORY_HATE_SPEECH",
        "HARM_CATEGORY_SEXUALLY_EXPLICIT",
        "HARM_CATEGORY_DANGEROUS_CONTENT",
    ]
]


@app.post("/generate_brief")
async def generate_brief(request: BriefRequest):
    if not GOOGLE_API_KEY:
        raise HTTPException(status_code=500, detail="Google API Key not configured.")
    logger.info(
        f"Generating brief for query: '{request.user_query}' using Gemini model {GEMINI_MODEL_NAME}"
    )

    docs_context = (
        "\n".join(request.retrieved_docs[:2])
        if request.retrieved_docs
        else "No relevant context from documents found."
    )

    full_prompt = construct_gemini_prompt(
        user_query=request.user_query,
        analysis_data=request.analysis,
        docs_context=docs_context,
    )
    logger.debug(f"Full prompt for Gemini:\n{full_prompt}")

    try:
        model = genai.GenerativeModel(
            model_name=GEMINI_MODEL_NAME,
            generation_config=generation_config,
            safety_settings=safety_settings,
        )
        max_retries = 1
        retry_delay_seconds = 10
        for attempt in range(max_retries + 1):
            try:
                response = await model.generate_content_async(full_prompt)

                if not response.parts:
                    if (
                        response.prompt_feedback
                        and response.prompt_feedback.block_reason
                    ):
                        block_reason_message = (
                            response.prompt_feedback.block_reason_message
                            or "Unknown safety block"
                        )
                        logger.error(
                            f"Gemini content generation blocked. Reason: {block_reason_message}"
                        )
                        raise HTTPException(
                            status_code=400,
                            detail=f"Content generation blocked: {block_reason_message}",
                        )
                    else:
                        logger.error("Gemini response has no parts (empty content).")

                        if attempt == max_retries:
                            raise HTTPException(
                                status_code=500,
                                detail="Gemini returned empty content after retries.",
                            )
                        else:
                            logger.warning(
                                f"Gemini returned empty content, attempt {attempt+1}/{max_retries+1}. Retrying..."
                            )
                            await asyncio.sleep(retry_delay_seconds)
                            continue

                brief_text = response.text
                logger.info("Gemini content generated successfully.")
                return {"brief": brief_text}

            except (
                genai.types.generation_types.BlockedPromptException,
                genai.types.generation_types.StopCandidateException,
            ) as sce_bpe:
                logger.error(
                    f"Gemini generation issue on attempt {attempt+1}: {sce_bpe}"
                )
                raise HTTPException(
                    status_code=400, detail=f"Gemini generation issue: {sce_bpe}"
                )
            except Exception as e:
                logger.error(
                    f"Error during Gemini generation on attempt {attempt+1}: {type(e).__name__} - {e}"
                )
                if (
                    "rate limit" in str(e).lower()
                    or "quota" in str(e).lower()
                    or "429" in str(e)
                    or "resource_exhausted" in str(e).lower()
                ):
                    if attempt < max_retries:
                        wait_time = retry_delay_seconds * (2**attempt)
                        logger.info(f"Rate limit likely. Retrying in {wait_time}s...")
                        await asyncio.sleep(wait_time)
                        continue
                    else:
                        logger.error("Max retries reached for rate limit.")
                        raise HTTPException(
                            status_code=429,
                            detail=f"Gemini API rate limit/quota exceeded: {e}",
                        )
                elif attempt < max_retries:
                    await asyncio.sleep(retry_delay_seconds)
                    continue
                else:
                    raise HTTPException(
                        status_code=500,
                        detail=f"Failed to generate brief with Gemini: {e}",
                    )

        raise HTTPException(
            status_code=500, detail="Brief generation failed after all attempts."
        )
    except HTTPException:
        raise
    except Exception as e:
        logger.error(f"Critical error in /generate_brief: {e}", exc_info=True)
        raise HTTPException(
            status_code=500, detail=f"Critical failure in brief generation: {e}"
        )