Spaces:

diginoron
/

Tradingdata

Running

File size: 5,758 Bytes

83a2a70
3ba690a
 
 
6867162
 
e5eed83
6867162
b4abe98
8633440
 
 
e5eed83
c62298d
0490f39
 
83a2a70
ddd0771
 
 
81a41a0
6867162
b4abe98
6867162
8633440
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b4abe98
6867162
e5574dd
 
3ba690a
 
 
 
 
937f1aa
3ba690a
 
b4abe98
3ba690a
99af9f6
e5eed83
 
99af9f6
 
e5eed83
b4abe98
3ba690a
6867162
8633440
b4abe98
3caec61
83a2a70
6867162
3caec61
83a2a70
8633440
83a2a70
8633440
 
 
83a2a70
e5eed83
 
6867162
e5eed83
430be1f
8633440
 
 
 
430be1f
6867162
8633440
 
 
6867162
8633440
 
 
e5eed83
430be1f
6867162
430be1f
 
 
 
 
 
 
 
e5eed83
6867162
b4abe98
430be1f
6867162
e5eed83
 
 
 
 
 
 
8c27317
6867162
8c27317
 
 
 
 
891e827
8c27317
b4abe98
e5eed83
8c27317
 
 
e5eed83
 
8c27317
 
b4abe98
 
8c27317
 
 
 
b4abe98
 
8c27317
 
 
 
6867162

import os
import gradio as gr
import pandas as pd
import comtradeapicall
import spaces
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
from deep_translator import GoogleTranslator
import torch

# تنظیم متغیر محیطی برای دیباگ CUDA
os.environ["CUDA_LAUNCH_BLOCKING"] = "1"

# کلید COMTRADE
subscription_key = os.getenv("COMTRADE_API_KEY", "")
# توکن Hugging Face
hf_token = os.getenv("HF_API_TOKEN")

# تعریف مترجم
translator = GoogleTranslator(source='en', target='fa')

# تنظیم کوانت‌سازی برای کاهش مصرف حافظه
quantization_config = BitsAndBytesConfig(load_in_4bit=True)

# بارگذاری توکنایزر و مدل
try:
    tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=hf_token)
    model = AutoModelForCausalLM.from_pretrained(
        "google/gemma-2b-it",
        token=hf_token,
        quantization_config=quantization_config,
        device_map="auto",
        torch_dtype=torch.float16
    )
except Exception as e:
    print(f"خطا در بارگذاری مدل: {str(e)}")
    raise e

# تنظیم صریح pad_token_id
if tokenizer.pad_token_id is None:
    tokenizer.pad_token_id = tokenizer.eos_token_id

# تابع دریافت اطلاعات واردکنندگان
def get_importers(hs_code: str, year: str, month: str):
    period = f"{year}{int(month):02d}"
    df = comtradeapicall.previewFinalData(
        typeCode='C', freqCode='M', clCode='HS', period=period,
        reporterCode=None, cmdCode=hs_code, flowCode='M',
        partnerCode=None, partner2Code=None,
        customsCode=None, motCode=None,
        maxRecords=500, includeDesc=True
    )
    if df is None or df.empty:
        return pd.DataFrame(columns=["کد کشور", "نام کشور", "ارزش CIF"])
    df = df[df['cifvalue'] > 0]
    result = (
        df.groupby(["reporterCode", "reporterDesc"], as_index=False)
          .agg({"cifvalue": "sum"})
          .sort_values("cifvalue", ascending=False)
    )
    result.columns = ["کد کشور", "نام کشور", "ارزش CIF"]
    return result

# تابع ارائه مشاوره با استفاده از GPU
@spaces.GPU(duration=120)
def provide_advice(table_data: pd.DataFrame, hs_code: str, year: str, month: str):
    if table_data is None or table_data.empty:
        return "ابتدا باید اطلاعات واردات را نمایش دهید."
    
    table_str = table_data.to_string(index=False)
    period = f"{year}/{int(month):02d}"
    # پرامپت بهینه‌شده
    prompt = (
        f"Table of countries importing HS code {hs_code} in {period}:\n{table_str}\n\n"
        f"Analyze market opportunities and cultural/economic factors in one paragraph. "
        f"Provide strategic recommendations for exporters in another paragraph."
    )
    print("پرامپت ساخته‌شده:")
    print(prompt)

    try:
        # آماده‌سازی ورودی برای مدل
        inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=512)
        input_ids = inputs.input_ids.to("cuda")
        attention_mask = inputs.attention_mask.to("cuda")
        
        # تولید خروجی
        outputs = model.generate(
            input_ids=input_ids,
            attention_mask=attention_mask,
            max_new_tokens=512,
            do_sample=True,
            temperature=0.7,
            top_p=0.9,
            pad_token_id=tokenizer.eos_token_id
        )
        # دیکد کردن خروجی و حذف پرامپت
        generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
        # حذف پرامپت از خروجی
        if generated_text.startswith(prompt):
            generated_text = generated_text[len(prompt):].strip()
        
        # بررسی اینکه خروجی خالی نباشد
        if not generated_text:
            return "مدل نتوانست پاسخ مناسبی تولید کند. لطفاً دوباره امتحان کنید."
        
        print("خروجی مدل دریافت شد (به انگلیسی):")
        print(generated_text)

        # ترجمه خروجی به فارسی
        translated_outputs = translator.translate(generated_text)
        print("خروجی ترجمه‌شده به فارسی:")
        print(translated_outputs)
        return translated_outputs
    except Exception as e:
        error_msg = f"خطا در تولید مشاوره: {str(e)}"
        print(error_msg)
        return error_msg

# تنظیمات رابط Gradio
current_year = pd.Timestamp.now().year
years = [str(y) for y in range(2000, current_year+1)]
months = [str(m) for m in range(1, 13)]

with gr.Blocks() as demo:
    gr.Markdown("##تولید شده توسط DIGINORON نمایش کشورهایی که یک کالا را وارد کرده‌اند")
    with gr.Row():
        inp_hs = gr.Textbox(label="HS Code")
        inp_year = gr.Dropdown(choices=years, label="سال", value=str(current_year))
        inp_month = gr.Dropdown(choices=months, label="ماه", value=str(pd.Timestamp.now().month))
    btn_show = gr.Button("نمایش اطلاعات")
    out_table = gr.Dataframe(
        headers=["کد کشور", "نام کشور", "ارزش CIF"],
        datatype=["number", "text", "number"],
        interactive=True,
    )
    btn_show.click(get_importers, [inp_hs, inp_year, inp_month], out_table)

    btn_advice = gr.Button("ارائه مشاوره تخصصی")
    out_advice = gr.Textbox(label="مشاوره تخصصی", lines=6)

    btn_advice.click(
        provide_advice,
        inputs=[out_table, inp_hs, inp_year, inp_month],
        outputs=out_advice
    )

if __name__ == "__main__":
    demo.launch()