metadata

title: SkladBot Free AI
emoji: 🤖
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 5.34.2
app_file: app.py
pinned: false
license: mit

🤖 SkladBot Free AI Microservice

БЕСПЛАТНЫЙ AI микросервис для обработки складских документов

🎯 Возможности

📸 OCR (Optical Character Recognition)

TrOCR для печатного текста - извлечение текста с высокой точностью
TrOCR для рукописного текста - обработка рукописных накладных
Table Transformer - специализированная обработка таблиц
LayoutLM - понимание структуры документов

🧠 Искусственный интеллект

Автоматическое определение типа документа (накладная, таблица, форма)
Извлечение складских данных (артикулы, количества, цены)
Парсинг команд через русскую NER модель
Умные предложения для исправления ошибок

📊 Поддерживаемые форматы

Накладные и счета-фактуры
Складские таблицы и остатки
Рукописные документы
Смешанные форматы (печатный + рукописный)

💰 Стоимость

100% БЕСПЛАТНО

0 рублей за использование
20,000 запросов в месяц без оплаты
Неограниченное время работы
Без скрытых платежей

🚀 Использование

1. Загрузка документа

import requests
import base64

# Загрузка изображения
with open("накладная.jpg", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

# Отправка на обработку
response = requests.post("https://your-space.hf.space/api/extract", json={
    "image": image_b64,
    "document_type": "auto"
})

result = response.json()

2. Результат обработки

{
  "success": true,
  "document_type": "invoice",
  "extracted_items": [
    {
      "article": "F186ST9",
      "quantity": 5,
      "price": 1500.0,
      "name": "ЛДСП Чикаго",
      "confidence": 0.85
    }
  ],
  "suggestions": [
    {
      "type": "missing_article",
      "message": "Не найден артикул для товара 'Дуб'",
      "action": "manual_input",
      "priority": "high"
    }
  ],
  "confidence": 0.88,
  "cost": 0.0
}

🔧 API Endpoints

POST /api/extract

Основной endpoint для обработки документов

Параметры:

image (string) - Base64 изображение или PIL Image
document_type (string) - Тип документа: "auto", "invoice", "table", "form", "handwritten"

Ответ:

success (bool) - Успешность обработки
extracted_items (array) - Найденные товары
suggestions (array) - Предложения по улучшению
confidence (float) - Уровень уверенности (0-1)
cost (float) - Стоимость обработки (всегда 0.0)

GET /api/stats

Статистика работы сервиса

Ответ:

total_requests (int) - Всего запросов
success_rate (float) - Процент успешных обработок
uptime_hours (float) - Время работы в часах
quota_used (string) - Использованная квота "X/20000"

🧠 AI Модели

Использованные модели (все БЕСПЛАТНЫЕ):

microsoft/trocr-base-printed - OCR печатного текста
microsoft/trocr-base-handwritten - OCR рукописного текста
impira/layoutlm-document-qa - Понимание структуры документов
microsoft/table-transformer-structure-recognition - Обработка таблиц
cointegrated/rubert-tiny-ner - Русская NER для товаров

📋 Примеры использования

Обработка накладной

result = process_warehouse_document(
    image="накладная.jpg",
    document_type="invoice"
)

# Результат: извлеченные товары, количества, цены
for item in result["extracted_items"]:
    print(f"{item['article']}: {item['quantity']} шт по {item['price']} руб")

Обработка таблицы остатков

result = process_warehouse_document(
    image="остатки.png",
    document_type="table"
)

# Результат: товары с остатками
for item in result["extracted_items"]:
    print(f"На складе {item['article']}: {item['quantity']} шт")

🔗 Интеграция

Для SkladBot

# Добавить в AI orchestrator
huggingface_service = HuggingFaceSpacesService()
result = await huggingface_service.extract_data(image_data, "auto")

Для других проектов

import requests

def extract_warehouse_data(image_path, doc_type="auto"):
    with open(image_path, "rb") as f:
        image_b64 = base64.b64encode(f.read()).decode()

    response = requests.post("https://your-space.hf.space/api/extract", json={
        "image": image_b64,
        "document_type": doc_type
    })

    return response.json()

📊 Производительность

Скорость обработки: 5-15 секунд на документ
Точность OCR: 85-95% для печатного текста
Точность извлечения: 80-90% для складских данных
Поддержка языков: Русский, Английский
Максимальное разрешение: 4096x4096 пикселей

🛠️ Техническая информация

Системные требования

CPU: 2 ядра (предоставляется HF Spaces)
RAM: 16GB (предоставляется HF Spaces)
GPU: Не требуется (все модели работают на CPU)
Хранилище: 10GB для моделей

Время запуска

Холодный старт: 30-60 секунд (загрузка моделей)
Теплый старт: 1-3 секунды
Автоматическое засыпание: через 1 час неактивности

📞 Поддержка

Сообщить об ошибке

Если нашли ошибку в обработке документов, создайте Issue с примером изображения

Предложить улучшение

Идеи по новым функциям и улучшению точности приветствуются

Коммерческое использование

Сервис полностью бесплатен для любого использования в рамках лимитов HF Spaces

🎯 Цель: Обеспечить российские предприятия бесплатным и качественным AI для цифровизации складского учета

💡 Философия: Мощные AI возможности должны быть доступны всем без платных барьеров