skladbot-free-ai / README.md
Lyti4's picture
Update README.md
ff73c82 verified
---
title: SkladBot Free AI
emoji: 🤖
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 5.34.2
app_file: app.py
pinned: false
license: mit
---
# 🤖 SkladBot Free AI Microservice
**БЕСПЛАТНЫЙ** AI микросервис для обработки складских документов
## 🎯 Возможности
### 📸 OCR (Optical Character Recognition)
- **TrOCR для печатного текста** - извлечение текста с высокой точностью
- **TrOCR для рукописного текста** - обработка рукописных накладных
- **Table Transformer** - специализированная обработка таблиц
- **LayoutLM** - понимание структуры документов
### 🧠 Искусственный интеллект
- **Автоматическое определение типа документа** (накладная, таблица, форма)
- **Извлечение складских данных** (артикулы, количества, цены)
- **Парсинг команд** через русскую NER модель
- **Умные предложения** для исправления ошибок
### 📊 Поддерживаемые форматы
- Накладные и счета-фактуры
- Складские таблицы и остатки
- Рукописные документы
- Смешанные форматы (печатный + рукописный)
## 💰 Стоимость
### 100% БЕСПЛАТНО
- **0 рублей за использование**
- **20,000 запросов в месяц** без оплаты
- **Неограниченное время работы**
- **Без скрытых платежей**
## 🚀 Использование
### 1. Загрузка документа
```python
import requests
import base64
# Загрузка изображения
with open("накладная.jpg", "rb") as f:
image_b64 = base64.b64encode(f.read()).decode()
# Отправка на обработку
response = requests.post("https://your-space.hf.space/api/extract", json={
"image": image_b64,
"document_type": "auto"
})
result = response.json()
```
### 2. Результат обработки
```json
{
"success": true,
"document_type": "invoice",
"extracted_items": [
{
"article": "F186ST9",
"quantity": 5,
"price": 1500.0,
"name": "ЛДСП Чикаго",
"confidence": 0.85
}
],
"suggestions": [
{
"type": "missing_article",
"message": "Не найден артикул для товара 'Дуб'",
"action": "manual_input",
"priority": "high"
}
],
"confidence": 0.88,
"cost": 0.0
}
```
## 🔧 API Endpoints
### POST /api/extract
Основной endpoint для обработки документов
**Параметры:**
- `image` (string) - Base64 изображение или PIL Image
- `document_type` (string) - Тип документа: "auto", "invoice", "table", "form", "handwritten"
**Ответ:**
- `success` (bool) - Успешность обработки
- `extracted_items` (array) - Найденные товары
- `suggestions` (array) - Предложения по улучшению
- `confidence` (float) - Уровень уверенности (0-1)
- `cost` (float) - Стоимость обработки (всегда 0.0)
### GET /api/stats
Статистика работы сервиса
**Ответ:**
- `total_requests` (int) - Всего запросов
- `success_rate` (float) - Процент успешных обработок
- `uptime_hours` (float) - Время работы в часах
- `quota_used` (string) - Использованная квота "X/20000"
## 🧠 AI Модели
### Использованные модели (все БЕСПЛАТНЫЕ):
1. **microsoft/trocr-base-printed** - OCR печатного текста
2. **microsoft/trocr-base-handwritten** - OCR рукописного текста
3. **impira/layoutlm-document-qa** - Понимание структуры документов
4. **microsoft/table-transformer-structure-recognition** - Обработка таблиц
5. **cointegrated/rubert-tiny-ner** - Русская NER для товаров
## 📋 Примеры использования
### Обработка накладной
```python
result = process_warehouse_document(
image="накладная.jpg",
document_type="invoice"
)
# Результат: извлеченные товары, количества, цены
for item in result["extracted_items"]:
print(f"{item['article']}: {item['quantity']} шт по {item['price']} руб")
```
### Обработка таблицы остатков
```python
result = process_warehouse_document(
image="остатки.png",
document_type="table"
)
# Результат: товары с остатками
for item in result["extracted_items"]:
print(f"На складе {item['article']}: {item['quantity']} шт")
```
## 🔗 Интеграция
### Для SkladBot
```python
# Добавить в AI orchestrator
huggingface_service = HuggingFaceSpacesService()
result = await huggingface_service.extract_data(image_data, "auto")
```
### Для других проектов
```python
import requests
def extract_warehouse_data(image_path, doc_type="auto"):
with open(image_path, "rb") as f:
image_b64 = base64.b64encode(f.read()).decode()
response = requests.post("https://your-space.hf.space/api/extract", json={
"image": image_b64,
"document_type": doc_type
})
return response.json()
```
## 📊 Производительность
- **Скорость обработки**: 5-15 секунд на документ
- **Точность OCR**: 85-95% для печатного текста
- **Точность извлечения**: 80-90% для складских данных
- **Поддержка языков**: Русский, Английский
- **Максимальное разрешение**: 4096x4096 пикселей
## 🛠️ Техническая информация
### Системные требования
- **CPU**: 2 ядра (предоставляется HF Spaces)
- **RAM**: 16GB (предоставляется HF Spaces)
- **GPU**: Не требуется (все модели работают на CPU)
- **Хранилище**: 10GB для моделей
### Время запуска
- **Холодный старт**: 30-60 секунд (загрузка моделей)
- **Теплый старт**: 1-3 секунды
- **Автоматическое засыпание**: через 1 час неактивности
## 📞 Поддержка
### Сообщить об ошибке
Если нашли ошибку в обработке документов, создайте Issue с примером изображения
### Предложить улучшение
Идеи по новым функциям и улучшению точности приветствуются
### Коммерческое использование
Сервис полностью бесплатен для любого использования в рамках лимитов HF Spaces
---
**🎯 Цель**: Обеспечить российские предприятия бесплатным и качественным AI для цифровизации складского учета
**💡 Философия**: Мощные AI возможности должны быть доступны всем без платных барьеров