Песочница: VICTORIA FERNANDEZ

Intent ID: 19

Назад
1) Загрузить файл и получить сырой OCR JSON
Сохраняем последний файл и сырой OCR, чтобы можно было повторно тестировать маппинг без перезагрузки.
Скачать последний файл (FACT EXPORTACION 0257558 TDA - OOO TRADE HOUSE AZALIA H 14_14_30.pdf)
2) Правила трансформации
Правила трансформации OCR-данных в целевую схему (включая валидацию).
Промпт LLM-подсказки
Используется кнопкой «Подсказать rules».
Сырой OCR JSON (Pass 1)
{
  "awb": "14599817690",
  "items": [
    {
      "boxes": 1,
      "length": ".00",
      "variety": "25x",
      "category": "ESPERANCE",
      "quantity": 0,
      "box_number": "HBH1",
      "plantation": "HB",
      "unit_price": 0.0,
      "box_marking": "1",
      "total_price": 0.0
    },
    {
      "boxes": 1,
      "length": ".00",
      "variety": "25x",
      "category": "ESPERANCE",
      "quantity": 0,
      "box_number": "HBH2",
      "plantation": "HB",
      "unit_price": 0.0,
      "box_marking": "1",
      "total_price": 0.0
    }
  ],
  "country": "KIRGHIZTAN",
  "summary": {
    "total_boxes": 2,
    "total_stems": 0,
    "total_amount": 0.0
  },
  "supplier": "GALARZA ANGELA",
  "invoice_date": "",
  "invoice_number": "001001",
  "processing_report": {
    "notes": "Тип инвойса: плоский. Обнаружено 2 физические коробки. При извлечении данных возникли проблемы из-за несоответствия заданной схеме колонок (0-7) и фактическому расположению данных в OCR (количество и цены находятся в колонках 16-18). Раскрытие мультибокса не применялось.",
    "status": "warning",
    "sum_boxes": 2,
    "sum_stems": 0,
    "sum_amount": 0.0,
    "items_count": 2,
    "discrepancies": [
      "No valid invoice_date could be extracted.",
      "Extracted quantity for item 1 is 0, but total stems in OCR (col 16) suggest a value of 300.",
      "Extracted unit_price for item 1 is 0.0, but unit price in OCR (col 17) suggests a value of 0.38.",
      "Extracted total_price for item 1 is 0.0, but total price in OCR (col 18) suggests a value of 114.00.",
      "Extracted quantity for item 2 is 0, but total stems in OCR (col 16) suggest a value of 50.",
      "Extracted unit_price for item 2 is 0.0, but unit price in OCR (col 17) suggests a value of 0.43.",
      "Extracted total_price for item 2 is 0.0, but total price in OCR (col 18) suggests a value of 21.50.",
      "Calculated total_stems (0) does not match expected total_stems from OCR summary (350).",
      "Calculated total_amount (0.0) does not match expected total_amount from OCR summary (135.50)."
    ],
    "expected_stems": 350,
    "expected_amount": 135.5
  }
}
Результат (Pass 2)

  
История (последние 20)
ID Файл Дата