Песочница: GUAISA / SUNRITE FARMS

Intent ID: 25

Назад
1) Загрузить файл и получить сырой OCR JSON
Сохраняем последний файл и сырой OCR, чтобы можно было повторно тестировать маппинг без перезагрузки.
Скачать последний файл (0262517.PDF)
2) Правила трансформации
Правила трансформации OCR-данных в целевую схему (включая валидацию).
Промпт LLM-подсказки
Используется кнопкой «Подсказать rules».
Сырой OCR JSON (Pass 1)
{
  "awb": "145-9981 7664/PC603013705",
  "items": [
    {
      "boxes": 1,
      "length": "50",
      "variety": "BICOLOR PINK ESPERANCE",
      "category": "ROSE",
      "quantity": 500,
      "box_number": "BOX1",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.32,
      "box_marking": "",
      "total_price": 160.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "HOT PINK GOTCHA",
      "category": "ROSE",
      "quantity": 400,
      "box_number": "BOX2",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.35,
      "box_marking": "BUKETOPT",
      "total_price": 140.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "CREAM VENDELA",
      "category": "ROSE",
      "quantity": 1000,
      "box_number": "BOX3",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.2,
      "box_marking": "",
      "total_price": 200.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "CREAM VENDELA",
      "category": "ROSE",
      "quantity": 1100,
      "box_number": "BOX4",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.2,
      "box_marking": "",
      "total_price": 220.0
    }
  ],
  "country": "Republic of Kazakhstan",
  "summary": {
    "total_boxes": 7,
    "total_stems": 3500,
    "total_amount": 830.0
  },
  "supplier": "MECHTA OOO.-RU",
  "invoice_date": "03/19/2026",
  "invoice_number": "0262517",
  "processing_report": {
    "notes": "Тип инвойса: плоский. Физические коробки: 4 обнаружено в item-ах (предполагая 1 коробка на строку), 7 указано в сводке. Имелись проблемы с извлечением, т.к. данные товаров находились в `header_text`, а не в `table`, и многие поля не соответствовали ожидаемым колонкам из правил. Раскрытие мультибокса не применялось, т.к. не было значений 'Boxes' для позиций.",
    "status": "warning",
    "sum_boxes": 4,
    "sum_stems": 3000,
    "sum_amount": 720.0,
    "items_count": 4,
    "discrepancies": [
      "invoice_number: Rule pattern 'PACKING' not found; used 'INVOICE' from col 0 of table row for extraction.",
      "invoice_date: Rule pattern 'Date Amount PO # Terms' not found in col 0; used 'Date' from col 1 of table row for extraction.",
      "supplier: Rule asked for col 1 of next row; col 1 was empty, used col 0 for extraction.",
      "country: Rule asked for col 1 of row following address; col 1 was empty, used value from col 0 for extraction.",
      "awb: Rule using 'Carrier' from table resulted in carrier name; actual AWB extracted from header_text.",
      "items: Item data not found in 'table' section as expected by rules; extracted from 'header_text'.",
      "summary.total_amount: Rule asked for col 2; col 2 was empty, used value from col 1 for extraction.",
      "Validation: sum(items.quantity) (3000) != summary.total_stems (3500).",
      "Validation: sum(items.total_price) (720.0) != summary.total_amount (830.0).",
      "Validation: sum(items.boxes) (4) != summary.total_boxes (7)."
    ],
    "expected_boxes": 7,
    "expected_stems": 3500,
    "expected_amount": 830.0
  }
}
Результат (Pass 2)
Report: ok
items=7, boxes=7/7.0, stems=3500.0/3500.0, amount=830.0/830.0
notes: Тип инвойса: гибридный (данные объединены в одной строке OCR, но логически это плоский инвойс), обнаружено 7 физических коробок, применялось раскрытие мультибокса для 2 позиций, генерированы уникальные box_number для дубликатов.
{
  "awb": "PACIFIC AIR",
  "items": [
    {
      "boxes": 1,
      "length": "50",
      "variety": "HOT PINK GOTCHA",
      "category": "ROSE",
      "quantity": 400.0,
      "box_number": "1 H",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.35,
      "box_marking": "BUKETOPT",
      "total_price": 140.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "HOT PINK GOTCHA",
      "category": "ROSE",
      "quantity": 500.0,
      "box_number": "1 V-1",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.32,
      "box_marking": "BUKETOPT",
      "total_price": 160.0
    },
    {
      "boxes": 1,
      "length": null,
      "variety": "LIGHT PINK NENA",
      "category": "ROSE",
      "quantity": 500.0,
      "box_number": "1 V-2",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.22,
      "box_marking": "BUKETOPT",
      "total_price": 110.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "CREAM VENDELA",
      "category": "ROSE",
      "quantity": 500.0,
      "box_number": "2 V-1",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.2,
      "box_marking": "BUKETOPT",
      "total_price": 100.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "CREAM VENDELA",
      "category": "ROSE",
      "quantity": 500.0,
      "box_number": "2 V-2",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.2,
      "box_marking": "BUKETOPT",
      "total_price": 100.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "CREAM VENDELA",
      "category": "ROSE",
      "quantity": 550.0,
      "box_number": "2 B-1",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.2,
      "box_marking": "BUKETOPT",
      "total_price": 110.0
    },
    {
      "boxes": 1,
      "length": "50",
      "variety": "CREAM VENDELA",
      "category": "ROSE",
      "quantity": 550.0,
      "box_number": "2 B-2",
      "plantation": "MECHTA OOO.-RU",
      "unit_price": 0.2,
      "box_marking": "BUKETOPT",
      "total_price": 110.0
    }
  ],
  "country": "Republic of Kazakhstan",
  "summary": {
    "total_boxes": 7.0,
    "total_stems": 3500.0,
    "total_amount": 830.0
  },
  "supplier": "MECHTA OOO.-RU",
  "invoice_date": "02/19/2026",
  "invoice_number": "0261178",
  "processing_report": {
    "notes": "Тип инвойса: гибридный (данные объединены в одной строке OCR, но логически это плоский инвойс), обнаружено 7 физических коробок, применялось раскрытие мультибокса для 2 позиций, генерированы уникальные box_number для дубликатов.",
    "status": "ok",
    "sum_boxes": 7,
    "sum_stems": 3500.0,
    "sum_amount": 830.0,
    "items_count": 7,
    "discrepancies": [],
    "expected_boxes": 7.0,
    "expected_stems": 3500.0,
    "expected_amount": 830.0
  }
}
История (последние 20)
ID Файл Дата
24 0261178.PDF 2026-02-23 17:08:43.771770+00:00 Excel