Dokumentooborot
Интенты
Обработка
Справочники
Intent: MICHEL VAN KOERT
v1
2026-03-05 09:59:44.251676+00:00
by: auto_pipeline
Песочница
Назад
Поставщик
name
country
--
Эквадор
Колумбия
Кения
Голландия
Израиль
Италия
Китай
Таиланд
ЮАР
aliases (one per line)
email_patterns (one per line)
michel.vankoert@airflo.nl Michel van Koert <michel.vankoert@airflo.nl>
Сохранить поставщика
Rules для трансформации (OCR → 1С)
Правила трансформации OCR-данных в целевую схему (включая валидацию).
Transform rules (JSON массив строк)
[ "Тип инвойса: Б (плоский) - каждая строка таблицы содержит отдельную позицию, нет строк-заголовков MIXED BOX и строк-деталей.", "Колонки таблицы: table.columns пуст, но строки содержат метаданные о грузе (CONSIGNOR, CONSIGNEE, BROKER, WEIGHT, FLIGHT & DATE, ORIGIN, DESTINATION), а не товарные позиции. Товарные позиции находятся в header_text.", "invoice_number: извлечь из header_text по паттерну 'INVOICE' + пробелы + последовательность цифр. Преобразовать в строку.", "invoice_date: извлечь из header_text по паттерну 'INVOICE DATE:' + дата в формате DD-MMM-YY. Преобразовать в строку.", "supplier: извлечь из header_text название поставщика после 'VAT #:' и до следующей строки или 'ATTENTION:'. В данном случае 'RTA AIR & SEA'.", "country: определить страну поставщика из адреса в header_text. Если адрес содержит 'NETHERLANDS' или 'NL' - страна 'Netherlands'.", "awb: извлечь из header_text по паттерну 'MAWB' или 'HAWB' + пробелы + буквенно-цифровая последовательность. Если несколько, взять первую.", "items: массив объектов, извлекаемых из header_text. Каждая товарная позиция описывается строкой, содержащей 'DESCRIPTION', 'VAT IN EUR', 'CHARGES IN EUR'.", "items[].box_number: сгенерировать на основе invoice_number и порядкового номера позиции, например, 'INV-522507-1'.", "items[].box_marking: не применимо для данного типа инвойса (нет данных о типе/размере коробки). Оставить пустым.", "items[].boxes: всегда 1, так как каждая позиция считается отдельной единицей.", "items[].plantation: не применимо для данного типа инвойса (нет данных о ферме). Оставить пустым.", "items[].category: извлечь из описания товара в header_text. Если содержит 'Surcharge' - категория 'Surcharge'.", "items[].variety: извлечь из описания товара в header_text. Если содержит название сорта (например, 'Peak Season') - использовать его.", "items[].length: не применимо для данного типа инвойса (нет данных о длине). Оставить пустым.", "items[].quantity: извлечь из описания товара в header_text по паттерну 'KG @' + число. Преобразовать в число.", "items[].unit_price: извлечь из описания товара в header_text по паттерну '@ USD' + число. Преобразовать в число, удалив '$'.", "items[].total_price: извлечь из header_text по паттерну 'CHARGES IN EUR' + число в строке товара. Преобразовать в число, удалив 'EUR' и запятые.", "summary.total_boxes: равно количеству элементов в items[], так как каждая позиция = 1 коробка.", "summary.total_stems: не применимо для данного типа инвойса (нет данных о стеблях). Оставить null.", "summary.total_amount: извлечь из header_text по паттерну 'TOTAL EUR' + число. Преобразовать в число, удалив 'EUR' и запятые.", "processing_report.status: 'ok', если удалось извлечь invoice_number, invoice_date, supplier, awb, и items не пуст. Иначе 'error'.", "processing_report.items_count: количество элементов в items[].", "processing_report.sum_stems: сумма items[].quantity.", "processing_report.sum_amount: сумма items[].total_price.", "processing_report.sum_boxes: количество уникальных items[].box_number.", "processing_report.expected_stems: summary.total_stems (если есть, иначе null).", "processing_report.expected_amount: summary.total_amount.", "processing_report.expected_boxes: summary.total_boxes.", "processing_report.discrepancies: массив строк, описывающих расхождения между sum_amount и expected_amount, sum_boxes и expected_boxes.", "processing_report.notes: строка, описывающая тип инвойса (плоский), количество позиций, и любые проблемы при извлечении данных." ]
Доступные справочники для shortcode
varities
{{ref:varities}}
Скопировать
test
{{ref:test}}
Скопировать
Сохранить rules
Документы поставщика
Загрузить файлы
Обработать все pending
Скачать выбранные XLSX
Сохранить порядок
↕
Файл
Источник
Статус
Дата
Действия
⠿
INVOICE 522507 DSVAIRMOW (28-Feb-26).PDF
email
done
●
Pass 2 report: ok
05.03 09:57
Файл
XLSX
JSON
Удалить
Результат OCR
×