Elke order die binnenkomt bevat gevoelige informatie. Klantgegevens, prijsafspraken, leveringsadressen. Die context hebben we nodig om AI beter te maken. Tegelijk wil je die data niet opslaan. Niet alleen om GDPR-redenen, maar ook omdat klantvertrouwen cruciaal is.
Drie manieren om AI te bouwen voor orderverwerking
Wanneer je AI ontwikkelt voor orderautomatisatie heb je trainingsdata nodig. De echte vraag is dus niet of je data nodig hebt, maar waar die data vandaan komt en wat je ermee doet.
In de praktijk zien we drie benaderingen. De meeste oplossingen kiezen voor één van de eerste twee. Wij hebben bewust voor de derde gekozen.
Aanpak 1: OCR gecombineerd met machine learning
De eerste aanpak start met OCR. Een document wordt gescand, tekst wordt uitgelezen en een model leert patronen herkennen.
Op papier klinkt dat logisch. In de praktijk loopt het snel vast.
OCR heeft moeite met handschrift, afwijkende layouts en scans van slechte kwaliteit. De machine learning laag daarachter heeft bovendien enorme hoeveelheden gelabelde data nodig voordat het betrouwbaar wordt.
Voor B2B-distributeurs die met honderden verschillende orderformaten werken, van PDF tot Excel tot foto's van documenten, wordt dat snel een onderhoudsprobleem. Elke nieuwe afwijking vraagt opnieuw training.
Aanpak 2: een eigen LLM trainen of fine-tunen
Een tweede strategie is het trainen of fine-tunen van een large language model op eigen orderdata.
Het idee is dat het model na verloop van tijd de context van het bedrijf leert begrijpen.
Maar daar hangt een prijskaartje aan. Je moet grote hoeveelheden ruwe orderdata opslaan, veel rekenkracht voorzien en maanden itereren voordat het model stabiel werkt.
Bovendien zit je daarna vast aan die specifieke modelarchitectuur. Wanneer een provider een nieuwe versie lanceert kan het zijn dat het hele fine-tuning proces opnieuw moet beginnen.





