Abstracte visualisatie van gestructureerde datapatronen die door een beveiligd AI-systeem stromen

Blog

Behind the scenes: hoe we AI trainen op echte klantorders zonder data

Om onze order-AI te verbeteren hebben we echte klantorders nodig. Maar die data opslaan kan niet. Dit is de aanpak die we gekozen hebben en waarom die werkt.

Hyperfox AI orderverwerking zonder gevoelige klantdata te bewaren

Elke order die binnenkomt bevat gevoelige informatie. Klantgegevens, prijsafspraken, leveringsadressen. Die context hebben we nodig om AI beter te maken. Tegelijk wil je die data niet opslaan. Niet alleen om GDPR-redenen, maar ook omdat klantvertrouwen cruciaal is.

Drie manieren om AI te bouwen voor orderverwerking

Wanneer je AI ontwikkelt voor orderautomatisatie heb je trainingsdata nodig. De echte vraag is dus niet of je data nodig hebt, maar waar die data vandaan komt en wat je ermee doet.

In de praktijk zien we drie benaderingen. De meeste oplossingen kiezen voor één van de eerste twee. Wij hebben bewust voor de derde gekozen.

Aanpak 1: OCR gecombineerd met machine learning

De eerste aanpak start met OCR. Een document wordt gescand, tekst wordt uitgelezen en een model leert patronen herkennen.

Op papier klinkt dat logisch. In de praktijk loopt het snel vast.

OCR heeft moeite met handschrift, afwijkende layouts en scans van slechte kwaliteit. De machine learning laag daarachter heeft bovendien enorme hoeveelheden gelabelde data nodig voordat het betrouwbaar wordt.

Voor B2B-distributeurs die met honderden verschillende orderformaten werken, van PDF tot Excel tot foto's van documenten, wordt dat snel een onderhoudsprobleem. Elke nieuwe afwijking vraagt opnieuw training.

‍

Aanpak 2: een eigen LLM trainen of fine-tunen

Een tweede strategie is het trainen of fine-tunen van een large language model op eigen orderdata.

Het idee is dat het model na verloop van tijd de context van het bedrijf leert begrijpen.

Maar daar hangt een prijskaartje aan. Je moet grote hoeveelheden ruwe orderdata opslaan, veel rekenkracht voorzien en maanden itereren voordat het model stabiel werkt.

Bovendien zit je daarna vast aan die specifieke modelarchitectuur. Wanneer een provider een nieuwe versie lanceert kan het zijn dat het hele fine-tuning proces opnieuw moet beginnen.

Wat wij doen: context modelling

Wij kozen voor een derde aanpak. Intern noemen we dat context modelling.

In plaats van ruwe orders te gebruiken als trainingsdata structureren we de context rond een order.

Voor elke klant definiëren we wat een geldige bestelling is. Dat betekent onder andere productcatalogi, prijsafspraken, leveringsregels, verpakkingsconventies en typische uitzonderingen die hun team behandelt.

Die gestructureerde context is waar de AI mee werkt. Niet het originele document.

Wanneer een order binnenkomt, via PDF, Excel, e-mail of zelfs een voice note, verloopt de verwerking als volgt.

De AI leest het document en haalt de relevante velden eruit.
Het systeem controleert die gegevens aan de hand van de regels van de klant.
Uitzonderingen worden door een medewerker nagekeken.
De feedback uit die controle verfijnt het systeem voor de volgende orders.

Wat we niet bewaren zijn de ruwe orders, klantidentificerende gegevens, prijsdetails of leveringslocaties.

Wat we wel bewaren zijn de structuren, validatieregels en uitzonderingen die helpen om de nauwkeurigheid te verbeteren.

Met andere woorden: we leren uit patronen, niet uit opgeslagen documenten.

‍

No items found.

Waarom dit in de praktijk verschil maakt

Deze aanpak levert een aantal voordelen op die elkaar versterken.

Snelle onboarding

Omdat we geen nieuw model per klant trainen duurt een implementatie dagen in plaats van maanden.

Het systeem leert uit structuur, niet uit volume. We configureren de contextlaag van de klant met regels, productmapping en uitzonderingen. Daarna kan de AI meteen orders verwerken.

Onafhankelijk van één model

Context modelling zorgt ervoor dat we niet vastzitten aan één modelprovider.

Als er morgen een beter model beschikbaar is kunnen we dat gebruiken zonder alles opnieuw op te bouwen. De echte intelligentie zit in de contextlaag.

Privacy als ontwerpkeuze

We moeten geen gevoelige orderdata bewaren om beter te worden.

Bij sommige klanten stijgt de nauwkeurigheid na verloop van tijd boven de 95 procent. Niet ondanks privacybeperkingen, maar net doordat die beperking ons dwingt om het systeem slimmer te bouwen.

‍

Deze manier van denken zit ook achter onze Codex-functie.

Codex is een gestructureerde kennislaag waarin klantspecifieke interpretatieregels worden vastgelegd. De logica die normaal alleen in het hoofd van een medewerker zit wordt zo expliciet en machine-leesbaar.

Daardoor kan bijvoorbeeld "4x mayonaise" voor de ene klant automatisch pallets betekenen en voor een andere klant emmers.

Het echte verschil

In de wereld van orderautomatisatie claimen veel oplossingen dat ze AI-gedreven zijn.

In de praktijk betekent dat vaak OCR met een betere interface, of een model dat eerst maanden data nodig heeft voordat het echt waarde levert.

Wij vinden dat de belangrijkste vraag niet is hoe slim de AI is.

De echte vraag is hoe goed het systeem jouw business begrijpt.

Dat begrip ontstaat niet door klantorders op te slaan. Het ontstaat door regels, context en uitzonderingen correct te structureren en door een validatielaag die afwijkingen detecteert voordat ze je ERP bereiken.

Dat is wat context modelling mogelijk maakt. En dat is waarom wij voor deze aanpak gekozen hebben.

Wil je zien hoe dit werkt voor jouw ordertypes? Boek gerust een demo met ons team. We tonen het graag aan de hand van een live voorbeeld.