17 juni 2026

Zero-Trust AI: Hoe u uw modellen toegang geeft zonder uw infrastructuur bloot te stellen

De meeste interne engineeringteams geven hun AI-modellen veel te veel toegang tot productiedatabases en interne API's. We zien consequent ongereguleerde enterprise-implementaties waarbij een enkele prompt injection authenticatie kan omzeilen en gevoelige financiële gegevens kan lezen.

Dit gebeurt omdat standaard AI-frameworks prioriteit geven aan developer velocity boven security. Wanneer een engineeringteam een Large Language Model (LLM) koppelt aan een database, leveren ze doorgaans een serviceaccount op admin-niveau. Deze fundamentele architectuurfout brengt uw hele perimeter in gevaar.

Als u actief bent in fintech, bankieren of gereguleerde markten, garandeert deze aanpak dat u zult falen tijdens uw volgende SOC 2-audit. U moet het AI-model behandelen als een onbetrouwbare, vijandige gebruiker.

Hier is hoe wij Zero-Trust AI architecturen ontwerpen voor enterprise-klanten die zich geen blootstelling van infrastructuur kunnen veroorloven.

De Faalmodus: Overgeprivilegieerde Modellen

De wortel van het probleem is hoe ontwikkelaars AI-tools conceptualiseren. Ze beschouwen de LLM als een interne applicatiecomponent, vergelijkbaar met een background worker of een microservice.

Omdat ze de applicatiecode vertrouwen, breiden ze dat vertrouwen uit naar de LLM. Ze configureren de omgeving van het model met ruwe API-sleutels, directe databaseverbindingen en onbeperkt netwerk egress. Dit betekent dat het model werkt met de maximale privileges van het systeem.

Dit is een kritieke kwetsbaarheid. Een LLM is geen voorspelbare code; het is een executie-engine aangedreven door natuurlijke taal. Als een gebruiker een kwaadaardige prompt invoert, zal het model deze getrouw uitvoeren met behulp van de permissies die het bezit.

Als het model schrijftoegang heeft tot uw primaire PostgreSQL-database, kan een prompt injection tabellen verwijderen (drop tables). Als het model toegang heeft tot een interne HR-API, kan een gecompromitteerde prompt salarisgegevens exfiltreren. We zien regelmatig proof-of-concepts waarbij ontwikkelaars LangChain-agents bedraden met root-inloggegevens alleen maar om een demo werkend te krijgen.

Deze opstellingen overleven nooit een enterprise security review. Uw infrastructuur moet strikt beperken wat het model kan doen, ongeacht wat de gebruiker het vraagt te doen.

Zero-Trust AI Definiëren voor Productiesystemen

Zero-Trust AI vereist de toepassing van standaard netwerkbeveiligingsprincipes op de uitvoeringsomgeving van het model. De kernaanname is simpel: het model zal uiteindelijk gecompromitteerd raken.

Wanneer u deze houding aanneemt, verandert de architectuur volledig. U geeft geen credentials meer door aan de LLM-omgeving. U staat niet toe dat het model ruwe SQL-query's uitvoert. U blokkeert alle uitgaande internettoegang vanuit de container waarop het model draait.

In plaats daarvan moet het model zijn autorisatie voor elke afzonderlijke actie bewijzen. Het moet precies de machtigingen overnemen van de menselijke gebruiker die ermee interacteert, en absoluut niets meer.

Als een accountmanager een interne AI-assistent om klantgegevens vraagt, moet het systeem de JWT (JSON Web Token) van de accountmanager verifiëren voordat de gegevens worden opgehaald. Het model zelf bezit geen intrinsieke datatoegangsrechten. Als de mens de permissie mist, laat het model het verzoek falen.

Architectuur voor Gereguleerde Fintech

We hebben onlangs een AI-architectuur herbouwd voor een financiële instelling in de VAE. Hun interne team had zes maanden lang geworsteld om een klantgerichte assistent in te zetten. Ze werden geblokkeerd door hun eigen compliance-afdeling omdat hun voorgestelde ontwerp in strijd was met de basale data residency en toegangscontroles.

U kunt de volledige technische uitsplitsing lezen van hoe we dit hebben opgelost in onze penetration testing case study. De kernoplossing berustte op het fysiek en logisch scheiden van het model van de executielaag.

We implementeerden een open-source model binnen een strikt air-gapped Virtual Private Cloud (VPC) subnet. Het model had geen uitgaande internettoegang en geen directe databaseverbindingen. Het kon geen verzoeken initiëren; het kon alleen reageren op een gecentraliseerde orchestratie gateway.

Wanneer een gebruiker met het systeem interageerde, handelde de orchestratie gateway de authenticatie af. Vervolgens gaf het de opgeschoonde prompt door aan de LLM. De LLM verwerkte de tekst en retourneerde een gestructureerde intentie. De orchestrator, die zich buiten de air-gapped omgeving bevond, voerde de intentie uit op de database met behulp van Role-Based Access Control (RBAC).

De LLM zag de databaseschema's nooit. Het had nooit een API-sleutel in bezit. Het was volledig geïsoleerd van de core banking infrastructuur.

Als uw team worstelt om security audits voor interne LLM-implementaties te halen, is dit waar een scoping call met ons doorgaans 3-4 maanden aan verspilde engineeringtijd bespaart.

Executie vs. Orchestratie: Het Mentale Model

Om veilige AI te bouwen, moet uw engineeringteam het Intent-Execution patroon aannemen. Dit mentale model scheidt het besluitvormingsproces van de daadwerkelijke infrastructuurexecutie.

In een gebrekkige opstelling beslist het model wat te doen en voert het dit onmiddellijk uit. Het besluit bijvoorbeeld om het saldo van een gebruiker op te vragen en voert een API-call uit met behulp van een hardgecodeerde token.

In het Intent-Execution patroon genereert het model alleen intenties (intents). Het voert een gestructureerd JSON-object uit dat beschrijft wat het wil doen, zoals {"action": "query_balance", "account_id": "98765"}.

Het model geeft deze intentie terug aan de orchestratielaag. De orchestrator onderschept het verzoek en voert het uit via een Identity and Access Management (IAM) policy engine. Deze controleert of de huidige geauthenticeerde gebruiker de rechten heeft om account 98765 te lezen.

Als de policy engine goedkeurt, doet de orchestrator de API-call, haalt de data op en geeft de ruwe tekst terug aan het model voor opmaak. Het model maakt het antwoord alleen op; het raakt de gegevensbron nooit aan.

Dit raamwerk stelt security teams in staat om regels op de API gateway te auditen en af te dwingen, precies waar ze gewend zijn dat te doen. U hoeft geen nieuwe beveiligingsparadigma's voor AI uit te vinden. U hoeft alleen het model te beperken tot het genereren van intenties.

Datapipelines Beveiligen in AI Platforms

Enterprise-systemen vereisen multi-tenant data isolatie. Wanneer u AI platforms bouwt voor B2B SaaS of intern gebruik over meerdere afdelingen, is datalekkage het primaire risico.

RAG (Retrieval-Augmented Generation) pipelines zijn berucht om het blootleggen van data tussen verschillende tenants (cross-tenant). Als u al uw bedrijfsdocumenten dumpt in een enkele vector database zonder strikte toegangscontroles, zal het model onvermijdelijk beperkte documenten ophalen om generieke vragen te beantwoorden.

Wij dwingen datagrenzen af op de ingestielaag. Wanneer een document is geëmbed en opgeslagen in de vector database, koppelen we strikte metadata tags die overeenkomen met tenant-ID's, gebruikersrollen en veiligheidsmachtigingsniveaus.

Tijdens de ophaalfase wordt de query zwaar gefilterd. Voordat de similarity search überhaupt begint, forceert het systeem een metadata filter op basis van de sessietoken van de huidige gebruiker. De vector database negeert simpelweg records die de gebruiker niet mag zien.

Dit garandeert dat de context window die in de LLM wordt geïnjecteerd, alleen data bevat waartoe de gebruiker al toegang heeft. Zelfs als de gebruiker het model specifiek opdraagt om beveiligingsbeperkingen te negeren, kan het ophaalsysteem wiskundig gezien de verboden data niet retourneren.

Deze aanpak voldoet aan de strenge VAE-wetgeving inzake data residency en voldoet aan de vertrouwelijkheidsvereisten van islamitische financiën, waar datascheiding strikt wordt gehandhaafd.

Voorbij de Proof-of-Concepts

Ondernemingen in de Golf bewegen snel en hebben het budget om geavanceerde systemen in te zetten, maar interne teams lopen vaak tegen een muur op bij de overgang van een lokale demo naar productie. Ze ontdekken dat de architecturen die in tutorials worden onderwezen, fundamenteel onverenigbaar zijn met de veiligheidsnormen voor ondernemingen.

U kunt veiligheid niet vastplakken op een overgeprivilegieerd model. U moet het systeem vanaf de eerste commit ontwerpen met zero-trust principes.

Als u AI-partners in de VAE of Pakistan evalueert, boek dan een scoping call van 30 minuten met Seven Labs: https://calendly.com/seven-labs-intro

De Faalmodus: Overgeprivilegieerde Modellen

Zero-Trust AI Definiëren voor Productiesystemen

Architectuur voor Gereguleerde Fintech

Executie vs. Orchestratie: Het Mentale Model

Datapipelines Beveiligen in AI Platforms

Voorbij de Proof-of-Concepts

Lees volgende

Engineering Reliable AI Agents Across Multiple Devices: A Systems Approach

AI Infrastructure Engineering Beyond Chatbots