I mars lanserade vi en anpassad klassificerare i GA för att automatiskt klassificera dokumenttyper. I juli lanserade vi en anpassad splitter i GA för att automatiskt dela upp och klassificera flera dokument i en enda fil. Och nu tar vi med kraftfulla, nya generativa AI-tekniker för att göra dessa anpassade arbetsflöden för dokumentbehandling ännu mer produktiva.
Generativ AI kan hjälpa till att extrahera data från dokument med mycket friformstext, till exempel kontrakt, med komplexa layouter som fakturor, W2S och konossement, eller med praktiskt taget ingen träningsdata tillgänglig. En anpassad extraktor med generativ AI ger unikt värde: snabbare tid på marknaden: publicera dokumentet och de fält du vill extrahera till API - slutpunkten för att få strukturerad data i gengäld-utan att ta hänsyn till modellen som inte krävs för att komma igång.
En tidig kund kunde inom en timme uppnå det som tidigare tog dagar av ansträngning att träna en anpassad modell. Ett enkelt sätt att anpassa generativa artificiella intelligensresultat för dina dokument. Ingen generativ AI-expertis krävs, bara bekräftar innehållet i dokumentet, som Workbench automatiskt använder för att förbättra din noggrannhet med några bilder.
Eftersom grundmodellen nu är tillgänglig i en anpassad extraktor kan du ringa slutpunkten ur rutan med alla dokument och fält du vill extrahera för att få strukturerad data i gengäld. Eller så kan du snabbt ställa in och förhandsgranska resultaten för dina dokument. Identifiera först de fält du vill extrahera och ladda upp ett exempeldokument för att förhandsgranska resultaten.
Här är exempel på vad en generativ modell kan extrahera från flera olika dokument utan någon utbildning: för att förbättra noggrannheten, bekräfta eller regel prognoser och markera dokument som markerade. Om du importerar och bekräftar prognoser för ~5-dokument använder Workbench automatiskt exempel för att förbättra modellens noggrannhet för din exklusiva användning.
Om du gillar prestanda, gå till byggsidan och skapa en ny version för att åberopa grundmodellen med hjälp av specifika fält och exempeldokument taggade i datasetet för att aktivera flera bilder. Använd den i en automatisk stämpel för att ta kvaliteten till nästa nivå, förbereda en större dataset. Använd grundmodellen för att automatiskt märka dokument när du importerar dem.
Granska sedan och bekräfta förutsägelserna i din dataset. Testuppsättningen kan användas för att köra en utvärdering av en modell med generativ kraft. Du kommer snart att kunna använda din träningsuppsättning för att utföra effektiv parameterinställning för en generativ modell. Slutligen utvärdera modellerna sida vid sida och distribuera den mest effektiva versionen i produktionen - ring bara slutpunkten med dokumenten för att få strukturerad data.
Om du vill veta mer kan du kolla in demovideon, versionsfakta, Användarhandbok, märkning av bästa praxis och träningsalternativ. Sammanfattaren, som nu finns i den allmänna förhandsgranskningen, kan användas direkt utan utbildning och ge sammanfattningar för dokument upp till sidor. Med AI-dokument kan du: digitalisera dokument med OCR för att få text, layout och olika tillägg som bildkvalitetsdetektering för läsbarhet och Deskewing helt automatiskt.
Extrahera text-och layoutdata från dokumentfiler och normalisera objekt. Identifiera par av viktiga KVP-värden i strukturerade former och i enkla tabeller. Till exempel: namn: Jill Smith - KVP. Klassificera dokumenttyper för att leda till nedströmsprocesser som hämtning och lagring. Separera och klassificera dokumenten efter typ. Till exempel en PDF-fil med flera riktiga dokument.
Förbered dataset som ska användas vid finjustering och modelluppskattningar med hjälp av automatisk märkning, schemahantering och inställningshanteringsfunktioner som dokumentgranskning och prognoser. Integrera det med produkter som molnlagring, BigQuery och Vertex AI-sökning för att hjälpa dig att lagra, söka, organisera, hantera och analysera dokument och metadata.
Detta diagram illustrerar alla viktiga dokumentbehandlingssteg som stöds av AI Document AI och hur de kan ansluta till varandra. AI-Processor-dokumentprocessorn är placerad mellan dokumentfilen och maskininlärningsmodellen, som utför dokumentbehandling och förståelse av åtgärder.
De kan användas för att klassificera, separera, analysera eller analysera ett dokument. Varje Google Cloud-projekt måste skapa sina egna processorinstanser.
Processorer passar in i en av följande kategorier: digitalisera: OCR. Extrakt: Anpassad extraktor, formanalysator och förberedda analysatorer. Klassificera: Anpassad klassificerare och anpassad splitter.