Normal 0 false false false FI JA AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Normaali taulukko"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-font-kerning:1.0pt; mso-ligatures:standardcontextual; mso-ansi-language:SV-FI; mso-fareast-language:EN-US;} Presentation av komponenter
Arkkiivi och dess komponenter har utvecklats inom projektet Förbättring av kvaliteten och användbarheten av digitalt material med artificiell intelligens (2021–2023).
Finns det i ert material många post-it-lappar som döljer texten i dokumenten? Förekommer det vid skanningen för ofta vikta eller sönderrivna sidhörn, eller innehåller ert material för många tomma sidor som stör användningen av digitalt material? Och har ni behov av att känna igen skrivtyp eller skulle ni vilja använda en automatisk identifierare av metadata och textspråk för att berika metadata?
I användargränssnittet Arkkiivi kan du prova komponenter som känner igen skanningsfel och innehåll! Välkommen att ta del.
- Igenkänning av tomma sidor: Klassificerar sidorna som tomma eller innehållsliga.
- Igenkänning av post-it-lappar: Känner igen post-it-lappar på dokumentens sidor och anger deras sidnummer
- Igenkänning av vikta sidhörn: Känner igen vikta eller sönderrivna sidhörn och anger deras sidnummer
- Igenkänning av metadata: Känner igen namnentiteter, tar fram ämnesord och känner igen språk. Obs! Tills vidare är det möjligt att känna igen namnentiteter i maskinskrivet material på finska och engelska och igenkänningen av ämnesord fungerar dessutom i svenskspråkiga texter. Komponenterna fungerar troligen inte på korrekt sätt i handskrivet material och/eller i material på andra språk.
- Igenkänning av skrivtyp: Klassificerar sidorna efter skrivtyp: handskrivna, maskinskrivna och en kombination av de föregående.
Du kan testa komponenterna genom att klicka på Pröva.
Obs! Arkkivi.fi är en demo/försöksplattform och lämpar sig inte för produktion. Komponenternas koder och utbildade modeller finns i GitHub och är fritt tillgängliga och redigerbara (publicerade med MIT-licens). Observera också att vissa komponenter använder igenkänning av maskinskriven text och därför fungerar de inte i handskrivet material. Läs mer om beskrivningarna av komponenterna!