Bent u klaar voor een uitdaging?

Probeer dan eens dit artikel binnen 36  seconden te lezen! Voorlopig hoeft u nog niet te proberen om de tekst te begrijpen, maar alleen om alle letters te zien. Hierbij mag u de spaties en de plaatjes overslaan. Klaar? Start dan nu uw stop-watch, scan het artikel, kijk hoe lang u erover deed, en ga dan hieronder verder!

Version française

Welnu wat was uw tijd? Zeer waarschijnlijk veel langer dan 36  seconden. Als u het al volgehouden heeft tot aan het einde... Welnu: een machine vision systeem doet dit in minder dan de helft van die tijd! En zonder ooit de moed op te geven. Maar wees niet teleurgesteld als u niet zo snel was: u kunt uzelf troosten met de wetenschap dat u, als mens, zeer veel andere en zelfs betere mogelijkheden en eigenschappen heeft dan een machine vision systeem ooit zal hebben. Zo kunt u bijvoorbeeld de betekenis van een tekst begrijpen, zoals u momenteel doet. En tegelijkertijd kunt u van achtergrondmuziek genieten en zelfs een kop koffie drinken tijdens het lezen.

Wat is een Machine Vision Systeem?
In principe is een Machine Vision Systeem (MVS) een combinatie van een camera, een computer en specifieke software, die gebruikt wordt om informatie uit zijn omgeving te halen. Meestal wordt een MVS gebruikt voor het controleren van zojuist geproduceerde (half-)fabrikaten op een produktielijn. Hierbij kunnen de goederen geïnspecteerd worden op afmeting, vorm, kleur, volledigheid, beschadiging, enz. Zodra het MVS een negatieve afwijking ten opzichte van de gewenste kwaliteit van een produkt constateert, verwijdert hij dat wanprodukt van de transportband. Zo kan niet alleen voorkomen worden dat een waardeloos ding verder bewerkt wordt, maar ook dat een misvormd produkt vast kan komen te zitten in de automatische produktiemachines (zoals robots), die zich stroomafwaarts aan de produktielijn bevinden.
Steeds meer Machine Vision Systemen worden tegenwoordig echter gebruikt om de produkten niet alleen te inspecteren maar ook te identificeren. En daarvoor moeten ze teksten en codes lezen.

In het algemeen voert een machine vision computer drie stappen uit om te kunnen lezen:
- eerst moet er een beeld van de tekst in het systeem binnengehaald worden met behulp van een industriële video camera en elektronica in een computer;
- daarna moet het beeld "verwerkt" worden om er informatie uit te halen;
- tenslotte moet het systeem, afhankelijk van de context van de informatie, beslissen of en hoe er gehandeld moet worden.
U vindt deze stappen waarschijnlijk zeer logisch. Maar bedenk wel dat u er zelf (als mensenkind) er zo’n vier jaren over gedaan heeft om ze toe te leren passen! Laten we daarom de mogelijkheden (en problemen) van een lezend machine vision systeem eens vanuit het menselijk oogpunt bekijken.

Binnenhalen van het beeld
Als u deze tekst goed kunt lezen, is uw verlichting goed. De irissen van uw ogen hebben zich automatisch aangepast aan het lichtniveau en eventueel heeft u een lamp aangedaan, of juist een gordijn dichtgetrokken om fel zonlicht uit te sluiten. Verder nemen we aan dat u de letters redelijk scherp kunt zien. Daarvoor hebben de lenzen in uw ogen automatisch hun vorm veranderd om optimaal scherp te kunnen stellen. Daarbij heeft u het papier op een juiste afstand van uw ogen gebracht en heeft u eventueel een bril opgezet.
En tenslotte heeft u een tekst voor ogen die geschikt is om gelezen te worden: het contrast tussen de inkt van de letters en de achtergrond van het papier is hoog genoeg en het type (font), de grootte en de kleur van de letters garanderen een goede leesbaarheid.

Wat heeft dit alles nu te maken met Machine Vision Systemen?
Om een beeld in te nemen, gebruikt een MVS een industriële CCD videocamera met een geschikte lens, die de produkten alleen kan bekijken onder goede verlichtingscondities. Tevens moeten focussering en diafragma van de lens goed ingesteld zijn. De camera is gekoppeld aan een zogenoemde "frame grabber", een (PCI-bus gebaseerde) uitbreidingskaart, die het signaal van de camera omzet naar digitale beelden in het geheugen van de PC.
Een van de belangrijkste taken van de ontwerpers en bouwers van Machine Vision Systems is het definiëren van de optimale combinatie van deze componenten. De gouden regel bij het gebruik van een MVS is dan ook: als het camerabeeld niet goed genoeg is, zul je er nooit bruikbare informatie uit kunnen distilleren. Om optimale resultaten te krijgen worden diverse maatregelen genomen.

Verlichting
De beste leesresultaten worden verkregen als het lichtniveau constant is. Daarom wordt strooilicht vermeden: op het moment dat een produkt onder de camera ligt, mag bijvoorbeeld een TL-buis in de fabriekshal, die knippert met 100 Hz, dat produkt niet verlichten. En ook zonlicht, dat door bewolking op een onvoorspelbare manier al of niet doorgelaten wordt, moet afgeschermd worden. Dus wordt er enerzijds een donkere kap rondom de lees-plaats gebouwd tegen strooilicht, en wordt er anderzijds een speciaal ontworpen verlichtingssysteem in die kap geplaatst. De vorm en plaats van de lampen kan daarbij optimaal aangepast worden op de eigenschappen van het produkt.
De lens, de camera en de frame grabber hebben variabele instellingen zoals iris (ofwel diafragma), sluitersnelheid, versterking, contrast en white balance, die meestal door de software van het MVS veranderd kunnen worden. Dit kan nodig zijn als er zich toch nog onverwachte wijzigingen voordoen in het lichtniveau, of bijvoorbeeld als er produkten vervaardigd worden met een andere kleur.

Scherpstelling
Elke lens heeft beperkingen voor wat betreft de afstanden waarop hij kan scherpstellen: als een produkt te dichtbij of te ver af is, kan de lens er geen scherpe beelden van maken. Het gebied waarbinnen dit wel kan, de zogenoemde scherptediepte van de lens, kan verschoven worden door de lens te focusseren. Maar daarmee wordt tevens de grootte van dat gebied veranderd. Tevens is de scherptediepte afhankelijk van zowel het diafragma als van de (eventuele) zoomfactor. In de meeste Machine Vision Systemen konden tot nu toe standaard lenzen gebruikt worden, omdat de produkten normaliter slechts zo weinig in grootte varieerden, dat ze binnen de scherptediepte van een dergelijke lens vielen. Maar steeds vaker moet er met hetzelfde systeem gekeken worden naar produkten met sterk uiteenlopende afmetingen en types. Dit leidt tot sterk variërende afstanden van produkt tot lens, waardoor een modern MVS (automatisch) de focus-instelling van zijn lens moet kunnen aanpassen, zodra er een nieuw type produkt verwerkt moet worden.

De kwaliteit van de tekst
Een MVS kan helaas niet de drukkwaliteit van de te lezen tekst beïnvloeden. Het kan wel eventueel die kwaliteit meten en een operator waarschuwen als het onvoldoende is: het contrast kan te laag zijn, de kleuren onjuist, of de letters kunnen beschadigd zijn.
Overigens: sommige Machine Vision Systemen worden inderdaad ingezet om alleen de drukkwaliteit te meten, en niet om de teksten te lezen.

Snelheid
Binnen de beeldvorming is dit een aspect waar uw ogen geen last van hebben, omdat uw hersenen bewegingsonscherpte elimineren. Helaas kan een Machine Vision Systeem dit proces slechts nabootsen door gebruik te maken van zeer korte belichtingstijden. Gedurende deze korte opnametijden is de verplaatsing van het produkt onder de camera zo klein, dat het niet waarneembaar is. De consequentie van deze techniek is dat er een grote hoeveelheid licht nodig is om een bruikbaar beeld te kunnen maken. In enkele gevallen worden flitslampen toegepast.

Beeldverwerking
Tijdens het lezen van het eerste deel van dit artikel heeft u al veel data verwerkt: u heeft uw ogen over de regels tekst laten glijden, de regels opgedeeld in stukken, deze stukken herkend, ze geïnterpreteerd, en hun betekenis begrepen. Vervolgens heeft u de betekenissen en begrippen gecombineerd en een (naar wij hopen groot) deel daarvan in uw geheugen opgeslagen.
Hierboven vernoemen wij expliciet "stukken" van de regels, omdat u normaliter de letters niet apart leest: u herkent complete woorden of zelfs groepen woorden. U neemt de letters alleen dan apart waar, als u een onbekend woord tegenkomt, zoals "HOUDOE". Er is overigens een tweede reden die woord slecht leesbaar maakt: het bevat alleen hoofdletters, hetgeen niet normaal is voor een woord in een "moderne westerse" taal. Maar omdat de letters zelf bekend zijn en lettertype, -grootte en -kleur correct zijn, heeft u toch geprobeerd dit woord te lezen, waarschijnlijk zelfs door het voor een tweede keer te bekijken. Dus u vertraagde uw leessnelheid en herhaalde een van uw acties.
Een Machine Vision Systeem krijgt deze kansen niet! Want elk produkt op de transportband komt slechts één enkele keer onder de camera voorbij. En steeds met dezelfde (meestal hoge) snelheid. De prestaties die hierdoor van een Machine Vision Systeem verlangd worden zijn dus soms zelfs hoger dan van uw ogen: het resultaat moet de eerste keer meteen correct zijn. Het MVS moet dus uit dat enkele beeld van het produkt alle benodigde informatie kunnen halen. Maar vaak is het ook niet nodig om het gehele digitale camera-beeld te verwerken. Dan kan alleen het relevant deel geanalyseerd worden, waarin de te lezen tekst of code staat.
De software van het MVS zoekt daarom eerst het beeld af naar plaatsen waar zich vormen of vlekken bevinden die letters of cijfers kunnen voorstellen. Daarna probeert een ander deel van het programma elke gevonden vlek te herkennen. Afhankelijk van de hoeveelheid kennis, die in de software is opgenomen, kan dit programma letters in verschillende fonts en groottes herkennen. Het kan tevens binnen bepaalde grenzen compenseren voor afwijkingen in contrast, helderheid en kleur, en zelfs voor kleine beschadigingen aan de letters. Maar het herkennen blijft niet beperkt tot alleen letters en cijfers. Een MVS kan ook leren om symbolen te lezen, zodat bijvoorbeeld "@#$%&*" een zinvolle betekenis kan hebben (en niet meer alleen een vloek in een stripboek is). Als alle karakters apart herkend zijn, kan het MVS ze eventueel combineren en/of interpreteren.

Wat te doen met de nieuwe informatie
Nadat u uit de bovenstaande teksten informatie heeft gehaald, kunt u beslissen wat u gaat doen met uw nieuw verworven kennis. U zou aantekeningen kunnen maken. Of u zou een leverancier van een tekst-lezend Machine Vision Systeem kunnen bellen. In ieder geval hangt uw beslissing (onder andere) af van uw interesses.
Een MVS is geprogrammeerd om te handelen in het belang van zijn gebruiker. Het machinaal lezen van teksten kan bijvoorbeeld dienen om:
- specifieke produkten te identificeren (zonder barcodes of dotcodes te gebruiken)
- alle gelezen gegevens op te slaan in een bestand op de harde schijf van een PC (als bewijs dat bepaalde produkten geïnspecteerd zijn)
- de gelezen teksten door te sturen naar een ander apparaat, zoals een host computer of een printer
- codes te controleren op specifieke combinaties van letters en/of cijfers
- de gelezen data te decoderen om de produktielijn of een daaraan gekoppeld inpaksysteem te besturen.
Deze acties en beslissingen worden normaliter geprogrammeerd in een software-laag die boven op het lees-programma ligt. Daardoor hoeft alleen deze applicatielaag aangepast te worden als de eisen van de gebruiker veranderen. Zo zou een MVS bijvoorbeeld geprogrammeerd kunnen worden om een deel van het transportsysteem uit te schakelen zodra het (op het laatste produkt van een batch) het woord "houdoe" gelezen heeft.
Overigens: heeft u gemerkt dat u het woord "houdoe" nu wel snel kunt lezen? (het is Brabants voor "tot ziens"). Deze keer nam uw leessnelheid niet of nauwelijks af. Op dezelfde manier hangt de leessnelheid van een MVS af van de hoeveelheid voorkennis in het programma. Maar ook van de problemen die zich kunnen voordoen tijdens het gehele lees-proces en van de hoeveelheid functies in de applicatie-laag. Een basis-uitvoering van een MVS kan onder normale omstandigheden 1000 tekens per seconde lezen.

Toepassingen van Machine Vision Systemen
In de afgelopen 16 jaren heeft DVS te Breda diverse types machine vision systemen ontwikkeld, inclusief tekstlezers. Dit werd steeds in nauwe samenwerking met de klant gedaan, omdat elke gebruiker van een dergelijk systeem zijn eigen wensen en eisen heeft voor wat betreft functionaliteit, user interface en (niet in het minst) het totale prijskaartje.
Naast tekst-lezers (zie inzet over de Automatic Label Reader) bestaan er vision machines voor onder andere:
- het identificeren van artikelen en producten, zoals Printed Circuit Boards
- het inspecteren van glazen flessen en potten op vervuiling, vormafwijkingen en spanningen in het glas
- het sorteren van planten, zaailingen, enz. op afmeting, vorm en/of kleur
- het meten van het volume van bulk materiaal
- het zeer nauwkeurig meten van medische produkten
- het kalibreren en monitoren van militaire systemen.
De inzet omschrijft een aantal uitvoeringen van een tekst-lezer, die recentelijk door DVS geleverd werden. Dit geeft u een indruk van de mogelijkheden van beeldverwerking in de praktijk van moderne machine vision systemen.
Zoals u gezien heeft, is veel van de "technologie" van onze menselijke ogen en hersenen gekopieerd en nagebootst in (industriële) machine vision systemen. Deze machines zijn al een sleutelrol gaan spelen in de verbetering van zowel produktie-systemen als kwaliteitsbeheer. Ze functioneren objectief en betrouwbaar gedurende 24 uren per dag, 7 dagen per week. Toch hebben we nog een lange weg voor ons voordat deze systemen even flexibel worden als ons menselijk visueel observatiesysteem. Voor nu rest ons nog een (simpel) woord te lezen: houdoe!

j.dorn@dvs.nl

 

ALR: de Automatic Label Reader

De Omgeving
Publikaties als kranten, periodieken, catalogi en direct mailing produkten worden verpakt in plastic folie of in papier. Soms wordt het adres op het produkt zelf geprint, soms wordt er een adreslabel opgeplakt. Buhrs-Zaandam in Nederland ontwerpt, bouwt en levert diverse machines aan mailingbedrijven, die combinaties van deze producten verwerken. De publicaties worden voorzien van bijlagen en (eventueel) adreslabels, en worden met een snelheid van maximaal 18.000 pakketten per uur verpakt, gestapeld en gepallettiseerd.

De Probleemstelling
Tijdens de ontwikkeling van een van de laatste typen systemen, de Enveloper MTR, stuitte Buhrs-Zaandam op een aantal eisen, die alleen door een machine vision systeem opgelost konden worden.
- Voordat een produkt verstuurd mag worden, moet de drukkwaliteit van alle karakters op het adreslabel gecontroleerd worden;
- Adressen, die gedrukt zijn op produkten, worden onzichtbaar als deze produkten in papier of in ondoorzichtig plastic folie verpakt worden. Daarom moet aan het einde van de verpakkingslijn een kopie van het originele adreslabel geprint en op het pakket geplakt worden.
- Speciale unieke numerieke codes op de adreslabels moeten gelezen en opgeslagen worden om later aan te kunnen tonen dat de betreffende produkten verwerkt zijn.
- Afhankelijk van een specifieke code op het adreslabel, moeten er selectief een aantal bijlagen toegevoegd worden aan het originele produkt.

Bij al deze eisen is het uiterst belangrijk dat een machine betrouwbaar teksten kan lezen, die ook voor de mens leesbaar zijn. De klanten van de mailingbedrijven willen namelijk steeds meer op ruimte besparen door bar-, dot- of bi-codes op hun adreslabels weg te laten: de informatie zit immers al in de leesbare tekst, die voor de postbode onmisbaar is.

De Oplossing
Om aan al deze eisen te kunnen voldoen ontwierp DVS te Breda een flexibel systeem dat adressen, postcodes en verzendcodes leest en decodeert: de Automatic Label Reader (ALR). Dit systeem bestaat uit een industriële PC met een snelle en flexibele frame grabber, een industriële CCD camera, speciale continue verlichting en verschillende applicatie-software programma’s.
De hardware van de ALR is voor elk systeem gelijk, evenals het basisdeel van de software: het Optical Character Reading (OCR) softwarepakket. Alleen de applicatie-laag van de software (ofwel de functionaliteit van het systeem) werd steeds aangepast aan de specifieke eisen van de gebruiker van de ALR.

Diverse Types ALRs
Aan een Engels bedrijf werd bijvoorbeeld een ALR geleverd, die het complete adres plus een "depot code" (in totaal maximaal 312 karakters) leest van een brief, die in een venster-envelop zit. Bij een snelheid van meer dan 8.000 enveloppen per uur. De ALR staat aan het begin van het transportsysteem, en stuurt de gelezen gegevens naar een printer, die aan het einde van de baan een extra label print. Dit label wordt gebruikt als ontvangstbewijs voor aflevering van het produkt aan de geadresseerde.
Een ander type ALR leest in Oslo een verzend-code die door een PLC gebruikt wordt om specifieke bijlagen aan het hoofdprodukt toe te voegen. De ALR past de code aan, aan de actuele status van het systeem. Zo kan bijvoorbeeld het nummer van een station dat een bepaalde bijlage zou moeten toevoegen, maar momenteel leeg is, vervangen worden door het nummer van een back-up station.
Bovendien vergelijkt de ALR de postcodes van de opeenvolgende adreslabels, zodat de pakketten per postcode gesorteerd en verpakt aan de Noorse PTT aangeboden kunnen worden. Het complete systeem verwerkt meer dan 12.000 pakketten per uur.
De nieuwste, Nederlandse ALR versie stuurt een gelezen adres-code naar een printer controller, die het bijbehorende adres opzoekt in een database. Dat adres wordt geprint op een retour-enveloppe, die binnen in de bijbehorende catalogus geplaatst wordt. Nadat de catalogus plus bijlagen ingepakt zijn in papier, wordt het zelfde adres aan de buitenzijde op het pakket geprint.

 

Êtes-vous prêts à
relever un défi?

Essayez alors de lire cet article en moins de 36 secondes ! Nous ne vous demandons pas de comprendre le texte, seulement de voir toutes les lettres. Vous pouvez même omettre les espaces et les images. Prêt ? Démarrer votre chrono, scannez l’article et vérifiez votre temps. Ensuite, vous pouvez reprendre votre lecture !

Alors, quel était votre temps ? Fort probablement plus de 36 secondes. Du moins, si vous avez tenu jusqu’au bout… Pourtant, un système de vision effectue cette même opération en moins de la moitié du temps. Et sans jamais baisser les bras. Ne soyez toutefois pas déçus : vous pouvez vous consoler en vous disant que vous, en tant que personne, avez plein d’autres possibilités et facultés que n’aura jamais un système de vision. Ainsi, vous pouvez par exemple comprendre le sens d’un texte, comme vous le faites maintenant, tout en profitant d’une musique de fond et en dégustant, éventuellement, une tasse de café.

Le Système de Vision Machines
En principe, un "Machine Vision System" (MVS) combine une caméra, un ordinateur et un logiciel spécifique, utilisé pour extraire des informations de son environnement. Le MVS est souvent utilisé pour contrôler des produits (semi) finis sur une ligne de production. Il inspecte la dimension, la forme, la couleur, l’intégralité, l’endommagement… des marchandises. Dès que le MVS constate un écart négatif par rapport à la qualité souhaitée d’un produit, il éjecte ce mauvais produit du convoyeur. Il évite ainsi le traitement ultérieur d’un produit sans valeur ou encore que ce produit incorrect ne vienne bloquer les machines de production automatiques (comme les robots), qui se trouvent en aval sur la ligne de production. Les systèmes de vision sont de plus en plus utilisés pour inspecter et identifier les produits. A cet effet, ils doivent néanmoins pouvoir lire des textes et des codes.
En règle générale, l’ordinateur de vision effectue sa lecture en trois étapes :
- une image du texte doit d’abord être saisie par le système au moyen d’une caméra vidéo industrielle et d’une électronique embarquée dans un ordinateur ;
- ensuite, l’image doit être traitée pour en extraire des informations ;
- finalement, le système doit décider, en fonction du décodage de l’information, s’il y a lieu de prendre une action et, si oui, comment.
Ces étapes vous paraîtront probablement très logiques. Imaginez toutefois qu’en tant qu’être humain cela vous a pris environ quatre ans pour apprendre à les appliquer ! Examinons donc les possibilités (et problèmes) d’un système de vision de lecture du point de vue de l’homme.

Saisir l’image
Si vous pouvez lire ce texte correctement, vous disposez d’un bon éclairage. Les iris de vos yeux se sont adaptés automatiquement au niveau lumineux. Vous avez éventuellement allumé une lampe ou seulement fermé un rideau pour éviter d’être ébloui par le soleil. Par ailleurs, nous supposons que vous pouvez déchiffrer clairement les lettres. Le cristallin de votre œil a automatiquement changé de forme pour assurer la netteté optimale. Vous avez, de même, tenu le papier à une bonne distance de vos yeux et éventuellement mis des lunettes. Et finalement, vous avez sous les yeux un texte facile à la lecture : le contraste entre l’encre des lettres et le fond du papier est suffisant et la police, la taille et la couleur des lettres garantissent une bonne lisibilité.

Quel rapport avec les Systèmes de Vision ?
Pour capter une image, le MVS utilise une caméra vidéo CCD industrielle dotée d’un objectif adéquat qui peut seulement analyser les produits sous de bonnes conditions d’éclairage. La focale et le diaphragme de la lentille doivent être bien réglés. La caméra est reliée à une carte d’acquisition, une carte d’extension (basée sur un bus PCI) qui convertit les signaux de la caméra en images numériques au sein de la mémoire du PC. Une des principales tâches des concepteurs et constructeurs de systèmes de vision consiste à définir la combinaison optimale de ces composants. La règle d’or lors de l’utilisation d’un MVS est dès lors : si l’image caméra est insuffisante, vous n’en retirerez aucune information utile. Plusieurs mesures s’imposent si l’on veut des résultats optimaux.

Eclairage
Les meilleurs résultats de lecture sont obtenus avec un niveau de lumière constant. C’est pourquoi on évite la lumière diffuse : dès que le produit se trouve sous la caméra, il ne peut par exemple pas être éclairé par un tube TL du hall de l’usine, qui clignote à 100 Hz. Il doit également être protégé de la lumière du soleil, qui peut apparaître ou disparaître de façon imprévisible suite à une quelconque nébulosité. L’emplacement de lecture est donc protégé de toute lumière diffuse par un couvercle sombre et illuminé par un système d’éclairage spécial placé dans le couvercle. La forme et la place des lampes peuvent être adaptées de façon optimale aux caractéristiques du produit. L’objectif, la caméra et la carte d’acquisition possèdent différents réglages variables tel que l’iris (ou le diaphragme), la vitesse d’obturation, le renforcement, le contraste et la balance des blancs, qui peuvent généralement être modifiés par le logiciel du MVS. Cela peut s’avérer nécessaire si le niveau de lumière change soudainement ou si certains produits sont fabriqués dans une autre couleur.

Mise au point
Chaque objectif peut présenter des restrictions au niveau des distances de mise au point : si la distance du produit est trop petite ou trop grande, l’objectif ne peut fournir des images nettes. La plage dans laquelle l’objectif réalise sa mise au point, la profondeur de champ de l’objectif, peut être ajustée en modifiant la focale de l’objectif. Mais cette opération modifie simultanément la grandeur de cette plage. La profondeur de champ de l’objectif dépend également du diaphragme et de (l’éventuel) facteur de zoom. Jusqu’à présent, la plupart des systèmes de vision pouvaient se contenter d’objectifs standard car la taille des produits variait normalement si peu qu’ils convenaient à la profondeur de champ d’un tel objectif. Aujourd’hui toutefois, un même système doit de plus en plus analyser des systèmes présentant des dimensions et des types très divergents. Ceci génère des distances très fluctuantes entre le produit et l’objectif. Un système de vision moderne doit donc pouvoir (automatiquement) adapter le réglage de sa focale dès qu’il doit traiter un nouveau type de produit.

La qualité du texte
Le système de vision ne peut malheureusement influencer le texte à lire. Il peut éventuellement mesurer la qualité et informer l’opérateur lorsque celle-ci s’avère insuffisante : le contraste peut être trop faible, les couleurs incorrectes ou les lettres abîmées. Certaines machines de vision sont d’ailleurs seulement utilisées pour mesurer la qualité d’impression et pas pour lire les textes.

Vitesse
Vos yeux ne souffrent pas du déplacement de l’image car votre cerveau élimine le flou dû au mouvement. Hélas, une machine de vision ne peut imiter ce processus qu’en utilisant des temps d’exposition très courts. Pendant ces temps d’enregistrement ultra courts, le déplacement du produit sous la caméra est tellement faible qu’il n’est pas perceptible. Cette technique nécessite dès lors une grande quantité de lumière pour pouvoir réaliser une image exploitable. Il est parfois nécessaire de recourir à des flashes.

Traitement de l’image
Vous avez déjà traité de nombreuses données en lisant la première partie de cet article : vous avez fait glisser vos yeux sur les lignes du texte, vous avez divisé les lignes en morceaux, vous avez reconnu ces morceaux, vous les avez interprétés et compris leur sens. Ensuite, vous avez combiné les significations et les notions et stocké une part (importante, espérons-le) dans votre mémoire. Nous parlons explicitement de ‘morceaux’ de lignes car vous ne lisez normalement pas les lettres les unes après les autres : vous reconnaissez des mots complets, voire même des groupes de mots. Vous ne traitez les lettres séparément que lorsque vous rencontrez un mot inconnu, comme par exemple ‘TOT-RADE’. Il y a d’ailleurs une deuxième raison qui rend ce mot peu lisible : il ne contient que des majuscules ce qui n’est pas normal pour un mot d’une langue ‘occidentale moderne’. Mais comme les lettres sont connues, que la police, la taille et la couleur sont correctes, vous avez quand même essayé de lire ce mot, probablement en l’analysant une seconde fois. Vous avez donc réduit votre vitesse de lecture et répété une de vos actions. Un système de vision n’a pas droit à cette chance ! Chaque produit sur le convoyeur ne passe qu’une seule fois devant la caméra. Et toujours à la même vitesse (souvent élevée). Les performances requises d’un système de vision sont dès lors souvent supérieures à celles de vos yeux : le résultat doit être directement correct. Le MVS doit donc pouvoir retirer de cette unique image du produit toutes les informations nécessaires. Mais souvent, il n’est pas nécessaire de traiter toute l’image numérique. Seule la partie pertinente, contenant le texte ou code à lire, doit être traitée. Le logiciel du MVS recherche donc d’abord sur l’image les places où se trouvent des formes ou tâches pouvant représenter des lettres ou chiffres. Ensuite, une autre partie du programme essaie de reconnaître chaque tâche trouvée. En fonction de la quantité de connaissances acquises par le logiciel, le programme peut reconnaître des lettres de différentes polices et tailles. Il peut également compenser, dans certaines limites, des écarts de contraste, clarté et lumière ainsi que des petites détériorations des lettres. Mais la reconnaissance ne se limite pas aux lettres et chiffres. Un MVS peut également apprendre à lire des symboles. ‘@#$%&*’ peut ainsi avoir une signification sensée (et ne pas seulement représenter une injure dans une BD). Lorsque tous les caractères distincts sont reconnus, le MVS peut éventuellement les combiner et/ou interpréter.

Que faire avec les nouvelles informations ?
Après avoir extrait les informations du texte ci-dessus, vous pouvez décider de ce que vous allez faire de vos nouvelles connaissances. Vous pourriez prendre des notes ou appeler un fournisseur d’un système de vision qui lit les textes. Votre décision dépend de toute façon (entre autres) de vos intérêts.
Le MVS est programmé pour agir dans l’intérêt de son utilisateur. La lecture automatique des textes peut par exemple servir à :
- identifier des produits spécifiques (sans devoir utiliser de codes-barres ou de dotcodes)
- enregistrer toutes les données lues dans un fichier sur le disque dur d’un PC (comme preuve que certains produits sont inspectés)
- envoyer les textes lus vers un autre appareil, comme un ordinateur hôte ou une imprimante
- contrôler les codes sur des combinaisons spécifiques de lettres et/ou chiffres
- décoder les données lues pour piloter la ligne de production et un système d’emballage qui y est relié.
Ces actions et décisions sont normalement programmées dans une couche logicielle située au-dessus du programme de lecture. De ce fait, seule la couche application doit être adaptée si les exigences de l’utilisateur changent. Un MVS pourrait ainsi par exemple être programmé pour débrancher une partie du système de transport dès qu’il a lu le mot ‘tot-rade’ (sur le dernier produit d’un lot). Avez-vous par ailleurs remarqué que vous êtes maintenant capable de lire rapidement  le mot ‘tot-rade’ ? (Il signifie, en patois wallon, ‘à bientôt’). Cette fois-ci, votre vitesse de lecture n’a pas été ralentie ou très peu. La vitesse de lecture d’un MVS dépend de la même manière de la quantité de prérequis du programme. Elle dépend néanmoins aussi des problèmes survenant pendant le processus de lecture et de la quantité de fonctions présentes dans la couche d’application. Dans des conditions normales, un MVS de base peut lire 1000 signes par seconde.

Applications des Systèmes de Vision Machines
Au cours des 16 dernières années, la société DVS située à Breda a développé plusieurs types de systèmes de vision, y compris des lecteurs de texte. Ce développement est chaque fois le fruit d’une étroite collaboration avec le client car chaque utilisateur a ses propres souhaits et exigences en matière de fonctionnalité, d’interface utilisateur et de prix global. Outre les lecteurs de texte (voir le cadre sur l’Automatic Label Reader), il existe des machines de vision pour :
- l’identification d’articles et produits comme les circuits imprimés
- l’inspection de bouteilles et pots en verre en termes de saleté, écarts de forme et tensions dans le verre
- le tri de plantes, semis, etc. en termes de dimensions, formes et/ou couleurs
- la mesure du volume de matériaux en vrac
- le calibrage et la surveillance de systèmes militaires
Le cadre ci-joint décrit plusieurs exécutions d’un lecteur de texte, récemment fourni par DVS. Ceci vous donne, dans la pratique, une idée des possibilités de traitement d’images des systèmes de vision modernes. Comme vous l’avez constaté, une grande part de la ‘technologie’ de nos yeux et cerveaux humains a été copiée et reproduite dans les systèmes de vision (industriels). Ces machines jouent déjà un rôle clé dans l’amélioration des systèmes de production et de gestion de la qualité. Leur fonctionnement est optimal et fiable, 24 heures sur 24, 7 jours sur 7. Il nous reste pourtant un long chemin à parcourir avant que ces systèmes ne présentent la même flexibilité que notre système d’observation humain. Pour l’heure, il nous reste plus qu’un petit mot à lire : tot-rade !

j.dorn@dvs.nl

 

ALR: de Automatic Label Reader

Le contexte
Des publications comme les journaux, les périodiques, les catalogues et les produits de direct mailing sont emballés sous film ou sous papier. L’adresse est imprimée sur le produit ou reprise sur une étiquette collée sur le produit. La société néerlandaise Buhrs-Zaandam conçoit, fabrique et fournit plusieurs machines aux sociétés de mailing qui utilisent des combinaisons de ces produits. Les publications sont dotées d’annexes et (éventuellement) d’étiquettes d’adresse. Elles sont emballées, empilées et palettisées à une vitesse de maximum 18.000 paquets par heure.

La problématique
Lors du développement d’un de ces derniers systèmes, l’Envelopper MTR, Buhrs-Zaandam a été confronté à plusieurs exigences, qui ne pouvaient être remplies que par un système de vision.
- Avant d’envoyer un produit, la qualité d’impression de tous les caractères figurant sur l’étiquette d’adresse doit être contrôlée ;
- Les adresses imprimées sur les produits deviennent invisibles lorsque ces produits sont emballés dans du papier ou dans un film plastique non transparent. Il faut donc imprimer une copie de l’étiquette d’adresse originale à la fin de la ligne d’emballage et la coller sur le paquet.
- Les codes numériques uniques qui figurent sur les étiquettes d’adresse doivent être lus et mémorisés pour pouvoir démontrer par la suite que ces produits ont été traités.
- En fonction d’un code spécifique présent sur l’étiquette d’adresse, il faut ajouter sélectivement plusieurs annexes au produit d’origine.
Pour répondre à toutes ces exigences, il est primordial que la machine puisse lire fidèlement tous les textes lisibles par l’homme. Les clients des sociétés de mailing veulent notamment toujours économiser de l’espace en supprimant les codes-barres, les dotcodes ou les codes bidimensionnels. En effet, l’information se trouve déjà dans le texte lisible qui est indispensable au facteur.

La solution
La société DVS de Breda a donc développé un système flexible qui lit et décode les adresses, les codes postaux et les codes d’envoi : l’Automatic Label Reader (ALR). Ce système est composé d’un PC industriel doté d’une carte d’acquisition rapide et flexible, d’une caméra CCD industrielle, d’un éclairage spécifique continu et de différents logiciels applicatifs.
Le matériel de l’ALR est toujours identique ainsi que la partie élémentaire du logiciel, le progiciel de Reconnaissance Optique de Caractères (OCR). Seule la couche applicative du logiciel (ou la fonctionnalité du système) a toujours été adaptée aux exigences spécifiques de l’utilisateur de l’ALR.

Les différents types d’ALR
DVS a par exemple fourni un ALR à une société anglaise, qui lit l’adresse complète plus un ‘code de dépôt’ (au total, maximum 312 caractères) d’une lettre qui se trouve dans une enveloppe à fenêtre, à une vitesse de plus de 8.000 enveloppes par heure. L’ALR se trouve au début du système de transport et envoie les données lues à une imprimante qui imprime à la fin de la ligne une étiquette supplémentaire. Cette étiquette servira de preuve de la bonne réception de la livraison du produit au destinataire. Un autre type d’ALR lit à Oslo un code d’envoi utilisé par un PLC pour ajouter des annexes spécifiques au produit principal. L’ALR adapte le code à l’état actuel du système. Le numéro d’une station qui devrait ajouter une certaine annexe mais qui est momentanément vide peut ainsi être remplacé par le numéro d’une station de back-up.
L’ALR compare en outre les codes postaux des étiquettes d’adresse qui se suivent. Les paquets sont livrés à la poste norvégienne, triés par code postal et emballés. Le système traite plus de 12.000 paquets par heure.
La toute dernière version néerlandaise envoie un code d’adresse lu à un contrôleur d’imprimante qui recherche l’adresse en question dans une base de données. Cette adresse est imprimée sur une enveloppe retour, placée dans le catalogue annexe. Après l’emballage sous papier du catalogue et des annexes, la même adresse est imprimée sur la face extérieure du paquet.

 

©