|
Bent u klaar voor een
uitdaging?
Probeer dan eens dit artikel binnen 36
seconden te lezen! Voorlopig hoeft u nog niet te proberen om de tekst te
begrijpen, maar alleen om alle letters te zien. Hierbij mag u de spaties en de
plaatjes overslaan. Klaar? Start dan nu uw stop-watch, scan het artikel, kijk
hoe lang u erover deed, en ga dan hieronder verder!
Version
française
Welnu wat was uw tijd? Zeer waarschijnlijk
veel langer dan 36
seconden. Als u het al volgehouden heeft tot aan het einde... Welnu: een machine
vision systeem doet dit in minder dan de helft van die tijd! En zonder ooit de
moed op te geven. Maar wees niet teleurgesteld als u niet zo snel was: u kunt
uzelf troosten met de wetenschap dat u, als mens, zeer veel andere en zelfs
betere mogelijkheden en eigenschappen heeft dan een machine vision systeem ooit
zal hebben. Zo kunt u bijvoorbeeld de betekenis van een tekst begrijpen, zoals u
momenteel doet. En tegelijkertijd kunt u van achtergrondmuziek genieten en zelfs
een kop koffie drinken tijdens het lezen.
Wat is een Machine Vision Systeem?
In principe is een Machine Vision Systeem (MVS) een combinatie van een
camera, een computer en specifieke software, die gebruikt wordt om informatie
uit zijn omgeving te halen. Meestal wordt een MVS gebruikt voor het controleren
van zojuist geproduceerde (half-)fabrikaten op een produktielijn. Hierbij kunnen
de goederen geïnspecteerd worden op afmeting, vorm, kleur, volledigheid,
beschadiging, enz. Zodra het MVS een negatieve afwijking ten opzichte van de
gewenste kwaliteit van een produkt constateert, verwijdert hij dat wanprodukt
van de transportband. Zo kan niet alleen voorkomen worden dat een waardeloos
ding verder bewerkt wordt, maar ook dat een misvormd produkt vast kan komen te
zitten in de automatische produktiemachines (zoals robots), die zich
stroomafwaarts aan de produktielijn bevinden.
Steeds meer Machine Vision Systemen worden tegenwoordig echter gebruikt om de
produkten niet alleen te inspecteren maar ook te identificeren. En daarvoor
moeten ze teksten en codes lezen.
In het algemeen voert een machine
vision computer drie stappen uit om te kunnen lezen:
- eerst moet er een beeld van de tekst in het
systeem binnengehaald worden met behulp van een industriële video camera en
elektronica in een computer;
- daarna moet het beeld "verwerkt" worden om er informatie uit te
halen;
- tenslotte moet het systeem, afhankelijk van de context van de informatie,
beslissen of en hoe er gehandeld moet worden.
U vindt deze stappen waarschijnlijk zeer logisch. Maar bedenk wel dat u er zelf
(als mensenkind) er zo’n vier jaren over gedaan heeft om ze toe te leren
passen! Laten we daarom de mogelijkheden (en problemen) van een lezend machine
vision systeem eens vanuit het menselijk oogpunt bekijken.
Binnenhalen van het beeld
Als u deze tekst goed kunt lezen, is uw
verlichting goed. De irissen van uw ogen hebben zich automatisch aangepast aan
het lichtniveau en eventueel heeft u een lamp aangedaan, of juist een gordijn
dichtgetrokken om fel zonlicht uit te sluiten. Verder nemen we aan dat u de
letters redelijk scherp kunt zien. Daarvoor hebben de lenzen in uw ogen
automatisch hun vorm veranderd om optimaal scherp te kunnen stellen. Daarbij
heeft u het papier op een juiste afstand van uw ogen gebracht en heeft u
eventueel een bril opgezet.
En tenslotte heeft u een tekst voor ogen die geschikt is om gelezen te worden:
het contrast tussen de inkt van de letters en de achtergrond van het papier is
hoog genoeg en het type (font), de grootte en de kleur van de letters garanderen
een goede leesbaarheid.
Wat heeft dit alles nu te maken met
Machine Vision Systemen?
Om een beeld in te nemen, gebruikt een MVS een industriële CCD videocamera
met een geschikte lens, die de produkten alleen kan bekijken onder goede
verlichtingscondities. Tevens moeten focussering en diafragma van de lens goed
ingesteld zijn. De camera is gekoppeld aan een zogenoemde "frame
grabber", een (PCI-bus gebaseerde) uitbreidingskaart, die het signaal van
de camera omzet naar digitale beelden in het geheugen van de PC.
Een van de belangrijkste taken van de ontwerpers en bouwers van Machine Vision
Systems is het definiëren van de optimale combinatie van deze componenten. De
gouden regel bij het gebruik van een MVS is dan ook: als het camerabeeld niet
goed genoeg is, zul je er nooit bruikbare informatie uit kunnen distilleren. Om
optimale resultaten te krijgen worden diverse maatregelen genomen.
Verlichting
De beste leesresultaten worden verkregen als het lichtniveau constant is.
Daarom wordt strooilicht vermeden: op het moment dat een produkt onder de camera
ligt, mag bijvoorbeeld een TL-buis in de fabriekshal, die knippert met 100 Hz,
dat produkt niet verlichten. En ook zonlicht, dat door bewolking op een
onvoorspelbare manier al of niet doorgelaten wordt, moet afgeschermd worden. Dus
wordt er enerzijds een donkere kap rondom de lees-plaats gebouwd tegen
strooilicht, en wordt er anderzijds een speciaal ontworpen verlichtingssysteem
in die kap geplaatst. De vorm en plaats van de lampen kan daarbij optimaal
aangepast worden op de eigenschappen van het produkt.
De lens, de camera en de frame grabber hebben variabele instellingen zoals iris
(ofwel diafragma), sluitersnelheid, versterking, contrast en white balance, die
meestal door de software van het MVS veranderd kunnen worden. Dit kan nodig zijn
als er zich toch nog onverwachte wijzigingen voordoen in het lichtniveau, of
bijvoorbeeld als er produkten vervaardigd worden met een andere kleur.
Scherpstelling
Elke lens heeft beperkingen voor wat betreft de afstanden waarop hij kan
scherpstellen: als een produkt te dichtbij of te ver af is, kan de lens er geen
scherpe beelden van maken. Het gebied waarbinnen dit wel kan, de zogenoemde
scherptediepte van de lens, kan verschoven worden door de lens te focusseren.
Maar daarmee wordt tevens de grootte van dat gebied veranderd. Tevens is de
scherptediepte afhankelijk van zowel het diafragma als van de (eventuele)
zoomfactor. In de meeste Machine Vision Systemen konden tot nu toe standaard
lenzen gebruikt worden, omdat de produkten normaliter slechts zo weinig in
grootte varieerden, dat ze binnen de scherptediepte van een dergelijke lens
vielen. Maar steeds vaker moet er met hetzelfde systeem gekeken worden naar
produkten met sterk uiteenlopende afmetingen en types. Dit leidt tot sterk
variërende afstanden van produkt tot lens, waardoor een modern MVS
(automatisch) de focus-instelling van zijn lens moet kunnen aanpassen, zodra er
een nieuw type produkt verwerkt moet worden.
De kwaliteit van de tekst
Een MVS kan helaas niet de drukkwaliteit van de te lezen tekst beïnvloeden.
Het kan wel eventueel die kwaliteit meten en een operator waarschuwen als het
onvoldoende is: het contrast kan te laag zijn, de kleuren onjuist, of de letters
kunnen beschadigd zijn.
Overigens: sommige Machine Vision Systemen worden inderdaad ingezet om alleen de
drukkwaliteit te meten, en niet om de teksten te lezen.
Snelheid
Binnen de beeldvorming is dit een aspect waar uw ogen geen last van hebben,
omdat uw hersenen bewegingsonscherpte elimineren. Helaas kan een Machine Vision
Systeem dit proces slechts nabootsen door gebruik te maken van zeer korte
belichtingstijden. Gedurende deze korte opnametijden is de verplaatsing van het
produkt onder de camera zo klein, dat het niet waarneembaar is. De consequentie
van deze techniek is dat er een grote hoeveelheid licht nodig is om een
bruikbaar beeld te kunnen maken. In enkele gevallen worden flitslampen
toegepast.
Beeldverwerking
Tijdens het lezen van het eerste deel van dit artikel heeft u al veel data
verwerkt: u heeft uw ogen over de regels tekst laten glijden, de regels
opgedeeld in stukken, deze stukken herkend, ze geïnterpreteerd, en hun
betekenis begrepen. Vervolgens heeft u de betekenissen en begrippen gecombineerd
en een (naar wij hopen groot) deel daarvan in uw geheugen opgeslagen.
Hierboven vernoemen wij expliciet "stukken" van de regels, omdat u
normaliter de letters niet apart leest: u herkent complete woorden of zelfs
groepen woorden. U neemt de letters alleen dan apart waar, als u een onbekend
woord tegenkomt, zoals "HOUDOE". Er is overigens een tweede reden die
woord slecht leesbaar maakt: het bevat alleen hoofdletters, hetgeen niet normaal
is voor een woord in een "moderne westerse" taal. Maar omdat de
letters zelf bekend zijn en lettertype, -grootte en -kleur correct zijn, heeft u
toch geprobeerd dit woord te lezen, waarschijnlijk zelfs door het voor een
tweede keer te bekijken. Dus u vertraagde uw leessnelheid en herhaalde een van
uw acties.
Een Machine Vision Systeem krijgt deze kansen niet! Want elk produkt op de
transportband komt slechts één enkele keer onder de camera voorbij. En steeds
met dezelfde (meestal hoge) snelheid. De prestaties die hierdoor van een Machine
Vision Systeem verlangd worden zijn dus soms zelfs hoger dan van uw ogen: het
resultaat moet de eerste keer meteen correct zijn. Het MVS moet dus uit dat
enkele beeld van het produkt alle benodigde informatie kunnen halen. Maar vaak
is het ook niet nodig om het gehele digitale camera-beeld te verwerken. Dan kan
alleen het relevant deel geanalyseerd worden, waarin de te lezen tekst of code
staat.
De software van het MVS zoekt daarom eerst het beeld af naar plaatsen waar zich
vormen of vlekken bevinden die letters of cijfers kunnen voorstellen. Daarna
probeert een ander deel van het programma elke gevonden vlek te herkennen.
Afhankelijk van de hoeveelheid kennis, die in de software is opgenomen, kan dit
programma letters in verschillende fonts en groottes herkennen. Het kan tevens
binnen bepaalde grenzen compenseren voor afwijkingen in contrast, helderheid en
kleur, en zelfs voor kleine beschadigingen aan de letters. Maar het herkennen
blijft niet beperkt tot alleen letters en cijfers. Een MVS kan ook leren om
symbolen te lezen, zodat bijvoorbeeld "@#$%&*" een zinvolle
betekenis kan hebben (en niet meer alleen een vloek in een stripboek is). Als
alle karakters apart herkend zijn, kan het MVS ze eventueel combineren en/of
interpreteren.
Wat te doen met de nieuwe informatie
Nadat u uit de bovenstaande teksten informatie
heeft gehaald, kunt u beslissen wat u gaat doen met uw nieuw verworven kennis. U
zou aantekeningen kunnen maken. Of u zou een leverancier van een tekst-lezend
Machine Vision Systeem kunnen bellen. In ieder geval hangt uw beslissing (onder
andere) af van uw interesses.
Een MVS is geprogrammeerd om te handelen in het belang van zijn gebruiker. Het
machinaal lezen van teksten kan bijvoorbeeld dienen om:
- specifieke produkten te identificeren (zonder
barcodes of dotcodes te gebruiken)
- alle gelezen gegevens op te slaan in een bestand op de harde schijf van een PC
(als bewijs dat bepaalde produkten geïnspecteerd zijn)
- de gelezen teksten door te sturen naar een ander apparaat, zoals een host
computer of een printer
- codes te controleren op specifieke combinaties van letters en/of cijfers
- de gelezen data te decoderen om de produktielijn of een daaraan gekoppeld
inpaksysteem te besturen.
Deze acties en beslissingen worden normaliter geprogrammeerd in een
software-laag die boven op het lees-programma ligt. Daardoor hoeft alleen deze
applicatielaag aangepast te worden als de eisen van de gebruiker veranderen. Zo
zou een MVS bijvoorbeeld geprogrammeerd kunnen worden om een deel van het
transportsysteem uit te schakelen zodra het (op het laatste produkt van een
batch) het woord "houdoe" gelezen heeft.
Overigens: heeft u gemerkt dat u het woord "houdoe" nu wel snel kunt
lezen? (het is Brabants voor "tot ziens"). Deze keer nam uw
leessnelheid niet of nauwelijks af. Op dezelfde manier hangt de leessnelheid van
een MVS af van de hoeveelheid voorkennis in het programma. Maar ook van de
problemen die zich kunnen voordoen tijdens het gehele lees-proces en van de
hoeveelheid functies in de applicatie-laag. Een basis-uitvoering van een MVS kan
onder normale omstandigheden 1000 tekens per seconde lezen.
Toepassingen van Machine Vision Systemen
In de afgelopen 16 jaren heeft DVS te Breda
diverse types machine vision systemen ontwikkeld, inclusief tekstlezers. Dit
werd steeds in nauwe samenwerking met de klant gedaan, omdat elke gebruiker van
een dergelijk systeem zijn eigen wensen en eisen heeft voor wat betreft
functionaliteit, user interface en (niet in het minst) het totale prijskaartje.
Naast tekst-lezers (zie inzet over de Automatic Label Reader)
bestaan er vision machines voor onder andere:
- het identificeren van artikelen en producten, zoals
Printed Circuit Boards
- het inspecteren van glazen flessen en potten op vervuiling, vormafwijkingen en
spanningen in het glas
- het sorteren van planten, zaailingen, enz. op afmeting, vorm en/of kleur
- het meten van het volume van bulk materiaal
- het zeer nauwkeurig meten van medische produkten
- het kalibreren en monitoren van militaire systemen.
De inzet omschrijft een aantal uitvoeringen van een tekst-lezer, die recentelijk
door DVS geleverd werden. Dit geeft u een indruk van de mogelijkheden van
beeldverwerking in de praktijk van moderne machine vision systemen.
Zoals u gezien heeft, is veel van de "technologie" van onze menselijke
ogen en hersenen gekopieerd en nagebootst in (industriële) machine vision
systemen. Deze machines zijn al een sleutelrol gaan spelen in de verbetering van
zowel produktie-systemen als kwaliteitsbeheer. Ze functioneren objectief en
betrouwbaar gedurende 24 uren per dag, 7 dagen per week. Toch hebben we nog een
lange weg voor ons voordat deze systemen even flexibel worden als ons menselijk
visueel observatiesysteem. Voor nu rest ons nog een (simpel) woord te lezen:
houdoe!
j.dorn@dvs.nl
ALR: de
Automatic Label Reader
De Omgeving
Publikaties als kranten, periodieken, catalogi en direct mailing produkten
worden verpakt in plastic folie of in papier. Soms wordt het adres op het
produkt zelf geprint, soms wordt er een adreslabel opgeplakt. Buhrs-Zaandam in
Nederland ontwerpt, bouwt en levert diverse machines aan mailingbedrijven, die
combinaties van deze producten verwerken. De publicaties worden voorzien van
bijlagen en (eventueel) adreslabels, en worden met een snelheid van maximaal
18.000 pakketten per uur verpakt, gestapeld en gepallettiseerd.
De Probleemstelling
Tijdens de ontwikkeling van een van de laatste typen systemen, de Enveloper
MTR, stuitte Buhrs-Zaandam op een aantal eisen, die alleen door een machine
vision systeem opgelost konden worden.
- Voordat een produkt verstuurd mag worden, moet de
drukkwaliteit van alle karakters op het adreslabel gecontroleerd worden;
- Adressen, die gedrukt zijn op produkten, worden onzichtbaar als deze produkten
in papier of in ondoorzichtig plastic folie verpakt worden. Daarom moet aan het
einde van de verpakkingslijn een kopie van het originele adreslabel geprint en
op het pakket geplakt worden.
- Speciale unieke numerieke codes op de adreslabels moeten gelezen en opgeslagen
worden om later aan te kunnen tonen dat de betreffende produkten verwerkt zijn.
- Afhankelijk van een specifieke code op het adreslabel, moeten er selectief een
aantal bijlagen toegevoegd worden aan het originele produkt.
Bij al deze eisen is het uiterst
belangrijk dat een machine betrouwbaar teksten kan lezen, die ook voor de mens
leesbaar zijn. De klanten van de mailingbedrijven willen namelijk steeds meer op
ruimte besparen door bar-, dot- of bi-codes op hun adreslabels weg te laten: de
informatie zit immers al in de leesbare tekst, die voor de postbode onmisbaar
is.
De Oplossing
Om aan al deze eisen te kunnen voldoen ontwierp DVS te Breda een flexibel
systeem dat adressen, postcodes en verzendcodes leest en decodeert: de Automatic
Label Reader (ALR). Dit systeem bestaat uit een industriële PC met een snelle
en flexibele frame grabber, een industriële CCD camera, speciale continue
verlichting en verschillende applicatie-software programma’s.
De hardware van de ALR is voor elk systeem gelijk, evenals het basisdeel van de
software: het Optical Character Reading (OCR) softwarepakket. Alleen de
applicatie-laag van de software (ofwel de functionaliteit van het systeem) werd
steeds aangepast aan de specifieke eisen van de gebruiker van de ALR.
Diverse Types ALRs
Aan een Engels bedrijf werd bijvoorbeeld een ALR geleverd, die het complete
adres plus een "depot code" (in totaal maximaal 312 karakters) leest
van een brief, die in een venster-envelop zit. Bij een snelheid van meer dan
8.000 enveloppen per uur. De ALR staat aan het begin van het transportsysteem,
en stuurt de gelezen gegevens naar een printer, die aan het einde van de baan
een extra label print. Dit label wordt gebruikt als ontvangstbewijs voor
aflevering van het produkt aan de geadresseerde.
Een ander type ALR leest in Oslo een verzend-code die door een PLC gebruikt
wordt om specifieke bijlagen aan het hoofdprodukt toe te voegen. De ALR past de
code aan, aan de actuele status van het systeem. Zo kan bijvoorbeeld het nummer
van een station dat een bepaalde bijlage zou moeten toevoegen, maar momenteel
leeg is, vervangen worden door het nummer van een back-up station.
Bovendien vergelijkt de ALR de postcodes van de opeenvolgende adreslabels, zodat
de pakketten per postcode gesorteerd en verpakt aan de Noorse PTT aangeboden
kunnen worden. Het complete systeem verwerkt meer dan 12.000 pakketten per uur.
De nieuwste, Nederlandse ALR versie stuurt een gelezen adres-code naar een
printer controller, die het bijbehorende adres opzoekt in een database. Dat
adres wordt geprint op een retour-enveloppe, die binnen in de bijbehorende
catalogus geplaatst wordt. Nadat de catalogus plus bijlagen ingepakt zijn in
papier, wordt het zelfde adres aan de buitenzijde op het pakket geprint.
Êtes-vous
prêts à
relever un défi?
Essayez alors de lire cet article en moins
de 36 secondes ! Nous ne vous demandons pas de comprendre le texte,
seulement de voir toutes les lettres. Vous pouvez même omettre les espaces et
les images. Prêt ? Démarrer votre chrono, scannez l’article et
vérifiez votre temps. Ensuite, vous pouvez reprendre votre lecture !
Alors, quel était votre temps ? Fort
probablement plus de 36 secondes. Du moins, si vous avez tenu jusqu’au bout…
Pourtant, un système de vision effectue cette même opération en moins de la
moitié du temps. Et sans jamais baisser les bras. Ne soyez toutefois pas
déçus : vous pouvez vous consoler en vous disant que vous, en tant que
personne, avez plein d’autres possibilités et facultés que n’aura jamais
un système de vision. Ainsi, vous pouvez par exemple comprendre le sens d’un
texte, comme vous le faites maintenant, tout en profitant d’une musique de
fond et en dégustant, éventuellement, une tasse de café.
Le Système de Vision Machines
En principe, un "Machine Vision System" (MVS) combine une caméra,
un ordinateur et un logiciel spécifique, utilisé pour extraire des
informations de son environnement. Le MVS est souvent utilisé pour contrôler
des produits (semi) finis sur une ligne de production. Il inspecte la dimension,
la forme, la couleur, l’intégralité, l’endommagement… des marchandises.
Dès que le MVS constate un écart négatif par rapport à la qualité
souhaitée d’un produit, il éjecte ce mauvais produit du convoyeur. Il évite
ainsi le traitement ultérieur d’un produit sans valeur ou encore que ce
produit incorrect ne vienne bloquer les machines de production automatiques
(comme les robots), qui se trouvent en aval sur la ligne de production. Les
systèmes de vision sont de plus en plus utilisés pour inspecter et identifier
les produits. A cet effet, ils doivent néanmoins pouvoir lire des textes et des
codes.
En règle générale, l’ordinateur de vision effectue sa lecture en trois
étapes :
- une image du texte doit d’abord être saisie par le système au moyen d’une
caméra vidéo industrielle et d’une électronique embarquée dans un
ordinateur ;
- ensuite, l’image doit être traitée pour en extraire des
informations ;
- finalement, le système doit décider, en fonction du décodage de l’information,
s’il y a lieu de prendre une action et, si oui, comment.
Ces étapes vous paraîtront probablement très logiques. Imaginez toutefois qu’en
tant qu’être humain cela vous a pris environ quatre ans pour apprendre à les
appliquer ! Examinons donc les possibilités (et problèmes) d’un
système de vision de lecture du point de vue de l’homme.
Saisir l’image
Si vous pouvez lire ce texte correctement, vous disposez d’un bon
éclairage. Les iris de vos yeux se sont adaptés automatiquement au niveau
lumineux. Vous avez éventuellement allumé une lampe ou seulement fermé un
rideau pour éviter d’être ébloui par le soleil. Par ailleurs, nous
supposons que vous pouvez déchiffrer clairement les lettres. Le cristallin de
votre œil a automatiquement changé de forme pour assurer la netteté optimale.
Vous avez, de même, tenu le papier à une bonne distance de vos yeux et
éventuellement mis des lunettes. Et finalement, vous avez sous les yeux un
texte facile à la lecture : le contraste entre l’encre des lettres et le
fond du papier est suffisant et la police, la taille et la couleur des lettres
garantissent une bonne lisibilité.
Quel rapport avec les Systèmes de
Vision ?
Pour capter une image, le MVS utilise une caméra vidéo CCD industrielle
dotée d’un objectif adéquat qui peut seulement analyser les produits sous de
bonnes conditions d’éclairage. La focale et le diaphragme de la lentille
doivent être bien réglés. La caméra est reliée à une carte d’acquisition,
une carte d’extension (basée sur un bus PCI) qui convertit les signaux de la
caméra en images numériques au sein de la mémoire du PC. Une des principales
tâches des concepteurs et constructeurs de systèmes de vision consiste à
définir la combinaison optimale de ces composants. La règle d’or lors de l’utilisation
d’un MVS est dès lors : si l’image caméra est insuffisante, vous n’en
retirerez aucune information utile. Plusieurs mesures s’imposent si l’on
veut des résultats optimaux.
Eclairage
Les meilleurs résultats de lecture sont obtenus avec un niveau de lumière
constant. C’est pourquoi on évite la lumière diffuse : dès que le
produit se trouve sous la caméra, il ne peut par exemple pas être éclairé
par un tube TL du hall de l’usine, qui clignote à 100 Hz. Il doit également
être protégé de la lumière du soleil, qui peut apparaître ou disparaître
de façon imprévisible suite à une quelconque nébulosité. L’emplacement de
lecture est donc protégé de toute lumière diffuse par un couvercle sombre et
illuminé par un système d’éclairage spécial placé dans le couvercle. La
forme et la place des lampes peuvent être adaptées de façon optimale aux
caractéristiques du produit. L’objectif, la caméra et la carte d’acquisition
possèdent différents réglages variables tel que l’iris (ou le diaphragme),
la vitesse d’obturation, le renforcement, le contraste et la balance des
blancs, qui peuvent généralement être modifiés par le logiciel du MVS. Cela
peut s’avérer nécessaire si le niveau de lumière change soudainement ou si
certains produits sont fabriqués dans une autre couleur.
Mise au point
Chaque objectif peut présenter des restrictions au niveau des distances de
mise au point : si la distance du produit est trop petite ou trop grande, l’objectif
ne peut fournir des images nettes. La plage dans laquelle l’objectif réalise
sa mise au point, la profondeur de champ de l’objectif, peut être ajustée en
modifiant la focale de l’objectif. Mais cette opération modifie
simultanément la grandeur de cette plage. La profondeur de champ de l’objectif
dépend également du diaphragme et de (l’éventuel) facteur de zoom. Jusqu’à
présent, la plupart des systèmes de vision pouvaient se contenter d’objectifs
standard car la taille des produits variait normalement si peu qu’ils
convenaient à la profondeur de champ d’un tel objectif. Aujourd’hui
toutefois, un même système doit de plus en plus analyser des systèmes
présentant des dimensions et des types très divergents. Ceci génère des
distances très fluctuantes entre le produit et l’objectif. Un système de
vision moderne doit donc pouvoir (automatiquement) adapter le réglage de sa
focale dès qu’il doit traiter un nouveau type de produit.
La qualité du texte
Le système de vision ne peut malheureusement influencer le texte à lire.
Il peut éventuellement mesurer la qualité et informer l’opérateur lorsque
celle-ci s’avère insuffisante : le contraste peut être trop faible, les
couleurs incorrectes ou les lettres abîmées. Certaines machines de vision sont
d’ailleurs seulement utilisées pour mesurer la qualité d’impression et pas
pour lire les textes.
Vitesse
Vos yeux ne souffrent pas du déplacement de l’image car votre cerveau
élimine le flou dû au mouvement. Hélas, une machine de vision ne peut imiter
ce processus qu’en utilisant des temps d’exposition très courts. Pendant
ces temps d’enregistrement ultra courts, le déplacement du produit sous la
caméra est tellement faible qu’il n’est pas perceptible. Cette technique
nécessite dès lors une grande quantité de lumière pour pouvoir réaliser une
image exploitable. Il est parfois nécessaire de recourir à des flashes.
Traitement de l’image
Vous avez déjà traité de nombreuses données en lisant la première
partie de cet article : vous avez fait glisser vos yeux sur les lignes du
texte, vous avez divisé les lignes en morceaux, vous avez reconnu ces morceaux,
vous les avez interprétés et compris leur sens. Ensuite, vous avez combiné
les significations et les notions et stocké une part (importante, espérons-le)
dans votre mémoire. Nous parlons explicitement de ‘morceaux’ de lignes car
vous ne lisez normalement pas les lettres les unes après les autres : vous
reconnaissez des mots complets, voire même des groupes de mots. Vous ne traitez
les lettres séparément que lorsque vous rencontrez un mot inconnu, comme par
exemple ‘TOT-RADE’. Il y a d’ailleurs une deuxième raison qui rend ce mot
peu lisible : il ne contient que des majuscules ce qui n’est pas normal
pour un mot d’une langue ‘occidentale moderne’. Mais comme les lettres
sont connues, que la police, la taille et la couleur sont correctes, vous avez
quand même essayé de lire ce mot, probablement en l’analysant une seconde
fois. Vous avez donc réduit votre vitesse de lecture et répété une de vos
actions. Un système de vision n’a pas droit à cette chance ! Chaque
produit sur le convoyeur ne passe qu’une seule fois devant la caméra. Et
toujours à la même vitesse (souvent élevée). Les performances requises d’un
système de vision sont dès lors souvent supérieures à celles de vos
yeux : le résultat doit être directement correct. Le MVS doit donc
pouvoir retirer de cette unique image du produit toutes les informations
nécessaires. Mais souvent, il n’est pas nécessaire de traiter toute l’image
numérique. Seule la partie pertinente, contenant le texte ou code à lire, doit
être traitée. Le logiciel du MVS recherche donc d’abord sur l’image les
places où se trouvent des formes ou tâches pouvant représenter des lettres ou
chiffres. Ensuite, une autre partie du programme essaie de reconnaître chaque
tâche trouvée. En fonction de la quantité de connaissances acquises par le
logiciel, le programme peut reconnaître des lettres de différentes polices et
tailles. Il peut également compenser, dans certaines limites, des écarts de
contraste, clarté et lumière ainsi que des petites détériorations des
lettres. Mais la reconnaissance ne se limite pas aux lettres et chiffres. Un MVS
peut également apprendre à lire des symboles. ‘@#$%&*’ peut ainsi
avoir une signification sensée (et ne pas seulement représenter une injure
dans une BD). Lorsque tous les caractères distincts sont reconnus, le MVS peut
éventuellement les combiner et/ou interpréter.
Que faire avec les nouvelles
informations ?
Après avoir extrait les informations du texte ci-dessus, vous pouvez
décider de ce que vous allez faire de vos nouvelles connaissances. Vous
pourriez prendre des notes ou appeler un fournisseur d’un système de vision
qui lit les textes. Votre décision dépend de toute façon (entre autres) de
vos intérêts.
Le MVS est programmé pour agir dans l’intérêt de son utilisateur. La
lecture automatique des textes peut par exemple servir à :
- identifier des produits spécifiques (sans devoir utiliser de codes-barres ou
de dotcodes)
- enregistrer toutes les données lues dans un fichier sur le disque dur d’un
PC (comme preuve que certains produits sont inspectés)
- envoyer les textes lus vers un autre appareil, comme un ordinateur hôte ou
une imprimante
- contrôler les codes sur des combinaisons spécifiques de lettres et/ou
chiffres
- décoder les données lues pour piloter la ligne de production et un système
d’emballage qui y est relié.
Ces actions et décisions sont normalement programmées dans une couche
logicielle située au-dessus du programme de lecture. De ce fait, seule la
couche application doit être adaptée si les exigences de l’utilisateur
changent. Un MVS pourrait ainsi par exemple être programmé pour débrancher
une partie du système de transport dès qu’il a lu le mot ‘tot-rade’ (sur
le dernier produit d’un lot). Avez-vous par ailleurs remarqué que vous êtes
maintenant capable de lire rapidement le mot ‘tot-rade’ ? (Il
signifie, en patois wallon, ‘à bientôt’). Cette fois-ci, votre vitesse de
lecture n’a pas été ralentie ou très peu. La vitesse de lecture d’un MVS
dépend de la même manière de la quantité de prérequis du programme. Elle
dépend néanmoins aussi des problèmes survenant pendant le processus de
lecture et de la quantité de fonctions présentes dans la couche d’application.
Dans des conditions normales, un MVS de base peut lire 1000 signes par seconde.
Applications des Systèmes de Vision
Machines
Au cours des 16 dernières années, la société DVS située à Breda a
développé plusieurs types de systèmes de vision, y compris des lecteurs de
texte. Ce développement est chaque fois le fruit d’une étroite collaboration
avec le client car chaque utilisateur a ses propres souhaits et exigences en
matière de fonctionnalité, d’interface utilisateur et de prix global. Outre
les lecteurs de texte (voir le cadre sur l’Automatic Label Reader), il existe
des machines de vision pour :
- l’identification d’articles et produits comme les circuits imprimés
- l’inspection de bouteilles et pots en verre en termes de saleté, écarts de
forme et tensions dans le verre
- le tri de plantes, semis, etc. en termes de dimensions, formes et/ou couleurs
- la mesure du volume de matériaux en vrac
- le calibrage et la surveillance de systèmes militaires
Le cadre ci-joint décrit plusieurs
exécutions d’un lecteur de texte, récemment fourni par DVS. Ceci vous donne,
dans la pratique, une idée des possibilités de traitement d’images des
systèmes de vision modernes. Comme vous l’avez constaté, une grande part de
la ‘technologie’ de nos yeux et cerveaux humains a été copiée et
reproduite dans les systèmes de vision (industriels). Ces machines jouent
déjà un rôle clé dans l’amélioration des systèmes de production et de
gestion de la qualité. Leur fonctionnement est optimal et fiable, 24 heures sur
24, 7 jours sur 7. Il nous reste pourtant un long chemin à parcourir avant que
ces systèmes ne présentent la même flexibilité que notre système d’observation
humain. Pour l’heure, il nous reste plus qu’un petit mot à lire :
tot-rade !
j.dorn@dvs.nl
ALR:
de Automatic Label Reader
Le contexte
Des publications comme les journaux, les périodiques, les catalogues et les
produits de direct mailing sont emballés sous film ou sous papier. L’adresse
est imprimée sur le produit ou reprise sur une étiquette collée sur le
produit. La société néerlandaise Buhrs-Zaandam conçoit, fabrique et fournit
plusieurs machines aux sociétés de mailing qui utilisent des combinaisons de
ces produits. Les publications sont dotées d’annexes et (éventuellement) d’étiquettes
d’adresse. Elles sont emballées, empilées et palettisées à une vitesse de
maximum 18.000 paquets par heure.
La problématique
Lors du développement d’un de ces derniers systèmes, l’Envelopper MTR,
Buhrs-Zaandam a été confronté à plusieurs exigences, qui ne pouvaient être
remplies que par un système de vision.
- Avant d’envoyer un produit, la qualité d’impression de tous les
caractères figurant sur l’étiquette d’adresse doit être
contrôlée ;
- Les adresses imprimées sur les produits deviennent invisibles lorsque ces
produits sont emballés dans du papier ou dans un film plastique non
transparent. Il faut donc imprimer une copie de l’étiquette d’adresse
originale à la fin de la ligne d’emballage et la coller sur le paquet.
- Les codes numériques uniques qui figurent sur les étiquettes d’adresse
doivent être lus et mémorisés pour pouvoir démontrer par la suite que ces
produits ont été traités.
- En fonction d’un code spécifique présent sur l’étiquette d’adresse,
il faut ajouter sélectivement plusieurs annexes au produit d’origine.
Pour répondre à toutes ces exigences, il est primordial que la machine puisse
lire fidèlement tous les textes lisibles par l’homme. Les clients des
sociétés de mailing veulent notamment toujours économiser de l’espace en
supprimant les codes-barres, les dotcodes ou les codes bidimensionnels. En
effet, l’information se trouve déjà dans le texte lisible qui est
indispensable au facteur.
La solution
La société DVS de Breda a donc développé un système flexible qui lit et
décode les adresses, les codes postaux et les codes d’envoi : l’Automatic
Label Reader (ALR). Ce système est composé d’un PC industriel doté d’une
carte d’acquisition rapide et flexible, d’une caméra CCD industrielle, d’un
éclairage spécifique continu et de différents logiciels applicatifs.
Le matériel de l’ALR est toujours identique ainsi que la partie élémentaire
du logiciel, le progiciel de Reconnaissance Optique de Caractères (OCR). Seule
la couche applicative du logiciel (ou la fonctionnalité du système) a toujours
été adaptée aux exigences spécifiques de l’utilisateur de l’ALR.
Les différents types d’ALR
DVS a par exemple fourni un ALR à une société anglaise, qui lit l’adresse
complète plus un ‘code de dépôt’ (au total, maximum 312 caractères) d’une
lettre qui se trouve dans une enveloppe à fenêtre, à une vitesse de plus de
8.000 enveloppes par heure. L’ALR se trouve au début du système de transport
et envoie les données lues à une imprimante qui imprime à la fin de la ligne
une étiquette supplémentaire. Cette étiquette servira de preuve de la bonne
réception de la livraison du produit au destinataire. Un autre type d’ALR lit
à Oslo un code d’envoi utilisé par un PLC pour ajouter des annexes
spécifiques au produit principal. L’ALR adapte le code à l’état actuel du
système. Le numéro d’une station qui devrait ajouter une certaine annexe
mais qui est momentanément vide peut ainsi être remplacé par le numéro d’une
station de back-up.
L’ALR compare en outre les codes postaux des étiquettes d’adresse qui se
suivent. Les paquets sont livrés à la poste norvégienne, triés par code
postal et emballés. Le système traite plus de 12.000 paquets par heure.
La toute dernière version néerlandaise envoie un code d’adresse lu à un
contrôleur d’imprimante qui recherche l’adresse en question dans une base
de données. Cette adresse est imprimée sur une enveloppe retour, placée dans
le catalogue annexe. Après l’emballage sous papier du catalogue et des
annexes, la même adresse est imprimée sur la face extérieure du paquet.
|