Aujourd'hui, grâce à des avancées majeures dans les capacités d'intelligence artificielle, les technologies basées sur la vision par ordinateur (CV) sont devenues des fonctionnalités clés de nombreuses applications et appareils, y compris ceux que les gens utilisent tous les jours.
Les logiciels biométriques de reconnaissance faciale n'existeraient pas sans la vision par ordinateur. Les voitures autonomes en ont besoin pour conduire en toute sécurité. La vision par ordinateur est nécessaire à la fois pour l'analyse d'images médicales et les processus d'inspection robotique d'assurance qualité. Mon entreprise, Shopic, utilise la vision par ordinateur pour identifier les articles placés dans des chariots d'autocollants.

Ces technologies utilisent essentiellement la vision par ordinateur pour automatiser des processus utiles en utilisant des données visuelles en entrée. Les systèmes comprennent du matériel de numérisation et des algorithmes qui permettent aux machines d'analyser, de traiter et d'extraire des informations à partir d'images et de vidéos numériques. Il s'appuie fortement sur l'apprentissage automatique, l'apprentissage en profondeur et les réseaux de neurones complexes.
Ces derniers mois, la vision par ordinateur s'est développée de manière nouvelle et passionnante. Pour certains, ces changements sont également troublants, mais je vois un potentiel et une opportunité dans ce domaine. Vous trouverez ci-dessous certaines des principales tendances qui, selon moi, domineront l'industrie à ce stade et dans un avenir prévisible.
L'obtention du seuil est progressivement abaissé
Les progrès continus du stockage en nuage en périphérie ont permis à des appareils de périphérie tels que des caméras numériques et des capteurs de vision d'exécuter le traitement de la vision par ordinateur sur site plutôt que de l'envoyer dans le cloud. Cela déplace le traitement de l'IA de la vision par ordinateur vers les appareils périphériques, ce qui réduit la latence et réduit la consommation d'énergie et de bande passante. Des entreprises telles que Nvidia développent des services cloud en périphérie pour améliorer le déploiement des ressources de vision par ordinateur. Se débarrasser du traitement et du stockage coûteux dans le cloud réduit le coût d'adoption et rend les systèmes CV plus accessibles et abordables. Le passage au traitement en périphérie améliore également la confidentialité des données pour les applications de vision par ordinateur, en surmontant les problèmes de conformité qui ont déjà entravé l'adoption par de nombreuses entreprises.
Les applications de vision par ordinateur se développent
À mesure que les obstacles à l'adoption diminuent, de plus en plus d'industries mettent en œuvre la vision par ordinateur dans de plus en plus de cas d'utilisation. La santé est un domaine désireux d'adopter la vision par ordinateur, qui pourrait permettre des diagnostics d'imagerie plus précis et des services médicaux à distance, avec la promesse d'une chirurgie assistée par robot.
Nous avons assisté à la croissance des cas d'utilisation de la vision par ordinateur dans le secteur de la vente au détail, y compris les systèmes d'achat en libre-service et les magasins sans caissier. Les véhicules autonomes et les équipements de sécurité routière utilisent la vision par ordinateur pour améliorer la sécurité, les agriculteurs utilisent la vision par ordinateur pour la surveillance des cultures et la détection des maladies, et les systèmes VSLAM utilisent la vision par ordinateur pour fournir une cartographie plus précise pour les secours en cas de catastrophe, les prévisions météorologiques, etc.
Au fur et à mesure que les cas d'utilisation continueront de s'accumuler, le marché de la vision par ordinateur se développera. Global Data prévoit que le marché de la vision par ordinateur passera de 17,73 milliards de dollars en 2023 à 30,3 milliards de dollars en 2026.
le système devient plus complexe
À mesure que les algorithmes d'intelligence artificielle qui sous-tendent les solutions de vision par ordinateur deviennent plus puissants, les systèmes de vision par ordinateur amélioreront leur capacité à reconnaître les objets et les visages. Cela permettra aux systèmes de vision par ordinateur de détecter plus précisément les émotions et de suivre les mouvements du corps, ouvrant de nouvelles capacités pour les informations comportementales et la détection des anomalies. Alors que la surveillance des individus est très problématique et a fait l'objet d'un examen minutieux ces dernières années, l'analyse anonymisée des sentiments de la foule est l'un des cas d'utilisation éthique.
Nous voyons également des systèmes de vision par ordinateur développer des modèles et des méthodes de traitement d'images innovants. Le "modèle d'attention" d'aujourd'hui est essentiellement une technique de traitement d'entrée qui permet à un réseau de neurones de se concentrer sur des parties spécifiques d'une image ou d'une vidéo complexe, permettant aux systèmes de vision par ordinateur de comprendre chaque partie d'une image occupée ou d'une fréquence initiale. De plus, les "réseaux de neurones graphiques" appliquent des prédictions d'apprentissage en profondeur à des structures de données riches en relations, améliorant la vision par ordinateur, la compréhension et l'interprétation du contexte.
La connexion de données visuelles à d'autres sources de données peut enrichir le contexte général et la compréhension des événements, tout comme les humains combinent la vision avec le sens du vent, la perception de la vitesse et les sons de fond ambiants pour comprendre le monde qui les entoure. De cette façon, les solutions de CV peuvent comprendre et extraire des informations sur l'ensemble de la scène dans un contexte plus large, pas seulement sur des segments sélectionnés
Cette maturité permettra une interprétation et une analyse plus précises, une prise de décision améliorée et une plus grande utilité dans des situations complexes et en évolution rapide telles que les usines de fabrication occupées ou les rues de la ville.
La RA entre dans une nouvelle ère
Les solutions de réalité augmentée (AR) d'aujourd'hui peuvent produire un rendu 3D interactif de n'importe quel environnement du monde réel, avec des ajustements limités effectués en suivant l'évolution de la lumière sur des surfaces planes. Ils peuvent répondre aux mouvements des utilisateurs grâce au suivi de la tête et aux contrôleurs, mais pas beaucoup plus.
Cependant, l'intégration des caméras de vision par ordinateur avec des solutions de suivi oculaire et des gyroscopes commence à produire des systèmes plus complexes. Les solutions de vision par ordinateur améliorée (CV-enhanced AR) peuvent percevoir l'ensemble de l'environnement de l'utilisateur, guider l'utilisateur pour éviter les obstacles, ajuster l'environnement virtuel en fonction des mouvements du corps de l'utilisateur, etc.
Cela a des implications importantes pour les appareils d'assistance, les applications de navigation et les expériences de jeu/métavers.
des défis demeurent
Malgré les formidables développements et les promesses de la vision par ordinateur, les leaders du domaine sont encore confrontés à certains défis. Étant donné que la vision par ordinateur est un domaine relativement nouveau dans le monde commercial, il y a une pénurie d'experts pour le développer et le déployer à grande échelle. Les entreprises doivent perfectionner leurs employés pour répondre à ces exigences.
En tant qu'industrie, nous devons également mieux résoudre les problèmes liés à la confidentialité, à la confiance et à l'utilisation éthique. La clé est d'avoir une collecte de données rigoureuse, soit totalement opt-in, soit véritablement anonymisée. Les systèmes de vision par ordinateur doivent se conformer à l'évolution des réglementations en matière de confidentialité et aux demandes du public en matière de confidentialité.
"Il y a un besoin croissant de transparence et d'explicabilité dans l'IA. La vision par ordinateur ne peut pas être simplement une boîte noire, mais les modèles d'IA sur lesquels elle s'appuie sont si complexes qu'il est difficile de les rendre explicables." Les personnes responsables de la mise en œuvre des systèmes d'IA feront un effort supplémentaire pour s'assurer qu'elles peuvent expliquer comment les décisions ont été prises et quelles informations ont été utilisées pour les prendre. "Mais à mesure que la vision par ordinateur devient plus complexe, les défis augmentent", écrit Bernard Marr.
La vision par ordinateur en est encore à ses balbutiements
Comme d'autres solutions d'IA, la vision par ordinateur progresse à la vitesse de la lumière, avec de nouvelles approches, applications, cas d'utilisation et capacités qui émergent constamment. Dans un environnement en évolution aussi rapide, il est difficile de prédire ce qui se passera à l'avenir.
Bien qu'il reste encore de nombreux défis à relever, notamment en matière de confidentialité et d'utilisation éthique, les systèmes de vision par ordinateur promettent de fournir de nouvelles capacités à de nombreuses industries, ouvrant de nouvelles opportunités pour toutes les parties concernées.






