Da câmera ao mapa tridimensional: como os robôs aprendem a enxergar

Da câmera ao mapa tridimensional: entenda como os robôs aprendem a enxergar

[{"selector":"#anim-7c478431-a9c7-4543-bd77-1ff1d9a210f5","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-93c746e9-2a19-4557-a04c-8f14449e9360","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-8ebb2411-e303-4d70-a8eb-7794628cc953","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-c4a434f4-0ca5-4ada-8ee8-681324a6aa5d","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Pavel Danilyuk/Pexels

[{"selector":"#anim-9968b734-7715-408b-a496-d49753893195 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(44.85945434944867%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-be70c56f-eec6-4f5c-ab63-439d231b9a40","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-c97f2c00-c023-410e-a8ba-728176a0e771","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-e4035996-c44e-43ba-8fb4-e27f967f6fe7","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-f5ee555f-2d64-42cd-949a-292c600ed483","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Um robô aspirador que desvia do sofá, um carro que freia sozinho antes de um pedestre, um sistema hospitalar que detecta sinais de doença em uma tomografia antes do médico: essas situações têm em comum uma tecnologia que avança silenciosamente em velocidade acelerada: a visão computacional Ron Lach/Pexels

[{"selector":"#anim-0a6ea644-1058-4f25-bd35-dba9cae08baa [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(-0.2828305282420686%, 3.668478673095195%) scale(0.8695652173913043)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-6f78a33b-bd4e-469b-bcb7-a114518f5374","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-4cc36818-642b-4322-8660-71eee86e626f","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-fd1bc46e-9aaa-4d48-8247-6c22f60b5a20","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-0810e0da-2cb6-449c-b903-aa5bababc29f","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] A área, que permite que máquinas interpretem imagens e vídeos de forma automatizada, deixou de ser um campo restrito a laboratórios de pesquisa e ganhou escala em setores que vão da saúde à agricultura cottonbro studio/Pexels

[{"selector":"#anim-8dbea781-7f1d-47b9-b078-f7b5e58d71d1 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(0, -1.834238602785981%, 0)","translate3d(0, 0%, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-1d774007-9306-4950-a3c5-d1a4a6ded0c9","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-ac1ebdbc-fead-4f4f-967a-4c8444c43a89","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-061aff02-4591-45dd-a1c0-dd1ca8edbd11","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-161dd2ba-b4f9-4c73-8f35-982b041d27f7","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Segundo levantamento da Fortune Business Insights, o mercado global dessa tecnologia era avaliado em US$ 20,75 bilhões (cerca de R$ 114,1 bilhões) em 2025 e deve saltar para US$ 72,80 bilhões (R$ 400,4 bilhões) até 2034 Kindel Media/Pexels

[{"selector":"#anim-5780d574-30d9-45bd-8118-48f2ddac255e [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(17.50916167860395%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-63d9610b-b199-494d-ad84-c9fabb6304e4","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-be2bb27d-aa4c-4fd7-9952-d22aca145dbe","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-5e44bfcc-1c7d-447f-81c7-b4ac4a3720e3","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-b11b5090-20ea-43c2-9dda-99e5840ed42d","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] A visão computacional é o campo da inteligência artificial que treina computadores para interpretar e compreender o mundo visualmente. Diferente de uma câmera comum, que registra e armazena imagens, um sistema de visão computacional analisa o conteúdo do que está à frente Pavel Danilyuk/Pexels

[{"selector":"#anim-3e051e76-17f3-4d27-a689-2287b5279597 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(0, 4.89130434782609%, 0)","translate3d(0, 0%, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-4e113967-ddd2-426b-b018-f63f4e1c84f1","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-d16037ef-ccc5-46b2-8088-71f0394040a1","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-9a072467-8506-489c-86a1-a2411cec65b9","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-2eeef8d0-6d42-40ae-99ff-050f333dc488","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] O processo começa nos sensores. Câmeras RGB tradicionais capturam cores como qualquer câmera convencional. Sensores infravermelhos conseguem operar no escuro ou detectar variações de calor Kindel Media/Pexels

[{"selector":"#anim-732bbc0b-c5f8-47fc-a972-036998ab1a8a [data-leaf-element=\"true\"]","keyframes":{"transform":["translate(4.856899492347601%, 6.521738602786001%) scale(0.8695652173913043)","translate(0%, 0%) scale(1)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-47657300-1492-4382-93ab-afbb3cec4316","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-99537061-4c9a-422d-96cc-5c76a741ef56","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-4c63a45e-2401-4378-ab0f-b01e1794f91c","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-f55a49e3-4133-460a-8218-a7fa79488430","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Para tarefas que exigem noção de profundidade e posição espacial, entra em cena outra categoria de equipamento. Os modelos mais simples, presentes em robôs aspiradores domésticos, estimam a distância entre objetos para desviar de obstáculos Tahir Xəlfə/Pexels

[{"selector":"#anim-7c6d2d86-7ae9-477a-a8a0-82cc784c5cd2 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(-32.15239607587614%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-e2512247-0cbb-46f2-a9e2-638750798c15","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-d51bd29b-753a-406d-8714-3c3293eec6b8","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-4046bec5-3c11-48fc-9d96-86f5af15d53c","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-d56201e2-5d28-45c4-a1ae-f50d6f865553","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Capturar imagens é apenas o primeiro passo. O que diferencia um robô com visão computacional de uma câmera de segurança comum é a camada de interpretação. É aqui que entra a inteligência artificial, especificamente as redes neurais profundas Towfiqu barbhuiya/Pexels

[{"selector":"#anim-4b4423e6-2f9c-4bfe-ba4e-68f3def7cdef [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(0, -12.913722298438163%, 0)","translate3d(0, 0%, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-d634eaa1-2fab-4009-85a6-0fa730b5399b","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-386f7396-c004-4d41-9b2f-a04d8be88f18","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-87f030ce-66bd-485c-8265-14f62801fb6e","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-1dffcfde-27ae-4fe8-9a41-56113e216001","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Essas redes são treinadas com milhões de imagens rotuladas. Após esse processo, elas conseguem reconhecer que determinadas combinações de formas, cores e texturas correspondem a um pedestre, uma placa de trânsito, um tumor em uma imagem médica ou uma peça defeituosa em uma linha de produção Divulgação/Hexagon

[{"selector":"#anim-a3712192-6260-47c3-a5b5-8cb1ec75dea5 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(39.68976859666283%, 0, 0)","translate3d(0%, 0, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-2c7e9bc2-8b37-4fd4-8258-5d32fea62f4d","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-05306c1c-864d-4168-a033-3a790b292204","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-3c33689d-d4de-4570-89a3-2667c9a66699","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-77526a79-c1ad-4411-9686-4376641de75b","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] Além de identificar o que está à volta, os robôs mais avançados constroem mapas do ambiente enquanto se movem e, ao mesmo tempo, se localizam dentro desses mapas Vithun Khamsong/Getty Images

[{"selector":"#anim-f6af1bd4-9e02-4a39-96d8-e561c3c2eb61 [data-leaf-element=\"true\"]","keyframes":{"transform":["translate3d(0, 13.043478260869568%, 0)","translate3d(0, 0%, 0)"]},"delay":0,"duration":2000,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-f123ed9f-4864-468d-b746-edb3af4b839c","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-37a2f8b6-c4a8-4d0a-8931-c1cdcbaaeb54","keyframes":{"opacity":[0,1]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"both"}] [{"selector":"#anim-17897903-a616-43c3-be8e-8d5f693655e7","keyframes":{"transform":["scale(0.3333333333333333)","scale(1)"]},"delay":0,"duration":500,"easing":"cubic-bezier(.3,0,.55,1)","fill":"forwards"}] [{"selector":"#anim-bbd3a0fb-51e5-4daa-b168-fd3fc464787e","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] A visão computacional não é mais uma promessa de futuro. Ela já opera em ambientes críticos e cotidianos simultaneamente. Em veículos autônomos, o sistema precisa reconhecer faixas de pista, placas de trânsito, pedestres, ciclistas, outros veículos e condições climáticas, tudo isso enquanto o carro está em movimento, em milissegundos Pavel Danilyuk/Pexels

CNNBRASIL.COM.BR

[{"selector":"#anim-6f0cd7a7-1b11-452d-b270-753f898f3b71","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-9a3df716-e2c6-410c-ac1c-cd9ab4213288","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.4, 0.4, 0.0, 1)","fill":"both"}] [{"selector":"#anim-06cc80f8-25e2-477f-9847-a722fd71deb8","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-b8bc79cb-fdfc-431b-b556-08d8eaf24ea9","keyframes":{"transform":["translate3d(0px, 1483.57597%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-473fb419-356f-441d-ac85-54f714e51270","keyframes":{"opacity":[0,1]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-2e16ac05-377e-4193-8f4e-d8f3d3d68b4a","keyframes":{"transform":["translate3d(-117.84387%, 0px, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":600,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-30fbbecb-b4d8-4b49-9ad3-d4d8da8d6abf","keyframes":{"opacity":[0,1]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] [{"selector":"#anim-454ded98-5ea8-49c0-b0d6-0eae3c4495c2","keyframes":{"transform":["translate3d(0px, 883.95105%, 0)","translate3d(0px, 0px, 0)"]},"delay":0,"duration":1000,"easing":"cubic-bezier(0.2, 0.6, 0.0, 1)","fill":"both"}] leia mais em Alexandra Bilham/Pexels