I processen att gå mot intelligensens era behövs inte bara AI-teknik, utan också en serie dator-, avkännings- och anslutningstekniker som är kompatibla med AI. Bland dessa är 3D-avkänning särskilt avgörande. Om man tittar på några av de mest populära områdena idag, som intelligenta robotar, autonoma fordon, XR (inklusive VR, AR och MR), och metaversen, som för närvarande är det hetaste ämnet, kräver alla 3D-avkänning.
Men under lång tid användes 3D-maskinseende främst för övervakning i smarta städer och lyckades inte hitta tillämpningar inom fler områden. Det finns många anledningar till detta, inklusive kostnad, teknisk mognad och hindren för att använda 3D-visionschip.
För att övergå från 2D till 3D och uppnå ett språng i kvaliteten och kvantiteten av information som inhämtas, måste en enorm teknisk klyfta överbryggas. Endast med mogna 3D-maskinseendeprodukter kan dessa marknader snabbt anta 3D-maskinseende i stor skala. Världens enda enda-chiplösning som integrerar 3D-djupavkänning, SLAM (Simultaneous Localization and Mapping) och AI-funktioner, när den marknadsförs och tillämpas på den kinesiska marknaden, kommer att påskynda den explosiva tillväxten av 3D-maskinseende.
3D Machine Vision välkomnar en möjlighet till explosiv tillväxt
Varför är 3D-maskinseende svårt att popularisera?
Den berömda psykologen Treicher verifierade en gång en uppsättning data: 83 % av informationen som människor får kommer från synen och 11 % från hörseln. För att uppnå maskinintelligens och gå mot den intelligenta eran är visuell information helt klart avgörande, särskilt 3D-seende.
Till exempel, det hetaste ämnet i år, metaversen, kräver XR (Extended Reality), som är nära relaterat till 3D-vision, för att kartlägga den verkliga världen i den virtuella världen. VR upplevde en investeringsboom 2015 och året därpå, 2016, kallades VR för "VR:s år".
Men på grund av problem som åksjuka orsakad av VR-enheter och otillräckligt innehåll, blev 2016 inte "VR-årets år". Det var inte förrän 2021, när Meta sålde 10 miljoner Oculus Quest 2 VR-headset, som branschen trodde att XR hade gått in i en ny period av explosiv tillväxt.
Autonoma fordon och intelligenta robotar är också typiska områden som kräver 3D-seende, men de möter alla utmaningar. Inom området för autonoma fordon kräver användningen av en rent 2D-visionslösning, oavsett om det är kameror eller lidar, enorma mängder data, vilket innebär enorma kostnadsutmaningar. Den 3D-visionsteknik som krävs i robotar är också svår att tillämpa i stor skala på grund av tekniska och utvecklingssvårigheter.
"3D-seende är inte bara en fråga om chips eller algoritmer, det involverar också relaterade frågor som optik, struktur och värmeavledning. Det komplexa tekniska systemet som består av chips och algoritmer gör att 3D-visionschips och -lösningar har mycket höga tekniska barriärer, vilket kräver mer tid, teknik och talanginvesteringar."
"Oavsett om en bra teknik och en framgångsrik produkt i slutändan kan driva utvecklingen av hela ekosystemet, finns det ett enormt gap däremellan, och detta gap beror förmodligen till 90% på mjukvarans arbetsbelastning." Bai Yi sa vidare, "Endast genom att tillhandahålla en komplett lösning på systemnivå på-nivå kan marknadens krav tillgodoses. Vi tror också att binokulär 3D-seende kommer att minska kostnaderna för artificiell intelligens maskinseende." Den höga tekniska barriären inom detta område innebär att endast ett fåtal företag med extremt starka tekniska och produktiva kapaciteter kan verka inom det, vilket hindrar den snabba populariseringen av 3D-visionsteknologi. Ett bra exempel är Apples förvärv av det israeliska 3D-chipföretaget PrimeSense för 360 miljoner dollar och dess efterföljande patentering av tekniken, vilket möjliggör Face ID 3D-ansiktsigenkänningsfunktionen på iPhones. Andra tillverkare, som saknar liknande teknik och produktleverantörer, har svårt att implementera 3D-igenkänningsfunktioner på sina telefoner jämförbara med Apples.
Inom områdena XR, autonoma fordon och intelligenta robotar ser marknaden uppkomsten av ett 3D-visuellt AI-chip som integrerar flera funktioner, vilket potentiellt driver en ökning av 3D-seendet i dessa områden.
3D Machine Vision är redo för ett genombrott
Att integrera dessa funktioner på ett enda chip är mycket utmanande, eftersom det kräver samtidig integration av många tekniker, inklusive datorseende, artificiell intelligens, optik, systemarkitektur, inbyggd systemmjukvara, edge computing och chipdesign. NU4000, som kombinerar Inuitives unika 3D-avkänningsteknik med SLAM och asynkron tidsförvrängningsteknologi (som kan generera mellanliggande bildrutor om videobildhastigheten är otillräcklig, vilket minskar bildflimmer och yrsel, och uppnår en fördröjning på mindre än 1 millisekund från rörelse till skärmreaktion, och har integrerats sedan dess lansering på marknaden).
Intelligent Robot 3D Vision kommer att bli den första som exploderar
"Även den bästa tekniken kan inte implementeras om kostnaden är för hög eller om det inte finns något marknadsfokus", sa Qu Guancheng vidare. "Anledningen till att vi först lanserade robotmodulen på den kinesiska marknaden är å ena sidan på grund av pandemin att marknadens efterfrågan på tjänsterobotar har visat explosiv tillväxt. Å andra sidan har marknadsledarnas strategiska anpassningar också gett oss stora möjligheter."
Enligt "China Robot Industry Development Report (2021)" förväntas den globala robotmarknadens storlek uppgå till 33,58 miljarder dollar 2021. År 2021 kommer den kinesiska tjänsterobotmarknaden att nå 30,26 miljarder yuan, högre än tillväxttakten för den globala tjänsterobotmarknaden; år 2023, med den snabba utvecklingen av nya scenarier och produkter som vision-styrda robotar och följeslagare tjänsterobotar, förväntas den kinesiska tjänsterobotmarknaden överstiga 60 miljarder yuan.
"Vår C158-modul kan förstås som ett allmänt-chip plus en dedikerad modul. Den passar behoven hos de flesta kunder inom området intelligenta robotar, medan kunder inom andra områden kräver dedikerade moduler." På grund av mångsidigheten hos vårt NU4000-chip är iterationscykeln för moduler baserade på detta generella-chip bara några månader, mycket kortare än chipets iterationscykel. Därför kan vi, genom att kontinuerligt iterera på modulerna, inte bara bättre möta behoven på samma marknad utan även expandera till nya marknader.
Mognad och utbredd tillämpning av ny teknik kräver en kombinerad effekt av olika faktorer. Teknisk mognad och kostnad är två nyckelfaktorer. Tidigare stod 3D-maskinseendeprodukter inför betydande utmaningar i stor-applikationer på grund av otillräcklig produktintegrering och svårigheter att använda.
Inom de förutsebara 3-5 åren kommer 3D-maskinseende också att tillämpas i stor utsträckning inom områden som assisterad körning i låg hastighet och VR/AR, och tillsammans med andra dator-, avkännings- och anslutningstekniker kommer det att driva på den explosiva tillväxten av 3D-maskinseende, vilket leder till en mer intelligent era.

