Kaj je globoko učenje AF: kako deluje Canonovo samodejno ostrenje z umetno inteligenco?

Canon je sprožil veliko hrupa zaradi svojega novega sistema globokega učenja AF, ki je v središču najnovejšega proizvajalčevega vodilnega profesionalnega fotoaparata. Sliši se neverjetno pametno, vendar je veliko vprašanj - kaj je poglobljeno učenje? Kdo poučuje? Ali se sistem uči, ko streljate? Je to res umetna inteligenca v fotoaparatu? Ali dejansko izboljša samodejno ostrenje?

Če ste prebrali naš pregled Canon EOS-1D X Mark III, boste vedeli, da je odgovor na zadnje vprašanje odločno pritrdilen. Kar zadeva odgovore na druga vprašanja o globokem učenju AF, si privoščite pijačo in prigrizek ter preberite …

Mehanika samodejnega ostrenja Canon EOS-1D X Mark III je neverjetno pametna in podpira dva posamična sistema AF. Prvi je optični sistem, ki skozi iskalo posname 16 sličic na sekundo z merilnim senzorjem s 400.000 slikovnimi pikami v povezavi z namenskim procesorjem Digic 8 za 191-točkovni AF, ki omogoča sledenje obrazov.

Potem je tu še sistem Live View, ki lahko posname 20 sličic na sekundo in uporablja vseh 20,1 milijona slikovnih pik slikovnega senzorja v kombinaciji z novim procesorjem Digic X za 3.869 točk CMOS z dvojnimi slikovnimi pikami, ki lahko samodejno zaznajo oči v celoti.

Oba od teh sistemov poganja Canonova jedrna tehnologija EOS iTR AFX - najnovejša ponovitev njegovega inteligentnega sledenja in prepoznavanja samodejnega ostrenja, ki je prvič nastopil v prvotnem EOS-1D X (in se nato prebil do družin 7D Mark II in 5D). In znotraj njegovega vezja je pokopan algoritem globokega učenja.

Poglobljeno učenje NI enako kot umetna inteligenca

Najprej je treba pojasniti, da globokega učenja ne smemo zamenjati z umetno inteligenco (AI). Sistem umetne inteligence je nekaj, kar je v stalnem razvoju. Globoko učenje ali strojno učenje je podskupina umetne inteligence.

Za razliko od prave umetne inteligence je globoko učenje zaprt proces. Gre za algoritem pred sestavljanjem, ki arhitekturi kamere omogoča, da se v bistvu uči sama, veliko hitreje, kot bi jo lahko ročno programirali človeški inženirji. Ko je to učenje končano, se zaklene in naloži v kamero.

Od tega trenutka učenje ni več mogoče; kljub imenu - in Deep Learning je ime tehnologije, ne opis postopka - fotoaparat se nenehno ne uči in ne bo 'boljši', ko več fotografirate (resnični sistem umetne inteligence bi se naučil čim več svojih slabih navad kot svoje dobre!).

"Učili so se," pojasnjuje Mike Burnhill, vodja tehnične podpore za Canon Europe. "Vstavite ga v računalnik, ta ustvari algoritem, ki se nato naloži v fotoaparat. Torej se razlikuje od umetne inteligence - umetna inteligenca se nenehno uči; globoko učenje je v bistvu samostojno in daje končni rezultat, ki se nato naloži v kamero. "

Kar postavlja vprašanje: ali je toliko podjetij, ki kričijo o funkcijah, ki temeljijo na umetni inteligenci, dejansko sposobna podpirati umetno inteligenco?

"Procesorska moč za resnično umetno inteligenco v fotoaparatu ni izvedljiva," pravi Burnhill. "Če želite to narediti, obstajajo telefoni - vendar podatkov ni v vašem telefonu, ampak v Silicijevi dolini. Tam je sistem AI. Samo, vaša telefonska povezava se povezuje z njim - ni tukaj, tam je (v oblak), ker potrebujete strežnik. Lahko bi naredili kamero, vendar bi ves čas vlekli velikanski primer leta. "

Kako se uči globoko učenje?

Torej, algoritem globokega učenja se uči sam - toda od kod se dejansko uči? Odgovor je preprost, "od najboljših".

"Canon je sodeloval z našimi agencijami," nam pove Burnhill. "V bistvu smo prejeli dostop do njihove celotne zbirke slik športnih fotografij od vseh večjih agencij, sodelovali smo z našimi veleposlaniki, ki streljajo šport, in zagotovili njihove slike različnih tem, kar nam je omogočilo, da smo ta sistem AF naučili, kako prepoznati ljudje v športu. "

Šport je očitno ciljna metoda poučevanja, ker je Canon EOS-1D X Mark III predvsem športna kamera. Težava je v tem, ali gre za košarkarja, obrnjenega stran od kamere, smučarja v očalih ali voznika formule ena v čeladi, saj imajo ljudje v športu pogosto zakrite obraze - kar pomeni, da tradicionalni AF za zaznavanje obraza ali celo oči ne ne bo delovalo in kamera se bo namesto tega zaklenila na stvari, kot so številke na uniformi igralca.

Z omogočanjem algoritma za globoko učenje dostopa do obsežne knjižnice slik, vse od obrnjenih telovadcev do hokejistov, ki nosijo blazinice in čelade, se je sposoben naučiti in razlikovati človeško obliko v neskončnih različnih situacijah - in na koncu je sposoben za izvedbo tega "odkrivanja glave", tako da je tudi, če obraz osebe ni viden, glava vedno glavna točka ostrenja.

"Poglobljeno učenje je v bistvu nekaj podob, ustvariš nabor pravil, po katerih se lahko uči, nato pa gre in ustvari svoj algoritem," nadaljuje Burnhill. "Torej nastavite parametre, kako bi bila oseba videti, greš:" Tu je oseba ", nato analizira vse podobe ljudi in reče:" To je oseba "," To je oseba ". gre skozi milijone slik v določenem časovnem obdobju in ustvari to bazo podatkov, ki se uči sama. "

Dejansko algoritem dejansko ustvari dve zbirki podatkov - eno za servisiranje sistema AF z optičnim iskalom in merjenje z uporabo Digic 8 in drugo za servisiranje AF AF v živo, ki uporablja Digic X. Ker je Digic X tisti, ki opravi vsa izračunavanja za sledenje glavi, ko algoritem AF zazna osebo v kadru, se vse premakne na novi procesor.

"Ko enkrat osebo vključiš, dejansko poteka dvojna obdelava," pravi Burnhill. "Tu sta dve zbirki podatkov, ker se bosta vhodna sporočila obeh senzorjev nekoliko razlikovala, zato bo način prepoznavanja nekoliko drugačen, zato gre za podskupine istega algoritma. Osnovni podatki za oba so enaki, samo kako ga bomo prepoznali in nanj uporabili prave podatke. "

Če se ne more naučiti novih stvari … kaj pa AF z živalmi?

Canon EOS-1D X Mark III seveda ni le športna kamera - njegovo drugo ključno občinstvo so strelci na prostoživeče živali. Vendar kamera nima možnosti samodejnega ostrenja živali in ugotovili smo, da se globoko učenje dejansko ne more naučiti nobenih novih trikov, ko je vpeto v kamero. Torej je to to? Se ob vsej tej modni novi tehnologiji fotoaparat sploh ne bo osredotočil na družinskega psa?

Res je, da trenutno kamera nima AF z živalskim (ali živalskim očesom). "V bistvu se osredotočamo na ljudi, s katerimi začnemo, da ta algoritem najprej deluje," odgovarja Burnhill. "Zato smo se nekako osredotočili na šport, saj je to določen parameter in ga lahko naučimo v določenem časovnem obdobju,"

Odgovor je torej v vdelani programski opremi. Burnhill je potrdil, da obstaja možnost, da se kamera še bolj poglobi, za stvari, kot so ptice in prostoživeče živali, in da se ta posodobljeni algoritem razširi med uporabnike s posodobitvami vdelane programske opreme - čeprav konkretnih načrtov za objavo ni.

"Ves čas ga bomo razvijali, zato trenutno še vedno ni določeno, kako in kam gremo. Toda razvojna skupina gre in si ogleduje druge fotografije živali - zavedamo se, da je cel kup polj, a očitno je veliko te kamere se osredotočajo na šport in nato na prosto živeče živali, očitno pa je bila pri Tokiu 2022-2023 to prednostna naloga. "

Pošteno je; če bi Canon čakal, da se Deep Learning nauči vsega, bi trajalo dlje, da se sprosti fotoaparat. In čeprav se proizvajalci, kot je Sony, v svojih fotoaparatih ponašajo z nekaj selektivnimi AF za živali, Burnhill ugotavlja, da bi Canon raje izdal popolno rešitev za AF za živali kot pa selektivno, po delih. In tu bo globoko učenje postalo neprecenljivo.

"Težave so z divjimi živalmi, obstaja veliko različnih živali - očitno imate plenilce z očmi spredaj, potem pa imate zajčke ob strani, imate kače, imate ptice … ni sistema, ki bi prepozna obraze vseh živali. In tam vstopite v celotno globoko učenje, pri poučevanju sistema, da prepozna te zapletene stvari. "

Čeprav bo vaš Sony morda lahko sledil vašemu psu ali mački, ne pa tudi salamanderju ali flamingu, Canon želi izdelati fotoaparat, ki naredi vse ali nič. "Če bi to počeli, bi to radi naredili za čim širši spekter - nočemo narediti pasu prijaznega in mačji fotoaparatu, želimo narediti živalim prijazen fotoaparat ki deluje za širok spekter živali, ki bi jih (strokovnjaki) odstrelili. "

Pregled Canon EOS-1D X Mark III
Kako je Canon izdelal najhitrejši DSLR sploh? S preoblikovanjem zrcalne škatle
102 posodobitve za Canon EOS-1D X Mark III

Zanimive Članki...