Mākslīgais intelekts ģenerē cilvēku sejas no dažu pikseļu fotoattēliem

Mākslīgā intelekta tīkli ir iemācījušies jaunu triku. Tie spēj radīt fotoreālistiskas sejas, izmantojot tikai dažus pikseļus. Sejām tiek pievienotas arī tādas iezīmes kā skropstas un grumbiņas, kuras oriģinālā pat nav saskatāmas.

Ir vērts atzīmēt, ka tā nav kāda dīvaina reversā pikseļu veidošana, kas var atklāt aizmiglotus attēlus, jo mākslīgā intelekta veidotās sejas ir mākslīgas – tās nav reālu cilvēku sejas.

PULSE (Photo Upsampling via Latent Space Exploration) sistēma var radīt fotoattēlus ar līdz pat 64 reizēm lielāku izšķirtspēju nekā pamata attēls. Turklāt tā ir 8 reizes detalizētāka nekā iepriekšējās metodes. 16×16 pikseļu režģi dažu sekunžu laikā ir iespējams pārveidot par 1024×1024 attēlu, pievienojot vairāk nekā miljonu pikseļu.

pixel move

Sistēma izmanto mašīnmācīšanās klasi ar nosaukumu Generative Adversarial Network jeb GAN, kas būtībā nostāda divus neironu tīklus (sarežģītus mākslīgā intelekta mācību dzinējus, kas paredzēti cilvēka smadzeņu imitēšanai) vienu otram pretī, un abi ir apmācīti uz viena un tā paša fotoattēlu kopuma. Viens ģenerē sejas, bet otrs izlemj, vai tās ir pietiekami reālistiskas.

Izvēloties šo metodi, pētnieki var iegūt attēlus, kuros nav izplūdušo vai neskaidro zonu, kas dažreiz parādās galaproduktā, kad tiek izmantotas citas metodes.

Daļa no sistēmas panākumiem ir atkarīga no tā, kā tiek veidots gala rezultāta attēls. Tā vietā, lai uzģenerētu vienu “patieso” attēlu, tas pārbauda virkni iespēju, līdz atrod vispiemērotāko variantu.

GAN turpina attīstīties un kļūst arvien advancētāks. Tehnoloģiju gigants Nvidia demonstrēja savu GAN tīklu, kas spēj radīt ļoti reālistiskas cilvēku sejas, kuras patiesībā neeksistē. 

Dodies uz vietni This Person Does Not Exist jeb “Šī persona neeksistē”. Katru reizi kā lapa tiek atjaunota, GAN ģenerē kādu neīstu personu.

Šajā gadījumā sejas tiek ģenerētas, sajaucot eksistējošu cilvēku sejas ar kaut ko jaunu. Savukārt PULSE sistēmas variantā, kā avots tiek izmantoti pikselēta attēla bloki.

No viena un tā paša avota attēla var izgatavot vairākas sejas, un to pašu ideju var izmantot, lai izveidotu fotoattēlus ar jebko – kaķi, saulrietu, koku, balonu vai ko citu.

Šis aspekts varētu padarīt to piemērotu izmantošanai dažādās citās jomās, ieskaitot medicīnu, mikroskopiju, astronomiju un satelītattēlus.

Sīkāku informāciju var atrast PULSE vietnē un pat izmēģināt to uz saviem attēliem.

Pētījums tika prezentēts 2020. gada Computer Vision and Pattern Recognition (CVPR) konferencē, un raksts ir pieejams arXiv.org pirmsdrukas serverī.

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on whatsapp
WhatsApp

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *