Tidak, ini belum berakhir: kemampuan alat AI untuk memproses gambar terus berkembang. Contoh terbaru hanyalah makalah penelitian untuk saat ini, tetapi ini sangat mengesankan, karena memungkinkan pengguna untuk menarik elemen dari gambar untuk mengubah tampilannya.
Sepintas lalu, kedengarannya tidak terlalu menarik, tetapi lihatlah contoh di bawah ini untuk mendapatkan gambaran tentang apa yang dapat dilakukan sistem ini.
Anda tidak hanya dapat mengubah dimensi mobil atau mengubah senyuman menjadi cemberut dengan ketukan dan seret sederhana, tetapi Anda juga dapat memutar subjek foto seolah-olah itu adalah model 3D — mengubah arah orang menghadap, misalnya. Satu demo menunjukkan pengguna menyesuaikan pantulan di danau dan ketinggian pegunungan dengan beberapa klik.
Berikut adalah ikhtisar dari berbagai topik:
Berikut adalah tampilan lebih dekat pada pemrosesan lanskap:
Dan hanya untuk bersenang-senang, mengotak-atik warna hitam:
Video-video ini berasal Beranda tim penelitimeskipun hal ini dapat terganggu oleh jumlah lalu lintas yang dikirim ke situs oleh Twitter (Terutama oleh user_akhaliq, yang berhasil menyoroti makalah AI yang menarik dan layak untuk ditindaklanjuti jika itu menarik minat Anda). Anda juga dapat membaca makalah di arXiv Di Sini.
Seperti dicatat oleh tim penanggung jawab, hal yang sangat menarik dari karya ini bukanlah manipulasi gambar menurut, tetapi antarmuka pengguna. Kami telah dapat menggunakan alat AI seperti GAN untuk membuat gambar fotorealistik untuk sementara waktu, tetapi sebagian besar metode kurang fleksibel dan presisi. Anda dapat meminta pembuat gambar AI untuk “membuat gambar singa mengintai sabana”, dan ia akan mendapatkannya, tetapi mungkin tidak tepat Buat apa yang Anda inginkan atau butuhkan.
Model ini, disebut DragGAN, menawarkan solusi yang jelas untuk itu. Antarmukanya persis sama dengan pembengkokan gambar tradisional, tetapi alih-alih hanya mengolesi dan menggandakan piksel yang ada, model ini membuat tema baru. Seperti yang ditulis para peneliti: “[Q]pendekatan Anda dapat berhalusinasi konten tertutup, seperti gigi di dalam mulut singa, dan dapat berubah bentuk setelah objek mengeras, seperti menekuk kaki kuda.”
Jelas, ini hanya demonstrasi saat ini, dan tidak mungkin untuk mengevaluasi teknologi sepenuhnya. (Seberapa realistiskah gambar akhir, misalnya? Sulit dikatakan berdasarkan video beresolusi rendah yang tersedia.) Tapi ini adalah contoh lain untuk mempermudah manipulasi gambar.