Cabang eksperimental Google, Google Labs, sedang menguji generator gambar baru yang disebut Whisk. Alat ini memungkinkan orang untuk meminta dengan gambar, bukan teks, sehingga mereka dapat membuat ulang foto dengan mengubah subjek, pemandangan, dan gaya.
Whisk menggunakan model pembuatan gambar Google, Imagen 3, untuk menggabungkan tiga gambar: satu untuk subjek, satu lagi untuk pemandangan, dan satu lagi untuk gaya. Misalnya, Anda dapat memilih foto diri Anda sebagai subjek, lanskap futuristik sebagai pemandangan, dan gaya anime untuk tampilan akhir.
Model secara otomatis menghasilkan keterangan detail gambar Anda, yang kemudian digunakan untuk memandu Imagen 3 dalam membuat remix foto tersebut. Anda juga dapat memasukkan petunjuk teks untuk menentukan lebih lanjut hasil yang diinginkan, termasuk deskripsi mendetail seperti “Subjek sedang mengendarai sepeda terbang.”
Karena Whisk hanya berfokus pada beberapa karakteristik utama dari setiap gambar, perusahaan menjelaskan bahwa hasilnya mungkin tidak selalu memenuhi harapan Anda. Misalnya, subjek yang dihasilkan dapat berbeda dalam hal tinggi badan, berat badan, gaya rambut, atau warna kulit. Google mengatakan Anda dapat melihat dan mengedit perintah yang mendasarinya kapan saja.
Eksperimen saat ini hanya tersedia bagi pengguna yang berbasis di AS di labs.google/whisk.