OpenAI membuka DALL-E 2

Berikut adalah beberapa analisis yang berguna untuk membantu Anda mendapatkan hasil maksimal darinya .  Berita yang telah lama ditunggu-tunggu ada di sini.

 

OpenAI adalah cara yang bagus untuk mengatakan bahwa mereka adalah DALL · E 2 Beta. Dalam beberapa minggu, semua orang di daftar tunggu akan memiliki akses ke model.  Selama tiga setengah bulan, OpenAI telah menjaga sistem dalam mode penelitian dan menilai potensi bahaya. Tetapi seperti yang dikatakan Sam Altman pada 6 April, mereka ingin meluncurkan produk di musim panas. Ini menyelesaikan penantian.

Bagaimana dal · E 2 beta akan bekerja, berapa biayanya, apa yang dapat dan tidak dapat Anda lakukan dalam pekerjaan Anda, dan apa konsekuensi langsung di luar beta – dengan beberapa tautan untuk membantu Anda menavigasi dunia kreativitas yang didukung oleh AI.

 

DALL·E 2 open beta

Jika Anda baru di sini, DALL· E 2, saya  menulis tinjauan non-teknis terperinci yang mencakup cara kerjanya, apa yang dapat dilakukannya, dan masalah yang melekat padanya (teknis dan sosial). Saya juga menemukan bahwa DALL ·  Dari tagar Instagram resmi E2, subreddit r/dalle2, dan Twitter, #dalle memahami betapa hebatnya teknologi ini.

Jika Anda tidak ingin membaca sebanyak itu, ide dasar yang perlu Anda ketahui adalah DALL · Di E2, Anda dapat membuat gambar dari sebuah kata. Pernyataan (petunjuk) dan DALL· E2 menghasilkan kumpulan gambar asli yang terkait dengan kata-kata yang digunakan. Dalam mode normal (teks → gambar),  empat gambar ditampilkan pada setiap prompt.  Dar · E2    juga dapat dibuat dengan mengedit variasi gambar yang dihasilkan atau diunggah (teks  + gambar →gambar).  Mode ini menghasilkan tiga gambar per prompt  .

Jadi mari kita lihat berapa biaya untuk bermain dengan generator visual AI canggih yang telah dipublikasikan.

 

Harga

OpenAI didasarkan pada DALL· E 2。 1 kredit = 1 generasi/suntingan/variasi. Artinya, dengan satu kredit, Anda akan mendapatkan 4 atau 3 gambar tergantung pada modenya.

Setiap akun menerima 50 kredit gratis di bulan pertama dan 15 kredit gratis di bulan-bulan berikutnya. Jika Anda menginginkan lebih banyak kredit, Anda dapat membeli paket 15 kredit seharga $15 ($0.13/kredit). Ada dal · Model bisnis E2. Mari kita pahami alasannya.

Jika Anda belum mencoba DALL · Dalam E 2 (atau generator seni AI lainnya), 15 kredit (15 prompt) adalah angka yang sangat rendah.

Mari kita lihat sebuah contoh. Pertengahan Perjalanan (Dal · Sepupu E2) Membuat gambar sampul untuk posting saya sebelumnya di jembatan algoritma: Ini bukan hasil yang sempurna (sudah jelas) Dan saya masih membutuhkan waktu sekitar 30 menit dan beberapa kali percobaan coba-coba. Saya mencoba tiga atau empat petunjuk dan kemudian “mesin tik dengan mata hitam dan putih, artstation, dalam gaya ikonik  dan bermakna, – ar 16:9” (lebih lanjut tentang rekayasa cepat di bawah). Untuk setiap prompt, saya membuat beberapa variasi dan memperbesar gambar beberapa kali untuk hasil yang lebih baik.

Secara total, ada sekitar 20 permintaan. DALL·  Untuk mendapatkan gambar serupa di E2, Anda mungkin perlu menggunakan semua kuota bulanan gratis Anda.

Dan itu karena saya lelah mencoba banyak hal. Seniman digital dapat mencurahkan satu hari penuh untuk mendorong eksperimen. Anda dapat dengan  mudah menggunakan kredit  senilai satu tahun untuk satu gambar. Saya tidak melebih-lebihkan, mereka bisa sangat perfeksionis – dan begitu Anda meletakkan tangan Anda di DALL … E 2, Anda mungkin juga.

Untuk mengatasi keterbatasan penting ini, OpenAI  menawarkan paket 115 kredit seharga $15. Mengambil perkiraan konservatif, dan dengan asumsi kebanyakan orang bukanlah pembisik yang baik, saya pikir 115 kredit dapat berubah menjadi citra yang layak 5-10.

Ini adalah kunci untuk memahami arti model pembayaran yang ingin diterapkan OpenAI. Untuk mendapatkan perkiraan biaya yang lebih baik,  Anda perlu berpikir dalam hal $ per “hasil yang baik”, bukan $ per upaya. $ 10 untuk 15 hasil bagus – 15  jika Anda benar-benar terampil – cukup mahal.

Dua nuansa.

Pertama, di akhir pengumuman, OpenAI menyatakan bahwa mereka akan mensubsidi akses ke “artis yang memenuhi syarat.” Dengan kata lain, DALL· E 2 adalah untuk pekerjaan mereka (sebagai lawan dari orang-orang seperti saya yang berencana untuk menggunakannya secara sporadis) dan “membutuhkan bantuan keuangan”, sehingga mereka dapat menggunakan sistem tanpa membayar uang sebanyak itu.

SAYA MEMILIKI OPSI INI TETAPI DALL ITU · E 2 dapat memengaruhi pekerjaan mereka sekarang atau dengan cara lain (karena itu adalah ancaman atau alat penting untuk inspirasi atau peningkatan).

Jika Anda yakin telah memenuhi persyaratan, silakan isi formulir ini.

Kedua, dan yang lebih penting secara umum, OpenAI menyatakan bahwa “saat kami mempelajari lebih lanjut dan mengumpulkan umpan balik pengguna, kami akan mengeksplorasi opsi lain yang selaras dengan proses kreatif pengguna kami.”

Ini berarti bahwa jika kami menerima umpan balik yang meminta perubahan, kami dapat mengubah sistem penetapan harga kami. Dua opsi yang terlintas dalam pikiran adalah model pembayaran per prompt dan model berlangganan. Kasus pertama mirip dengan yang digunakan dalam GPT-3. Bayar untuk setiap gambar yang Anda hasilkan (yang akan menjadi sesuatu seperti $0.05-0.10). Ini menarik bagi pengguna biasa yang hanya bermain dengan DAL · E 2 untuk melihat apa yang diributkan.

Model berlangganan masuk akal bagi mereka yang berencana untuk sering menggunakan layanan ini. Orang yang tidak ingin merasa tertekan tentang eksperimen. Kreativitas tidak berkembang jika Anda khawatir menghabiskan terlalu banyak uang.

Model berlangganan tentu membantu pengguna ini untuk berada di posisi terbaik untuk memberikan umpan balik yang paling berguna bagi perusahaan. Orang-orang ini, yang mungkin tidak memenuhi syarat untuk subsidi, pada akhirnya akan mengamortisasi pembayaran di muka mereka.

Namun, ada  alasan mengapa kami pikir OpenAI tidak mempertimbangkan model bisnis ini (setidaknya untuk saat ini). Ini adalah yang paling tidak berkorelasi dengan penggunaan GPU, yang menyumbang sebagian besar biaya perusahaan.

Bagaimanapun, jangan ragu untuk memberi mereka umpan balik, dan Anda mungkin melihatnya berubah menjadi model bisnis yang lebih sesuai dengan kebutuhan Anda.

selamat

Sangat penting untuk memahami hal ini, karena tidak melakukannya adalah cara terbaik untuk memblokir akun Anda dan memblokir akses ke DALL. E2 dicabut, mungkin selamanya, tergantung pada pelanggarannya.

Peneliti OpenAI telah bekerja dengan DALL· E 2 adalah pemahaman umum saat ini tentang apa yang membuat model AI aman. Pertama, kami menggunakan Tim Merah untuk menilai keterbatasan dan potensi bahayanya. Kemudian, ketika saya membuka studi beta, saya perlahan-lahan memberikan akses dalam kelompok kecil untuk mengumpulkan umpan balik dan melihat masalah apa yang mungkin saya abaikan.

Saat ini, akses beta terbuka menetapkan tiga pedoman kebijakan utama untuk keselamatan.

  • Mengekang penyalahgunaan. Mengunggah wajah, menghasilkan wajah selebriti, atau menghasilkan “generasi fotorealistik wajah pribadi nyata” tidak diperbolehkan. Ini berarti Anda dapat mengunggah selfie, DALL· E 2 menghasilkan foto Trump melakukan sesuatu yang konyol.
  • Pencegahan gambar berbahaya. Pengguna tidak boleh menghasilkan gambar yang termasuk dalam salah satu kategori terlarang (seperti kebencian, seks, kekerasan, dll.) sebagaimana didefinisikan dalam Kebijakan Konten OpenAI. Mereka menerapkan filter konten dan DALL· Pelatihan ditetapkan untuk E2.
  • Kurangi bias. Nah, Dar · E2 memanfaatkan teknologi baru untuk “lebih akurat mencerminkan keragaman populasi dunia.” Dengan pendekatan ini, saya ingin menghindari situasi di mana, misalnya, jika saya meminta “CEO,” saya hanya bisa mendapatkan gambar seorang pria kulit putih / Asia berjas.

Di luar Beta

Buka  Boneka Pembuka AI · E2 beta adalah awal dari banyak perubahan yang akan mempengaruhi setiap sudut masyarakat. Alasan utamanya adalah kami telah memutuskan untuk memberikan pemilik penuh kepada pembuatnya atas gambar yang dihasilkan. Berikut adalah ikhtisar singkat tentang konsekuensi yang paling mendesak.

Tujuan Bisnis

OpenAI –  bertentangan dengan apa yang awalnya saya pikirkan, saya harus mengakui –  pengguna harus mengakui bahwa mereka memiliki DALL ·  E2 untuk tujuan komersial. Ini adalah berita yang paling penting.

Izinkan saya menjelaskan mengapa dalam kasus khusus saya. Ketika saya mulai menulis, saya menyadari bahwa gambar sampul yang baik penting untuk artikel dengan kinerja yang baik. Saya mulai menggunakan repositori gambar gratis seperti Unsplash dan Pexels, tetapi segera menyadari bahwa apa yang dapat mereka tawarkan kepada saya sangat terbatas. Saya memutuskan untuk membeli langganan tahunan di Shutterstock. Saya telah menggunakan layanan ini selama setahun dan itu memberi saya beberapa gambar sampul terbaik yang saya temukan.

Setelah saya bisa menggunakan Dal · Dalam posting saya E 2 (seperti yang dilakukan Casey Newton), saya tidak akan pernah membeli langganan ke perpustakaan gambar stok lagi.  Untuk $15/bulan, saya dapat dengan mudah membuat 10 gambar yang sangat cocok dengan apa yang saya inginkan, tetapi setiap perusahaan gambar saham yang bagus akan mengenakan biaya +$30/untuk 10 gambar. Isi daya bulanan. E 2。

Layanan gambar stok sudah mati. Tetapi hasilnya tidak berakhir di sana.

Kematian desainer grafis?

Belum lama ini, sutradara pemenang penghargaan Karen X. Chen mengumumkan bahwa DALL. E2 membuat sampul majalah Cosmopolitan.  Ini adalah pertama kalinya AI digunakan untuk pekerjaan semacam ini, tetapi ini bukan yang terakhir. Ini adalah eksperimen, tetapi begitu  generator visual AI ini menjadi cukup baik untuk menggambarkan manusia dengan setia (tangan dengan semua jari dan mata melihat ke arah yang benar), bahkan kontraktor terbesar desainer grafis manusia, seperti majalah, akan dapat melakukannya. Gunakan AI.

Namun, dia tidak tahu bahwa Dal · E2 akan “menggantikan manusia,” seperti yang dia jelaskan di utas Twitter. “Saya melakukan ratusan coba-coba. Berjam-jam generasi cepat dan penyempurnaan sebelum mendapatkan gambar yang sempurna. Banyak orang terlibat dalam pembuatan sampul kosmopolitan, tetapi begitu sistem ini disempurnakan, satu orang dapat menggantikan seluruh tim desainer, memungkinkan mereka untuk menciptakan seni yang lebih baik lebih cepat dan lebih efisien.

Manusia akan tetap berada dalam lingkaran, itu sudah pasti. Namun, dibandingkan dengan era pra-DALL, berapa banyak manusia yang akan tersisa, E2 adalah pertanyaan lain.

Rekayasa cepat

Hal terakhir yang ingin saya sentuh adalah komunikasi antara manusia dan AI.

Sejak GPT-3, orang-orang telah menyadari bahwa cara mereka berkomunikasi dengan sistem AI sangat penting untuk kualitas yang mereka dapatkan sebagai imbalannya. Anda seharusnya tidak menganggap sistem ini sebagai peramal. Mereka tidak bisa membaca pikiran Anda. Mereka pandai membuat hal-hal baru hanya dengan sedikit bantuan, tetapi bantuan itu sangat penting. Dan itu terserah Anda. Anda harus belajar bagaimana mendapatkan yang terbaik dari mereka, jika tidak mereka mungkin akan kecewa.

Saat itulah para peneliti menemukan istilah “rekayasa instan.” Ini mencerminkan fakta bahwa belajar bagaimana berkomunikasi dengan AI ini adalah keterampilan. Orang dapat bermain dengan GPT-3 atau DALL selama berhari-hari. E 2 Dan Anda menyadari bahwa Anda tidak mendapatkan hasil yang lebih baik karena Anda belum pernah mempelajari teknik yang tepat. Orang lain mungkin menemukan bahwa bahkan setelah beberapa bulan, mereka masih meningkat dengan mengutak-atik kata dan konsep di sana-sini dan mendapatkan lebih banyak output berkualitas tinggi. Ini penting karena satu alasan.

Seniman digital, desainer, dan ilustrator yang menyadari munculnya teknologi ini dapat mengasah keterampilan mereka untuk tetap berada di depan kurva dan tetap relevan. Kebanyakan orang, paling banter, tetap menjadi pengguna biasa dari sistem ini. Orang-orang dengan keterampilan menginspirasi yang sangat baik dapat menggunakan DALL·  Ini adalah AI seperti E 2, tetapi kebanyakan orang harus bergantung pada mereka lagi untuk mendapatkan seni yang layak.

Ini adalah argumen terkuat yang menentang gagasan bahwa generator visual AI akan mengambil pekerjaan seniman dan desainer. Mereka perlu memperbarui keahlian mereka, ya. Namun, perusahaan diharuskan menggunakan DALL· E2 secara langsung. Mereka mencari orang yang tahu cara menggunakannya. Orang-orang dengan keterampilan teknik cepat yang sangat baik.

Dan kami yakin bahwa siapa pun yang akrab dengan kreativitas visual dan diperbarui dengan tren AI terbaru berada dalam posisi terbaik untuk mengisi tempat-tempat itu.

Mari kita tekankan itu. Jangan tertipu, jangan berpikir begitu hanya karena Anda dapat menggunakan DALL · E 2 Anda akan dapat melakukan sihir artistik. Setiap seniman digital dapat memilih DALL· E2 dapat dianggap sebagai seni itu sendiri.

Seperti lukisan cat minyak dan gambar digital, DALL· Begitu juga dengan E2.

Betapa sulitnya menguasai keterampilan ini pasti akan menentukan seberapa besar kemampuan yang akan dihadapi seorang seniman yang paham teknologi. Untuk saat ini, mereka memiliki keunggulan itu.

 

Akhir Kata

Pengumuman OpenAI  tidak terduga. Kami tahu ini akan datang. Ini bukan awal dari apa pun di ruang AI, tetapi kelanjutan dari tren yang ada.

Tapi itu jelas merupakan titik infleksi. Orang-orang yang tidak akan berhubungan langsung dengan AI akan diingatkan bahwa DALL· E 2 Karya.

Ini akan mencapai sudut terjauh dunia yang tidak paham teknologi, dan semakin banyak orang akan mulai memperhatikan AI dan dampaknya terhadap dunia dan kehidupan mereka.

 

 

Leave a Reply

Your email address will not be published.