Openai mendedahkan Dall-E 3, penjana imej berdasarkan chatgpt, dall-e 3: gabungan antara chatgpt dan penjanaan imej yang akan menggoncang midjourney

Dall-e 3: Gabungan antara chatgpt dan penjanaan imej yang akan menggoncang midjourney

Dengan mengintegrasikan Dall-E di Chatgpt, Openai menguatkan kedudukannya sebagai pemimpin di dunia AI generatif. Chatgpt dan dall-e 3, bersama-sama, berjanji untuk mengusir sempadan ai.

Openai mendedahkan Dall-e 3, penjana imej berdasarkan chatgpt

Versi terbaru model ini didasarkan pada GPT untuk memudahkan penciptaan imej yang kompleks dan koheren.

Openai, syarikat di belakang GPT Essential, baru saja mendedahkan model generatif terkini setakat ini. Dan kali ini, sekali lagi imej yang menjadi tumpuan; Tentera Sam Altman mendedahkan versi ketiga dari Generator Imej Dall-E. Dia berjanji Lebih banyak warna, perincian dan kerumitan.

Titik pertama yang diserlahkan oleh Openai adalah ketepatan segera. Malah penjana terbaik pada masa ini, seperti Midjourney atau DreamStudio, mengalami masalah biasa: mereka ada kecenderungan untuk mengabaikan kata -kata tertentu dari permintaan teks.

Untuk mendapatkan hasil yang terbaik, oleh itu perlu Secara empirik belajar berkomunikasi dengan algoritma. Ini menunjukkan banyak ujian mengenai perbendaharaan kata dan berubah untuk mencari mereka yang paling mungkin ditafsirkan dengan betul. Ini adalah latihan yang boleh menjadi halus apabila pengguna menanti hasil yang sangat spesifik, oleh itu istilah ” kejuruteraan segera »».

Chatgpt digerakkan untuk komposisi segera

Dengan Dall-E 3, Openai ingin menamatkan keadaan ini. “” Sistem teks-ke-imej moden cenderung mengabaikan perkataan atau deskripsi, yang membentuk pengguna untuk mempelajari promosi yang menggalakkan. Dall-e 3 mewakili langkah besar ke hadapan dalam keupayaan kami untuk menghasilkan imej yang mematuhi teks yang disediakan “Menunjukkan syarikat.

Dan untuk melakukan ini, syarikat sudah mempunyai alat yang sempurna: Chatgpt. Versi baru model penyebaran 3 adalah ” Dibina secara asli »Sekitar chatbot. Kini berfungsi sebagai perantara untuk Mentafsirkan setiap perincian permintaan. Model bahasa juga dapat membantu pengguna menjana segera sangat terperinci supaya Dall-e memahami apa yang diharapkan dari dia tanpa menggunakan teknik kejuruteraan segera lanjutan.

Dan jika hasil awal tidak sesuai, itu tidak. Sudah cukup untuk pergi lagi dengan chatgpt untuk menuntut perubahan yang tepat dari segi warna, bentuk, gaya, terperinci tertentu … dengan kata lain, Openai telah meletakkan hidangan kecil di dalam yang besar untuk menawarkan ijazah kawalan maksimum dengan Sekurang -kurangnya usaha dan kepakaran teknikal.

Mengenai contoh yang dicadangkan oleh OpenAI, juga ambil perhatian bahawa Dall-E 3 dapat menghasilkan teks yang koheren. Ini adalah sesuatu yang penjana imej mempunyai banyak masalah yang dilakukan setakat ini. Contohnya, versi terbaru Midjourney selalu menghasilkan cukup … hasil eksotik ketika diminta untuk terlibat dalam latihan ini.

Melindungi angka awam

Syarikat masih mengenakan beberapa had pada versi ketiga ini. Sebagai contoh, jurutera telah menyatukan perlindungan yang sudah ada di Dall-E dan Dall-E 2 yang menghalang pengguna daripada menghasilkan kandungan ” ganas, dewasa atau kebencian »».

Di samping itu, Dall-E 3 direka untuk menolak permintaan yang secara eksplisit menyebut tokoh awam. Matlamatnya adalah untuk mengelakkannya daripada digunakan untuk tujuan propaganda atau disinformasi.

Menghormati harta intelek

Titik penting lain dari kemas kini ini adalah bahawa Optai nampaknya telah mengambil perhatian tentang banyak kritikan yang telah ditujukan kepada pelbagai penjana imej mengenai harta intelektual. Dall-e pergi menolak permintaan yang memintanya meniru gaya artis yang hidup. Ini harus menutup pintu untuk banyak percubaan palsu.

Sebaliknya, sistem perlindungan ini pasti tidak sempurna. Ketepatan versi ketiga ini adalah pedang berganda. Secara teori, pengguna yang cukup persepsi sentiasa dapat memperoleh hasil yang cukup dekat. Anda hanya perlu menggambarkan gaya artis yang disasarkan dengan tepat tanpa nama secara jelas.

Openai juga menawarkan dua penyelesaian yang membolehkan artis menolak bahawa karyanya digunakan untuk melatih Dall-e. Yang pertama adalah mengisi borang di alamat ini. Tetapi jika anda ingin melindungi sejumlah besar, seperti yang anda simpan dalam portfolio dalam talian anda, yang ideal adalah untuk melarang akses ke crawler gptbot. Untuk melakukan ini, ikuti arahan yang tersedia di alamat ini.

Ini akan membatasi keupayaan Dall-E 3 untuk meniru karya yang dipersoalkan. Sekurang -kurangnya, jika mereka belum diserahkan kepada gelendong. Dan malangnya mustahil untuk menentukan dalam amalan, kerana data sumber tidak disimpan setelah dimasukkan ke dalam model.

Dall-E3 akan dilancarkan secara rasmi pada Oktober depan untuk pelanggan tawaran Chatgpt Plus dan Chatgpt Entreprise.

Dall-e 3: Gabungan antara chatgpt dan penjanaan imej yang akan menggoncang midjourney

Openai, syarikat induk ibu, tidak lagi dibentangkan. Setelah menawarkan kami chatgpt, dia kini mengumumkan keupayaannya untuk menghasilkan imej yang tepat, terima kasih kepada gabungan Dall-E dan Chatgpt di Dall-E.

Frandroid, Bagi mereka yang mengikuti, gunakan alat Generasi Imej: Midjourney. Sekiranya instrumen ini ternyata kuat dan inovatif dalam dunia penjanaan imej, Dall-e Openai juga berada di landasan yang betul, dengan kursus yang sama mengagumkan. Dan opus baru Dall-e 3 Risiko baik untuk mengubah keadaan.

Menurut demonstrasi yang dikongsi oleh OpenAI, jelas bahawa Dall-e 3 dibezakan dari pendahulunya dan pesaingnya. Di mana Midjourney cemerlang dalam pemulihan photorealistik, tetapi masih memerlukan banyak manipulasi, Dall-e 3 menjanjikan penjanaan imej yang jauh lebih efisien dan kurang salah. Satu prestasi yang ketara, terutamanya memandangkan fakta bahawa ini adalah pendahuluan utama berbanding Dall-E.

Di samping itu, alat baru ini seolah -olah telah membangunkan kecekapan khusus untuk menguruskan teks dalam imej, melampaui keupayaan beberapa pesaingnya seperti penyebaran stabil XL dan DeepFloyd. Khususnya, Openai menyoroti keupayaannya untuk menghasilkan imej surat, angka, dan tangan manusia yang meyakinkan (kesukaran sebenar untuk alat ini).

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dall-e 3 // Sumber: Openai

Dengan mengintegrasikan Dall-E di Chatgpt, Openai menguatkan kedudukannya sebagai pemimpin di dunia AI generatif. Chatgpt dan dall-e 3, bersama-sama, berjanji untuk mengusir sempadan ai.

Chatbots bukan sahaja dapat bercakap dengan cara yang hampir manusia, tetapi juga untuk membayangkan dan membuat imej dari deskripsi mudah. Kami tidak sabar untuk menguji.

Sekiranya anda ingin menguji Dall-E 3, ia akan tersedia untuk pengguna Chatgpt Plus dan Enterprise. Yang lebih mudah digunakan daripada pertengahan … di mana anda memerlukan pelanggan perselisihan.

Chatgpt

Kepada siapa gambar yang dihasilkan ?

Persoalan hak cipta yang dikaitkan dengan imej yang dihasilkan oleh AI kini menjadi topik hangat. Peraturan semasa mencadangkan bahawa imej IA memasuki domain awam. Walau bagaimanapun, Openai dengan jelas menyatakan bahawa harta imej yang dihasilkan oleh Dall-E 3 kembali kepada pencipta mereka. Dan itulah perdebatan lain dalam sektor ini.

Bing Cat juga berhak mendapat Dall-E 3

Khamis ini, 21 September, Microsoft mengadakan persidangan untuk mengumumkan kedatangan Copilot yang seterusnya, tetapi juga Range Surface baru. Selari, syarikat itu berkomunikasi semasa ketibaan model Dall-E 3 dalam pencipta imej bing. Sebagai peringatan, ini adalah alat penciptaan gambar bing chat. Menurut Microsoft, Pencipta Imej Bing ” Juga memahami apa yang anda minta, yang membolehkan anda mendapatkan gambar yang lebih tepat. »»

Microsoft juga mengatakan pergi lebih jauh dengan menambah ” Tanda air digital tidak dapat dilihat oleh semua imej yang dihasilkan oleh AI di Bing, termasuk masa dan tarikh penciptaan mereka. “Sukar untuk mengetahui betapa kuatnya watermark ini, atau bagaimana kita dapat memeriksa kehadirannya atau tidak, tetapi ini adalah langkah pertama.

Untuk mengikuti kami, kami menjemput anda untuk memuat turun aplikasi Android dan iOS kami. Anda boleh membaca artikel, fail, dan menonton video YouTube terbaru kami.

Thanks! You've already liked this