Beranda Bisnis Openai dan Microsoft menambahkan pembuatan gambar baru dan fitur agen AI –...

Openai dan Microsoft menambahkan pembuatan gambar baru dan fitur agen AI – dan menampilkan keunggulan platform mereka

31
0


Halo dan selamat datang di AI. Dalam edisi hari ini … OpenAI merilis generator gambar yang lebih mampu, sementara Microsoft menanam sahamnya di agen penalaran; Google debut model Gemini 2.5 “Berpikir”; Amazon menguji AI Assistants for Health and Shopping; Karakter.ai memberi orang tua lensa waktu anak -anak mereka di platform; dan perayap agresif perusahaan AI membanjiri proyek sumber terbuka.

Minggu ini, baik OpenAi dan pendukungnya (dan dulu saingannya … rumit) Microsoft meluncurkan beberapa kemampuan AI terbaru dan paling kuat mereka ke dalam platform utama mereka. OpenAI debut kemampuan pembuatan gambar baru untuk GPT-4O pada layanan chatgpt utamanya, menawarkan pembuatan gambar yang ditingkatkan dan kemampuan pengeditan granular berdasarkan permintaan teks. Ini membuat generasi gambar jauh lebih unggul dari apa yang mungkin dengan model Dall-E sebelumnya. Dan Microsoft mengumumkan meningkatkan penawaran kopilot Microsoft 360 -nya dengan dua “agen penalaran yang dalam,” serta “aliran agen” yang dirancang untuk menghapus beberapa ketidakpastian yang datang dengan menggunakan agen AI.

ChatGPT sudah memiliki generator gambar, dan Microsoft telah meluncurkan berbagai jenis agen yang diarahkan pada perusahaan. Kedua rilis, bagaimanapun, menawarkan sentuhan baru pada apa yang mereka tawarkan – dan menunjukkan kekuatan untuk dapat secara instan meluncurkan fitur baru pada platform yang sudah memiliki ratusan juta pengguna. Memiliki distribusi semacam itu adalah keunggulan besar karena persaingan di antara produk -produk serupa memanas.

4o Generasi gambar meningkatkan standar

Sekarang diluncurkan ke Chatgpt Plus, Pro, Tim, dan pengguna gratis, OpenAI menggambarkan integrasi baru sebagai “generator gambar paling canggih.” Dan saya harus mengatakan, hasilnya mengesankan.

Secara keseluruhan, pembuatan gambar 4O dapat menghasilkan adegan realistis yang jelas dan menghasilkan transformasi “transfer gaya” yang mengesankan dari gambar yang diunggah berdasarkan petunjuk. (Anda juga dapat mengedit fitur utama dari gambar yang diunggah, hanya dari petunjuk juga.) Berdasarkan kebanyakan gambar yang membanjiri Subreddit chatgptKemampuan transfer gaya ini terbukti populer. Gambar Model yang dibuat setelah pengguna mendorongnya untuk mengubah meme “pacar yang terganggu” menjadi gaya “South Park,” misalnya, sejujurnya agak mengejutkan dalam betapa tepatnya hal itu pada tampilan visual acara-tidak ada perusahaan heran yang menciptakan model AI generatif sedang dibanjiri dengan tuntutan hukum hak cipta. Pada catatan lain, Pengguna sudah menguji batasan menciptakan gambar tokoh -tokoh publik seperti Donald Trump dan Elon Musk. Openai mengkonfirmasi untuk mengawasi AI bahwa itu tidak membatasi model gambar baru dari membuat gambar orang sungguhan kecuali dalam kasus ketelanjangan atau kekerasan grafis. Ini merupakan pergeseran dari pembatasannya untuk Dall-E, yang akan menolak untuk menghasilkan gambar orang sungguhan.

Mungkin kemajuan yang paling menarik, bagaimanapun, adalah lompatan besar dalam kemampuan model untuk menghasilkan teks. Dall-E dan model pembangkit gambar sebelumnya biasanya akan membuat teks yang kacau, tetapi pembuatan gambar 4o dapat membuat string teks yang panjang, terperinci, dan akurat di dalam gambar. Contoh pertama di Posting blog Openai Menampilkan seluruh papan tulis teks yang mudah dibaca dan akurat untuk prompt.

Seorang ‘peneliti’ dan ‘analis’ bergabung dengan 365 Workspace Anda

Microsoft menjelaskan “Agen penalaran dalam” yang baru untuk 365 Copilot Microsoft yang dirancang untuk “menangani tugas -tugas rumit yang memerlukan analisis terperinci, pemikiran metodis, dan pemahaman yang bernuansa.” Berdasarkan model penalaran O1 OpenAI, agen peneliti diarahkan untuk penelitian multi-langkah dan berintegrasi dengan platform eksternal seperti Salesforce, ServiceNow, dan pertemuan untuk mengumpulkan wawasan dari seluruh data perusahaan. Lalu ada agen analis, yang didasarkan pada model penalaran O3-mini AI terbuka. Microsoft mengklaim bahwa itu dioptimalkan untuk melakukan analisis data canggih di tempat kerja, menggunakan penalaran rantai, dan dapat menjalankan Python untuk menangani kueri data yang kompleks. Keduanya akan mulai diluncurkan pada bulan April.

Selain agen baru, Microsoft juga mengumumkan kemampuan baru yang disebutnya “aliran agen” yang dimaksudkan untuk menambah prediktabilitas pada penggunaan agen. Aliran agen menyediakan alur kerja yang terstruktur dan berbasis aturan yang menggabungkan tindakan AI, mengikuti jalur yang telah ditentukan sebelumnya dan deterministik. Ini penting karena seperti yang saya tulis di buletin Kamis lalu, agen AI memiliki masalah serius dengan keandalan dan bisa berisiko, terutama dalam hal tindakan kritis atau data sensitif.

Berbagai perusahaan telah merilis agen AI yang disebut -sebut untuk “penelitian mendalam” belakangan ini, tetapi peran Microsoft 365 sebagai platform pusat banyak bisnis – dan integrasi dengan semua produk data lain yang mereka gunakan – memberikan Microsoft keuntungan unik. Lapangan AI penuh dengan perusahaan yang bersaing dengan produk serupa, masing -masing joki untuk pijakan diferensiasi. Pembaruan ini membuat fitur AI canggih mudah diakses tepat di mana pengguna produk populer sudah beroperasi, yang kemungkinan merupakan keuntungan pasar yang signifikan. Terlebih lagi, baik Microsoft dan Google pindah untuk menggabungkan fitur AI mereka ke dalam perangkat lunak perusahaan mereka secara default-dan menaikkan harga produk inti-setelah sebelumnya memungkinkan pelanggan untuk ikut serta ke fitur AI dengan biaya tambahan. Itulah keuntungan platform.

Dan dengan itu, inilah lebih banyak berita AI.

Sage Lazzaro
sage.lazzaro@consultant.fortune.com
sagelazzaro.com

Kisah ini awalnya ditampilkan di Fortune.com


Source link

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini