AI ini menggunakan GPT-4 untuk menjadi pemain ahli Minecraft

Peneliti AI telah membuat bot Minecraft yang dapat mengeksplorasi dan memperluas kemampuannya di dunia terbuka game — tetapi tidak seperti bot lainnya, bot ini pada dasarnya menulis kodenya sendiri melalui coba-coba dan banyak kueri GPT-4.

Disebut Voyager, sistem eksperimental ini adalah contoh dari “agen yang diwujudkan”, AI yang dapat bergerak dan bertindak secara bebas dan terarah dalam lingkungan simulasi atau nyata. AI tipe asisten pribadi dan chatbots tidak harus benar-benar melakukan sesuatu, apalagi menavigasi dunia yang kompleks untuk menyelesaikan pekerjaan itu. Tapi itulah yang diharapkan dilakukan robot rumah tangga di masa depan, jadi ada banyak penelitian tentang bagaimana mereka bisa melakukannya.

Minecraft adalah tempat yang bagus untuk menguji hal-hal seperti itu karena ini adalah representasi yang sangat (sangat) perkiraan dari dunia nyata, dengan aturan dan fisika yang sederhana dan lugas, tetapi juga rumit dan cukup terbuka sehingga ada banyak hal yang harus diselesaikan atau dicoba. Simulator yang dibuat khusus juga bagus, tetapi mereka memiliki keterbatasannya sendiri.

MineDojo adalah kerangka kerja simulasi yang dibangun di sekitar Minecraft, karena Anda tidak bisa begitu saja menempatkan AI acak di sana dan mengharapkannya memahami apa yang dilakukan semua balok dan babi ini. Pembuatnya (banyak tumpang tindih dengan tim Voyager) mengumpulkan video YouTube tentang game, transkrip, artikel wiki, dan banyak postingan Reddit dari r/minecraft, di antara data lainnya, sehingga pengguna dapat membuat atau menyempurnakan model AI pada mereka. Ini juga memungkinkan model-model itu dievaluasi kurang lebih secara objektif dengan melihat seberapa baik mereka melakukan hal-hal seperti membangun pagar di sekitar llama atau menemukan dan menambang berlian.

Voyager unggul dalam tugas ini, berkinerja jauh lebih baik daripada satu-satunya model lain yang mendekati, AutoGPT. Tetapi mereka memiliki pendekatan yang serupa: menggunakan GPT-4 untuk menulis kode mereka sendiri saat digunakan.

Biasanya Anda baru saja melatih model tentang semua data Minecraft yang bagus itu dan berharap ia menemukan cara melawan kerangka saat matahari terbenam. Voyager, bagaimanapun, memulai dengan relatif naif, dan saat menemukan hal-hal dalam game, ia melakukan sedikit percakapan internal dengan GPT-4 tentang apa yang harus dilakukan dan bagaimana caranya.

Mengarahkan tindakan selanjutnya, dan menambahkan keterampilan ke tumpukan.

Misalnya, katakanlah malam tiba dan kerangka itu keluar. Agen memiliki gambaran umum tentang ini, tetapi ia bertanya pada dirinya sendiri, apa yang akan dilakukan oleh pemain yang baik dari game ini ketika ada monster di dekatnya? Nah, kata GPT-4, jika Anda ingin menjelajahi dunia dengan aman, Anda ingin membuat dan melengkapi pedang, lalu pukul kerangka dengan itu sambil menghindari terkena. Dan pengertian umum tentang apa yang harus dilakukan diterjemahkan ke tujuan konkret: mengumpulkan batu dan kayu, membuat pedang di meja kerajinan, melengkapinya, dan melawan kerangka.

Setelah melakukan hal-hal itu, mereka dimasukkan ke perpustakaan keterampilan umum sehingga nanti, saat tugasnya adalah “masuk jauh ke dalam gua untuk menemukan bijih besi”, ia tidak harus belajar bertarung lagi dari awal. Itu masih menggunakan GPT, tetapi GPT-3.5 yang lebih murah dan lebih cepat, yang memberi tahu keterampilan yang paling relevan dengan situasi tertentu – jadi tidak mencoba menambang kerangka dan melawan bijih.

Ini mirip dengan agen seperti AutoGPT, ketika dihadapkan dengan antarmuka yang belum diketahuinya, harus belajar sendiri untuk menavigasinya untuk mencapai tujuannya. Tapi Minecraft adalah lingkungan yang jauh lebih dalam daripada yang biasa dipecahkan, jadi agen khusus seperti Voyager jauh lebih baik. Ia menemukan lebih banyak barang, mempelajari lebih banyak keterampilan, dan menjelajahi area yang jauh lebih luas daripada bot lainnya.

Menariknya meskipun mungkin tidak mengherankan, GPT-4 menghapus lantai dengan GPT-3.5 (yaitu ChatGPT) dalam hal menghasilkan kode yang berguna. Tes yang menggantikan yang pertama dengan yang terakhir membuat agen tersebut menemui hambatan sejak awal, bahkan mungkin secara harfiah, dan gagal untuk berkembang. Mungkin tidak jelas dari berbicara dengan dua model bahwa yang satu jauh lebih pintar, tetapi sebenarnya Anda tidak harus terlalu pintar untuk melakukan percakapan yang tampaknya cerdas (tanyakan kepada saya bagaimana saya tahu). Pengkodean jauh lebih sulit dan GPT-4 adalah pembaruan besar di sana.

Inti dari penelitian ini bukanlah untuk membuat pemain Minecraft menjadi usang, tetapi untuk menemukan metode yang dapat digunakan oleh model AI yang relatif sederhana untuk meningkatkan diri berdasarkan “pengalaman” mereka, karena tidak ada kata yang lebih baik. Jika kita akan memiliki robot yang membantu kita di rumah, rumah sakit, dan kantor kita, mereka perlu mempelajari dan menerapkan pelajaran tersebut untuk tindakan di masa mendatang.

Anda dapat membaca lebih lanjut tentang Voyager di sini.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *