Dumme, sebuah startup yang menggunakan AI untuk penggunaan praktis dalam pengeditan video, sudah menghasilkan permintaan sebelum dibuka untuk umum. Perusahaan yang didukung Y Combinator memiliki ratusan pembuat video yang menguji produknya, yang memanfaatkan AI untuk membuat video pendek dari konten YouTube, dan daftar tunggu lebih dari 20.000 pra-peluncuran, katanya. Dengan menggunakan kombinasi model AI berpemilik dan AI yang sudah ada, janji Dumme adalah tidak hanya menghemat waktu pengeditan, tetapi juga — dan inilah klaim besarnya — melakukan pekerjaan yang lebih baik daripada tenaga kerja (manusia) yang dikontrak yang sering diberi tugas lebih kasar. pekerjaan pengeditan video, seperti memangkas konten berdurasi panjang untuk dipublikasikan di platform berformat pendek seperti YouTube Shorts, TikTok, atau Instagram Reels.

Didirikan pada Januari 2022 dan menjadi peserta dalam program akselerator startup Y Combinator’s Winter 2022, salah satu pendiri dan CEO Dumme Merwane Drai mengatakan bahwa dia awalnya berfokus pada pembuatan mesin pencari untuk video. Namun sekitar enam bulan lalu, tim menyadari bahwa produk yang lebih baik mungkin menggunakan kembali model AI yang sama yang mereka kembangkan untuk mengedit klip video.

Bergabung dengan co-founder Will Dahlstrom (CPO) dan Jordan Brannan (CTO), semuanya dengan latar belakang AI, Drai menyadari bahwa Dumme mungkin telah mendarat di pasar produk yang tepat setelah aplikasi mereka menjadi viral, merusak server mereka.

“Kami tidak benar-benar berharap itu akan mendapatkan banyak daya tarik atau apa pun, jadi kami hanya mengeluarkan sesuatu,” jelas Drai. “Kemudian yang terjadi adalah dalam semalam, kami terbangun dengan server yang kelebihan beban — seperti, tidak ada yang benar-benar berfungsi. Jadi kami mengambil semuanya dan benar-benar menyusun semacam daftar tunggu, ”lanjutnya. “Keesokan paginya, kami mungkin membangunkan 5.000 orang di sana, itu menarik.”

Tim kemudian menemukan bahwa pembuat TikTok telah memposting video pendek tentang produk tersebut, yang mengirimkan banyak lalu lintas ke situs mereka.

“Sebenarnya tidak pernah tenang dari itu,” kata Drai.

Produk, diucapkan “dummy”, menarik bagi pembuat karena bertujuan untuk menyederhanakan dan mempercepat pekerjaan yang terkait dengan pengeditan video.

Kredit Gambar: Dumme

Menggunakan Dumme sesederhana namanya. Untuk memulai, pengguna menempelkan tautan video YouTube, lalu mengklik “hasilkan” dan AI akan menampilkan sejumlah video pendek yang menampilkan sorotan dari konten yang diserap tersebut. Perusahaan mengatakan itu menggunakan YouTube sebagai sumber, alih-alih mendukung rekaman video mentah, untuk mengalihdayakan moderasi konten – yaitu, jika diizinkan di YouTube, itu diizinkan di Dumme.

Waktu pemrosesan dan jumlah klip yang dihasilkan akan bergantung pada panjang video aslinya.

Tetapi sebagai contoh, podcast video berdurasi satu jam mungkin memerlukan waktu sekitar 20 menit untuk diproses dan Anda akan mulai menerima klip setelah sekitar lima menit, kata Drai. Setelah selesai, pembuat dapat mengunduh klip video, yang secara default kurang dari 60 detik, dan mengunggahnya ke platform apa pun yang mendukung konten bentuk pendek, seperti YouTube Shorts, tetapi juga platform lain, seperti Reels atau TikTok.

Kredit Gambar: Dumme

Bagaimana semua ini bekerja di bagian belakang, tentu saja, jauh lebih kompleks. Perusahaan mengatakan bahwa, pada awalnya, Dumme akan belajar sebanyak mungkin dari video sumber melalui metadata. Itu kemudian menyalin video dan mencoba memahami semantik dari apa yang dikatakan sambil juga melihat bingkai untuk mencoba memecahkan kode emosi orang yang berbicara. Temuan ini dikorelasikan dan diteruskan ke model bahasa yang mencoba menentukan bagian mana dari video yang layak untuk kliping. Itu kemudian diteruskan ke model lain yang melacak speaker aktif dan menangani pemangkasan.

Dumme mengatakan itu bekerja dengan model AI yang ada seperti GPT-4, versi Whisper yang disetel dengan baik dan lainnya yang dibuat sendiri – seperti model yang melacak speaker aktif dalam bingkai video. Salah satu modelnya juga dilatih di banyak YouTube Shorts untuk mempelajari apa yang membuat hook pembuka yang bagus untuk menarik pemirsa. Dan, meskipun belum tayang, tim ini juga bereksperimen dengan model open source, LaViLa dari Facebook Research, untuk lebih memahami konteks video.

Pekerjaan AI sedang dilakukan pada penyedia Cloud GPU CoreWeave, bukan AWS, karena lebih terjangkau, kata perusahaan itu kepada kami.

Karena Dumme mengandalkan AI yang memproses kata-kata yang diucapkan, teknologi tersebut tidak sesuai untuk hal-hal seperti video alur game yang panjang atau lainnya di mana orang tidak berbicara. Drai mengatakan startup ini awalnya menargetkan pembuat YouTube, podcaster, dan agensi – yang terakhir, menurut mereka, akan menjadi pilihan terbaik untuk memonetisasi produk.

Kredit Gambar: Dumme

Agensi, jelas Drai, saat ini sering mengalihdayakan jenis pekerjaan ini dengan hasil untung-untungan.

“Mereka hanya membayar kontraktor di yurisdiksi murah untuk mengedit konten mereka sendiri. Dan masalahnya adalah itu sebenarnya masih cukup mahal dan memakan banyak waktu – butuh berminggu-minggu, bukan menit, ”katanya.

Ditanya bagaimana perasaannya tentang menciptakan teknologi yang benar-benar membuat orang kehilangan pekerjaan, Drai tidak khawatir.

“Cara saya memikirkannya adalah, pada akhirnya… Saya pikir ini seperti memberi tahu saya bahwa guru matematika akan melakukannya [be put] menganggur karena ada yang namanya kalkulator…,” jelasnya. “Orang-orang akan beradaptasi. Lalu akan ada seseorang yang mengajarimu tentang kalkulator, kan? Jadi saya pikir ini hanya soal beradaptasi dengan ini,” kata Drai.

Saat ini, harga yang sedang dipertimbangkan melibatkan tingkatan di mana bisnis akan membayar $0,40 per menit untuk video yang diproses, sementara pembuat konten yang lebih kecil dapat memilih langganan bulanan yang dibatasi hingga 10 jam konten per bulan. (Angka-angka ini dapat berubah.) Selama pengujian, produk bebas digunakan.

Pengadopsi awal telah menggunakan Dumme untuk berbagai pengeditan, termasuk membuat klip dari podcast video mereka untuk dipublikasikan ke Shorts, serta memotong video baru lainnya dan menelusuri katalog belakang mereka.

Produk tersebut tampaknya bersaing dengan teknologi AI lainnya di pasar, termasuk dari perusahaan pembuat Jellysmack, yang telah memanfaatkan AI untuk mengubah video YouTube yang lebih panjang menjadi video yang lebih pendek, dengan memotong, mengubah ukurannya, dan mengoptimalkannya untuk platform tertentu — sebuah hasil dari akuisisi Kamua tahun 2021. Alat lain yang melakukan pekerjaan serupa termasuk hal-hal seperti Vidyo.ai, Detail, TubeBuddy, Wisecut, dan lainnya. Sejauh mana Dumme berhasil atau gagal akan mengungguli pesaing dalam kualitas pekerjaan dan biaya – metrik yang belum ditentukan.

Tetapi beberapa investor bertaruh pada Dumme. Menjelang peluncurannya, startup ini mengumpulkan dana awal sebesar $3,4 juta dari Y Combinator, Caffeinated Capital, Max dan Nellie Levchin (melalui SciFi VC), Suhail Doshi, Nico Chinot, Protocol Labs, Chris Puscasiu, dan malaikat lainnya.

Mengingat minat dan daftar tunggu yang cukup besar, Dumme mengatakan itu bertujuan untuk membawa sekitar 500 orang setiap minggu. Pembaca TechCrunch dapat melewati batas menggunakan kode undangan TECHCRUNCH hingga slot habis.