Teknolog dan CEO Synesis One, Isaac Bang, memperingatkan terhadap skenario 'sangat berbahaya' di mana beberapa raksasa teknologi menguasai data dan memimpin perlombaan kecerdasan buatan (AI). Dia berargumen untuk 'demokratisasi' kekuatan AI, memastikan bahwa 'pemenang' dari perlombaan AI yang sedang berlangsung tidak menjadi raksasa industri.

Menurut Bang, sebagian dari solusi terletak pada memprioritaskan crowdsourcing data terdesentralisasi daripada bergantung pada perusahaan besar yang berfokus pada data. Seperti yang dijelaskan Bang dalam tanggapan tertulisnya kepada Bitcoin.com News, crowdsourcing data terdesentralisasi memungkinkan perusahaan menghindari penggunaan ilmuwan data internal. Sebaliknya, mereka dapat 'menawarkan pekerjaan' kepada kumpulan umum pekerja digital atau spesialis untuk tugas analisis data.

Model ini, menurut Bang, ideal untuk perusahaan yang ingin berkembang tetapi kekurangan sumber daya internal. Selain keuntungan komersial, crowdsourcing data terdesentralisasi juga membantu mengatasi tantangan bias data yang dihadapi oleh raksasa teknologi terpusat.

Sementara pemerintah menyatakan kekhawatiran keselamatan publik terkait manajemen data terdesentralisasi, Bang tetap memperingatkan terhadap regulasi luas yang mungkin akhirnya menghambat inovasi. Sebaliknya, ia mendesak regulator dan pembuat undang-undang untuk mempelajari bagaimana 'sumber data terdesentralisasi dapat dan sedang digunakan' sebelum memberlakukan kebijakan.

Tanggapan tambahan Bang membahas persaingan dalam industri AI dan risiko inheren yang terkait dengan penggunaan AI. Di bawah ini adalah jawaban CEO Synesis One untuk pertanyaan yang dikirim.

Isaac Bang (IB): AI adalah teknologi kunci yang membawa revolusi industri keempat, dan dampaknya jauh lebih luas daripada yang dapat kita bayangkan saat ini. Beberapa pemain dominan yang menguasai data dan memimpin perlombaan AI sangat berbahaya dalam banyak hal. Tidak hanya teknologi AI yang memungkinkan bisnis menjadi lebih produktif dan memaksimalkan keuntungan, tetapi juga memungkinkan pemerintah meningkatkan kemampuan militer mereka baik secara fisik maupun digital. 'Pemenang' dari perlombaan AI akan menjadi kekuatan dominan, dan sangat penting kita mengambil tindakan sekarang untuk mendemokratisasi kekuatan AI demi kebaikan semua.

IB: Secara tradisional, perusahaan mengumpulkan data dari pengguna/pelanggan yang menggunakan produk atau layanan yang diberikan. Untuk memanfaatkan data yang dikumpulkan untuk AI, perusahaan mempekerjakan ilmuwan data dan spesialis lainnya untuk membersihkan dan menganotasi data. Metode tradisional dalam mengumpulkan dan menyiapkan data efisien untuk perusahaan besar dengan banyak pengguna dan banyak uang. Namun, untuk perusahaan kecil dan menengah, meningkatkan kebutuhan data mereka akan sulit.

Crowdsourcing data terdesentralisasi adalah pengumpulan data mentah atau praproses data melalui jaringan besar pekerja digital yang bersedia dan mampu menyediakan data atau pekerjaan praproses. Perusahaan atau pengembang dapat, tanpa memiliki pengguna atau ilmuwan data internal, menawarkan hadiah untuk tugas data dari kumpulan umum pekerja digital atau spesialis untuk melakukan pekerjaan data. Ini memungkinkan perusahaan untuk berkembang tanpa perlu menghabiskan sejumlah besar uang dan waktu untuk mempekerjakan tenaga kerja internal.

IB: Manusia memiliki kemampuan untuk melakukan penalaran logis. AI yang menggunakan pembelajaran mesin saat ini menggunakan perhitungan statistik untuk mengenali pola, tanpa penalaran logis. Seiring model AI meningkat, kebutuhan akan data berkualitas tinggi dan data spesifik domain menjadi semakin berharga. Misalnya, LLM umum tidak cocok untuk digunakan dalam pengaturan medis. LLM dapat disesuaikan untuk bidang kedokteran tertentu, tetapi melakukan hal itu memerlukan manusia dengan pengetahuan ahli di bidang tersebut. Konsep ini tidak hanya berlaku untuk LLM umum, tetapi juga untuk aplikasi AI lainnya dengan kasus penggunaan yang lebih spesifik.

IB: Sederhana – semakin beragam kumpulan penyedia data dan pengannotasi data, semakin beragam dan representatif data tersebut. Dalam jaringan crowdsourcing terdesentralisasi, penyedia data mentah dan/atau pengannotasi data tidak berasal dari satu platform, perusahaan, jaringan, atau kelompok. Ini mengurangi bias data yang mungkin dihadapi perusahaan terpusat.

IB: Salah satu kasus penggunaan yang paling praktis adalah dalam ranah bahasa alami. Bisnis saat ini bersifat global, dan ini mengharuskan perusahaan untuk mahir dalam memberikan kualitas layanan dan produk yang sama dalam semua bahasa pasar yang mereka layani. Namun, banyak dari LLM yang berkinerja terbaik saat ini sebagian besar berbasis bahasa Inggris. Kami telah melihat perusahaan mengandalkan crowdsourcing untuk bahasa dan dialek yang berbeda, tidak hanya untuk kebutuhan AI, seperti lokalisasi produk mereka.

IB: Selama semua transaksi data tercatat di onchain, transparansi seharusnya cukup untuk mengatasi kekhawatiran pengawasan dan pengawasan. Jika regulator benar-benar khawatir tentang keselamatan dan keamanan publik, seharusnya ada lebih banyak regulasi untuk manajemen dan penggunaan data oleh entitas terpusat. Alih-alih melompat ke kesimpulan dengan ketakutan, pembuat undang-undang harus terlebih dahulu mempelajari cara sumber data terdesentralisasi dapat dan sedang digunakan. Jika ada niat atau penggunaan yang jahat, maka mereka harus turun tangan, alih-alih mengeluarkan regulasi payung yang merugikan inovasi.

Technologist: Decentralized Data Crowdsourcing Is Key to Countering Big Tech's Dominance

CEO Synesis One, Isaac Bang

IB: Saat ini, kami belum menyaksikan adanya penyalahgunaan platform. Sulit untuk benar-benar melihat risiko potensial yang mungkin berdampak pada tingkat keamanan nasional. Di tingkat penyimpanan data, Synesis dapat bekerja dengan solusi penyimpanan terdistribusi (misalnya, IPFS, Arweave) dan solusi terpusat (misalnya, AWS), jadi terserah kepada klien. Di tingkat anotasi data, setiap orang melewati tinjauan sejawat dan bahkan tinjauan sejawat dapat dioptimalkan secara khusus oleh klien untuk mencegah perilaku jahat.

IB: Di Synesis, kami bertujuan untuk menjadi jaringan pekerja digital terbesar di dunia yang terdiri dari spesialis dan ahli domain tertentu yang membantu dalam kebutuhan data AI dari perusahaan. Kami sudah melihat peningkatan permintaan untuk pengetahuan tingkat ahli untuk pelatihan AI (misalnya, fine tuning, RLHF, data mentah) seiring dengan semakin banyaknya kasus penggunaan AI. Kami ingin memungkinkan perusahaan dari segala ukuran di berbagai domain untuk dapat meningkatkan kebutuhan data AI mereka dengan memanfaatkan platform dan jaringan ahli digital kami di seluruh dunia. Ini tidak hanya akan membantu perusahaan berkembang, tetapi juga membawa peluang baru bagi orang-orang di seluruh dunia untuk menghasilkan uang dengan menyediakan pengetahuan dan keterampilan mereka secara online.

IB: Secara mengejutkan, ada banyak titik masalah yang belum diselesaikan oleh perusahaan mainstream untuk pekerjanya. Salah satunya adalah masalah pembayaran, karena pembayaran lintas batas seringkali mahal dan lambat. Titik masalah utama lainnya adalah kurangnya transparansi. Ini adalah keuntungan besar bagi kami karena sistem pembayaran kami tidak memerlukan saldo minimum, tidak memiliki biaya, dan instan. Kami telah mengontrak banyak pekerja digital yang frustrasi yang telah menggunakan pemain besar di ruang pelabelan data web2. Seiring kami membawa lebih banyak pekerja digital dari berbagai latar belakang dan membangun jaringan, solusi kami akan semakin menarik bagi klien potensial.

IB: Salah satu risiko terbesar yang dihadapi pengguna kami adalah ketidakcocokan pengetahuan dan/atau keterampilan yang dibutuhkan untuk kampanye tertentu. Beberapa kampanye data bersifat teknis, dan jika seorang pengguna tidak berkinerja baik, pengguna tidak akan mendapatkan imbalan yang baik. Segala sesuatu, termasuk reputasi pengguna, didasarkan pada akurasi pekerjaan yang diberikan oleh pengguna. Beberapa tugas memerlukan keterampilan/pengetahuan teknis, atau memiliki kurva pembelajaran yang curam. Jadi, setiap pengguna baru di platform harus mengharapkan untuk menghabiskan waktu belajar bagaimana melakukan beberapa tugas kampanye/data. Kami terus memperbarui dan memproduksi materi pendidikan dan pelatihan baru untuk pengguna baru dan yang sudah ada agar kami dapat membimbing mereka untuk tampil lebih baik. Ini menguntungkan semua orang, selama pengguna menghabiskan waktu membaca dan belajar dari materi tersebut.