(Anotasi tingkat Gleason yang disempurnakan dari dataset TCGA PRAD) adalah hasil kolaborasi antara Codatta dan DPath.ai, menetapkan standar baru untuk data patologi yang siap untuk AI. Dengan mengumpulkan komunitas ahli patologi terkemuka melalui platform Codatta, dataset ini melampaui anotasi tingkat potongan tradisional dengan memperkenalkan anotasi spasial tingkat ROI, meningkatkan detail, akurasi, dan transparansi diagnostik. Dengan tingkat Gleason yang disempurnakan, alasan anotasi yang mendetail, dan pemetaan model Gleason berbasis ROI, dataset ini menjadi sumber daya kunci untuk pengembangan model AI dan penelitian patologi, mengatasi tantangan utama dalam menciptakan data anotasi berkualitas tinggi. Melalui Model Royalti Codatta, kontributor dapat mempertahankan kepemilikan atas karya mereka, memastikan pengakuan dan nilai berkelanjutan, sementara DPath.ai menunjukkan bagaimana solusi kolaboratif dapat mendorong kemajuan dalam AI patologi.
Gambar 1: Anotasi tingkat Gleason yang disempurnakan dari dataset TCGA PRAD. Sumber gambar: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset
Apa itu dataset TCGA PRAD?
Anotasi tingkat Gleason yang disempurnakan dari dataset TCGA PRAD (karcinoma prostat dalam atlas genom kanker) meningkatkan anotasi tingkat potongan asli, dengan menambahkan anotasi spasial tingkat ROI. Dikembangkan bersama oleh Codatta dan DPath.ai, dataset ini dibuat dengan kolaborasi komunitas ahli patologi, mendukung partisipasi global dan memastikan kepemilikan anotasi. Metode ini meningkatkan akurasi, detail, dan keandalan diagnostik, yang merupakan elemen kunci untuk pelatihan model AI dan penelitian patologi.
Dengan mengorganisir 435 gambar potongan TCGA, para ahli patologi mengidentifikasi 245 kasus yang memerlukan perbaikan anotasi, serta mengkonfirmasi 190 kasus anotasi yang akurat. Dataset ini mencakup metadata tingkat potongan dan anotasi spasial tingkat ROI, menyediakan sumber daya berharga bagi peneliti untuk pengembangan alur kerja AI, eksplorasi area tumor interaktif, serta penelitian patologi lanjutan.
Pemberdayaan AI Patologi: Codatta dan DPath.ai Bekerja Sama
(Anotasi tingkat Gleason yang disempurnakan dari dataset TCGA PRAD) menunjukkan potensi penciptaan data kolaboratif dan berbasis komunitas, sekaligus meningkatkan akurasi dan detail anotasi, menjadikan pelatihan model AI lebih dapat diandalkan dan mendorong kemajuan penelitian medis. Namun, kontribusi ini memerlukan keahlian bidang, waktu, dan usaha, sehingga memerlukan struktur insentif yang berkelanjutan untuk mengakui dan menghargai kerja para profesional yang terampil.
Model Royalti
Model Royalti Codatta menawarkan solusi untuk ini. Dibandingkan dengan model Web2 tradisional (seperti Scale AI), ini meningkatkan efisiensi kontribusi dan perolehan data. Meskipun Scale AI unggul dalam memenuhi preferensi likuiditas instan pengguna umum, mampu mengumpulkan data besar dengan cepat dan efisien, biaya tinggi dalam melibatkan para ahli di bidang tersebut menghalangi peserta kecil. Namun, Codatta sejalan dengan para praktisi dan ahli yang terampil dengan menawarkan imbalan berbasis aset dan kondisi. Seperti yang ditunjukkan pada gambar 2 di bawah, insentif ini menarik kontributor yang bersedia memberikan data profesional berkualitas tinggi, meskipun pengembalian mungkin tertunda, tetapi potensi keuntungannya lebih tinggi, menjadikan Codatta pilihan ideal untuk aplikasi AI vertikal dan lanjutan yang membutuhkan akurasi dan profesionalisme.
Gambar 2: Pemetaan keterampilan dan preferensi likuiditas dalam kontribusi data
Berbeda dengan biaya awal yang tinggi dari Scale AI, Model Royalti Codatta menghilangkan hambatan finansial bagi startup AI kecil dengan memperkenalkan sistem pembayaran sesuai permintaan. Metode ini mendemokratisasikan perolehan data terdepan yang penting tanpa memerlukan investasi awal yang mahal, memungkinkan startup untuk menunjukkan kesesuaian produk mereka di pasar dan memperluas skala. Selain itu, dengan mengubah data menjadi aset likuid di pasar keuangan terdesentralisasi, Codatta memastikan kontributor dapat menyeimbangkan kebutuhan likuiditas jangka pendek dengan kepemilikan aset jangka panjang. Fungsi seperti transaksi yang disepakati dan kepemilikan sebagian lebih lanjut mengoptimalkan likuiditas, menjadikan imbalan berbasis aset lebih menarik bagi kontributor yang lebih luas. Konsistensi ini mendorong kolaborasi, inovasi dalam aplikasi AI niche, dan menciptakan ekosistem investasi yang beragam bagi pencipta data dan startup.
DPath.ai: Solusi kolaboratif untuk tantangan data AI patologi
DPath.ai sedang menciptakan platform terdesentralisasi yang bertujuan menghubungkan ahli patologi, peneliti, dan pengembang model AI di seluruh dunia. Kami bertanggung jawab untuk memperoleh, menyusun, dan menukar data patologi berkualitas tinggi, memungkinkan siapa saja yang tertarik untuk melatih model AI untuk berpartisipasi. Platform DPath memanfaatkan teknologi blockchain untuk memastikan transparansi, keadilan, dan keamanan dalam pertukaran data.
Platform seperti DPath.ai dapat memanfaatkan protokol data terdesentralisasi Codatta untuk memperoleh anotasi secara kolaboratif dan transparan:
Definisi tugas: Standar anotasi yang jelas (seperti tingkat Gleason untuk kanker prostat) memastikan konsistensi dan keandalan data hasil.
Partisipasi Komunitas: Ahli patologi berpengalaman di seluruh dunia berpartisipasi melalui platform Codatta dan didorong oleh Model Royalti mereka untuk mendapatkan imbalan berkelanjutan yang terkait dengan nilai masa depan dataset.
Kualitas dan Integritas: Verifikasi berbasis blockchain dan referensi silang multilateral memastikan anotasi berkualitas tinggi yang dapat dilacak, sekaligus meningkatkan akuntabilitas para anotator.
Keamanan dan Aksesibilitas: Data disimpan secara terdesentralisasi, menjaga kepemilikan data aman dan dapat diakses oleh individu terkait.
Gambar 3: Kolaborasi Codatta dengan DPath.ai. Sumber gambar: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset
Dengan cara kolaboratif untuk memperoleh data spesifik bidang, DPath.ai tidak hanya memperkaya dataset TCGA PRAD dengan tingkat Gleason yang tepat, tetapi juga menunjukkan bagaimana platform Codatta menciptakan data terdepan untuk bidang AI profesional. Pendekatan ini mendorong partisipasi yang berkelanjutan, mendemokratisasikan perolehan data, dan mempercepat pengembangan sistem AI kesehatan yang adil dan efisien.
Kesimpulan
(Anotasi tingkat Gleason yang disempurnakan dari dataset TCGA PRAD) adalah hasil kolaborasi antara Codatta dan DPath.ai, yang meningkatkan akurasi dan detail diagnostik data AI patologi melalui anotasi tingkat ROI yang disertai alasan anotasi. Dengan partisipasi para ahli patologi global, proyek ini memastikan data berkualitas tinggi, sekaligus memberikan imbalan kepada kontributor melalui Model Royalti Codatta, menawarkan nilai berkelanjutan dan kepemilikan. Pendekatan ini juga mendorong kolaborasi, meningkatkan likuiditas data, mempercepat pengembangan AI kesehatan, dan menunjukkan kekuatan solusi berbasis komunitas yang terdesentralisasi.