Investasi $ 14,3 miliar di Scale AI telah mengintensifkan diskusi yang sedang berlangsung tentang kualitas dan kepercayaan data AI - kadang-kadang dengan cara yang mencerminkan buruk pada Meta dan Scale, tetapi tidak diragukan lagi dengan cara yang penting.
Investasi ini, yang diumumkan pada Juni 2025, memberikan Meta 49% kepemilikan non-voting di startup label data AI.
Dalam beberapa hari, klien utama termasuk Google, OpenAI, dan xAI mulai mematahkan hubungan dengan Scale AI, memicu apa yang digambarkan oleh satu pesaing sebagai “
Hasilnya telah membawa fokus baru pada dua bidang penting yang membentuk masa depan pengembangan AI: infrastruktur kepercayaan yang mendukung kemitraan dan kebutuhan yang semakin meningkat untuk data pelatihan berkualitas tinggi.
Imperatif untuk mempercayai pengembangan AI
Scale telah membangun penilaian mereka pada proposisi yang sederhana tetapi kuat: bertindak sebagai arbiter netral di pasar label data, menyediakan layanan untuk hampir setiap laboratorium AI besar tanpa memainkan favorit.
Investasi Meta menghancurkan kepercayaan itu sepanjang malam.Seperti Garrett Lord, CEO dari pesaing Scale Handshake,
A client exodus was swift and decisive. Google, Scale’s largest customer with plans to spend approximately $200 million on Scale’s services in 2025,
Tetapi krisis kepercayaan itu lebih dalam daripada kekhawatiran kompetitif. penyelidikan berikutnya dari Business Insider mengungkapkan bahwa Scale AI
Pelanggaran keamanan meluas ke tenaga kerja Scale, dengan dokumen publik yang berisi alamat email pribadi ribuan kontraktor, informasi gaji, dan penilaian kinerja - termasuk daftar pekerja yang dicurigai "pelecehan." para ahli keamanan siber menggambarkan praktik Scale sebagai "sangat tidak dapat diandalkan," memperingatkan bahwa kerentanan tersebut dapat mengekspos perusahaan dan kliennya ke berbagai bentuk serangan siber.
Scale menanggapi dengan berjanji untuk melakukan penyelidikan menyeluruh dan menonaktifkan berbagi dokumen publik,Namun kerusakan tersebut telah dilakukan.
Tantangan Kualitas Data
Sementara kepercayaan mendominasi headlines, kesepakatan Meta-Scale menyoroti tantangan yang lebih fundamental: kekurangan data pelatihan berkualitas tinggi yang meningkat yang mengancam akan membatasi pengembangan AI.
Krisis kualitas data adalah baik kuantitatif dan kualitatif. penelitian oleh Epoch AI menunjukkan bahwa
Proliferasi konten sintetis menciptakan siklus jahat. model AI yang dilatih pada data yang dihasilkan oleh AI menderita dari apa yang disebut peneliti
Solusi adalah mengandalkan para ahli topik yang menerapkan pengetahuan mereka untuk melatih dan memeriksa kualitas aplikasi AI. Sebagai contoh, model AI dalam perawatan kesehatan membutuhkan wawasan mendalam yang terletak di dalam pikiran praktisi industri. para praktisi itu, pada gilirannya, perlu diajarkan bagaimana untuk mendorong model bahasa besar untuk melatih mereka. Anda hanya tidak menemukan para ahli di luar rak.
Model bisnis Scale AI dibangun untuk memecahkan tantangan ini melalui jaringan global lebih dari 240.000 kontraktor yang secara manual menganotasi gambar, teks, dan video, tetapi dokumen internal perusahaan mengungkapkan masalah kontrol kualitas yang melampaui pelanggaran keamanan.
Tekanan untuk melayani klien utama selama boom AI pasca-ChatGPT menyebabkan kompromi dalam kontrol kualitas. program yang dimaksudkan untuk dipekerjakan secara eksklusif oleh para ahli menjadi “terpancar dengan spam,” menurut dokumen internal.
Efek Ripple di seluruh ekosistem AI
Kontroversi Meta-Scale telah mempercepat fragmentasi pasar karena perusahaan berjuang untuk mengurangi ketergantungan pada penyedia tunggal.