320 čitanja
320 čitanja

Meta's $ 14B Bet na Scale AI Backfires, Triggers AI Trust Crisis

by davidjdeal...4m2025/06/30
Read on Terminal Reader

Predugo; Citati

Ulaganjem u Scale, Meta je intenzivirala kontinuirani razgovor o poverenju u ekosistem AI i kvalitetu podataka potrebnih za obuku AI.
featured image - Meta's $ 14B Bet na Scale AI Backfires, Triggers AI Trust Crisis
David Deal HackerNoon profile picture
0-item

Njegova investicija od 14,3 milijardi dolara u Scale AI pojačala je raspravu o kvalitetu i poverenju podataka o AI-u – ponekad na načine koji loše odražavaju Meta i Scale, ali nedvojbeno na načine koji su važni.

Investicija, najavljena u junu 2025. godine, dodijelila je Meta 49% ne-glasujućeg udjela u startup-u za označavanje podataka AI, dokIznajmljivanje svog izvršnog direktora, Alexandr WangOno što je uslijedilo bilo je katastrofa u lancu opskrbe koja je otkrila temeljne ranjivosti u čitavom ekosustavu AI.

Iznajmljivanje svog izvršnog direktora, Alexandr Wang

U roku od nekoliko dana, veliki klijenti uključujući Google, OpenAI i xAI počeli su prekinuti veze sa Scale AI, što je izazvalo ono što je jedan konkurent opisao kao "Eksplozija naftovoda između Rusije i Evrope» »

Eksplozija naftovoda između Rusije i Evrope

Rezultat je donio obnovljen fokus na dva ključna područja koja oblikuju budućnost razvoja AI: infrastrukturu poverenja koja podržava partnerstva i rastuću potrebu za visokokvalitetnim podacima o obuci.

Imperativ za poverenje u razvoj AI

Scale je svoju procjenu izgradio na jednostavnom, ali snažnom prijedlogu: služiti kao neutralni arbiter na tržištu označavanja podataka, pružajući usluge gotovo svakom velikom laboratoriju AI bez igranja favorita.

Meta je investicija razbila to poverenje preko noći. Kao Garrett Lord, izvršni direktor konkurenta Scale Handshake,explained“Labori ne žele da druge laboratorije saznaju koje podatke koriste da bi svoje modele napravili boljim. Ako ste General Motors ili Toyota, ne želite da vaši konkurenti dođu u vašu tvornicu i vide kako upravljate svojim procesima.”

Objašnjenje

Google, najveći kupac Scale-a s planovima da potroši oko 200 miliona dolara na usluge Scale-a 2025. godine,immediately began planning to sever tiesOpenAI je potvrdio da je obustavlja odnose koji su bili mjesecima u izradi. xAI stavio projekte na vrijeme.

Odmah je počeo planirati rastavljanje veza

Ali kriza povjerenja bila je dublja od konkurentnih zabrinutosti. naknadna istraga Business Insider-a otkrila je da je Scale AIkoristite javni Google Docskako bi pratili rad visokih profila klijenata, ostavljajući hiljade stranica povjerljivih dokumenata projekta dostupnih svima sa linkom.

koristite javni Google Docs

Bezbednosni propusti proširili su se na radnu snagu Scale-a, s javnim dokumentima koji sadrže privatne adrese e-pošte hiljada izvođača, informacije o plaćama i procjene performansi – uključujući liste radnika osumnjičenih za „prevara“.

Scale je odgovorio obećanjem da će provesti temeljitu istragu i onemogućiti javno dijeljenje dokumenata,Međutim, šteta je učinjena.

Izazov kvaliteta podataka

Dok je povjerenje dominiralo naslovnicama, sporazum Meta-Scale naglasio je još fundamentalniji izazov: rastući nedostatak visokokvalitetnih podataka o obuci koji prijeti da će ograničiti razvoj AI.

Kriza kvaliteta podataka je i kvantitativna i kvalitativna.Istraživanje Epoch AI ukazuje na to dačitav stok ljudski generisanih javnih tekstovnih podataka, procjenjuje se na oko 300 trilijuna žetona, mogao bi biti iscrpljen između 2026. i 2032. godine.Ali problem teče dublje od jednostavnog nedostatka.57% sadržaja na mreži sada je AI generisanstvaranje "krize autentičnosti" koja ugrožava kvalitet podataka o obuci.

čitav stok ljudski generisanih javnih tekstovnih podataka57% sadržaja na mreži sada je AI generisan

Proliferacija sintetičkog sadržaja stvara začarani krug. AI modeli obučeni na AI generisanim podacima pate od onoga što istraživači nazivajuModel kolapsa, fenomen u kojem uzastopne generacije modela gube svoju sposobnost da uhvate punu složenost i varijabilnost podataka iz stvarnog svijeta. raniji kolaps modela utječe na manjine podataka i slučajeve granica, dok kasni kolaps modela može učiniti modele gotovo beskorisnim jer gube većinu svoje varijancije i počinju da zbunjuju osnovne koncepte.

Model kolapsa

Rješenje je da se oslanjamo na stručnjake koji primjenjuju svoje znanje za obuku i kvalitetnu kontrolu aplikacija AI. Na primer, AI modeli u zdravstvenoj skrbi trebaju duboke uvidove koji se nalaze u umovima praktikanata industrije. Ti praktikanti, zauzvrat, moraju biti naučeni kako da pokrenu velike jezikovne modele kako bi ih obučili.Nije ni čudo da 81 odsto preduzeća kaže da imaju značajne probleme s kvalitetom podataka.

Nije ni čudo da 81 odsto preduzeća kaže da imaju značajne probleme s kvalitetom podataka

Poslovni model Scale AI izgradjen je na rješavanju tih izazova kroz globalnu mrežu od preko 240.000 izvođača koji ručno anotiraju slike, tekstove i video zapise.Ali unutarnji dokumenti kompanije otkrili su probleme kontrole kvalitete koji se protežu izvan sigurnosnih kršenja.Transparentno shoddy rad koji je uspio da izbegne detekciju» »

Transparentno shoddy rad koji je uspio da izbegne detekciju

Pritisak da služimo velikim klijentima tokom post-ChatGPT AI buma doveo je do kompromisa u kontroli kvalitete. Programi koji su bili namijenjeni isključivo stručnjacima postali su "zaplavljeni spamom", prema unutrašnjim dokumentima. Čak i kada su projekti bili namijenjeni da budu anonimni, izvođači su lako mogli identificirati klijente po prirodi zadataka ili uputstvu, ponekad jednostavno pozivajući modele izravno.

Ripple učinci širom AI ekosustava

Kontroverza o meta-skali ubrzala je fragmentaciju tržišta jer se kompanije bore da smanje ovisnost o pojedinim pružateljima.Konkurenti skale izvješćuju o dramatičnom porastu potražnjeTo, usput, nije loša stvar. Konkurencija je dobra. Ova fragmentacija takođe odražava šire priznavanje da preduzeća moraju pažljivo provjeriti svoje pružatelje podataka, pogotovo zato što jedan gubitak može kompromitirati infrastrukturu AI. AI razvoj zavisi od složene mreže odnosa. Integritet podataka, neutralnost dobavljača i konkurentna inteligencija se preklapaju na načine koji mogu brzo destabilizirati čitave lance snabdevanja. AI infrastrukture odluke nose rizike koji se protežu daleko iznad tehničkih metrika performansi. S druge strane, preduzeća i proizvođači podataka koji surađuju na obuci AI sa stručnim znanjem o predmetu sada imaju ogromnu prednost. Izrada podataka koja gradi poverenje i poseduje dokazane procese za osiguranje kvaliteta podataka

Konkurenti skale izvješćuju o dramatičnom porastu potražnje

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks