Ką reikia žinoti apie OpenAI operatorių

Per pastarąsias kelias savaites OpenAI padėjo pagrindą. Nors dauguma vartotojų tik pradėjo iš tikrųjų tyrinėti „ChatGPT Tasks“ – naują funkciją, leidžiančią naudotojams planuoti ir suaktyvinti užduotis, įmonė ruošėsi kažkam daug reikšmingesniam.

Vakar išleistas „Operator“ yra dar vienas aiškus signalas, kur link juda dirbtinis intelektas: nuo modelių, kurie tiesiog apdoroja informaciją, iki agentų, kurie gali aktyviai dirbti kartu su mumis.

Kiekvieną dieną praleidžiame daugybę valandų naršydami svetaines, pildydami formas, užsakydami paslaugas ir tvarkydami skaitmenines užduotis. AI dažniausiai stebėjo iš šalies, apsiribojo patarimu ar teksto apdorojimu. Operatorius kartu su kai kuriais kitais naujausiais agentų pranešimais, tokiais kaip Anthropic’s Computer Use ir Google’s Project Mariner, visiškai pakeičia šią dinamiką.

Techninis pasiekimas čia yra reikšmingas. OpenAI sukūrė dirbtinį intelektą, kuris gali matyti žiniatinklio sąsajas ir su jomis sąveikauti kaip žmogus. Jis fiksuoja ekrano kopijas, supranta vaizdinius išdėstymus ir priima sprendimus, kur spustelėti, ką įvesti ir kaip naršyti.

Štai ką reikia žinoti apie operatoriaus agentą: Nors daugelis AI įrankių iš esmės yra įstrigę už API ir specializuotų integracijų, Operator dirba su žiniatinkliu lygiai taip pat, kaip jūs. Jis mato ekraną, supranta kontekstą ir tiesiogiai imasi veiksmų.

Turinys:

Atidžiau pažvelkite į tikrąjį operatoriaus darbą

Kai dirbtinio intelekto įmonės išleidžia etalonus, svarbu atidžiai pažvelgti į tai, ką iš tikrųjų reiškia skaičiai. Operatoriaus našumas skirtingose testavimo aplinkose pasakoja skirtingą istoriją.

Įspūdingiausias rodiklis yra 87 % operatoriaus sėkmės rodiklis WebVoyager etalone. Tai svarbu, nes „WebVoyager“ išbando realaus pasaulio svetaines – faktines platformas, kurias naudojame kasdien, pavyzdžiui, „Amazon“ ir „Google Maps“. Tai nėra kontroliuojamas laboratorinis tyrimas. Tai spektaklis laukinėje gamtoje.

Tačiau pažvelgę į kitus etalonus matome labiau niuansuotą vaizdą:

WebArena etalonas: 58,1% sėkmės rodiklis. Imituojamų svetainių testavimas atliekant tokias užduotis kaip apsipirkimas ir turinio valdymas. Žemesnis našumas iš tikrųjų atskleidžia kai ką svarbaus apie tai, kaip AI agentai tvarko struktūrizuotą ir nestruktūruotą aplinką.
OSWorld etalonas: 38,1% sėkmės rodiklis. Taip išbandomos sudėtingos kelių etapų užduotys, pvz., PDF rinkmenų derinimas iš el. laiškų. Didelis našumo sumažėjimas parodo dabartines AI agentų ribas, kai užduotims atlikti reikia kelių konteksto jungiklių.

Mane domina šie skaičiai, kaip jie atspindi žmogaus mokymosi modelius. Paprastai mes geriau veikiame pažįstamoje, realaus pasaulio aplinkoje nei dirbtiniais bandymų scenarijais. Faktas, kad „Operator“ puikiai tinka tikrosioms svetainėms, nors ir kovoja su imituotomis svetainėmis, rodo, kad jo mokymas teikia pirmenybę praktinei naudai, o ne teoriniam veikimui.

Šie etalonai nustato naujus naršyklės automatizavimo rekordus, tačiau skirtingi skirtingų bandymų sėkmės rodikliai mums parodo kai ką esminio apie OpenAI strategiją.

Pagalvokite apie savo naršymą internete. Dauguma užduočių yra nesudėtingos: pildyti anketas, pirkti, rezervuoti susitikimus. Čia šviečia 87% operatoriaus sėkmės rodiklis. Sudėtingesnės užduotys, kurių našumas krenta, paprastai yra tos, kurių žmogiškoji priežiūra bet kokiu atveju yra vertinga.

Šie duomenys rodo, kad „OpenAI“ daro apgalvotą pasirinkimą: pirmiausia tobulinkite įprastas užduotis, o tada palaipsniui išplėskite iki sudėtingesnių operacijų. Tai praktinis požiūris, kuris teikia pirmenybę tiesioginei naudai, o ne teorinėms galimybėms.

AI agento lyginamieji standartai („OpenAI“)

OpenAI požiūris į operatorių atskleidžia kruopščiai parengtą strategiją.

Pirma, apsvarstykite laiką. Neseniai įdiegus tokias funkcijas kaip „ChatGPT Tasks“ buvo siekiama ne tik pridėti funkcijų, bet ir paruošti vartotojus savarankiškiems agentams.

Bet štai kas yra tikrai įdomu: OpenAI planuoja atskleisti CUA modelį per API. Tai reiškia, kad kūrėjai galės sukurti savo kompiuterius naudojančius agentus.

To pasekmės yra reikšmingos:

Integracijos potencialas

Tiesioginis įtraukimas į esamas darbo eigas
Individualūs agentai konkretiems verslo poreikiams
Konkrečiai pramonės šakai pritaikyti automatikos sprendimai

Ateities plėtros kelias

Išplėtimas iki Plus, Team ir Enterprise vartotojų
Tiesioginė ChatGPT integracija
Geografinė plėtra (nors Europa užtruks ilgiau dėl reguliavimo reikalavimų)

Iškalbingos ir strateginės partnerystės. OpenAI bando sukurti visą ekosistemą. Jie dirba su tokiomis įmonėmis kaip „DoorDash“, „Instacart“ ir „OpenTable“, taip pat su viešojo sektoriaus organizacijomis, tokiomis kaip Stoktono miestas.

Tai rodo ateitį, kurioje AI agentai yra ne tik padėjėjai, bet ir neatsiejama sąveikos su skaitmeninėmis sistemomis dalis.

Ką tai iš tikrųjų reiškia jums

Įžengiame į fazę, kai dirbtinis intelektas ne tik atsako į klausimus – jis tampa aktyviu mūsų skaitmeninio gyvenimo dalyviu.

Pagalvokite apie savo kasdienes užduotis internete. Ne sudėtingas strateginis darbas, kuriam reikia jūsų patirties, o pasikartojančios užduotys. Kalbu apie kelionių galimybių keliose svetainėse tyrimą, standartizuotų formų pildymą, duomenų rinkimą iš įvairių žiniatinklio šaltinių ir įprastų užsakymų tvarkymą. Čia operatorius iš pradžių pašalina skaitmeninį užimtumą. Tačiau ne čia tai sustos. Laikui bėgant AI agentai galės atlikti vis sudėtingesnes darbo eigas.

Ankstyvieji našumo duomenys taip pat mums sako kai ką labai svarbaus: operatorius puikiai atlieka įprastas žiniatinklio užduotis su 87 % sėkmės rodikliu. Ankstyvieji naudotojai, išmokę jį efektyviai integruoti, turės didelį našumo pranašumą.

Integravimo laiko juosta atskleidžia kruopštų OpenAI požiūrį. Pradedama nuo „Pro“ naudotojų JAV, o vėliau iki „Plus“, „Team“ ir „Enterprise“ naudotojų, kol galiausiai integruosis tiesiogiai į „ChatGPT“.

Stebime esminį AI įrankių veikimo pokytį. Tikrasis klausimas, kurį turėtumėte užduoti sau, yra ne tai, ar prisitaikyti prie šių pokyčių, o kaip tai padaryti strategiškai. Technologija vystysis, tačiau principas išlieka: AI nuo atsakymų į klausimus pereina prie veiksmų. Tie, kurie anksti supras šį pakeitimą, turės didelį pranašumą formuodami, kaip šie įrankiai bus integruojami į jų darbo eigą.

Source link

Atidžiau pažvelkite į tikrąjį operatoriaus darbą

Ką tai iš tikrųjų reiškia jums

Susiję įrašai