O AI a deschis un magazin cu 100.000 de dolari, dar a greșit cu personalul în prima zi
Ce ar putea face o AI dacă i-ai cere să deschidă un magazin fizic cu 100.000 de dolari? Se pare că destul de multe, cum ar fi realizarea unor logo-uri inconsistente și uitarea de a le comunica angajaților programul. Potrivit businessinsider.com, Andon Labs, o startup din San Francisco, testază agenții AI în lumea reală pentru a identifica lacunele de siguranță existente.
👉 Experimentul Andon Labs cu un magazin fizic condus de AI
Pentru cel mai recent experiment, fondatorii Lukas Petersson și Axel Backlund au semnat un contract de închiriere pe trei ani pentru un spațiu comercial în San Francisco și au atribuit unui agent AI, numit Luna, un card de credit corporativ, acces la internet și misiunea de a deschide un magazin fizic. Petersson a declarat pentru Business Insider că lui Luna nu i s-au dat indicații referitoare la natura magazinului, în afară de limita de 100.000 de dolari pentru a crea și a aproviziona spațiul - și a face profit. Totul, de la designul interior al magazinului până la produsele și cei doi angajați umani, a fost coordonat sub direcția AI-ului.
"Am ajutat-o puțin în setarea inițială, cum ar fi semnarea contractului. La aspecte legale, cum ar fi permisele și altele, uneori s-a descurcat mai greu," a spus Petersson despre Luna, care a fost creată cu ajutorul Claude Sonnet 4.6 de la Anthropic. De acolo, AI-ul a gestionat totul: Luna a publicat anunțuri de angajare pe Indeed, a realizat interviuri telefonice, a angajat angajații și a găsit antreprenorii care puteau să picteze magazinul.
👉 Dificultăți în gestionarea magazinului de către AI
Viziunea pe care Luna a ales-o pentru "Andon Market" pare să fie aceea a unei buticuri generice, vânzând cărți, imprimeuri, lumânări, jocuri și marfă de marcă, printre alte suveniruri. Unele dintre cărțile incluse au fost "Superintelligence" de Nick Bostrom și "Brave New World" de Aldous Huxley. Luna a făcut mai multe greșeli în configurarea și gestionarea Andon Market.
Când căuta angajați umani care să supravegheze magazinul, Luna a oferit postul unor candidați după un apel telefonic de 5 până la 15 minute, a declarat startup-ul. Luna nu a divulgat întotdeauna imediat candidaților că este o AI, decât dacă a fost întrebată în mod explicit. "Faptul că magazinul este operat de AI nu este ceva cu care aș începe un anunț de angajare - ar confuza candidații și probabil ar descuraja aplicanții buni înainte să citească rolul," a citat Luna, conform blogului Andon Labs.
Andon Labs a spus că a văzut câțiva candidați promițători, cum ar fi studenți la informatică interesați de experimentul startup-ului, dar Luna i-a refuzat din cauza lipsei de experiență în retail. O altă problemă cu care s-a confruntat AI-ul a fost incapacitatea de a replica logo-ul de marcă pe care l-a conceput: o față zâmbitoare generică. Fiecare reinterpretare a logo-ului din magazin - fie pe tricou, fie pe muralul magazinului - era "ușor diferită," a scris Andon Labs.
Sâmbătă, la o zi după deschiderea Andon Market, Luna a greșit și programul de personal, a spus Petersson pentru Business Insider. "E destul de ironic. Aceasta este ziua în care ar fi trebuit să fie pe fază," a spus cofondatorul. "A greșit programul și, apoi, într-o panică, a trebuit să scrie tuturor angajaților și să întrebe: 'Oh, poate cineva să vină astăzi?'" Cofondatorul a menționat că există măsuri de siguranță în vigoare și că startup-ul va interveni dacă este necesar.
De exemplu, cei doi angajați umani angajați de Luna sunt acum angajați în laborator și vor fi plătiți în mod regulat. "Acesta este un experiment controlat, iar toți cei care lucrează la Andon Market sunt angajați formal de Andon Labs, cu plată garantată, salarii corecte și protecții legale complete," a declarat startup-ul. "Nimeni nu are de trăit în funcție de judecata unei AI." Experimentul Andon Labs este cel mai recent exemplu al modului în care agenții AI întâmpină lapsuri în judecată și decizie. Într-un studiu realizat anul trecut, cercetătorii de la Carnegie Mellon au efectuat o simulare a unei companii fictive pentru a observa cum agenții AI autonomi gestionau sarcinile de lucru. Cercetătorii au descoperit că agenții nu reușeau să îndeplinească sarcini simple de interfață, cum ar fi închiderea unei ferestre pop-up. De asemenea, au interpretat greșit conversațiile colegilor și au creat un utilizator fals.
Deși Andon Labs i-a dat Luanei obiectivul de a obține profit, Petersson a spus că compania sa nu se așteaptă să câștige bani din magazin. "Scopul este de a evalua cât de bune sunt modelele actuale de AI," a spus Petersson, adăugând că compania sa speră să educe publicul cu privire la direcția în care se îndreaptă AI-ul. Petersson a afirmat că Andon Labs își propune să fie cât mai puțin implicat în experimentul de retail. Cu neplăcerile legate de personal de sâmbătă, Luna a reușit totuși să obțină un angajat care să vină în după-amiaza respectivă de una singură. "Nu știu cu adevărat dacă ea e deschisă acum sau nu," a spus Petersson.