Zilele trecute am primit în căsuța poștală un mail de la OpenAI, care promitea să-mi facă viața mai ușoară prin digitalizarea notițelor mele. Tradus în limba română, mesajul avea următorul conținut:
Fă-ți notițele utile
Fă o poză notițelor tale de mână, apoi transformă-le într-un rezumat sau o listă de sarcini.
ChatGPT te poate ajuta să transformi notițele scrise de mână într-un rezumat, o schiță sau o listă de sarcini. Folosește-l pentru a extrage punctele principale în ordine.
Mesajul mai conținea un link către site-ul ChatGPT, care se deschidea cu un prompt deja setat, care, tradus în română, arată astfel:
În câteva cuvinte, învață-mă cum să folosesc ChatGPT pentru a redacta texte pornind de la note scrise de mână. Apoi, ajută-mă să transform o fotografie cu notele mele de la ședință într-un prim draft clar, cu punctele principale ordonate.
La prima vedere, pare o funcție utilă. Dar dacă te oprești puțin să analizezi textul și imaginea cu care a venit la pachet, realizezi că ditamai gigantul tech a trimis o mostră clasică de marketing făcut în grabă, pe genunchi.
Iată de ce această campanie este un eșec major de logică:
1. O telegramă a redundanței
Mesajul reușește paradoxul de a fi extrem de scurt, dar incredibil de repetitiv. În doar trei rânduri, textul îți spune aproape exact același lucru de două ori: că poți transforma notițele într-un rezumat sau o listă de sarcini. Singura diferență în a doua frază este adăugarea cuvântului „schiță”. Această lene în redactare trădează lipsa unei revizuiri elementare. Pare un text creat cu AI, trântit la repezeală într-un șablon de mail și trimis în masă.
2. Imaginea nu prea are legătură cu textul
În mail, textul era însoțit de o imagine cu o mână care ține un telefon deasupra unui caiet deschis (vezi mai sus). Problema? În caiet nu există text scris de mână, ci niște schițe în creion, linii haotice și desene abstracte care aduc a wireframe-uri rudimentare. Mai mult, ecranul telefonului este complet blurat și anonim. În loc să vedem interfața aplicației ChatGPT care chiar face magia digitalizării, primim o imagine de stoc generică, în care conținutul foii contrazice direct promisiunea din text. ChatGPT nu va scoate liste de sarcini ordonate din niște mâzgălituri cu creionul.
3. Mitul OCR-ului perfect
Campania ne oferă promisiunea iluzorie a unui flux de lucru ideal, unde totul se convertește instant și fără erori, afirmând că AI-ul va extrage ideile „în ordine”. În realitate, oricine își ia notițe pe hârtie știe că foile scrise de mână sunt pline de structuri alandala: săgeți, adăugiri pe margini, cuvinte încercuite și liste intercalate, foaie scrisă din alt unghi etc. Tehnologia OCR e faultată dur de scrisul dezordonat sau de lumina proastă din cameră. Să pretinzi că transformarea e 100% fluidă înseamnă să ascunzi sub preș timpul pierdut ulterior pentru corectarea textului digitalizat eronat.
4. Publicul țintă e complet greșit
Dar cea mai mare problemă a mailului, pe care am lăsat-o la sfârșit, este că ignoră modul în care oamenii folosesc tehnologia. În realitate, utilizatorii se împart în două tabere, care niciuna nu are nevoie de această funcție:
- Utilizatorii conservatori. Cei care aleg conștient pixul și hârtia o fac tocmai pentru a scăpa de ecrane și pentru libertatea actului de a scrie liber. Ei nu vor liste digitale rigide. Aceștia nu vor să transforme notele de mână în liste pe ecran, pentru că tocmai asta doresc să evite scriind pe hârtie.
- Utilizatorii moderni. Cei care preferă digitalul au abandonat demult hârtia. Când vor să noteze o idee, folosesc deja aplicații software pentru asta, sau se înregistrează audio, fără să mai aibă nevoie ulterior de conversie din analog în digital.
Fluxul propus de OpenAI (scrie pe hârtie -> scoate telefonul -> fă poza -> speră că IA-ul înțelege ceva -> corectează manual textul) adaugă prea mulți pași inutili pentru oricare dintre cele două categorii.
Trăgând linie, e destul de ciudat să vezi cum o companie evaluată la miliarde de dolari, care definește viitorul inteligenței artificiale, pică testul de bază al comunicării și targetării. Și astfel ajungi să te întrebi dacă nu cumva giganții AI strâng cureaua și bula inteligenței artificiale se apropie, încet dar sigur, de momentul când o să se spargă. Adică, totuși, să nu ai o echipă de PR care să trimită niște mailuri mai serioase în locul acestei ciorne?

Am primit și eu un e-mail d-ăsta absolut din senin, doar tema era diferită:
RăspundețiȘtergere„ Make your post easier to finish
Give ChatGPT your rough hook and post copy to get a draft you can edit.
Ask ChatGPT to shape your hook into marketing copy that feels clear and natural before it goes live. You can try a few caption options, tighten the wording, and add a simple next step.”
Este lucru cunoscut că foarte multe companii care oferă AI au costuri extrem de mari, și că de fapt au tot ascuns acest cost, în cursa de a-și mări bazinul de utilizatori. Tehnica este bine-cunoscută, și Uber a făcut treaba asta, practic este modus operandi obligatoriu.
Deja și OpenAI și alții au început să mai strîngă un pic cureaua și să crească costul tokenilor. Nu aș spune că întreaga piață AI se duce de rîpă, există utilitate clară și un raport cost/beneficii pozitiv în anumite domenii (e.g. programare și tot ce ține de IT) -- dar în altele nu. Tocmai de asta vedem vînzoleala de la ChatGPT, ei sunt printre cei mai vechi, au prăjit cei mai mulți bani pe temă, doar-doar or reuși să se impună cu ideea de „AI generalist”. Doar că nu le-a prea mers, variantele pe ieftineală halucinează la greu, iar dacă tot plătești ... alegi să plătești alte produse cum ar fi Gemini.
Ghinion. Business as usual. În timp ce OpenAI se chinuie să-și aducă înapoi utilizatorii, alte companii (Anthopic) au AI-uri care-ți scriu aplicații întregi într-un weekend. Nici nu-i loc de comparație.
Între timp, am primit și eu încă un mail, cu titlul: „Translate anything, your way”, scris la fel ca cel din articol.
ȘtergereNu am folosit niciodată AI plătită. Nu știu dacă este ca la calculatoare, unde cel mai prost model de anul ăsta este mai bun decât cel mai scump model de acum 10 ani (și atunci nu are rost să plătești decât dacă vrei să fii primul care dispune de acei cai putere). De la cei care folosesc, aud păreri opuse. Unii zic ca tine, că variantele free sunt mult mai slabe. Cred că ei sunt majoritatea. Dar am văzut și utilizatori dezamăgiți că au plătit și modelul merge tot mai rău.
Totuși, chiar și un model gratuit este foarte bun la redactat de articole, mailuri promoționale etc. De fapt, mă gândesc că dacă ar fi redactat aceste mailuri cu propriul lor model inteligent, le-ar fi ieșit un mesaj mult mai bun. 😁
Gemini e mai bun decât ChatGPT? Ai un top personal, sau un articol relevant pe tema asta?
Modelele de AI sunt actualizate constant, deci nu aș zice că există comparație cu modelele de anu' trecut versus cele de anul ăsta. Teoretic toți se străduiesc să și le îmbunătățească, iar ce-ți prezintă este the latest and greatest.
ȘtergereNotează că eu folosesc Gemini în special pentru programare, unde este muncă iterativă -- încerc să fac X, mi se dă soluția X1, aia are o problemă, întreb din nou, mi se dă soluția X2, aia are altă problemă, și tot așa pînă ajungem la ceva mulțumitor. Cu side-quests gen „explică-mi te rog cum a fost gîndită scula Cutare și biblioteca Cutare”, ca să mai învăț cîte ceva.
Diferența pe care o fac abonamentele plătite la Gemini este la ce ți se oferă, în special la context window (cîtă informație reține în aceeași conversație, cîți tokeni are în cap) respectiv la compute power (cît efort este dispus să depună înaine să-ți zică „boss, mi-ai dat prea greu, refuz să-ți analizez acest .pdf de 500 de pagini”).
Pentru conversații lungi și iterative (gen ce fac eu), aceste două trăsături sunt esențiale. Dacă, AI-ul începe să uite de ce faci ceea ce faci, care era scopul anumitor bucăți de cod, efectiv ajunge să privească din avion și să-ți dea răspunsuri pe sistemul „baba nu le știe, dar le potrivește”. Gunoi, adică.
Bonus: tot la Gemini, dacă îi schimbi thinking level de pe standard pe extended, practic îl forțezi să-și analizeze propriile răspunsuri intermediare, și deci să prindă singur anumite erori de logică pe care era pe cale să le comită. Dar chiar și așa, dacă vreau să fiu sigur că face ce trebuie, îi descriu eu în detaliu fix ce vreau, ce presupuneri am făcut, și mai și adaug la final „Let me know if this makes sense. Ask for clarification on any point that is not fully clear. Before starting to work on the problem, consider if my approach is good, or I could attack the problem from another angle”, în principal îi zic să se comporte ca un consultant și arhitect, înainte de a-și pune pălăria de code monkey care generează cod.
Nu pot să mă pronunț despre alte modele de AI, la ChatGPT am renunțat demult pentru că varianta gratis este foarte limitativă pentru cod, iar prima treaptă este abonamentul de 23 de dolari. Idem și la Claudiu. Așa că n-am un datapoint pentru comparație.
Interesant. Auzisem și eu că Gemini în varianta premium are fereastră de context largă (ce zici tu cu tokenii și cât e disponibil să „înghită” și analizeze). Mersi.
Ștergere