Am acoperit subiectul pe larg. Un pic de context:
Biasul de recență e real:
Cercetările arată că 65% din citările AI provin din conținut publicat în ultimul an. Asta înseamnă:
- Arhiva ta are valoare AI limitată
- Conținutul proaspăt contează mai mult
- Publicarea continuă e necesară pentru vizibilitate
Excepția Wikipedia:
Wikipedia e citată în 47,9% dintre sursele de top ChatGPT pentru că e licențiată liber (CC BY-SA 3.0). Lecția: termenii de licențiere contează pentru vizibilitatea AI.
Exemplul Reddit:
Acordul Reddit de 60 milioane $/an cu Google arată valoarea conținutului de comunitate. Dataset-ul lor WebText2 primește o pondere de 5x la antrenarea GPT.
Concluzie:
Dacă nu poți negocia un acord major, axează-te pe:
- Conținut proaspăt, continuu
- Conținut de tip comunitate/discuții
- Cercetare originală unică
- Ia în calcul modelele tip RSL/marketplace