Ho seguito questo settore in profondità. Un po’ di contesto:
Il bias della recentità è reale:
Le ricerche mostrano che il 65% delle citazioni AI proviene da contenuti pubblicati nell’ultimo anno. Questo significa:
- Il tuo archivio ha valore AI limitato
- I contenuti freschi contano di più
- Serve pubblicare continuamente per mantenere la visibilità
L’eccezione Wikipedia:
Wikipedia viene citata nel 47,9% delle principali fonti su ChatGPT perché è a licenza libera (CC BY-SA 3.0). La lezione: i termini di licensing contano per la visibilità AI.
L’esempio Reddit:
L’accordo da $60M/anno di Reddit con Google mostra il valore dei contenuti della community. Il loro dataset WebText2 pesa 5 volte di più nell’addestramento GPT.
Conclusione:
Se non puoi negoziare un grande accordo, concentra su:
- Contenuti freschi e continui
- Contenuti di community/discussione
- Ricerche originali e uniche
- Valuta modelli RSL/marketplace