Analizamos 680M de citas de IA: ¿qué publicaciones son realmente las más citadas?
Discusión comunitaria sobre qué publicaciones son citadas con mayor frecuencia por los motores de IA. Experiencias reales de marketers analizando patrones de ci...
He estado analizando patrones de citación en distintas plataformas de IA. El sesgo es real y significativo.
Lo que muestran los datos:
Las 10 principales fuentes representan aproximadamente el 50% de las citaciones en las principales plataformas de IA. Mientras tanto, millones de sitios de calidad comparten el otro 50%.
Patrones específicos:
| Plataforma | Fuente principal | % de citaciones |
|---|---|---|
| ChatGPT | Wikipedia | 7.8% |
| Perplexity | 6.6% | |
| Google AI | YouTube | 1.9% |
El sesgo en la práctica:
Puse a prueba dos contenidos:
La publicación importante se cita 8 veces más a menudo, a pesar de que el blog tiene mejor contenido y es más detallado.
Mis preguntas:
¿Qué están viendo ustedes?
El sesgo en la selección de fuentes está bien documentado. Aquí está el porqué.
Causas principales:
Composición de los datos de entrenamiento
Herencia de señales de autoridad
Preferencias explícitas de fuentes
Sesgo de formato y estructura
Las implicaciones:
Este sesgo refuerza las estructuras de poder existentes. Las grandes publicaciones obtienen más visibilidad en IA, lo que atrae más tráfico, que aporta más autoridad, que genera más visibilidad en IA…
¿Está mejorando?
Mixto. Algunas plataformas añaden más fuentes. Pero la concentración en la cima persiste.
Como editor pequeño: esto es frustrante.
Nuestra situación:
Nuestra visibilidad en IA: Casi nula.
Mientras tanto, vemos que nuestra investigación es recogida por medios importantes, y la versión de ELLOS es la que cita la IA, no la nuestra.
Lo que estamos intentando:
La realidad incómoda:
Por ahora, la estrategia es “ser mencionado por fuentes en las que confía la IA” más que “convertirse en una fuente en la que confía la IA”.
Es un parche, no una solución.
Comparto algo de análisis cuantitativo:
Estudio de distribución de citaciones (1,000 prompts):
| Nivel de fuente | % de citaciones | % de la web |
|---|---|---|
| Top 100 sitios | 52% | 0.0001% |
| Top 1,000 sitios | 78% | 0.001% |
| Todos los demás sitios | 22% | 99.999% |
El efecto Pareto es extremo.
Menos del 0.001% de los sitios web reciben el 78% de las citaciones de IA.
Qué predice la citación:
| Factor | Correlación |
|---|---|
| Antigüedad del dominio | 0.42 |
| Presencia en Wikipedia | 0.61 |
| Menciones en grandes publicaciones | 0.58 |
| Número de backlinks | 0.45 |
| Calidad del contenido (valoración humana) | 0.23 |
La conclusión:
La calidad del contenido es la que MENOS correlaciona con ser citado. Las señales de autoridad importan más.
Esto es sesgo, por definición.
Trabajando dentro del sistema de sesgos:
Acepta la realidad, luego haz estrategia.
No puedes cambiar el funcionamiento de los sistemas de IA. Pero puedes posicionar tu contenido para beneficiarte de sus sesgos.
La doble estrategia:
1. Optimización directa (largo plazo)
2. Posicionamiento indirecto (corto plazo)
Resultados en nuestros clientes:
Cliente sin visibilidad en IA:
6 meses después: aumento del 400% en citaciones de IA.
La meta-estrategia:
Conviértete en una fuente en la que confían las fuentes. La IA sigue el rastro.
Perspectiva de marca sobre el sesgo de fuentes:
El impacto competitivo:
Nuestro competidor (empresa más grande y antigua) es citado 5 veces más que nosotros en respuestas de IA, a pesar de que:
¿Por qué?
Nuestra respuesta:
Fase 1 (Inmediata):
Fase 2 (Continua):
Fase 3 (Monitoreo):
Plazo esperado: 12-18 meses para cambiar el equilibrio de forma significativa.
Esto es una maratón, no una carrera de velocidad.
Perspectiva académica sobre el sesgo de fuentes en IA:
El consenso investigador:
El sesgo en la selección de fuentes en LLM está bien documentado y es preocupante:
Lo que muestran los artículos:
Qué podría ayudar:
La realidad:
Las compañías de IA optimizan para calidad de respuesta, no equidad de fuentes. Reducir el sesgo no es prioridad salvo que los usuarios lo exijan.
La concienciación es el primer paso.
Frustración de creador de contenido:
El ciclo que nos perjudica:
Ejemplo real:
Publicamos una investigación original sobre tendencias del sector. Un medio empresarial importante escribió un resumen de 500 palabras citándonos brevemente.
ChatGPT cita: La publicación importante ChatGPT no cita: Nuestra investigación original
Lo que he aprendido a hacer:
La dura realidad:
Ser la fuente original no importa si los sistemas de IA no te reconocen como autoridad.
La calidad por sí sola no basta.
La oportunidad de nicho en el sesgo de fuentes:
Dónde los pequeños SÍ pueden ganar:
El sesgo afecta más a las consultas generales. Para consultas específicas o de nicho:
Nuestro enfoque:
En vez de: “¿Qué es el marketing de IA?” (dominado por grandes publicaciones) Enfocarse en: “¿Cómo usan las empresas SaaS B2B la IA para la segmentación de clientes?” (nicho)
Resultados:
| Tipo de consulta | Tasa de citación (grandes sitios) | Tasa de citación (sitios nicho) |
|---|---|---|
| General | 85% | 15% |
| Media | 60% | 40% |
| Nicho | 30% | 70% |
La estrategia:
No puedes vencer a los grandes de forma general. Pero puedes dominar los nichos.
Excelente discusión. Aquí mi síntesis sobre el sesgo en la selección de fuentes:
La realidad:
El sesgo en la selección de fuentes de IA es real, significativo y se retroalimenta. Las fuentes principales son citadas más, lo que genera más autoridad y, a su vez, más citaciones.
Los datos:
Estrategias dentro del sistema:
Corto plazo:
Largo plazo:
Medición:
La incómoda verdad:
El sistema es sesgado. Trabajar dentro del sesgo es pragmático. Construir autoridad genuina lo supera eventualmente, pero requiere tiempo.
El contenido de calidad es necesario, pero no suficiente. El posicionamiento estratégico es clave.
¡Gracias a todos por sus valiosas perspectivas!
Get personalized help from our team. We'll respond within 24 hours.
Comprende cómo los sistemas de IA seleccionan y citan fuentes. Haz seguimiento a tu visibilidad e identifica patrones de sesgo que afectan a tu marca.
Discusión comunitaria sobre qué publicaciones son citadas con mayor frecuencia por los motores de IA. Experiencias reales de marketers analizando patrones de ci...
Discusión comunitaria sobre qué tipos de contenido son más citados por las plataformas de IA. Datos reales sobre YouTube, Wikipedia, Reddit y otras preferencias...
Discusión comunitaria sobre cómo los modelos de IA deciden qué citar. Experiencias reales de SEOs analizando patrones de citación en ChatGPT, Perplexity y Gemin...
Consentimiento de Cookies
Usamos cookies para mejorar tu experiencia de navegación y analizar nuestro tráfico. See our privacy policy.