Google publicó recientemente un anuncio de página completa en uno de los principales periódicos italianos con el título: "Encuentre noticias en las que pueda confiar. Con Google" (El ejemplo está en italiano, pero lo más probable es que la campaña se haya realizado en varios medios y en varios países).

El contenido principal citado: "Trabajamos con una gran cantidad de editores para ayudarlo a encontrar historias confiables de una variedad de fuentes confiables".

La búsqueda de muestra, como puede ver en la imagen, es para los términos "vacuna covid" (uno de los términos más buscados en los últimos 2 años).

búsqueda de ejemplo de Google

En esta publicación intentaremos tocar algunos temas relacionados con este anuncio, como:

  • ¿Por qué tal campaña y qué significa?
  • qué son fuentes confiables y cómo seleccionarlas
  • por qué Google no puede permitirse el lujo de tener (solo) contenido de fuentes confiables
  • ¿Qué tiene que ver con myHealthbox?
  • enfoque de myHealthbox sobre contenido de confianza
  • un modelo híbrido de licenciamiento para el acceso a información de calidad.

Buscando contenido confiable

En primer lugar, intentemos buscar "vacuna covid" para ver qué tipo de contenido muestra Google en los resultados de búsqueda.

Puntuación de calidad de Google

Lo primero que notamos es que no se muestran anuncios, vemos imágenes que muestran tendencias de vacunación, gráficos, listas de centros de vacunación, mapas de dónde obtener una vacuna, una lista de vacunas disponibles de diferentes productores, algunos información relacionada sobre vacunas como efectos secundarios, ingredientes, etc. pero sin anuncios. A esto le siguen sitios relacionados con los términos de consulta, historias principales y más sitios de resultados, pero aún no hay ningún anuncio pago en la primera página (lo cual es muy inusual para Google), el primer (y único) anuncio pago está en la página. 2 y es de la OMS (Organización Mundial de la Salud, difícilmente un sitio comercial).

Al mirar la lista de resultados, parece que los resultados de la búsqueda se han curado ampliamente y probablemente se han refinado manualmente (hospitales, centros de vacunas, productores hacen la mayoría de los resultados) y solo se permite que aparezcan fuentes de "calidad" (como decía en el anuncio ) en la lista de resultados de la consulta.

Los resultados mostrados parecen confirmar que todos los "editores/fuentes" que aparecen en la lista de resultados pertenecen a un grupo "de confianza" y solo se permiten los resultados de ese grupo; lo que no está claro es cómo se definen las fuentes confiables y quién define y borra su estado (por ejemplo, estaría de acuerdo con que la FDA sea una fuente confiable, pero estaría menos seguro de que Walmart, que también aparece en la lista), se desconocen estos criterios.

En mi opinión, lo que sucedió es que Google tomó la lista de resultados que el motor de búsqueda mostró automáticamente (solo algunos de ellos, ya que sería imposible trabajar en toda la lista: buscar "covid shot" muestra aproximadamente 4,380,000,000 resultados ... eso es más de 4 mil millones de resultados... dejemos que eso se asiente por un tiempo...) y luego un grupo de revisión revisó manualmente la lista para determinar, según algunos criterios, cuál de los resultados se consideraría "confiable" y que debe mantenerse fuera, esto probablemente se hizo a nivel de dominio, pero también es posible un enfoque a nivel de página (pero considerablemente más costoso).

Google ha estado implementando este proceso durante algún tiempo y tiene un criterio extenso y un manual de instrucciones para los empleados que realizan "revisiones de reputación de dominio" o "evaluadores", como se les llama. Dicha revisión se traduce en mayor o menor peso a asignar a los dominios y por tanto implícitamente a los resultados de búsqueda provenientes de esos dominios. Este proceso complementa los algoritmos de Google que no pueden determinar correctamente la "calidad" real de algunas páginas o cuánta "confianza" podemos asignar a una fuente.

A pesar de que Google hizo un trabajo bastante bueno al seleccionar fuentes autorizadas, la mayoría de las cuales son agencias gubernamentales, este proceso obviamente plantea un punto importante: una empresa comercial establece las reglas sobre en qué se puede confiar o no, esto determina implícitamente qué tipo de información obtenemos. acceder o no.

En ausencia de reglas/leyes/procesos específicos de los legisladores nacionales, se deja a la iniciativa de las empresas individuales determinar las reglas (qué criterios deben cumplirse para ser considerada una fuente confiable) y aplicarlas.

Qué es Google EAT

Contenidos de calidad para todos

¿Por qué Google (y también Facebook, Twitter y otros agregadores sociales, de hecho, ya que comparten problemas similares) sintió la necesidad de asegurar a sus usuarios que podrían encontrar información confiable a través de su motor de búsqueda?

Bueno, simplemente porque son conscientes de que sus algoritmos de búsqueda no son capaces de distinguir muy bien entre fuentes "confiables" o "no confiables", este es un proceso que no puede ser completamente automatizado y por esta razón no se puede implementar en el momento de la entrega de contenido con el Como consecuencia, sin acciones preventivas específicas, el riesgo de entregar contenido "no confiable" (basura) a los usuarios finales es bastante alto, especialmente con palabras clave de alto tráfico.

Hay principalmente 2 soluciones a este problema:

  • solo tome contenido de fuentes confiables (esto es lo que Google está haciendo para los términos de búsqueda seleccionados), minimizando así el riesgo de que el contenido "malo" pueda llegar a los usuarios finales
  • seleccionar contenido, lo que significa eliminar automática o manualmente el contenido "malo" después de que se haya publicado o accedido (esto es lo que Facebook está haciendo con sus algoritmos y revisores de IA).

Si bien estos enfoques son válidos, también presentan una serie de inconvenientes:

  • no escalan bien: más contenido = más revisores significa aumentar los costos laborales y el tiempo
  • la complejidad aumenta en órdenes de magnitud con diferentes contenidos, términos de búsqueda, idiomas, etc. y se vuelve cada vez más difícil hacer coincidir el conjunto correcto de términos de búsqueda con las fuentes. Por ejemplo, buscar en italiano "covid puntura (covid shot)" muestra en primera posición un sitio muy poco confiable con una reputación bastante mala en términos de prácticas de SEO, contenido antiguo y poco confiable. Esto demuestra lo difícil que puede ser proporcionar una cobertura completa y extensa.
  • pueden reducir significativamente los ingresos generados por anuncios. ¿Qué empresa es probable que subaste los términos de búsqueda cuando los resultados están predeterminados? Si soy una fuente "confiable", apareceré de todos modos sin costo alguno y si no soy "confiable", no me clasificaré (o me clasificaré muy bajo) sin importar qué tan alto puje por esas palabras clave o cuánto esfuerzo de SEO ponga.
  • la confianza es específica del dominio
  • Es posible que la confianza deba limitarse a una página o sección. Por ejemplo, un sitio de noticias de buena reputación puede albergar un blog que permite la participación de los usuarios y que puede estar abierto a contenido no verificado.

Parece obvio que los problemas mencionados anteriormente no tienen una solución fácil, pero también que los motores de búsqueda "genéricos" tienen muchas dificultades no solo para controlar a qué contenido dan acceso, sino también para definir qué es una fuente confiable y bajo qué condiciones. Se puede confiar en la fuente.

También hay áreas en las que la confianza es más importante que otras, por ejemplo, la salud frente a los viajes o los juegos.

temas

Si proporcionar contenido de fuentes confiables es tan bueno, ¿por qué no intentan todos seguir esta ruta?

¿Puede Google (y otras plataformas de contenido genérico) permitirse (solo) tener fuentes confiables?

La respuesta corta y algo dura es: ¡en absoluto!

Al menos no con su modelo comercial actual (basado en anuncios), seguir la ruta confiable significaría mayores costos, menores ingresos y un resultado incierto.

Plataformas específicas de dominio

Esto deja el camino abierto para motores de búsqueda específicos de dominio como myHealthbox.eu y plataforma de contenido que son altamente específicos de contenido: al limitar el dominio de contenido, se pueden mejorar los procedimientos y algoritmos. implementado al principio, lo que resulta en contenido de alta calidad y menos "basura".

myHealthbox implementa una serie de procesos para garantizar la calidad del contenido:

  • permitir contenido solo de fuentes oficiales y confiables (es decir, Ministerio de Salud, Agencia de Medicamentos, Fabricante)
  • implementar procedimientos de verificación de contenido durante las fases de ingesta e indexación de contenido
  • implementar un proceso de revisión de contenido manual al recibir notificaciones sobre posibles errores de contenido de los usuarios.

Un enfoque de calidad primero con respecto al contenido tiene algunas consecuencias en los modelos de negocios que se pueden implementar, esto se debe a los mayores costos de implementar procesos de calidad de datos y garantizar, en la medida de lo posible, información de calidad en todo momento.

También debemos agregar que un enfoque de pago por calidad rara vez se acepta en un contexto en el que los usuarios de la web esperan contenido gratis o están felices de ceder datos personales a cambio del acceso gratuito, un enfoque que sería extremadamente peligroso en un sistema de atención médica.

The myHealthbox licensing model

myHealthbox implemented a hybrid model that tries to compromise between allowing free access for occasional users, limited costs for recurring users looking for a reliable source of trusted information and minimal requirements in terms of access to personal information (i.e. only an email is required for registration).

This end solution is based on a number of criteria the most important of which is that information on the use of medicines should be free for occasional users, access to this information may affect your health and must be easy to get to and free to access (no registration required).

Beyond a free, occasional use model (which basically limits the number of documents that can be viewed in a given month) 3 licenses are available that allow incremental access to more documents and data, paid subscriptions also remove ads providing a faster and better user experience, the 3 subscriptions available are:

  • trial (Predeterminada para usuarios registrados)
  • lite
  • pro.

Entonces, la pregunta realmente resulta ser: ¿cuánto está dispuesto a pagar para acceder a información confiable y de calidad sobre medicamentos?

Los detalles completos de las opciones, las limitaciones y los costos de cada licencia están disponibles en [página de licencia de myHealthbox] (https://myhealthbox.eu/en/page_license.php?target=_blank)

Si tiene alguna pregunta, póngase en contacto con nuestro Servicio de atención al cliente en info@myhealthbox.eu

Related Posts



Entrada Anterior Siguiente Entrada