Google ha recentemente pubblicato un annuncio a tutta pagina su uno dei maggiori quotidiani italiani dal titolo: "Trova notizie di cui ti puoi fidare. Con Google" (L'esempio è in italiano ma molto probabilmente la campagna è stata condotta su più media e in più paesi). Il contenuto principale citava: "Lavoriamo con un gran numero di editori per aiutarti a trovare storie affidabili da una varietà di fonti affidabili".

La ricerca di esempio come potete vedere nella foto riguarda i termini "vaccino covid" (uno dei termini più cercati negli ultimi 2 anni).

Ricerca di esempio su Google

In questo post cercheremo di toccare alcuni argomenti relativi a questo annuncio come:

  • perché una tale campagna e cosa significa?
  • quali sono le fonti attendibili e come selezionarle
  • perché Google non può permettersi di avere (solo) contenuti da fonti attendibili
  • cosa c'entra con myHealthbox
  • l'approccio di myHealthbox sui contenuti attendibili
  • un modello di licenza ibrido per l'accesso a informazioni di qualità.

Ricerca di contenuti attendibili

Prima di tutto proviamo a cercare "vaccino covid" per vedere che tipo di contenuto sta mostrando Google nei risultati di ricerca.

Punteggio di qualità di Google

La prima cosa che notiamo è che non ci sono annunci mostrati, vediamo immagini che mostrano tendenze di vaccinazione, grafici, elenchi di centri di vaccinazione, mappe di dove ottenere un vaccino, un elenco di vaccini disponibili da diversi produttori, alcuni aspetti sanitari informazioni correlate su vaccini come effetti collaterali, ingredienti ecc. ma nessuna pubblicità. Questo è seguito da siti correlati ai termini di ricerca, notizie principali e altri siti di risultati, ma non ci sono ancora non ci sono annunci a pagamento sulla prima pagina (cosa molto insolita per Google), il primo (e unico) annuncio a pagamento è sulla pagina 2 ed è dell'OMS (Organizzazione Mondiale della Sanità, difficilmente un sito commerciale).

Osservando l'elenco dei risultati sembra che i risultati della ricerca siano stati ampiamente curati e probabilmente rifiniti manualmente (ospedali, centri di vaccinazione, produttori fanno la maggior parte dei risultati) con solo la possibilità di visualizzare le fonti di "qualità" (come diceva nell'annuncio ) nell'elenco dei risultati della query.

I risultati mostrati sembrano confermare che tutti gli "editor/fonti" che appaiono nell'elenco dei risultati appartengono a un gruppo "fidato" e sono ammessi solo i risultati di quel gruppo; ciò che non è chiaro è come vengono definite le fonti attendibili e chi definisce e cancella il loro stato (ad esempio sarei d'accordo sul fatto che la FDA sia una fonte attendibile ma sarei meno sicuro di Walmart che appare anche nell'elenco), questi criteri sono sconosciuti.

Dal mio punto di vista quello che è successo è che Google ha preso l'elenco dei risultati che il motore di ricerca ha visualizzato automaticamente (solo alcuni di essi in realtà sarebbe impossibile lavorare sull'intero elenco: la ricerca di "covid shot" mostra circa 4.380.000.000 di risultati .... ovvero oltre 4 miliardi di risultati... lasciamo perdere per un po'...) e poi un gruppo di revisione ha esaminato manualmente l'elenco per determinare, in base ad alcuni criteri, quale dei risultati doveva essere considerato "attendibile" e che dovrebbe essere tenuto fuori, questo è stato probabilmente fatto a livello di dominio ma è anche possibile un approccio a livello di pagina (ma notevolmente più costoso).

Google ha implementato questo processo per un po' di tempo e ha criteri estesi e un [manuale di istruzioni](https://static.googleusercontent.com/media/guidelines.raterhub.com/en//searchqualityevaluatorguidelines.pdf?target= _blank) per i dipendenti che effettuano "revisioni della reputazione del dominio" o "valutatori" come vengono chiamati. Tale revisione si traduce in più o meno peso da assegnare ai domini e quindi implicitamente ai risultati di ricerca provenienti da quei domini. Questo processo integra gli algoritmi di Google che non possono determinare correttamente la "qualità" effettiva di alcune pagine o quanta "fiducia" possiamo assegnare a una fonte.

Nonostante Google stia facendo un buon lavoro nella selezione di fonti autorevoli, la maggior parte delle quali sono agenzie governative, questo processo solleva ovviamente un punto importante: una società commerciale stabilisce le regole su ciò che può essere attendibile o meno, questo determina implicitamente il tipo di informazioni che otteniamo accedere o meno.

In assenza di regole/leggi/processi specifici da parte dei legislatori nazionali, è lasciata all'iniziativa delle singole società la determinazione delle regole (quali criteri devono essere soddisfatti per essere considerati una fonte attendibile) e l'applicazione delle stesse.

Cos'è-google-e-a-t

Contenuti di qualità per tutti

Perché Google (e anche Facebook, Twitter e altri aggregatori sociali in effetti poiché condividono problemi simili) ha sentito il bisogno di rassicurare i propri utenti sul fatto che sarebbero stati in grado di trovare informazioni affidabili attraverso il proprio motore di ricerca?

Ebbene, semplicemente perché sono consapevoli che i loro algoritmi di ricerca non sono in grado di distinguere molto bene tra fonti "fidate" o "non attendibili", si tratta di un processo che non può essere completamente automatizzato e per questo motivo non può essere implementato al momento della consegna dei contenuti con il conseguenza che senza specifiche azioni preventive il rischio di fornire contenuti "non attendibili" (spazzatura) agli utenti finali è piuttosto elevato soprattutto con parole chiave ad alto traffico.

Ci sono principalmente 2 soluzioni a questo problema:

  • prendi solo contenuti da fonti affidabili (questo è ciò che Google sta facendo per termini di ricerca selezionati) riducendo così al minimo il rischio che contenuti "cattivi" possano insinuarsi negli utenti finali
  • curare i contenuti, ovvero rimuovere automaticamente o manualmente i contenuti "cattivi" dopo che sono stati pubblicati o consultati (questo è ciò che Facebook sta facendo con i suoi algoritmi di intelligenza artificiale e revisori).

Sebbene validi, questi approcci presentano anche una serie di inconvenienti:

  • non si adattano bene: più contenuti=più revisori significa aumentare i costi di manodopera e il tempo
  • la complessità aumenta di ordini di grandezza con diversi contenuti, termini di ricerca, lingue ecc. e diventa sempre più difficile far corrispondere il corretto insieme di termini di ricerca con le fonti. Ad esempio la ricerca in lingua italiana di "covid puntura (covid shot)" mostra in prima posizione un sito molto inaffidabile con una discreta reputazione in termini di pratiche SEO, contenuti vecchi e inaffidabili. Questo dimostra quanto possa essere difficile fornire una copertura completa ed estesa.
  • possono ridurre significativamente le entrate generate dagli annunci. Quale azienda potrebbe mettere all'asta i termini di ricerca quando i risultati sono predeterminati? Se sono una fonte "fidata" apparirò comunque a costo zero e se non sono "fidato" non mi classificherò (o mi classificherò molto in basso) non importa quanto in alto offro per quelle parole chiave o quanto sforzo SEO ci metto
  • la fiducia è specifica del dominio
  • la fiducia potrebbe dover essere limitata a una pagina o una sezione. Ad esempio, un sito di notizie rispettabile può ospitare un blog che consente l'input dell'utente e che può essere aperto a contenuti non verificati.

Sembra ovvio che i problemi sopra menzionati non hanno una soluzione facile, ma anche che i motori di ricerca "generici" hanno difficoltà non solo a controllare a quali contenuti forniscono accesso, ma anche a definire cosa sia una fonte attendibile e a quali condizioni tale la fonte potrebbe essere attendibile.

Ci sono anche aree in cui la fiducia è più importante di altre, ad esempio la salute rispetto ai viaggi o ai giochi. argomenti di discussione più comuni

Se fornire contenuti da fonti attendibili è così eccezionale, perché non provano tutti a seguire questa strada?

Google (e altre piattaforme di contenuti generici) possono permettersi (solo) di avere fonti attendibili?

La risposta breve e un po' dura è: per niente!

Almeno non con il loro attuale modello di business (basato sugli annunci), seguire la strada attendibile significherebbe costi più elevati, ricavi inferiori e un risultato incerto.

Piattaforme specifiche del dominio

Ciò lascia la strada aperta a motori di ricerca specifici per domini (come myHealthbox.eu) e piattaforme di contenuti altamente specifiche per i contenuti: limitando il dominio dei contenuti procedure e algoritmi migliori può essere implementato all'inizio con conseguente contenuto di alta qualità e meno "spazzatura".

myHealthbox implementa una serie di processi per garantire la qualità dei contenuti:

  • consentire contenuti solo da fonti ufficiali e attendibili (es. Ministero della Salute, Agenzia di Medicina, Produttore)
  • implementazione di procedure di verifica dei contenuti durante le fasi di inserimento e indicizzazione dei contenuti
  • implementazione di un processo di revisione manuale del contenuto quando si ricevono notifiche su possibili errori di contenuto da parte degli utenti.

Un approccio quality-first per quanto riguarda i contenuti ha alcune conseguenze sui modelli di business che possono essere implementati, ciò è dovuto ai maggiori costi di implementazione dei processi di qualità dei dati e garantisce, per quanto possibile, informazioni di qualità in tutto.

Dobbiamo anche aggiungere che un approccio "pay-for-quality" è raramente accettato in un contesto in cui gli utenti web si aspettano contenuti gratuiti o sono felici di rinunciare ai dati personali in cambio di un accesso gratuito, un approccio che sarebbe estremamente pericoloso in ambito sanitario contesto.

Il modello di licenza myHealthbox

myHealthbox ha implementato un modello ibrido che cerca di trovare un compromesso tra consentire l'accesso gratuito agli utenti occasionali, costi limitati per gli utenti ricorrenti che cercano una fonte affidabile di informazioni affidabili e requisiti minimi in termini di accesso alle informazioni personali (ad esempio per la registrazione è necessaria solo un'e-mail) .

Questa soluzione finale si basa su una serie di criteri, il più importante dei quali è che le informazioni sull'uso dei medicinali devono essere gratuite per gli utenti occasionali, l'accesso a queste informazioni può influire sulla salute e deve essere facile da raggiungere e libero di accedere ( non è richiesta la registrazione).

Oltre a un modello di utilizzo occasionale gratuito (che sostanzialmente limita il numero di documenti che possono essere visualizzati in un determinato mese) sono disponibili 3 licenze che consentono l'accesso incrementale a più documenti e dati, gli abbonamenti a pagamento rimuovono anche gli annunci offrendo un'esperienza utente più rapida e migliore , i 3 abbonamenti disponibili sono:

  • trial (predefinito per gli utenti registrati)
  • lite
  • pro.

Quindi la domanda si rivela davvero essere: quanto sei disposto a pagare per accedere a informazioni affidabili e di qualità sui medicinali?

I dettagli completi di opzioni, limitazioni e costi per ciascuna licenza sono disponibili alla pagina Licenza myHealthbox

Per qualsiasi domanda contatta il nostro Servizio Clienti all'indirizzo info@myhealthbox.eu

Related Posts



Articolo precedente Prossimo articolo