O Google publicou recentemente um anúncio de página inteira em um dos principais jornais italianos com o título: "Encontre notícias confiáveis. Com o Google" (O exemplo está em italiano, mas provavelmente a campanha foi veiculada em várias mídias e em vários países).

O conteúdo principal citado: "Trabalhamos com um grande número de editores para ajudá-lo a encontrar histórias confiáveis de uma variedade de fontes confiáveis".

A pesquisa de amostra como você pode ver na imagem é para os termos "vacina covid" (um dos termos mais pesquisados nos últimos 2 anos).

Pesquisa de amostra do Google

Neste post tentaremos abordar alguns tópicos relacionados a este anúncio como:

  • por que tal campanha e o que isso significa?
  • o que são fontes confiáveis e como selecioná-las
  • por que o Google não pode ter (apenas) conteúdo de fontes confiáveis
  • o que isso tem a ver com myHealthbox
  • Abordagem myHealthbox em conteúdo confiável
  • um modelo de licenciamento híbrido para acesso à informação de qualidade.

Procurando por conteúdo confiável

Antes de tudo, vamos tentar pesquisar por "vacina covid" para ver que tipo de conteúdo o Google está mostrando nos resultados da pesquisa.

Índice de qualidade do Google

A primeira coisa que notamos é que não há anúncios exibidos, vemos imagens mostrando tendências de vacinação, gráficos, listas de centros de vacinação, mapas de onde obter uma vacina, uma lista de vacinas disponíveis de diferentes produtores, alguns informações relacionadas sobre vacinas como efeitos colaterais, ingredientes etc., mas sem anúncios. Isso é seguido por sites relacionados aos termos de consulta, principais notícias e mais sites de resultados, mas ainda há nenhum anúncio pago na primeira página (o que é muito incomum para o Google), o primeiro (e único) anúncio pago está na página 2 e é da OMS (Organização Mundial da Saúde, dificilmente um site comercial).

Ao olhar para a lista de resultados, parece que os resultados da pesquisa foram amplamente selecionados e provavelmente refinados manualmente (hospitais, centros de vacinas, produtores fazem a maior parte dos resultados) com apenas fontes de "qualidade" permitidas (como disse no anúncio ) na lista de resultados da consulta.

Os resultados mostrados parecem confirmar que todos os "editores/fontes" que aparecem na lista de resultados pertencem a um grupo "confiável" e apenas os resultados desse grupo são permitidos; o que ainda não está claro é como as fontes confiáveis ​​são definidas e quem define e limpa seu status (por exemplo, eu concordaria com a FDA sendo uma fonte confiável, mas estaria menos confiante sobre o Walmart, que também aparece na lista), esses critérios são desconhecidos.

Na minha opinião, o que aconteceu é que o Google pegou a lista de resultados que o mecanismo de pesquisa exibiu automaticamente (apenas alguns deles, na verdade, seria impossível trabalhar com toda a lista: pesquisar por "covid shot" mostra cerca de 4.380.000.000 resultados .... que é mais de 4 bilhões de resultados ... deixe isso afundar por um tempo ...) e, em seguida, um grupo de revisão revisou manualmente a lista para determinar, com base em alguns critérios, qual dos resultados deveria ser considerado "confiável" e que deve ser mantido de fora, isso provavelmente foi feito no nível do domínio, mas uma abordagem no nível da página também é possível (mas consideravelmente mais cara).

O Google vem implementando esse processo há algum tempo e possui critérios abrangentes e um manual de instruções para funcionários que realizam "revisões de reputação de domínio" ou "avaliadores", como são chamados. Tal revisão se traduz em mais ou menos peso a ser atribuído aos domínios e, portanto, implicitamente aos resultados de pesquisa provenientes desses domínios. Esse processo complementa os algoritmos do Google que não podem determinar adequadamente a "qualidade" real de algumas páginas ou quanta "confiança" podemos atribuir a uma fonte.

Apesar de o Google fazer um bom trabalho na seleção de fontes autorizadas, a maioria das quais são agências governamentais, esse processo obviamente levanta um ponto importante: uma empresa comercial define as regras sobre o que pode ser confiável ou não, isso determina implicitamente que tipo de informação recebemos acesso ou não.

Na ausência de quaisquer regras/leis/processos específicos dos legisladores nacionais, cabe à iniciativa de cada empresa determinar as regras (que critérios precisam ser atendidos para serem considerados uma fonte confiável) e aplicá-las.

O que é o google-e-a-t

Conteúdo de qualidade para todos

Por que o Google (e também o Facebook, Twitter e outros agregadores sociais, de fato, pois compartilham problemas semelhantes) sentiu o desejo de garantir aos seus usuários que eles seriam capazes de encontrar informações confiáveis ​​por meio de seu mecanismo de busca?

Bem, simplesmente porque eles estão cientes de que seus algoritmos de busca não são capazes de distinguir muito bem entre fontes "confiáveis" ou "não confiáveis", este é um processo que não pode ser totalmente automatizado e por isso não pode ser implementado no momento da entrega do conteúdo com o Conseqüentemente, sem ações preventivas específicas, o risco de entregar conteúdo "não confiável" (lixo) para usuários finais é bastante alto, especialmente com palavras-chave de alto tráfego.

Existem basicamente 2 soluções para este problema:

  • apenas pegue conteúdo de fontes confiáveis ​​(isso é o que o Google está fazendo para termos de pesquisa selecionados), minimizando assim o risco de conteúdo "ruim" chegar aos usuários finais
  • Curar conteúdo, o que significa remover automaticamente ou manualmente o conteúdo "ruim" depois de publicado ou acessado (é isso que o Facebook está fazendo com seus algoritmos de IA e revisores).

Embora válidas, essas abordagens também sofrem de várias desvantagens:

  • eles não são bem dimensionados: mais conteúdo=mais revisores significa aumentar os custos de mão de obra e o tempo
  • a complexidade aumenta em ordens de magnitude com diferentes conteúdos, termos de pesquisa, idiomas etc. e fica cada vez mais difícil combinar o conjunto correto de termos de pesquisa com as fontes. Por exemplo, pesquisar em italiano por "covid puntura (covid shot)" mostra na primeira posição um site muito não confiável com reputação bastante ruim em termos de práticas de SEO, conteúdo antigo e não confiável. Isso só prova o quão difícil pode ser fornecer uma cobertura abrangente e extensa.
  • eles podem reduzir significativamente as receitas geradas por anúncios. Qual empresa provavelmente leiloará os termos de pesquisa quando os resultados forem predeterminados? Se eu for uma fonte "confiável", aparecerei de qualquer maneira sem nenhum custo e, se não for "confiável", não classificarei (ou classificarei muito baixo), não importa o quão alto eu lance para essas palavras-chave ou quanto esforço de SEO eu coloque
  • confiança é específica do domínio
  • a confiança pode precisar ser limitada a uma página ou seção. Por exemplo, um site de notícias respeitável pode hospedar um blog que permite a entrada do usuário e que pode estar aberto a conteúdo não verificado.

Parece óbvio que os problemas mencionados acima não têm uma solução fácil, mas também que os mecanismos de pesquisa "genéricos" têm muita dificuldade não apenas para controlar a qual conteúdo eles fornecem acesso, mas também para definir o que é uma fonte confiável e sob quais condições tal fonte pode ser confiável.

Há também áreas em que a confiança é mais importante do que outras, saúde, por exemplo, versus viagens ou jogos.

tópicos

Se fornecer conteúdo de fontes confiáveis é tão bom, por que todos eles não tentam seguir esse caminho?

O Google (e outra plataforma de conteúdo genérico) pode (apenas) ter fontes confiáveis?

A resposta curta e um tanto dura é: de jeito nenhum!

Pelo menos não com seu modelo de negócios atual (baseado em anúncios), seguir a rota confiável significaria custos mais altos, receitas mais baixas e um resultado incerto.

Plataformas específicas de domínio

Isso deixa o caminho aberto para mecanismos de pesquisa específicos de domínio (como myHealthbox.eu) e plataformas de conteúdo altamente específicas de conteúdo: limitando o domínio de conteúdo, melhores procedimentos e algoritmos pode ser implementado no início resultando em conteúdo de alta qualidade e menos "lixo".

myHealthbox implementa uma série de processos para garantir a qualidade do conteúdo:

  • permitindo conteúdo apenas de fontes oficiais e confiáveis ​​(ou seja, Ministério da Saúde, Agência de Medicamentos, Fabricante)
  • implementação de procedimentos de verificação de conteúdo durante as fases de ingestão e indexação de conteúdo
  • implementação de um processo de revisão de conteúdo manual ao receber notificações sobre possíveis erros de conteúdo dos usuários.

Uma qualidade em primeiro lugar em relação ao conteúdo tem algumas consequências nos modelos de negócios que podem ser implementados, isso se deve aos custos mais altos de implementação de processos de qualidade de dados e garantia, tanto quanto possível, de informações de qualidade por toda parte.

Também precisamos acrescentar que uma abordagem de pagamento por qualidade raramente é aceita em um contexto em que os usuários da web esperam conteúdo de graça ou estão dispostos a ceder dados pessoais em troca de acesso gratuito, uma abordagem que seria extremamente perigosa em um setor de saúde contexto.

O modelo de licenciamento myHealthbox

A myHealthbox implementou um modelo híbrido que tenta conciliar entre permitir o acesso gratuito a utilizadores ocasionais, custos limitados para utilizadores recorrentes que procuram uma fonte fiável de informação fiável e requisitos mínimos em termos de acesso a informação pessoal (ou seja, apenas é necessário um email para registo) .

Esta solução final assenta numa série de critérios, sendo o mais importante que a informação sobre a utilização de medicamentos seja gratuita para os utentes ocasionais, o acesso a esta informação pode afetar a sua saúde e deve ser de fácil acesso e gratuito ( sem necessidade de registro).

Além de um modelo de uso ocasional gratuito (que basicamente limita o número de documentos que podem ser visualizados em um determinado mês) estão disponíveis 3 licenças que permitem acesso incremental a mais documentos e dados, assinaturas pagas também removem anúncios proporcionando uma experiência de usuário mais rápida e melhor , as 3 assinaturas disponíveis são:

  • trial (padrão para usuários registrados)
  • lite
  • pro.

Então a questão realmente acaba sendo: quanto você está disposto a pagar para ter acesso a informações confiáveis e de qualidade sobre medicamentos?

Detalhes completos das opções, limitações e custos de cada licença estão disponíveis na página de licença myHealthbox

Para qualquer dúvida, entre em contato com nosso Atendimento ao Cliente em info@myhealthbox.eu

Related Posts



Previous Post Next Post