Certamente!

Paulo Querido. Na Internet desde 1989

13 de maio de 2008

Medindo influência, alcance, sociabilidade e ruído no Twitter (II)

No primeiro artigo apresentei os quatro índices que apliquei, para já, nas páginas estatísticas individuais dos tuíteres portugueses e twiteros espanhóis, respectivamente em TwitterPortugal e TwitterEspana.

São eles: Evan Prodromou’s Twitter scale, mvalente’s influence scale, Range potencial (or Dave Winner’s Spewage) e Noise ratio (Louis Gray approach).

Ora, e o que querem medir estes índices?

O que representam os seus resultados?

Quais as fórmulas para os alcançar?

Vou tentar responder.

Ajustamento social, ou sociabilidade, é o que podemos ver no primeiro índice. Evan chegou ao seguinte enunciado da escala:

new scale: 1:5 = twittercaster, 1:2 = notable, 1:1 socially healthy, 2:1 newbie or social climber, 5:1 twitter spammer

Assim um indivíduo que tenha uma relação de um following por cada cinco followers — isto é, que tenha cinco vezes (ou mais) mais pessoas a segui-lo do que ele segue — é um twittercaster, um emissor, alguém com prestígio. O notable vem a seguir na escala e tem duas vezes mais followers do que following. Socialmente equilibrado é o tuíter (vi o termo neste excelente artigo do Edney sobre Twitter e ficou-me) que tem tantos seguidores como pessoas que segue. Virando a escala, os recém-chegados e os trepadores sociais distinguem-se por seguirem mais gente do que a gente os segue a eles, o que é natural e temporário no primeiro caso, e artificial e perene no segundo. O spammer é aquele que adiciona gente, adiciona gente, adiciona gente, tentanto “tocar” o maior número possível de pessoas na expectativa da retribuição de alguns incautos (dá para perceber de onde vem o nome).

As contas são simples: divide-se o número de following por followers.

Os tuíters não são todos iguais e uns influenciam mais que outros. Não nada fácil descobrir os influenciadores — quem souber ganha um prémio chorudo da indústria do SMM.

A fórmula do Mário Valente é mais complexa:

$mvrank = followers / following+1 / log(twitts)

Ou seja, dividimos o número de seguidores pelo número de seguidos mais um e voltamos a dividir o resultado pelo logaritmo natural do total de twitts (twits são as mensagens que emitimos pelo Twitter).

Esta fórmula distingue os utilizadores que publicam muito e têm mais seguidores do que seguem. Resulta relativamente bem para humanos, mas ainda pensamos numa ponderação para o caso dos não-humanos (como os jornais, publicações e serviços que usam o Twitter como canal), que surgem com uma influência desproporcionada.

O range potencial é o número limite teórico de contactos, ou visualizações, e corresponde muito grosseiramente aquilo a que os jornais chamam audiência. O número de twits multiplicado pelo número de “leitores” fornece a quantidade de contactos.

É um limite teórico, repito, ou talvez devesse escrever virtual, pois que na prática não existe: o número de followers não é constante, pelo que cada um dos twits chegou a um potencial de leitores diferente.

Por outro lado — e aqui vem a parecença com as medições que conhecemos nos mainstream media, bem como a sua exportação para o online no modelo das visualizações — o facto de dispormos de um potencial de xis leitores não significa que a mensagem tenha sido aberta por todos eles.

Apesar das suas fragilidades evidentes o alvo potencial, tal como sublinhou Dave Winner ao introduzi-lo, faz-nos olhar para o Twitter com mais respeito. Um puf! entre 3 servidores e os artigos no Certamente! multiplicaram-se numa rede com um limite de, deixa ver, 168.300 pares de olhos. Não há melhor relação custo/benefício no mundo da edição!

Duvido que lá dentro alguém saiba isto, mas o Público tem um potencial de 13.027.768 contactosnot bad para duas dúzias de electrões endiabrados ;)

O alcance, como tudo no Twitter, é espantoso. Um pouco menos, apesar de tudo, é o ruído. Mesmo as actuais queixas de spam são um pouco disparatadas: individualmente, o spam representa uma ameça muito inferior, quase nula. a bem dizer, nem nos chega a mensagem propriamente dita, mas apenas uma manifestação da intenção do spammer.

A escala de Louis Gray não tem nada a ver com o fenómeno do spam, o que ele quis foi ver se ele próprio “twitava” muito ou pouco.

É muito simples: dividimos o número de twits, ou mensagens, pelo número de followers, e obtemos um resultado que indicia o nível de ruído que geramos.

Indivíduos com menos mensagens enviadas do que leitores são Listeners — estão no Twitter sobretudo para ouvir os outros. Entre a paridade mensagens-destinatários e duas mensagens por destinatário, considera-se um Middle ground. Os Conversationalists são os que emitem entre 2 e 5 mensages por cada follower que têm, acima disso são considerados Megaphones.

—-

Finalizo indicando outro método que me parece promissor, mas que ainda não sei se aplicarei nas minhas experiências pois foge um pouco ao meu âmbito, que é mais universal e menos centrado no utilizador. Passa por valorizar a acção do tuíter calculando as quantidades de links que usa, a que se dirige, que se dirige a ele, e quantas mensagens não têm destinatário declarado (a maioria). A base de dados do Tweeterboard parece ainda não ter recuperado, infelizmente.

Uma nota mais: monitorar o Twitter é um triplo desafio.

Por um lado, as limitações físicas no acesso à API: 70 pedidos por hora obrigam a muita ginástica, alguma dela inteligente, como fazer um serviço que possa “pedir emprestado” o login ao cliente para realizar as operações.

Por outro, as pannes da API: volta e meia bloqueia, durante uma hora deixa passar todas as mensagens (acontece mais de madrugada), ou então tem um comportamento errático, perdendo uma mensagem aqui, outra ali.

E por último as crises do próprio serviço, que não são poucas. Bem precisam de mais 15 ou 20 milhões de dólares… (o que eu faria com 1% disso…)

(Link do primeiro artigo dos dois sobre este assunto)