Certamente!

Paulo Querido. Na Internet desde 1989

23 de janeiro de 2011

O Que Está A Dar, no Record: o agregador esperto que faltava ao jornalismo de desporto

Em Novembro lancei aqui uma novidade no jornalismo em português: a seção Tópicos do Jornal de Negócios. Hoje chegou a vez de apresentar o “irmão”: o agregador esperto que faltava ao jornalismo de desporto, O Que Está a Dar, incluído na versão online do Record.

Os dois projetos são na prática gémeos, sendo que O Que Está a Dar nasce um tempo depois. Partilham 95% do código que propulsiona os motores semânticos e de apresentação. É nesta que mais se diferenciam.

Mosaico

Enquanto para o Tópicos (e versão internacional) apostámos na nuvem de termos como visualização prioritária, surgindo na primeira página, em O Que Está a Dar optámos por uma visualização em mosaico.

Ambas facilitam a avaliação da importância relativa dos temas que mais se destacam no noticiário. No caso na nuvem, o tamanho das letras fornece essa indicação. No mosaico é a dimensão de cada célula, ou “tijolo”, que transmite imediatamente ao cérebro do leitor a importância do assunto.

O mosaico é, talvez, um pouco mais rico. Mas também é mais exigente, tanto tecnicamente (um desafio, que aprecio mais abaixo) como no esforço que pede ao leitor. Cada célula contém informação adicional ao tópico, ou assunto: mostra logo a última notícia relacionada e em grande parte dos casos ilustra o assunto com uma fotografia.

O mosaico é esteticamente inspirado no Zeitgeist do Guardian mas na realidade está tecnicamente mais perto dos treemaps e newsmaps. Já tinha usado newsmaps antes, quer em projetos autónomos quer em aplicações para o Expresso (dossiê Gripe A), todos já desativados ou ultrapassados.

A principal evolução prende-se com a necessidade de resolver um problema surgido na fase de testes: as extremas diferenças de dimensão de células por vezes provocavam “incidentes gráficos”. No Twitter (de onde vieram duas soluções de código para o mosaico, que é integralmente produzido em HTML, sem Flash nem Javascript) um leitor sugeriu uma escala logarítmica, que testei e acabei por aplicar, substituindo a escala aritmética que usara nos newsmaps.

A diferença entre estas apresentações é que um mosaico como o do Guardian não reflete a importância relativa entre os assuntos enquanto o newsmap vive precisamente de mostrar essa diferença; a escala aritmética é mais fiel, a escala logarítima é mais aceitável graficamente.

Optei pela designação de mosaico porque me parece mais indicada para a língua portuguesa.

Papel

Tal como no caso da versão internacional dos Tópicos do Jornal de Negócios, também O Que Está a Dar terá uma ligação com a edição papel do Record. Estreio-me na terça-feira com o primeiro artigo de uma série que espero longa e tão bem sucedida como as minhas anteriores passagens pelo jornalismo de desporto (comecei aqui a minha carreira de jornalista, já lá vão mais de três décadas).

O artigo terá por base a leitura das reações na blogosfera, twitosfera e mediaesfera aos principais incidentes de cada jornada das Ligas, Nacional e dos Campeões. O ponto de partida é a análise dessas reações através de O Que Está a Dar, nomeadamente usando a visualização Clássica — o nome, pouco inspirado embora, que encontrei para uma apresentação onde o meu algoritmo tenta reproduzir critérios editoriais minimalistas: escolhe os temas de primeira página em função do seu interesse e do “peso” dos temas no conjunto do noticiário das últimas 24 horas — ou das últimas 36 ou 48, no caso dos períodos de fim de semana.

Criei este formato por causa do meu interesse no robo-journalism, edição automatizada ou assistida por computador — designações ainda experimentais para as tentativas de aplicação de métodos aparentados, ou nem por isso, com a Inteligência Artificial para tratar jornalisticamente assuntos com elevado grau de previsibilidade (é no noticiário desportivo que estão a surgir as primeiras experiências de automated journalism).

Nota à margem: Já tenho uma experiência a correr nesta área: um esqueleto do que, muito eventualmente, poderá vir a ser um robô para apoio editorial, tem publicado uma nota diária sobre as edições na Wikipedia de língua portuguesa (funcionou melhor nos primeiros meses do que agora, nunca mais lhe mexi no código, mas produz um artigo todos os dias!). Se tiver curiosidade, eis uma das últimas notas, totalmente feita sem intervenção humana, da recolha e compilação dos dados ao longo de cada minuto à publicação da peça final, passando por decisões primárias sobre o título e o corpo do artigo: ‘Drambuie’ foi a página mais editada da Wikipedia.

Dificuldades (ai, Sporting!)

Embora o “coração” do código seja comum, o projeto para o Record só ficou pronto semanas depois do Jornal de Negócios (o seu lançamento em Janeiro foi decidido por outros fatores).

(Adianto, a propósito, que está na calha uma terceira aplicação, já tem nome, é para um diário generalista português, antes da internacionalização. Terá algumas diferenças, graças à aprendizagem nestas duas primeiras aplicações.)

O Que Está a Dar apresentou dificuldades inesperadas. Desde logo, impressionou-me (e não devia, dado o meu passado) a pouca rotatividade temática do desporto. Enquanto cerca de metade dos temas que fazem as notícias de economia é renovada numa base diária, no desporto a taxa de renovação é muito menor. E há temas “sagrados”, que nunca deixaram de estar no topo da lista ao longo dos 2 meses que o projeto já leva de produção.

E depois há dois pesadelos. Um, extremamente difícil de ultrapassar — e nem tenho a certeza que o possa fazer, no âmbito da agregação. Trata-se da projeção dos clubes como marcas multi-desporto. Fala-se de FC Porto no futebol, no hóquei, no voleibol, no basquetebol… A marca FC Porto acaba por ter um protagonismo que se sobrepõe ao das (suas) equipas que provocam a notícia.

O outro… chama-se Sporting. A palavra Sporting aparece em tantas situações diferentes que dificultam a sua catalogação semântica. Escreve-se Sporting para referir o Sporting Clube de Portugal. Mas a palavra está em “Sporting de Braga” e noutros clubes, nacionais e estrangeiros.

Continuo insatisfeito com os resultados dos motores semânticos que uso. Os estrangeiros são ainda piores a adivinhar de que Sporting se trata dentro do contexto das frases, numa língua que tem pouca atenção (por parte deles, claro).

Tentarei melhorar os resultados. Digamos que, mais que um desafio, é uma obsessão :)

Feeds impossíveis

Este trabalho permitiu-me ver até que ponto vai o atraso dos jornais portugueses na web. A pobreza técnica é tanta que me sinto meio envergonhado.

Deixo o resto de lado e falo só dos feeds. Há jornais com lugar indubitável nos dois projetos e que só não estão lá porque apresentam feeds ilegíveis e tecnicamente errados.

Num ou noutro caso consegui, com uma boa vontade cujo único reconhecimento será a satisfação dos leitores, e dentro das minhas limitações enquanto aprendiz de programação, corrigir situações ou dar-lhes a volta, para integrar as fontes.

Mas outras continuam ausentes. Como o jornal i, um estudo de caso de como mais valia estar quieto: os resultados do futebol entram na economia, a política entra no futebol, uma confusão completa subordinada, aparentemente, à máxima de que se devem plantar todas as sementes em todos os terrenos. Completo fail.

Noutros casos contactei, repetidamente, alertando para os benefícios de feeds com, ao menos, a informação da data/hora presente… Respondeu o leitor? Assim responderam eles.

Feeds com 2 e 3 redirecionamentos, feeds com repetições de artigos em endereços diferentes… Feeds sem indicação de autoria, levando o leitor a acreditar que uma notícia comprada ao quilo à Lusa é um original do jornal.

Para quem se interesse por estudar a relação dos jornais portugueses com a World Wide Web, o mais interessante disto tudo é que é mais fácil fazer um feed bem feito do que errar. Está tudo nos sistemas editoriais dos jornais e o documento técnico do RSS lê-se em 5 minutos e aplica-se num minuto. O que nos leva à conclusão de que há premeditação no serviço deficiente. Bem: é uma guerra até aqui perdida, e não por mim.

Hipertexto

O Que Está a Dar provocou algum frisson no Twitter por causa… dos links para A Bola!

@PauloQuerido ai jesus, o record a ligar para noticias da bola! ai o escandalo! até me benzo| LOL (MrSteed)

@PauloQuerido Ai que a malta da Bola lhe dá um xelique quando vir o referrer :) (Luís Grave)

Bem, eu também gostava de ver a cara do pessoal de A Bola quando vir na análise de tráfego que o Record lhes está a mandar leitores. E adivinho o falatório. Já estou habituado. Há anos.

Em 2007 apresentei uma exposição sobre o futuro do jornalismo na Internet, falando já no “do what you do best, link the rest”, num dos principais grupos de media, e as perguntas dos jornalistas prendiam-se quase exclusivamente com o medo — o pavor! — de “linkar” para fora dos seus jornais.

Esta incompreensão do funcionamento do hipertexto e do seu valor para o novo leitor vem somar-se a uma característica marcante das Redações portuguesas (e não só, mas é destas que falo): fingir que se ignora a concorrência.

Os jornais online do grupo onde perorei sobre links vai para quatro anos passaram a usar o hipertexto recentemente. Descobriram em 2010 que os links internos numa notícia levam o leitor de uma para outra página, aumentando os pageviews (o que nem é o mais importante, mas ainda vivem convencidos disso, portanto é disso que falo).

Tim Berners Lee deu-nos a World Wide Web com as ligações entre páginas em 1992. Nada mau, esse atraso de 18 anos. Talvez nem precisem passar tantos para descobrirem que, na exata medida em que constitui uma mais valia para o leitor, o hipertexto pleno — isto é: o link para o conteúdo relevante no contexto do artigo, mesmo que esteja num site concorrente — é um aliado do jornalismo, não é um inimigo. É um instrumento do bom jornalismo.

Talvez precisem apenas de ler as publicações de referência online prestando atenção aos detalhes.

Benchmark

Quando apresentei os Tópicos houve um par de equívocos acerca da sua natureza e objetivo. Respondi a quem merece resposta e ignorei o resto.

O benchmark inicial foi feito com os projetos similares, na altura muito poucos. Tomei como referência o trabalho de 2 jornais: Topics e Blogrunner do New York Times e Zeitgeist do Guardian. Entretanto, e desde que lançámos a aplicação de Tópicos no Negócios, em meados de Novembro, já surgiram aplicações com a mesma finalidade noutros jornais, todos estrangeiros. Destaco a seção a fondo do El País e os Tópicos do Estadão. Que passam a fazer parte do meu benchmark.