quinta-feira, 25 de agosto de 2016

O dono dos dados

Na área da saúde os dados são, antes de mais, dos doentes. Qualquer doente pode, em qualquer momento, requerer toda a informação que sobre si possa existir (diagnósticos, resultados de análises, terapêuticas a que esteja sujeito…). As instituições de saúde que possam ter este tipo de informação têm responsabilidade de guardar e proteger estes dados e utilizá-los no melhor interesse do doente, sempre com a autorização deste.
Se uma criança identificar uma casa que tem um cão de guarda como: “A casa do cão” – não está a dizer que o dono da casa é o cão, mas sim que o dono da casa também tem um cão.













É prática comum das revistas científicas exigirem uma declaração que especifique o consentimento informado dos doentes para o uso dos seus dados. Mas, tal como acontece no nosso dia-a-dia, a obtenção de consentimentos informados para a utilização de dados nem sempre é feita da forma mais clara.



Politicas de ‘Open Data’ e/ou ‘Open Access’, com a disponibilização gratuita e universal de certos dados e informação, podem ser a única salvaguarda de que estes não sejam usados de forma perniciosa. 

segunda-feira, 6 de junho de 2016

Código de ética

A ética é um conjunto de princípios e valores partilhados que nos ajudam a distinguir comportamentos certos de comportamentos errados. Estes princípios universais são um pilar da civilização e acreditamos que não mudam independentemente do lugar ou da situação em que nos encontremos.

Nos nossos dias, a Ciência de Dados, enquanto área profissional, tem acesso a dados e opções de análise sem precedentes e por isto há necessidade de definir limites em relação ao que é possível fazer.

Um cientista de dados deve ter sempre presentes conceitos como:
·         Consentimento informado
·         Propriedade dos dados
·         Privacidade
·         Anonimato
·         Validade dos dados
·         Justeza dos algoritmos
·         Consequências sociais




 O prof HV Jagadish propõe um código de conduta ético simples e sintético para cientistas de dados:

1.       Não surpreender
O sujeito dos dados não deve ser surpreendido com os dados que recolhemos, partilhamos ou usamos. Devemos salvaguardar que os indivíduos a quem pertencem os dados    não sejam surpreendidos pelo facto de não esperarem que estes tenham sido recolhidos  ou usados segundo as nossas intenções.

2.       Ser o dono dos resultados
Se o processo de análise redundar em resultados não desejáveis, este processo deve ser revisto e modificado de uma forma correcta. Temos de perceber os resultados, não podemos apenas deitar para fora tudo o que possa resultar dos dados.


quinta-feira, 19 de maio de 2016

Viés de observação

Também designado como o efeito do candeeiro de rua, o viés de observação caracteriza-se pela procura de resultados apenas onde é mais conveniente de procurar. A alegoria do bêbado que procura debaixo da luz do candeeiro é uma caricatura desta situação. 
Podemos também afirmar que antes de procurar nas sombras devemos começar a investigar à luz do candeeiro. Com o advento dos ‘open data’, cada vez mais proliferam “as ruas bem iluminadas” ficando ao critério de cada um, a escolha dos melhores caminhos a seguir.












segunda-feira, 9 de maio de 2016

o Peru indutivo

A estatística utiliza uma abordagem indutiva para fazer previsões, tal como o peru descrito nesta história:

O problema não está na utilização do método indutivo, mas na amostragem efectuada.

quinta-feira, 7 de abril de 2016

Necessidade de uma melhor investigação


Este artigo publicado em 1994 poderia ter sido publicado em 2016, pois o seu conteúdo continua actual. Nos dias de hoje este 'escândalo' é ainda maior tendo em conta a facilidade de acesso a informação. Vemos, não raras vezes, erros de metodologia estatística publicados em revistas científicas na área da saúde que poderiam ser evitados com uma simples pesquisa na internet através de um qualquer motor de busca. Os editores destas revistas deveriam ser o garante da sua qualidade científica e os seus artigos, quando têm por base a análise de dados, deveriam ter a metodologia utilizada avaliada e escrutinada por estatísticos, antes de serem publicados.

quinta-feira, 31 de março de 2016

O estado das coisas

"O termo estatística surge da expressão em latim statisticum collegium palestra sobre os assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado." - Wikipédia (Etimologia)

Quando analisamos dados públicos estamos necessariamente a fazer uma descrição do resultado de políticas públicas cujo sucesso é sempre passível de ser criticado. Se na nossa análise identificarmos quer erros graves, quer resultados meritórios haverá sempre alguém (mais ou menos indignado) a levantar a mão e a dizer: "Estão a falar de mim!".

Pergunto-me, se alguma vez escrever sobre um animal peludo, quadrúpede e de orelhas grandes, quem levantará a mão a dizer: "Estão a falar de mim!"?

   

quarta-feira, 30 de março de 2016

Autores de artigos científicos na área da saúde

Os critérios de autoria de publicações científicas da área da saúde são definidos pelo “International Commitee of Medical Journal Editors” (ICMJE). Estes critérios são também os seguidos nas Normas de Publicação da Acta Médica Portuguesa que os traduz da seguinte forma:

Autores são todos que: 
1. Têm uma contribuição intelectual substancial, directa, no desenho e elaboração do artigo 
2. Participam na análise e interpretação dos dados 
3. Participam na escrita do manuscrito, revendo os rascunhos; ou na revisão crítica do conteúdo; ou na aprovação da versão final 
4. Concordam que são responsáveis pela exactidão e integridade de todo o trabalho 
As condições 1, 2, 3 e 4 têm de ser reunidas.
[...] Ser listado como autor, quando não cumpre os critérios de elegibilidade, é considerado fraude.

São comuns os artigos que apresentam mais de uma dezena de autores e é licito perguntar-mo-nos se todos esses autores cumprem os pontos supracitados. 
A ordem em que são listados os autores nestes artigos não é aleatória. Poderíamos dizer que em muitos destes casos: os seus primeiros autores transpiram; os últimos autores inspiram; e os do meio suspiram. Também é da praxe o último autor ser o patrão ou chefe dos restantes sendo que o seu nome aparece na lista de autores como que por "direito da pernada"

Aqueles que não aceitam as práticas instituídas tendem a ser "incompreendidos":


quinta-feira, 17 de março de 2016

De bioestatísticos e epidemiologistas

Três bioestatísticos portugueses vão num comboio rumo a um congresso de epidemiologia, numa pequena cidade no Norte de Europa. Entram três epidemiologistas, também portugueses que se dirigem ao mesmo congresso e que coincidem com os bioestatísticos. Conversa para cá, conversa para lá, e um dos bioestatísticos pergunta aos epidemiologistas:
BE: Quantos bilhetes de comboio compraram?
Ao que um dos epidemiologistas responde:
EP: Três, compramos três bilhetes, claro!
BE: Nós só compramos um.
EP: E como vão passar pelo revisor?
BE: Temos um método.
A viagem continua em amena cavaqueira e quando os bioestatísticos vêm aproximar-se o revisor dos bilhetes levantam-se os três e vão fechar-se no WC. Quando o revisor chega ao WC, depois de fazer a sua ronda, bate à porta e exclama: “Bilhetes!”. E um bilhete aparece debaixo da porta para o revisor picar. Depois do revisor continuar os bioestatísticos saem do WC e voltam para os seus lugares para espanto dos epidemiologistas.

Findo o congresso, bioestatísticos e epidemiologistas combinam regressar todos juntos no mesmo comboio. Na viagem de regresso um bioestatístico pergunta aos epidemiologistas:
BE: Quantos bilhetes de comboio compraram?
EP: Um, compramos apenas um bilhete. Vamos usar o vosso método…
BE: Nós não compramos nenhum.
EP: E como vão passar pelo revisor?
BE: Temos um método.
A viagem continua e quando vêm aproximar-se o revisor, os epidemiologistas levantam-se para se fecharem num WC. Quando perguntam aos bioestatísticos porque não fazem o mesmo estes respondem: “temos um método”.
Depois dos epidemiologistas se fecharem no WC os bioestatísticos levantam-se batem à porta do WC e exclamam: “Bilhetes!”. Quando aparece o bilhete debaixo da porta os bioestatísticos agarram nele e vão fechar-se noutro WC.


Moral da história: não basta conhecer os métodos, é preciso saber como e quando devem ser aplicados.

quarta-feira, 16 de março de 2016

Se não sabe nadar...

Se não sabe nadar... provavelmente não é um peixe!

vídeo extraído de uma aula do Prof. Stanley Lemeshow:

Gimmi RC, Browne GJ. Cooking with potential energy. Journal of Irreproducible Results. 1987

segunda-feira, 14 de março de 2016

Viés de selecção


Em Estatística procuramos tirar conclusões gerais a partir de pequenas amostras de dados reais. Por esta razão a selecção amostral é possivelmente a fase mais importante e crítica de qualquer estudo.


- Viés de selecção: Ocorre quando o problema do estudo é causado por factores envolvidos na selecção dos participantes ou por factores que podem influenciar na participação dos seleccionados.


Consequências de uma má amostragem: