2013 Ano Internacional da Estatística

A Estatística e o Ambiente

Kamil Feridun Turkman
Kamil Feridun Turkman

As preocupações com problemas de natureza ambiental fazem parte, desde há décadas, da agenda de todas as Nações. É fundamental uma compreensão adequada dos mecanismos e relações que governam as questões ambientais para que seja possível conciliar interesses económicos e ambientais.

Há muitas questões que estão interligadas, e que necessitam ser tomadas em consideração pelos cientistas, quando estes são chamados pelos decisores a construir ferramentas de apoio à decisão.

Estas questões incluem, embora não se restrinjam, a monitorização ambiental, a amostragem, o estabelecimento de padrões ambientais e consequências associadas à sua não observância; questões de natureza climática e meteorológica tais como aquecimento global, recursos hídricos, a gestão e oferta de recursos pesqueiros, conservação de florestas, etc.. Nestes estudos há essencialmente dois objetivos em vista: compreender os mecanismos que governam os processos que lhes dão origem e predizer realizações futuras. A Estatística desempenha aqui um papel primordial no estabelecimento de modelos para a inferência, na quantificação de efeitos, medição de riscos e consequências e interpretação de evidências.

Ambiente rural
Fonte: iStock

Estudos ambientais produzem dados com uma estrutura de natureza dinâmica espácio-temporal de grande complexidade. Não só as observações são feitas, em geral, em diferentes unidades de tempo, como também em diferentes resoluções espaciais. Esta complexidade, inerente ao estudo dos problemas ambientais, é cada vez maior graças aos avanços que nos últimos anos se tem vindo a observar na qualidade e capacidade dos instrumentos de medida, permitindo obter dados, com um nível de resolução, para cuja análise as rotinas analíticas clássicas não estão preparadas para dar resposta. O aumento da quantidade e qualidade de informação disponível requer naturalmente a criação de modelos mais complexos que permitam entrar em linha de conta com todas as variáveis em jogo. A implementação destes modelos requer, por sua vez, mais e mais capacidade computacional, limitando a execução de simulações ou inferências, mesmo usando os sistemas computacionais mais sofisticados. Para dar uma ideia da amplitude da escala temporal e espacial de que se está a falar, basta referir que alguns modelos simulam processos em meso-escala, outros simulam, por exemplo, rajadas de vento em condições urbanas à volta de edifícios com resoluções espaciais extremamente finas.

Há muitos objetivos em vista quando se estuda este tipo de dados a nível global. Pode pretender-se modelar variações espácio-temporais existentes; quantificar a incerteza presente nos processos aleatórios que originam os dados; quantificar possíveis efeitos climáticos causais, quantificar efeitos relativos a fatores humanos ou outros efeitos nesses processos e finalmente predizer realizações futuras no espaço e no tempo.

Cox e Isham (1994) definem, genericamente, três classes de modelos matemáticos para modelar processos ambientais:

  •  Modelos determinísticos espaço temporais, os quais dependem da solução numérica de um sistema de equações diferenciais não lineares, sendo em geral elevado o número de equações envolvidas. Estas equações são escolhidas de modo a representarem, de um modo mais realístico possível, os processos físicos subjacentes.
  • Modelos paramétricos espaço temporais, de natureza estocástica, em que os processos físicos subjacentes são explicados através de um número elevado de parâmetros.
  • Modelos estatísticos espaço temporais, de natureza empírica, em que o estado do processo está relacionado com a experiência, dados observados no tempo e espaço e outras variáveis explicativas, através de funções de ligação.

Que abordagem ou abordagens a utilizar depende do problema em estudo. Por exemplo, modelos determinísticos, por natureza, são capazes de representar muito melhor a dinâmica dos processos subjacentes do que modelos estatísticos empíricos, mas não permitem quantificar as flutuações aleatórias inerentes e o seu efeito nas conclusões, retiradas a partir de estudos de simulação. Por outro lado, modelos estatísticos empíricos são construídos com o propósito de quantificar o grau de incerteza inerente a esses modelos, mas não são desenhados para capturar realisticamente o processo físico subjacente. Recentemente tem havido grande interesse em construir modelos que juntem as qualidades dos modelos determinísticos à dos modelos empíricos. São, contudo, muitos os desafios que se colocam aos investigadores na construção desses modelos, já que implicam a resolução numérica simultânea de um grande número de equações diferenciais estocásticas não lineares. Presentemente esses modelos ainda estão longe de serem operacionais. Tal como eloquentemente Noel Cressie afirmou: os cientistas que baseiam os seus estudos em modelos determinísticos, tais como modelos de circulação global em climatologia, apenas aceitariam usar modelos estatísticos empíricos e "convidariam estatísticos para trabalhar com eles" na modelação de dados que representem verdadeiros desafios, se os estatísticos forem capazes de produzir modelos realísticos, ultrapassando todos os problemas computacionais, e de apresentar resultados credíveis, em tempo considerado útil. Contudo, tipicamente, a solução desses modelos empíricos envolve operações de integração numérica e/ou inversão de matrizes, com centenas ou milhares de parâmetros desconhecidos, demasiado complexas para serem executadas usando as técnicas computacionais existentes.
 

Ambiente rural
Fonte: iStock

O artigo seminal de Gelfand e Smith (1990) abriu caminho para a utilização de métodos inferências baseados em simulação e para a verdadeira revolução que os métodos de Monte Carlo via cadeias de Markov (MCMC) trouxeram para a Estatística. Hoje, estatísticos e outros cientistas são capazes de resolver problemas bastante complexos, partindo-os em problemas mais simples, através de uma especificação hierárquica, permitindo fazer inferência em modelos com um número muito elevado de parâmetros, com recurso a sofisticados métodos de simulação. Estes modelos e métodos inferenciais são particularmente úteis na análise de dados de natureza espácio-temporal de grande complexidade, com estruturas de dependência não lineares e comportamentos marcadamente não gaussiano. Estes estudos constituem atualmente um tópico "quente" em estatística ambiental. Há, no entanto, dois grandes problemas a resolver. Um deles é a "maldição da dimensão". Tipicamente a estrutura de dependência espácio-temporal, inerente na maior parte dos dados, é representada no modelo através de um campo aleatório gaussiano, e os métodos inferenciais dependem da inversão da correspondente matriz de covariância cuja dimensão pode chegar a vários milhares. Os métodos numéricos correntes não conseguem dar resposta a esta questão. Há duas abordagens possíveis para este problema. Uma das abordagens passa pela constatação de que, embora as matrizes de covariância sejam densas, as suas inversas são matrizes esparsas e há métodos numéricos que fazem uso desta propriedade. A outra abordagem baseia-se na aproximação de campos aleatórios gaussianos, por campos aleatórios gaussianos com propriedades markovianas (Lindgren et al, 2010). Isto porque certas classes de campos aleatórios gaussianos, tais como a classe Mátern, surgem como solução de certas equações diferenciais estocásticas e essas soluções podem ser aproximadas por campos aleatórios gaussianos de Markov, usando método standard de elementos finitos.

Gostava de usar esta oportunidade para referir que Finn Lindgren, um dos investigadores mais ativos nesta área, esteve em Lisboa durante este mês de junho, a convite do CEAUL, para dar um curso sobre esta metodologia.

Outro problema associado com estes métodos empíricos é que a metodologia MCMC que os permite implementar depende fortemente da expressão da verosimilhança do modelo e, em muitos problemas, esta verosimilhança não pode ser expressa analiticamente, embora a simulação destes modelos não seja um problema difícil. Métodos computacionais "likelihood free", tais como Approximate Bayesian Computation (ABC), têm sido usados, com algum sucesso, em problemas de resolução difícil, sendo este atualmente um tópico de investigação de ponta em vários problemas ambientais e biológicos. Hoje em dia, avanços metodológicos em estatística ambiental, têm sido acompanhados por grandes avanços a nível computacional. A existência de uma grande variedade de bibliotecas do R, específicas para o estudo de dados ambientais, e pacotes de livre acesso, tais como OpenBUGS, JAGS e R INLA, põem a utilização dessas metodologias avançadas ao serviço dos investigadores.

Estrada em ambiente rural
Fonte: iStock

Em resumo, os investigadores da área da Estatística têm, nas últimas décadas, feito todos os esforços na tentativa de corresponder aos enormes desafios que lhes vão sendo colocados pelos investigadores nas áreas do ambiente. A cada vez maior complexidade de dados de natureza ambiental, fruto dos enormes avanços tecnológicos e da crescente capacidade de aquisição de dados com resolução espácio-temporal cada vez mais fina, já fez, por sua vez, mudar o paradigma da Estatística. Contribuiu grandemente para este esforço a criação, na última década do séc. XX, de organizações especificamente orientadas para a resolução de problemas de Estatística Ambiental, nomeadamente SPRUCE e TIES, juntamente com o surgimento de revistas de especialidade tais como Environmetrics e Environmental and Ecological Statistics. Hoje em dia a Estatística Ambiental é reconhecida como uma área específica da Estatística. É no entanto crucial que estatísticos e investigadores em Ciências do Ambiente mantenham uma colaboração estreita, para que continuem a ser desenvolvidos métodos estatísticos e computacionais adequados que permitam dar resposta continuada aos desafios presentes e futuros.

Kamil Feridun Turkman, professor do DEIO-FCUL e investigador do CEAUL
Marta Palma no CT Ciências ULisboa

“A maior aprendizagem é perceber que de facto existem pessoas maravilhosas, com uma enorme generosidade e grande sentido de voluntarismo e muito dinâmicas. E que trabalhando juntos, podemos de facto fazer a diferença”, diz Marta Palma, funcionária do Departamento de Biologia Animal e voluntária no Centro de Testes Ciências ULisboa.

Homem em banco de jardim, observando o rio

Andreia Santos, psicóloga do GApsi Ciências ULisboa, deixa um alerta: "o nível de cansaço sentido pelas pessoas a assistir a conferências, palestras através de um ecrã é superior ao de assistir ao mesmo de forma presencial".

Vanessa Mendonça

“Este prémio simboliza não só o reconhecimento do meu trabalho, mas também de toda a equipa que nele participou”, conta Vanessa Mendonça, segunda classificada pelo Prémio de Doutoramento em Ecologia - Fundação Amadeu Dias 2020. Vanessa Mendonça concluiu o mestrado e o doutoramento na Faculdade e atualmente é investigadora do MARE.

A SPECO anunciou recentemente os vencedores do Prémio de Doutoramento em Ecologia - Fundação Amadeu Dias 2020. José Ricardo Paula é o grande vencedor desta edição e irá apresentar o seu trabalho no 19.º Encontro Nacional de Ecologia, este ano associado às cerimónias dos 25 anos da SPECO, e que se realiza em dezembro, em Ponte de Lima.

Centro de Testes

Rita Loewenstein Simões, de 23 anos, é voluntária no Centro de Testes Ciências ULisboa, na estação Mix e Real-Time PCR, desde maio passado. Para esta jovem bióloga, formada na Faculdade, este trabalho tem um significado muito simples: ajudar. E foi exatamente isso que a motivou - saber que todas as horas que disponibilizasse fariam a diferença.

Informação eletrónica de rua: Keep your distance

Ganna Rozhnova trabalha em modelação epidemiológica na UMC Utrecht, na Holanda. A antiga aluna de doutoramento em Física Estatística da Faculdade, continua a colaborar com o BioISI e é a investigadora principal de um projeto da FCiências.ID, financiado no âmbito do Apoio especial a projetos Research 4 COVID-19.

Spinophorosaurus nigerensis

Uma inovação anatómica pode ser a chave na compreensão da evolução dos dinossáurios saurópodes. Os autores deste trabalho - Daniel Vidal, Pedro Mocho, Ainara Aberasturi, José Luis Sanz e Francisco Ortega - acreditam que parte do êxito evolutivo deste grupo de animais está relacionado com alterações na cintura pélvica e que esse fator contribuiu para os converter nos animais de maior porte da Terra.

Centro de Testes

“Em cada turno processamos uma quantidade significativa de amostras e é sempre importante conseguirmos fazê-lo eficientemente, para que os resultados sejam conseguidos num curto espaço de tempo”, diz Catarina Lagoas, voluntária no Centro de Testes Ciências ULisboa.

Teclado para invisuais

“A tecnologia deve poder ser usada por todas as pessoas!”, diz Carlos Duarte, professor do Departamento de Informática, investigador do LASIGE Ciências ULisboa, e recentemente membro do World Wide Web Consortium (W3C) e da Ação COST LEAD-ME -Leading Platform for European Citizens, Industries, Academia and Policymakers in Media Accessibility.

 olho de choco

Um grupo de investigadores da Ciências ULisboa a trabalhar no Laboratório Marítimo da Guia do MARE conseguiu mostrar que chocos acabados de eclodir (até cinco dias) são capazes de ter uma aprendizagem social. O estudo publicado na  Animal Cognition tem como primeiro autor Eduardo Sampaio, estudante de doutoramento em Biologia (ramo Etologia).

ETAR de Gaia Litoral

A análise de mais de 200 amostras de águas residuais das cinco ETAR monitorizadas no âmbito do projeto COVIDETECT comprova a presença de material genético nos afluentes que chegam às ETAR e evidencia a ausência de deteção do material genético do vírus SARS-CoV-2 nos efluentes tratados.

National Cancer Institute

Investigadores do LASIGE Ciências ULisboa, INESC TEC e Universidade do Minho apresentam uma nova técnica de deduplicação de dados baseado em semelhanças e padrões encontrados nos ficheiros de sequenciação de genomas humanos e uma codificação das alterações para a recuperação desses dados.

logotipo

Sétima rubrica Radar Tec Labs, dedicada às atividades do Centro de Inovação da Faculdade. A empresa em destaque é a Keep on Care.

Computador

“O período de confinamento pode ser encarado como um primeiro grande teste à integração de renováveis no sistema elétrico, prelúdio do que se prepara com a transição energética global em curso”, escreve o cientista Miguel Centeno Brito.

Conceção artística do telescópio espacial Athena (Advanced Telescope for High-Energy Astrophysics)

“Ciências ULisboa tem vindo a aumentar a sua capacidade e a sua intervenção no desenvolvimento científico e tecnológico de alguns dos projetos mais importantes para o avanço da Astrofísica, não só nos próximos anos, mas nas próximas décadas”, diz o cientista José Afonso.

post it

Cristina Luís, investigadora do Departamento de História e Filosofia das Ciências e do Centro Interuniversitário de História das Ciências e da Tecnologia (CIUHCT), é a responsável em Portugal pelo projeto “Citizen Science as the new paradigm for Science Communication (NEWSERA)”, coordenado por Rosa Arias, fundadora da Science for Change e que visa estudar como a ciência cidadã pode mudar o paradigma da comunicação da ciência.

janela

Entrevista com o cientista Carlos Cordeiro, que lidera o SAFE Coating, um projeto que tem a Biomimetx e o Hospital Curry Cabral como parceiros e que em seis meses procurará implementar uma tecnologia capaz de inativar o SARS-CoV-2 em superfícies, impedindo a sua viabilidade fora do hospedeiro humano e consequentemente, eliminando uma importante via de transmissão viral.

Lusovenator, a nova espécie pertence ao grupo dos carcharodontossáurios - dinossáurios carnívoros, alguns dos maiores predadores do planeta Terra. A sua descoberta mostra que estes dinossáurios estavam presentes no hemisfério norte 20 milhões de anos antes do que indicava o registo conhecido. O estudo foi liderado por Elisabete Malafaia, investigadora do IDL, polo da Ciências ULisboa.

O Roteiro Nacional de Infraestruturas de Investigação de Interesse Estratégico (RNIE) 2020 inclui 56 infraestruturas. Ciências ULisboa coordena a CoastNet, a PORTULAN CLARIN e a RNEM, integrando ainda outras sete infraestruturas.

A fase de implementação da Rede Portuguesa de Monitorização Costeira (CoastNet) terminou recentemente, segundo comunicado de imprensa emitido pela Faculdade recentemente. A apresentação pública da CoastNet coordenada por José Lino Costa, professor do Departamento de Biologia Animal da Ciências ULisboa, acontece a 7 de julho, num evento a decorrer por videoconferência.

O projeto MarCODE visa desenvolver uma ferramenta multidisciplinar para potenciar o rastreio e a rotulagem ecológica de espécies marinhas de interesse comercial, segundo comunicado de imprensa emitido pela Faculdade. O estudo iniciado este mês de julho deverá terminar daqui a três anos.

Sexta rubrica Radar Tec Labs, dedicada às atividades do Centro de Inovação da Faculdade. A empresa em destaque é a Nevaro.

Cláudio Pina Fernandes, coordenador do GAPsi Ciências ULisboa, escreve sobre o Princípio da Incerteza e chama a atenção para alguns aspetos.

O mundo de hoje é completamente dominado pela necessidade imperiosa de saber recolher e analisar dados, escrevem os cientistas Tiago A. Marques e Soraia Pereira. Leia o artigo dedicado ao roteiro serológico nacional, uma iniciativa promovida pelo Instituto Gulbenkian de Ciência e que conta com a colaboração do Centro de Estatística e Aplicações da Universidade de Lisboa, da autoria destes investigadores.

Ciências ULisboa volta a participar com equipas de estudantes no Global Management Challenge (GMC). No passado dia 16 de junho começou a 1ª fase do GMC 2020, que conta com quatro equipas desta faculdade compostas por alunos dos mestrados integrados em Engenharia Biomédica e Biofísica, em Engenharia da Energia e do Ambiente e em Engenharia Física, assim como alunos das licenciaturas em Matemática Aplicada e Tecnologias de Informação.

Páginas