2013 Ano Internacional da Estatística

A Estatística e o Ambiente

Kamil Feridun Turkman
Kamil Feridun Turkman

As preocupações com problemas de natureza ambiental fazem parte, desde há décadas, da agenda de todas as Nações. É fundamental uma compreensão adequada dos mecanismos e relações que governam as questões ambientais para que seja possível conciliar interesses económicos e ambientais.

Há muitas questões que estão interligadas, e que necessitam ser tomadas em consideração pelos cientistas, quando estes são chamados pelos decisores a construir ferramentas de apoio à decisão.

Estas questões incluem, embora não se restrinjam, a monitorização ambiental, a amostragem, o estabelecimento de padrões ambientais e consequências associadas à sua não observância; questões de natureza climática e meteorológica tais como aquecimento global, recursos hídricos, a gestão e oferta de recursos pesqueiros, conservação de florestas, etc.. Nestes estudos há essencialmente dois objetivos em vista: compreender os mecanismos que governam os processos que lhes dão origem e predizer realizações futuras. A Estatística desempenha aqui um papel primordial no estabelecimento de modelos para a inferência, na quantificação de efeitos, medição de riscos e consequências e interpretação de evidências.

Ambiente rural
Fonte: iStock

Estudos ambientais produzem dados com uma estrutura de natureza dinâmica espácio-temporal de grande complexidade. Não só as observações são feitas, em geral, em diferentes unidades de tempo, como também em diferentes resoluções espaciais. Esta complexidade, inerente ao estudo dos problemas ambientais, é cada vez maior graças aos avanços que nos últimos anos se tem vindo a observar na qualidade e capacidade dos instrumentos de medida, permitindo obter dados, com um nível de resolução, para cuja análise as rotinas analíticas clássicas não estão preparadas para dar resposta. O aumento da quantidade e qualidade de informação disponível requer naturalmente a criação de modelos mais complexos que permitam entrar em linha de conta com todas as variáveis em jogo. A implementação destes modelos requer, por sua vez, mais e mais capacidade computacional, limitando a execução de simulações ou inferências, mesmo usando os sistemas computacionais mais sofisticados. Para dar uma ideia da amplitude da escala temporal e espacial de que se está a falar, basta referir que alguns modelos simulam processos em meso-escala, outros simulam, por exemplo, rajadas de vento em condições urbanas à volta de edifícios com resoluções espaciais extremamente finas.

Há muitos objetivos em vista quando se estuda este tipo de dados a nível global. Pode pretender-se modelar variações espácio-temporais existentes; quantificar a incerteza presente nos processos aleatórios que originam os dados; quantificar possíveis efeitos climáticos causais, quantificar efeitos relativos a fatores humanos ou outros efeitos nesses processos e finalmente predizer realizações futuras no espaço e no tempo.

Cox e Isham (1994) definem, genericamente, três classes de modelos matemáticos para modelar processos ambientais:

  •  Modelos determinísticos espaço temporais, os quais dependem da solução numérica de um sistema de equações diferenciais não lineares, sendo em geral elevado o número de equações envolvidas. Estas equações são escolhidas de modo a representarem, de um modo mais realístico possível, os processos físicos subjacentes.
  • Modelos paramétricos espaço temporais, de natureza estocástica, em que os processos físicos subjacentes são explicados através de um número elevado de parâmetros.
  • Modelos estatísticos espaço temporais, de natureza empírica, em que o estado do processo está relacionado com a experiência, dados observados no tempo e espaço e outras variáveis explicativas, através de funções de ligação.

Que abordagem ou abordagens a utilizar depende do problema em estudo. Por exemplo, modelos determinísticos, por natureza, são capazes de representar muito melhor a dinâmica dos processos subjacentes do que modelos estatísticos empíricos, mas não permitem quantificar as flutuações aleatórias inerentes e o seu efeito nas conclusões, retiradas a partir de estudos de simulação. Por outro lado, modelos estatísticos empíricos são construídos com o propósito de quantificar o grau de incerteza inerente a esses modelos, mas não são desenhados para capturar realisticamente o processo físico subjacente. Recentemente tem havido grande interesse em construir modelos que juntem as qualidades dos modelos determinísticos à dos modelos empíricos. São, contudo, muitos os desafios que se colocam aos investigadores na construção desses modelos, já que implicam a resolução numérica simultânea de um grande número de equações diferenciais estocásticas não lineares. Presentemente esses modelos ainda estão longe de serem operacionais. Tal como eloquentemente Noel Cressie afirmou: os cientistas que baseiam os seus estudos em modelos determinísticos, tais como modelos de circulação global em climatologia, apenas aceitariam usar modelos estatísticos empíricos e "convidariam estatísticos para trabalhar com eles" na modelação de dados que representem verdadeiros desafios, se os estatísticos forem capazes de produzir modelos realísticos, ultrapassando todos os problemas computacionais, e de apresentar resultados credíveis, em tempo considerado útil. Contudo, tipicamente, a solução desses modelos empíricos envolve operações de integração numérica e/ou inversão de matrizes, com centenas ou milhares de parâmetros desconhecidos, demasiado complexas para serem executadas usando as técnicas computacionais existentes.
 

Ambiente rural
Fonte: iStock

O artigo seminal de Gelfand e Smith (1990) abriu caminho para a utilização de métodos inferências baseados em simulação e para a verdadeira revolução que os métodos de Monte Carlo via cadeias de Markov (MCMC) trouxeram para a Estatística. Hoje, estatísticos e outros cientistas são capazes de resolver problemas bastante complexos, partindo-os em problemas mais simples, através de uma especificação hierárquica, permitindo fazer inferência em modelos com um número muito elevado de parâmetros, com recurso a sofisticados métodos de simulação. Estes modelos e métodos inferenciais são particularmente úteis na análise de dados de natureza espácio-temporal de grande complexidade, com estruturas de dependência não lineares e comportamentos marcadamente não gaussiano. Estes estudos constituem atualmente um tópico "quente" em estatística ambiental. Há, no entanto, dois grandes problemas a resolver. Um deles é a "maldição da dimensão". Tipicamente a estrutura de dependência espácio-temporal, inerente na maior parte dos dados, é representada no modelo através de um campo aleatório gaussiano, e os métodos inferenciais dependem da inversão da correspondente matriz de covariância cuja dimensão pode chegar a vários milhares. Os métodos numéricos correntes não conseguem dar resposta a esta questão. Há duas abordagens possíveis para este problema. Uma das abordagens passa pela constatação de que, embora as matrizes de covariância sejam densas, as suas inversas são matrizes esparsas e há métodos numéricos que fazem uso desta propriedade. A outra abordagem baseia-se na aproximação de campos aleatórios gaussianos, por campos aleatórios gaussianos com propriedades markovianas (Lindgren et al, 2010). Isto porque certas classes de campos aleatórios gaussianos, tais como a classe Mátern, surgem como solução de certas equações diferenciais estocásticas e essas soluções podem ser aproximadas por campos aleatórios gaussianos de Markov, usando método standard de elementos finitos.

Gostava de usar esta oportunidade para referir que Finn Lindgren, um dos investigadores mais ativos nesta área, esteve em Lisboa durante este mês de junho, a convite do CEAUL, para dar um curso sobre esta metodologia.

Outro problema associado com estes métodos empíricos é que a metodologia MCMC que os permite implementar depende fortemente da expressão da verosimilhança do modelo e, em muitos problemas, esta verosimilhança não pode ser expressa analiticamente, embora a simulação destes modelos não seja um problema difícil. Métodos computacionais "likelihood free", tais como Approximate Bayesian Computation (ABC), têm sido usados, com algum sucesso, em problemas de resolução difícil, sendo este atualmente um tópico de investigação de ponta em vários problemas ambientais e biológicos. Hoje em dia, avanços metodológicos em estatística ambiental, têm sido acompanhados por grandes avanços a nível computacional. A existência de uma grande variedade de bibliotecas do R, específicas para o estudo de dados ambientais, e pacotes de livre acesso, tais como OpenBUGS, JAGS e R INLA, põem a utilização dessas metodologias avançadas ao serviço dos investigadores.

Estrada em ambiente rural
Fonte: iStock

Em resumo, os investigadores da área da Estatística têm, nas últimas décadas, feito todos os esforços na tentativa de corresponder aos enormes desafios que lhes vão sendo colocados pelos investigadores nas áreas do ambiente. A cada vez maior complexidade de dados de natureza ambiental, fruto dos enormes avanços tecnológicos e da crescente capacidade de aquisição de dados com resolução espácio-temporal cada vez mais fina, já fez, por sua vez, mudar o paradigma da Estatística. Contribuiu grandemente para este esforço a criação, na última década do séc. XX, de organizações especificamente orientadas para a resolução de problemas de Estatística Ambiental, nomeadamente SPRUCE e TIES, juntamente com o surgimento de revistas de especialidade tais como Environmetrics e Environmental and Ecological Statistics. Hoje em dia a Estatística Ambiental é reconhecida como uma área específica da Estatística. É no entanto crucial que estatísticos e investigadores em Ciências do Ambiente mantenham uma colaboração estreita, para que continuem a ser desenvolvidos métodos estatísticos e computacionais adequados que permitam dar resposta continuada aos desafios presentes e futuros.

Kamil Feridun Turkman, professor do DEIO-FCUL e investigador do CEAUL

As populações de várias espécies de anfíbios na Serra da Estrela estão a diminuir drasticamente, devido a uma infeção por uma nova estirpe de vírus, também já detetado noutras partes de Espanha e da Europa, segundo comunicado de imprensa emitido recentemente pelo cE3c – Centro de Ecologia, Evolução e Alterações Ambientais.

Durante o Green Day ocorrido esta segunda-feira no campus de Ciências foi apresentado o Ecokart Twin, o primeiro kart elétrico português de dois lugares.

“Pequenas ações fazem a diferença, não tenham medo de sair da zona de conforto”. João Paulo Silva, um dos membros do projeto Movetech Telemetry, “apaixonado pela natureza”, dedicado ao estudo da ecologia das aves dos meios agrícolas, nomeadamente em projetos de seguimento remoto de vida selvagem como o Lince ou a Águia Imperial, deixa este conselho aos jovens que se interessam por esta área da Biologia. Saiba mais sobre este cientista, antigo aluno de Ciências e coordenador da componente científica e de desenvolvimento de software do Movetech Telemetry.

João Paulo Silva, doutorado em Ecologia por Ciências, investigador do Centro de Investigação em Biodiversidade e Recursos Genéticos e do cE3c, é um dos membros da equipa do Movetech Telemetry, no âmbito do qual estão a ser desenvolvidos equipamentos ultraleves e de grande autonomia para monitorização eficaz da vida selvagem.

O mercado do processamento da língua natural (PLN), segmentado em codificação automatizada, análise de textos, reconhecimento de carateres óticos, resposta interativa em voz, reconhecimento de padrões e imagens, e analítica da voz, tenderá a aumentar muito nos próximos dez anos.

O “XV Encontro de Jovens Investigadores em Paleontologia (EJIP)” realiza-se de 19 a 22 de abril de 2017, na cidade de Pombal, um concelho cuja riqueza paleontológica é salientada pela comissão organizadora desta 15.ª edição. Carlos Marques da Silva e Mário Cachão, professores do Departamento de Geologia e investigadores do Instituto Dom Luiz, são oradores convidados do encontro, cujas inscrições decorrem até ao final de março.

“Este programa dá-nos acesso a artigos, livros e outros materiais propostos pelos nossos tutores que nos dão uma grande ajuda a compreender melhor o gigante mundo que é a Matemática”, diz Rodrigo Duarte, estudante de Ciências, galardoado com uma bolsa Novos Talentos em Matemática 2016/2017.

Anny Caroline Muniz, aluna do mestrado em Bioestatística de Ciências, participou no estudo “Perfil Tabágico dos Estudantes dos 2.º e 3.º ciclos das Escolas do ACES Arco Ribeirinho”, dos concelhos de Alcochete, Barreiro, Moita e Montijo, desenvolvendo igualmente um modelo matemático para a previsão do adolescente/tipo com maior probabilidade de começar a fumar precocemente.

Qual o principal fator que provocou o crescimento das regiões exteriores das galáxias elípticas na época mais recente do Universo? Esta pergunta motivou a investigação liderada por Fernando Buitrago, investigador do Instituto de Astrofísica e Ciências do Espaço e professor convidado do Departamento de Física de Ciências, dando origem ao mais detalhado estudo publicado online em janeiro na Monthly Notices of the Royal Astronomical Society.

Jardim

O inquérito desenvolvido pelo cE3c - no âmbito do projeto europeu “Green Surge - Green Infrastructure and Urban Biodiversity for Sustainable Urban Development and the Green Economy” -, pode ser respondido até 15 de abril de 2017.

O Lisbon Green Hackathon 2017 acontece nos dias 11 e 12 de março. As inscrições terminam a 1 de março. No âmbito do evento estão previstas outras atividades, nomeadamente um ciclo de workshops, sessões de networking, debates e apresentações de startups.

O Tec Labs abriu portas ao ecossistema de inovação e empreendedorismo de Lisboa. O dia foi marcado pela apresentação de novidades para 2017, pelo networking entre os convidados e pela partilha de eventuais projetos e parcerias futuras.

O “Dr. Celestino” era não só um petrólogo excecional e um geólogo de campo incansável, como, e acima de tudo, uma pessoa encantadora pela sua delicadeza de trato. Os colegas do Departamento de Geologia e os ex-colegas do IICT sentirão certamente a falta da sua presença assídua e das interessantes e interessadas conversas sobre a Geologia de Cabo Verde.

Em fevereiro o Tec Labs – Centro de Inovação de Ciências abre as portas aos parceiros do ecossistema empreendedor nacional.

Seguramente já terá ouvido falar em dados geográficos. Pelo nome, deduz-se que estejam relacionados com mapas e lugares. No entanto, estes dados vão muito para além das coordenadas geográficas, representando, entre outros, redes de transporte, águas subterrâneas, populações, temperatura e recursos energéticos.

O filme “O Primeiro Encontro” (“Arrival”) de Dennis Villeneuve (2016) aborda a hipótese de Sapir-Whorf, de 1939, que diz que “a linguagem pode influenciar os nossos pensamentos”. Hoje em dia, a validade desta ideia está assegurada, graças às neurociências, e é possível afirmar que aprender uma língua permite estabelecer imensas ligações no cérebro, alterando a sua estrutura, e influenciando o modo de olhar para o mundo, e ainda moldando a personalidade.

O que fazem e o que pensam alguns membros da comunidade de Ciências? O Dictum et factum de fevereiro é com Ricardo Pereira, assistente técnico do Departamento de Engenharia Geográfica, Geofísica e Energia de Ciências.

O cE3c acaba de lançar o programa "Vamos Jogar aos Insetos em Ordem nas Escolas?", no âmbito do qual vai oferecer 200 exemplares do jogo "Insetos em Ordem" às primeiras 50 escolas públicas, que aderirem à iniciativa.

No total, desde há 57 anos, a Fundação Calouste Gulbenkian atribuiu 83 mil bolsas de estudo em diferentes áreas. Os estudantes de Ciências fazem parte destas contas.

O financiamento atribuído ao professor do Departamento de Informática e investigador do Laboratório de Sistemas Informáticos de Grande Escala (LaSIGE) de Ciências, relaciona-se com a sua participação no projeto Hyperledger da Linux Foundation, em que a IBM, a Intel e dezenas de outras empresas colaboram para construir tecnologias de blockchain para negócios.

Partilhar o fascínio da investigação em Astronomia com crianças dos 7 aos 12 anos é um dos objetivos da iniciativa IAstro Júnior, quatro sessões gratuitas, em Lisboa e no Porto, organizadas pelo Instituto de Astrofísica e Ciências do Espaço e pela revista Visão Júnior.

António Branco, professor do Departamento de Informática de Ciências, volta a coordenar uma nova investigação em tradução automática profunda, desta vez entre Chinês e Português, no domínio das transações de compra e venda online.

Quando falamos de um mecanismo o que queremos dizer de facto?

O Nutriageing é um projeto a pensar nos cidadãos que se interessam por temas como nutrição, partindo de argumentos científicos simples. O seu site é composto por vídeos, receitas, explicações e dicas nutricionais.

Um novo estudo genético demonstra que as populações de duas espécies de golfinhos (Tursiops aduncus e Sousa spp.) que habitam as águas da Baía de Bengala, no Bangladesh, são diferentes do ponto de vista genético quando comparados com populações de golfinhos das mesmas espécies que vivem em áreas vizinhas.

Páginas