Cada ponto amostral foi composto por dois transectos de 200 m de extensão, com distância de pelo menos 50 m entre cada transecto e com pelo menos 400 m de distância de outros pontos amostrais. Os transectos foram dispostos preferencialmente a uma distância perpendicular de 50 m das estradas ou a uma distância mínima de 30 m destas. Apesar de não haver trânsito frequente nestas vias e provavelmente não interferirem sobremaneira sobre as aves do local, este cuidado foi tomado a fim de minimizar um possível efeito das estradas sobre os locais de amostragem.

Amostragem das aves

Foram realizadas amostragens de campo em 33 dias, distribuídos entre as duas campanhas de coleta, sendo 15 dias em novembro e dezembro de 2014 e 16 dias em março de 2015. As amostrages foram concentradas no período chuvoso por que este coincide com a época de reprodução e também de maior atividade da maioria das espécies. Para amostragem das espécies em cada ponto foi utilizado o método de transecto. Este é um dos métodos mais utilizados para o estudo deste grupo de vertebrados e consiste no registro visual e/ou auditivo das espécies de aves, enquanto o observador se desloca por um trajeto dentro da área de amostragem \cite{Bibby_et_al._1992}. Os registros poderiam ser feitos em todas as direções em relação ao trajeto (excluindo aqueles de indivíduos e espécies em vôo sobre o ponto amostral), mas foi estipulada uma distância máxima de 100m a partir do transecto para a inclusão dos registros das espécies. Além disto, foram deconsiderados os registros que estivessem dentro desta distância, más em um outro tipo de vegetação que não fosse estruturalmente semelhante àquela do ponto de amostragem. Nós também mensuramos a distância (perpendicular) a partir do transecto de todos registros visuais das espécies, utilizando uma trena eletrônica. Esta medida será usada como covariável de detecção. Cada transecto foi percorrido em um período de 20 minutos, mantendo o observador uma velocidade constante durante o todo o transecto. Este detalhe foi levado em consideração para que todo o transecto fosse amostrado de forma homogênea durante o período de amostragem. As amostras foram realizadas entre às 6:00 e às 11:00 da manhã no período matutino e entre 15:00 e 19:00 no periodo vespertino, evitando-se também os períodos de chuva. Durante cada período de amostragem, foram também obtidos dados de temperatura e umidade relativa utilizando termohigrômetros portáteis, os quais serão utilizados como covariáveis de detecção.

Amostragem da estrutura da vegetação

A estrutura vertical da vegetação em cada transecto foi medida a partir da adaptação do método descrito por Wiens e Rotenberry \cite{Wiens_&_Rotenberry_1981}. Este método consiste em quantificar a presença de vegetação em um plano vertical da vegetação, utilizando um padrão (vara ou régua) disposta perpendicularmente ao solo. Nós utilizamos uma vara de bambu de 4 m de altura como referência, marcada com fita adesiva a cada intervalo de 25 cm de altura. Nós quantificamos a presença de contatos da vegetação (viva ou morta) em cada um dos 16 intervalos de altura a partir do solo. Nós diferenciamos estes contatos em quatro estatos vegetacionais: herbáceo, arbustivo, árvore de porte pequeno e árvore de porte grande. Em cada transecto, foram tomadas 20 medidas de estrutura vertical da vegetação, separadas por 10 m umas das outras e a uma distância perpendicular de 5 m do transecto. Estas medidas foram tomadas alternando-se os dois lados do transecto, de forma a melhor representar a vegetação em torno destes.

Delineamento amostral

Para se obter réplicas temporais de amostragem nos pontos amostrais, necessárias para se estimar a detectabilidade, foi utilizado o delineamento de dupla observação (double observer approach, \cite{MacKenzie_et_al._2006}). Este delineamento amostral é indicado para situações onde os custos associados com a visita de todos os pontos igualmente são desproporcionais (e.g. devido ao grande tempo de deslocamento entre os pontos). Desta forma é utilizado um esforço amostral mínimo para todos os pontos (a fim de estimar a ocupação) e um esforço mais concentrado em um subconjunto dos pontos (a fim de estimar a detectabilidade). Em nosso caso, metade dos pontos foi amostrada quatro vezes (pela manhã), enquanto que a outra metade foi visitada 20 vezes (12 vezes pela manhã e oito à tarde). Os pontos amostrais foram visitados por dois observadores diferentes. Em cada período de amostragem, um dos observadores percorria um dos transectos do ponto amostral, enquanto o outro observador percorria o outro transecto do mesmo ponto. Ao final deste primeiro período amostral, os observadores amostravam novamente o mesmo ponto, porém alternavam os transectos percorridos por cada um. Os observadores não trocavam informações sobre as espécies registradas durante a alternância entre os transectos, a fim de garantir a independência entre as duas amostras consecutivas. Após cada observador percorrer os dois transectos de cada ponto amostral, os observadores se dirigiam a outro ponto. Este delineamento foi escolhido de forma a maximizar o número de contatos com as espécies em cada ponto e também o tempo de amostragem total.

Variáveis dependentes

Durante as amostragens das aves, foram registradas todas as espécies de aves detectadas visual ou auditivamente dentro da área amostral de 100 m a partir dos transectos. O número de espécies observado em cada ponto foi considerado como o número total de espécies amostradas pelos dois observadores em todos os períodos amostrais. Além do número de espécies observado, nós estimamos o número de espécies presentes em cada localidade utilizando um modelo estatístico que gera estimativas de riqueza de espécies considerando o efeito da detecção imperfeita. Este modelo estima a riqueza de espécies a partir dos dados de presença e ausência de cada espécie em cada ponto e em cada ocasião de amostragem. Com este modelo estatístico também é possível obter estimativas do número de espécies em toda a área de estudo (metacomunidade), considerando todas as espécies observadas e estimando aquelas que podem não ter sido amostradas devido à influência da detecção imperfeita durante as amostragens. O modelo em questão, conhecido como multi-species occupancy model, foi desenvolvido a partir da extensão de modelos populacionais usados para se estimar a ocupação e detecção de uma espécie (single species occupancy models) \cite{Dorazio_&_Royle_2005}. Estes modelos populacionais vêm sendo aplicados com sucesso nas últimas décadas com o intuito de embasar estudos ecológicos e/ou planos de manejo e conservação de espécies de diferentes grupos taxonômicos \cite{MacKenzie_et_al._2002,MacKenzie_et_al._2003,Bailey_et_al._2009}. Recentemente, a implementação e aplicação dos modelos multi-species têm ganhado importância, principalmente por descreverem propriedades de comunidades e por permitirem o uso de informação de muitas espécies, o que seria de difícil execução utilizando somente os modelos populacionais \cite{Zipkin_et_al._2009,Ruiz-Gutierrez_et_al._2010}.

Variáveis independentes

Duas covariáveis de ocupação foram calculadas a partir das medidas de estrutura da vegetação. Para obtê-las, os dados de presença de cada estrato vegetacional por classes de altura em relação ao solo foram resumidos utilizando a análise de componentes principais (PCA). Esta análise permite separar ou ordenar amostras a partir das correlações entre grandes quantidades de variáveis tomadas nestas amostras. As correlações entre estas diversas variáveis são representadas de forma conjunta, na forma de um número bem menor de variáveis (eixos da PCA) \cite{Manly_2004}. Assim, a presença e ausência dos quatro tipos de estratos vegetacionais em cada um dos 16 intervalos de altura foram representados pelos dois primeiros eixos da PCA, que representaram juntos em torno de 45% da variação dos dados (Figura 3). Estes dois eixos foram usados como variáveis independentes e foram relacionados ao número de espécies observado e estimado. Adicionalmente, os estratos de ocorrência das espécies também serão usados como covariável da ocupação das aves. Além do simples efeito dos estratos sobre a ocupação, é possível que haja uma interação entre os efeitos das variáveis de estrutura da vegetação e os estratos vegetacionais. Uma hipótese a ser testada pensando neste cenário é a de que poderia haver um maior efeito da estrutura da vegetação sobre a diversidade de aves de um determinado estrato do que em outro. Mais ainda, poderíamos esperar até relações opostas entre estrutura da vegetação e diversidade de aves em cada estrato vegetacional. As covariáveis de detecção que serão consideradas por nós são a estrutura da vegetação, a temperatura e umidade, a distância perpendicular dos contatos a partir do transecto e o estrato vegetacional. A estrutura da vegetação, que nós esperamos ter um efeito positivo sobre o número de espécies observado e estimado, pode intererir negativamente sobre a detecção das espécies. Isto pode acontecer devido à maior quantidade de obstáculos para obstruir a visão do observador e também bloquear o som emitido pelas aves. A temperatura e umidade podem alterar o comportamento e a detecção das aves de forma não linear, já que é esperado que as aves sejam menos ativas quando a temperatura e umidade são muito baixas ou muito altas e apresentem seu ótimo de atividade quando os valores destas variáveis forem intermediários. A distância de observação das aves, por sua vez, interfere negativamente na detecção e pode também interagir com a estrutura da vegetação, sendo mais difícil amostrar a grandes distâncias em habitats muito complexos, assim como poderia mais fácil amostrar a longas e curtas distâncias em habitats pouco complexos. Finalmente, iremos usar o estrato vegetacional como covariável de detecção. Além de alguns estratos serem mais presentes em alturas mais elevadas que outros (o que poderia facilitar a detecção nos estratos 3 e 4, por ex.), a densidade da folhagem pode variar enormemente entre os estratos, o que poderia influenciar a detecção das espécies nos estratos mais densos (por ex. Estratos 1 e 2).

Análises estatísticas

O modelo de ocupação para comunidades (multi-species occupancy model) foi elaborado de forma a representar três processos distintos, mas relacionados: presença ou ausência das espécies na metacomunidade, presença ou ausência das espécies na localidade amostrada e detecção ou não das espécies em cada período amostral \cite{Dorazio_&_Royle_2005}. Estes três processos são considerados de forma hierárquica no modelo, de modo que a detecção das espécies depende da ocupação das localidades por estas espécies, que por sua vez depende das espécies estarem presente no pool regional de espécies considerado como a metacomunidade \cite{Dorazio_et_al._2006}. Como as ocasiões temporais de amostragem podem ser modeladas por covariáveis de detecção e também a ocupação de cada espécie também pode ser relacionada a covariáveis de ocupação, os modelos podem se tornar bastante complexos e com muitos parâmetros a serem estimados. Nestes casos, tem sido indicado o uso da abordagem bayesiana, onde os parâmetros destes modelos são mais facilmente estimados usando o algoritmo computacional Markov Chain Monte Carlo method (ou método MCMC). Entretanto, como no presente momento nós estamos construindo os modelos e buscando entender melhor esta abordagem, nós optamos por estimar o número de espécies por sítio a partir de um modelo básico, que não inclui nenhuma covariável. Desta forma, para estimar e avaliar a relação entre as variáveis dependentes e independentes, nós utilizamos a abordagem de verossimilhança, a qual é mais conhecida, relativamente mais simples e facilmente implementável em softwares estatísticos como o R \cite{team2014r}. As variáveis dependentes (riqueza observada e estimada) foram relacionadas com as independentes (dois primeiros eixos da PCA da vegetação) por meio de um modelo linear generalizado (GLM) com distribuição dos erros Poisson, a qual é indicada para modelar variáveis dependentes que são contagens, como no nosso caso. Os modelos construídos para representar a relação entre as variáveis incluem relações lineares entre as variáveis dependentes e cada uma das variáveis independentes, além de um modelo onde a variável dependente possa ser relacionada com a soma dos efeitos das duas variáveis independentes. Além da relação linear entre riqueza de espécies e a estrutura da vegetação, é esperado também que a riqueza possa estar relacionada com a estrutura vegetacional por uma relação quadrática. Neste caso, a hipótese ecológica representada seria a de uma maior riqueza de espécies em estruturas de vegetação intermediárias e as áreas com estruturas menores e maiores com riquezas mais baixas. Assim, nós também construímos modelos em que cada uma das variáveis independentes se relacionam de forma quadrática com as variáveis dependentes, além de um modelo onde ambas as variáveis independentes possam se relacionar de forma quadrática com a variável dependente. Para a seleção dos modelos que melhor representem a variação da riqueza observada e estimada em nossas amostras, nós utilizamos uma adaptação do critério de informação de Akaike (AIC), indicada para lidar com pequenas amostras (AICc). Este critério permite escolhermos o modelo que mais se aproxima do modelo “original” que possa ter gerado os dados, mesmo sendo este modelo desconhecido. Esta escolha é baseada na diferença dos AICc’s entre os modelos concorrentes (deltaAICc), sendo o melhor modelo aquele que apresenta menor valor de AICc (deltaAICc=0). Outros modelos que apresentem deltaAICc igual ou menor que dois em comparação com o melhor, são considerados igualmente plausíveis e não devem ser descartados como possível explicação para os dados \cite{burnham2002model}.