Script de programação em R que gera um relatório dinâmico em HTML, no formato Markdown, a partir de planilhas eletrônicas com informações semanais de granjas de suínos, com base em diversos indicadores. Uma vez adquiridos, os dados são submetidos a rotinas automatizadas de limpeza, padronização e validação (incluindo a verificação de consistência, completude e coerência temporal), com posterior organização em bases analíticas, em periodicidade semanal ou quinzenal, conforme o esquema de manejo reprodutivo adotado na granja. Na sequência, a tecnologia realiza monitoramento orientado ao Controle Estatístico de Processo (CEP), cujo objetivo é detectar alterações relevantes no padrão de variabilidade dos indicadores-chave, distinguindo variações esperadas (causas comuns) de variações anormais potencialmente associadas a causas especiais e, portanto, passíveis de investigação e correção pelos produtores.
Para cada indicador-chave, define-se uma janela temporal deslizante composta por: (i) período de monitoramento, referente às observações mais recentes (tipicamente as últimas 8 semanas), e (ii) período de calibração, formado pelas 28 semanas imediatamente anteriores ao monitoramento, totalizando 36 semanas. No período de calibração, executa-se a purificação recursiva da base histórica, removendo observações instáveis/outliers, de modo a reter preferencialmente semanas representativas do estado “sob controle”, dado que os parâmetros estimados nessa etapa (por exemplo, média e desvio padrão) subsidiam os limites de controle e condicionam o desempenho da etapa de monitoramento. A filtragem é operacionalizada por meio de padronização a partir da curva normal reduzida, mantendo-se na calibração apenas as semanas cujos valores do indicador permaneçam dentro de uma faixa de estabilidade previamente definida (tipicamente entre −1 e +1 desvios-padrão normalizados). Esse procedimento é tecnicamente relevante porque a calibração deve refletir predominantemente a variabilidade decorrente de causas comuns no passado recente (28 semanas de calibração); a inclusão de semanas influenciadas por causas especiais tende a distorcer estimadores e, consequentemente, a degradar o desempenho do monitoramento (por exemplo, aumentando os falsos alarmes ou reduzindo a capacidade de detecção). Operacionalmente, a ausência de purificação pode introduzir instabilidade no conjunto de referência da granja, gerando limites de controle inadequados e reduzindo a sensibilidade do sistema para sinalizar deslocamentos reais do processo durante o período de monitoramento.
Concluída a qualificação dos dados, o sistema aplica, de forma complementar, duas cartas de controle, Média Móvel Exponencial - EWMA (Exponentially Weighted Moving Average) e Soma cumulativa - CUSUM (Cumulative Sum), particularmente adequadas à detecção de mudanças pequenas e graduais, frequentes em processos biológicos. Na modalidade EWMA, o valor monitorado é obtido por meio de uma média móvel com ponderação exponencial das observações históricas (com pesos decrescentes para os dados mais antigos), fornecendo uma estimativa dinâmica do nível médio do processo. Na modalidade CUSUM, o sistema computa somas cumulativas de desvios em relação a um parâmetro de referência (por exemplo, a média estimada na calibração), destacando deslocamentos persistentes e permitindo uma sinalização mais rápida de alterações sustentadas no comportamento do indicador. Sendo assim, nas semanas em que os indicadores ultrapassam os limites de controle estabelecidos, são automaticamente sinalizados por alertas visuais em vermelho nos gráficos, ou seja, avisos para ficar em alerta. Assim, facilita-se a identificação de possíveis eventos anômalos ou de intervenções necessárias.
Os modelos de EWMA e CUSUM necessitam de parâmetros para monitoramento. De forma mais detalhada, no EWMA o parâmetro λ (lambda) determina a taxa de decaimento dos pesos aplicados às observações passadas: a observação atual recebe peso λ, a observação imediatamente anterior contribui com peso λ(1−λ), e assim por diante, de modo que o peso da observação ocorrida k passos atrás é λ^k. Em outros termos, λ regula o equilíbrio entre a resposta rápida e a estabilidade. O desvio padrão (σ) desempenha um papel central na definição dos limites de controle, pois quantifica a variabilidade natural do processo em torno da média de referência. Sua inclusão no cálculo dos limites garante que a detecção de desvios se baseie não apenas na tendência central, mas também na amplitude esperada das flutuações inerentes ao sistema. Tipicamente, o script tem utilizado o parâmetro λ (lambda) de 0.4, 0.6 ou 0.8, com sigma de 3 desvios-padrão em relação à média. O CUSUM é uma técnica estatística de controle de qualidade utilizada para monitorar a estabilidade de um processo ao longo do tempo. Sendo assim, detecta pequenas e persistentes mudanças no processo, acumulando desvios em relação à média de referência. No gráfico CUSUM, dois parâmetros fundamentais são o intervalo de decisão (h) e o shift (k), que, em conjunto, determinam a sensibilidade do método à detecção de mudanças no processo. O intervalo de decisão (h) estabelece o limite de decisão, ou seja, o valor crítico que a soma acumulada deve ultrapassar para que se emita um sinal de alerta, funcionando como um controle da frequência de alarmes. Já o shift (k), também chamado de referência ou amplitude de mudança, define o tamanho da variação padronizada (em desvios-padrão) que o gráfico é projetado para detectar. Os modelos criados utilizam valores de h igual a 4 e de k igual a 1.
As rotinas de pré-processamento, estimação e monitoramento são executadas em computadores no ambiente R, por meio de scripts automatizados em Markdown. Podem ser empregadas bibliotecas para engenharia de dados e manipulação de tabelas, leitura de planilhas, tratamento de datas e semanas (incluindo semana ISO), bem como bibliotecas específicas para cartas de controle e monitoramento estatístico, sem prejuízo do uso de equivalentes funcionais. As saídas do sistema são disponibilizadas em relatórios dinâmicos gerados por R Markdown, que contêm, para cada indicador e para cada ciclo de atualização semanal ou quinzenal, as visualizações das cartas de controle e os respectivos sinais e alertas associados, gerando uma representação gráfica para o usuário.
Bibliotecas utilizadas:
library(tidyverse)
library(dplyr)
library(stringr)
library(qcc)
library(qicharts)
library(readxl)
library(dplyr)
library(lubridate)
library(ISOweek)
Rafael Romero Nicolino, Ailton Junior Antunes da Costa, Ana Luisa Martins Brum
A tecnologia tem como vantagem a criação de um fluxo contínuo de monitoramento de diversos indicadores-chave da suinocultura comercial. Grande parte das aplicações de Controle Estatístico de Processos apresenta o desempenho do modelo frente a uma doença, no caso, a síndrome reprodutiva e respiratória suína (PRRSV). Nos casos em que há alertas e não ocorre detecção da PRRSV, os modelos tendem a classificar como FALSO-POSITIVO; porém, há a possibilidade de ocorrência de outros agentes e eventos de interesse, o que pode classificar o evento incorretamente como falso. Ao utilizar uma gama ampla de indicadores em diversas fases da produção, a invenção tem a possibilidade de desenvolver uma ferramenta de monitoramento mais complexa, em que o foco esteja em evidenciar desvios de produção e não apenas uma única etiologia. Embora haja consenso geral quanto à necessidade de monitorar o desempenho, não se sabe como fazê-lo de forma eficiente, e a invenção tem a vantagem de criar e validar diversas ferramentas de monitoramento. A criação de um fluxo contínuo de retirada de dados, de tratamento dos dados de calibração e de gráficos de controle para um grande conjunto de indicadores é uma vantagem em relação às soluções apresentadas na literatura, por se tratar de vigilância inteligente, com dados em tempo quase real.
Número de Registro: PC202600297