O artigo pretende operacionalizar os conceitos do cálculo da dimensão de uma amostra para subgrupos, mediante dois cenários distintos: estimar o desempenho de um processo, tanto para o curto prazo, como para o longo prazo.
Palavras-chave: erro amostral, medição, nível sigma, capabilidade
Problema
Será de senso-comum querermos avaliar o desempenho de um determinado processo, produto ou serviço, seja em termos de design, seja já durante o seu próprio ciclo de vida. Não só esta aferição pretende traduzir o nível de satisfação do cliente, como também o de se entender em que patamar de desempenho o negócio atualmente se situa. De entre as várias métricas e indicadores possíveis (seja por exemplo pelo Cpk, Pp ou nível sigma) sabe-se que para os calcular necessitamos, primeiro, estimar o desvio-padrão.
E é aqui que as coisas se complicam porque quando olhamos para um processo, produto ou serviço podemos fazê-lo sob uma perspetiva de curto ou de longo prazo, e a forma como estimamos o desvio-padrão não é a mesma. A razão para querermos diferenciar estas perspetivas é simples: Enquanto a primeira traduz o potencial máximo de desempenho que se pode esperar, sem recorrer a nova tecnologia ou elevados investimentos, a segunda refere-se à verdadeira experiência sentida pelo cliente. Então, como operacionalizar tudo isto?
Direção da solução
Comecemos por definir um pouco melhor os próprios conceitos de curto e de longo prazo, isto é, quão curto é curto e quão longo é longo? Intuitivamente sabemos que algo de curto prazo terá uma janela temporal de dimensão menor, aquando da recolha das amostras medidas, mas ainda assim a resposta continua incompleta e pode não deixar à-vontade o analista ou a equipa de projeto. Assim, na expetativa de que a intuição seja suficiente costumamo-nos apoiar nos especialistas, na experiência e na própria dinâmica do negócio. Mas talvez possamos adicionar algo mais concreto a esta análise.
Vamos por partes. Em primeiro lugar, o desvio-padrão de curto e de longo prazo têm expressões matemáticas distintas, independentemente da janela temporal usada para recolher dados. Imagine-se que se recolhem amostras ao longo do tempo constituídas por 5 elementos cada, ou seja, 5 observações de cada vez, com instantes de tempo entre observações muito reduzidos. Em termos de engenharia da qualidade estamos a criar subgrupos racionais. Estes subgrupos são caraterizados por aquilo a que se chama erro puro ou variabilidade intra-amostral. Neste sentido, não estamos a considerar quaisquer desvios a um valor nominal ou à própria média de todas as observações. Consequentemente, o desvio-padrão deste modo apurado é necessariamente menor e, por isso mesmo, se denomina desvio-padrão de curto prazo. Por outro lado, se tivermos em consideração todas variações não só intra-amostrais, mas também de amostra para amostra (variações inter-amostrais), o desvio-padrão apurado denomina-se longo prazo. A partir do momento que conseguimos estimar cada um destes desvios-padrão estaremos em condições de estimar o desempenho do processo tanto no curto como no longo prazo.
Caso Prático
Vamos assumir que recolhemos 20 amostras com subgrupos de dimensão 5 referente ao tempo decorrido até se atender uma chamada, num call center. Depois de se garantir que podemos, de facto, confiar nos dados – isto é, que o sistema de medição foi validado, a primeira coisa que queremos fazer para estimar o desempenho (capabilidade) do processo é entender se os dados são estáveis e se até seguem uma distribuição normal. A estabilidade dos dados pode ser operacionalmente aferida a partir de uma carta de controlo Xbar/S para o efeito. Não havendo pontos fora de controlo assume-se que o processo é estatisticamente estável (não se está a olhar para eventuais padrões ditos de causa especial, mesmo quando os pontos estão dentro dos limites).
Fig.1: Carta de controlo Xbar/S para o tempo de atendimento das chamadas. O p-value quanto à normalidade de cada um dos conjuntos de pontos é, tanto para a média como para o desvio-padrão intra-amostral, superior a 0,1.
Estimativa do desvio-padrão de curto prazo
Mas, será que recolhemos um número suficiente de amostras? Para estarmos seguros que sim, é importante usar os dados originais registados e desenhar, ao longo do tempo, o desvio-padrão intra-amostral acumulativo. Ou seja, para a primeira amostra o desvio-padrão das 5 observações foi de 3,2 segundos. Para a segunda amostra o valor foi de 7,4 segundos, para a terceira amostra foi de 3,5 segundos, etc.
Com estes valores vamos calcular o desvio-padrão (pooled) acumulativo, sempre que adicionarmos mais uma amostra. Assim, o segundo ponto no gráfico da figura 2 são os próprios 3,2 segundos. O terceiro ponto já é a média dos dois primeiros valores, isto é, 5,3 segundos. E, o quarto ponto será a média dos três primeiros valores, ou seja, 4,7. Estendendo o raciocínio para todas as amostras obtém-se o seguinte comportamento:
Fig. 2: Evolução da estimativa do desvio-padrão de curto prazo ao longo do tempo (sempre que se adiciona mais uma amostra).
Não parece haver dúvidas que o número de amostras recolhidas é suficiente, para que se possa estimar o desvio-padrão de curto prazo e, com isso, estimar o nível sigma de curto prazo. Dito de outra maneira: se recolhêssemos mais uma amostra para estimar o desvio-padrão de curto prazo, a estimativa iria ser quase a mesma do que a anterior, e assim sucessivamente. O desvio-padrão de curto prazo é dado pela fórmula:
c4 é apenas um valor que vem em função da dimensão do subgrupo e que serve para corrigir um enviesamento da estimativa do desvio-padrão. Se, por exemplo, o limite de especificação superior deste processo for de 20 segundos e o valor nominal de 10 segundos, então torna-se trivial o cálculo do nível sigma de curto prazo (Z.ST=2,1):
Estimativa do desvio-padrão de longo prazo
Façamos o mesmo raciocínio para estimarmos o desvio-padrão de longo prazo. Desta vez, para cada subgrupo calculamos o desvio-padrão acumulativo, pela fórmula que tem em consideração os desvios da média. Por exemplo, o desvio-padrão de longo prazo, ao final da segunda amostra, não é mais do que o desvio padrão que tem por base as primeiras 10 observações (resultando em 5,4 segundos).
Fig. 3: Excerto dos dados originais e valores do desvio-padrão de curto e de longo prazo.
Contudo, se fizermos o gráfico respetivo, vemos que a linha cinzenta, que representa o desvio-padrão de longo prazo não está a convergir, o que nos leva a pensar que o número de amostras recolhidas para estimar o nível sigma de longo prazo (e consequentemente o Zshift) ainda não é suficiente. Haverá variáveis de ruído que precisam ser contabilizadas no cálculo, para termos uma estimativa sólida do desvio-padrão de longo prazo.
Fig. 4: Evolução da estimativa do desvio-padrão ao longo do tempo (sempre que se adiciona mais uma amostra), tanto para curto como para longo prazo
Repare-se que sem esta estabilização também não será legítimo estimar a média do processo. Por outro lado, para se calcular o nível sigma de longo prazo, ao contrário do de curto prazo, precisamos destas duas estimativas porque:
Qualquer cálculo feito ao dia de hoje iria simplesmente sobrestimar a verdadeira capabilidade de longo prazo do processo. Será por isso preciso continuar a recolher mais amostras até que a linha convirja para um declive próximo de zero.
Conclusão
Neste artigo mostrou-se uma visão mais aprofundada, quanto aos verdadeiros pressupostos no cálculo da dimensão da amostra, sempre que se pretende estimar o desempenho de um processo, mediante subgrupos racionais e que não chega olhar para a estabilidade dos dados, via SPC. Tal irá prevenir um menor ruído na comunicação com o cliente, um maior alinhamento das expetativas e uma melhor caraterização do próprio negócio. Pretende-se que esta informação possa ser usada em termos práticos pelo praticante de projetos de melhoria contínua, mais especificamente o Black Belt.
REFERÊNCIAS
[1] Harry, M. (2003) Resolving the mysteries of six sigma. NY Times and Business Week.
コメント