A coleta de dados é uma das etapas mais importantes em projetos para diferentes finalidades (científica, tecnológica ou publicitária para pesquisa de mercado, opinião e comportamento como Ibope). O planejamento e execução da etapa de amostragem e obtenção dos dados interferi no resultado e interpretação, gerando concluões equivocadas.
Veja alguns dos erros mais comuns na etapa de coleta de dados e planeje ações assertivas para alcançar seu verdadeiro objetivo.
1. Objetivo da amostragem e excesso de informações
Para maximizar recursos como dinheiro e tempo, muitos coordenadores e gestores de projetos tentam coletar o máximo possível de diferentes tipos de dados (variáveis) e excesso de amostras. Além, de inviabilizar a execução do projeto, esse tipo de planejamento tornando-o oneroso e trabalhoso, parte dos dados coletados podem não responder as perguntas do seu projeto. Portanto, não irão atender aos objetivos. Isso é consequência da falta de planejamento baseado nas perguntas certas para seu projeto: quais análises (laboratório ou estatísticas) serão feitas? Quais os dados alvos, características da região ou situações (tratamento) relacionados com as informações alvo do seu projeto? Planejar os passos necessários para alcançar seu objetivo baseado em hipóteses claras é um bom investimento de tempo.
2. Planejamento amostral: determinação do tamanho da amostra
Esse é um dos principais erros cometidos em projetos. Se uma amostragem em excesso pode inviabilizar o projeto em termos do tempo de execução, uma amostragem insuficiente diminui a confiabilidade dos resultados. Dos mais de 1 milhão de projetos científicos cadastrados no banco CAPES de Teses e Dissertações até 2018 em diferentes áreas, menos de 100 (0,01%) trabalham com temas diretamente relacionados ao planejamento amostral ou densidade amostral. Além da amostragem total, o gestor do projeto também deve ficar alerta na quantidade mínima de amostras para representar subgrupos dentro do plano geral de amostragem. Um das abordagens utilizadas para determinar o número de amostras é baseada na média populacional que se deseja representar.
n = estimativa do número de amostras
Vc = Valor crítico correspondente ao grau de confiança desejado (90% - 1,645; 95% - 1,96; 99% - 2,575)
DP = desvio-padrão da variável (obs.: para se balizar e ter um norte inicial, você pode utilizar o DP encontrado na literatura em trabalhos semelhantes ao que deseja executar)
Erro = erro máximo adimitido
3. Coleta, o que evitar no registro e arquivamento
Definido o plano de amostragem adequado, é importante padronizar a forma de coleta com a equipe do projeto para diminuir a fonte de erros. A falta de padronização pode aumentar a variabilidade dos seus dados, afetando análises posteriores como teste de médias (ex: teste t ou Tukey). Durante a tabulação dos dados (digitação no excel, por exemplo), coloque cada variável em uma célula diferente. Evite mesclar células do excel e colocar mais de uma variável em um mesmo campo. Uma sugestão é criar um arquivo chamado dados brutos onde cada variável fica em uma coluna específica e cada dado em uma célula. No arquivo de dados brutos, também evite deixar linhas ou colunas ocultas, filtros habilitados ou fórmulas relacionando uma coluna com outra. Por fim, mesmo após terminar o projeto, deixei seu arquivo com dados brutos salvo e protegido. Uma boa opção é salva-lo em algum sistema de arquivo em nuvem como Dropbox, Google Drive e outros.
Está em dúvida sobre qual o teste estatístico mais adequado para seu projeto? Veja um resumo de 5 minutos sobre abordagens estatísticas e sugestões de testes em 1 minuto! Clique aqui para assisti.
Veja também:
Análise multivariada: porquê utilizar no seu trabalho