Análise exploratória de dados (EDA) — E-commerce Olist

Matheus Buniotto
5 min readNov 28, 2021

--

Este artigo é uma continuação do projeto desenvolvido para conclusão de curso (TCC) no curso de pós-graduação de Gestão e Análise de Dados da PUC-MG. O projeto pretende desenvolver uma solução de dados de ponta a ponta transformando dados em informações para que os stakeholders possam tomar decisões ancoradas em dados e KPIs relevantes para o negócio. Na parte 1, os dados foram processados em um fluxo ETL e disponibilizados para consulta em forma de dashboards. Agora, os dados serão analisados através de ferramentas estáticas para gerar insights e recomendações para o negócio.

Link para o Dashboard desenvolvido na primeira etapa do projeto: Power BI

Bibliotecas utilizadas para análise

E-commerce no Brasil

Apesar da predominância das regiões sul e sudeste como os principais mercados de e-commerce no Brasil, as regiões Norte e principalmente a região Nordeste apresenta um enorme crescimento e potencial no mercado nacional. É o que nos indica a 43ª edição do Webshoppers, um dos mais amplos relatórios de sobre e-commerce no Brasil, elaborado pela Ebit | Nielsen.

Os dados MCC-ENET também apontam um crescimento acumulado de mais de 50% no Índice de Vendas Online nos últimos 12 meses. Outro ponto importante apontado pelos relatórios do Webshoppers é a importância do valor do frete na satisfação e preferências dos consumidores online.

Fonte: MCC-ENET — índices econômicos calculados com base na quantidade de vendas online, segundo período e região.

A partir desse cenário apresentado vamos analisar os dados abertos da empresa Olist para entender essas relações a partir do ponto de vista de frete, regiões e satisfação do consumidor.

Análise exploratória dos dados

Os clientes da região norte e nordeste são os que pagam mais pelo frete nos pedidos na Olist. Vemos que a maioria dos clientes dessas regiões pagam valores acima do valor médio do frete cobrado no marketplace.

Além disso, esses clientes também são os que mais esperam para receber que produtos foram comprados.

Vale ressaltar que esse valor maior não é influenciado por pedidos com peso ou volume maiores do que a média para a região nordeste, como podemos ver no gráfico de distribuição entre peso e valor do frete.

Para os clientes da região nordeste, o valor do frete ultrapassa 100% em relação ao valor do produto comprado para algumas categorias, como, por exemplo Casa e Conforto (2), nessa categoria, em média, o valor do frete representa 139% o valor do produto comprado.

Quando comparamos com os clientes da região Sudeste, esse valor não ultrapassa 50% do valor pago pelo produto.

Esse valor mais alto do frete em relação aos produtos faz com que o Ticket Médio para essas regiões seja maior, indicando que o cliente faz essa comparação de frete e valor do produto no momento da compra, tendo preferência por produtos com valores maiores, compensando o alto valor do frete que será pago por ele.

Um dos fatores que pode contribuir para esse alto valor no frete é a quantidade de vendedores presentes na região nordeste, esses vendedores representam apenas 1,80% do total de vendedores que vendem no marketplace. Sendo assim, a maioria dos produtos comprados pela região nordeste são enviados de outras regiões. Por outro lado, o número de compradores da região nordeste representa 9,4% do total, sendo a terceira maior região em número de compradores.

Uma estratégia de captação de novos vendedores da região nordeste poderia ser implementada visando aumentar o inventário de produtos disponíveis para envio partindo dessa região, oferecendo um frete mais atraente para os compradores regionais e dessa forma aumentar a participação de mercado da Olist.

Além disso, pode ser oferecido subsídios de frete para categorias estratégicas, reduzindo o valor do frete para a região nordeste, independentemente da região do vendedor. Apenas 15 categorias de produtos representam mais de 75% do total da receita acumulada pelo marketplace, essas categorias poderiam ser o ponto de partida para implementação de estratégias de redução de frete para os compradores da região nordeste.

Uma estratégia focada em oferecer benefícios e condições melhores de frete para categorias e produtos com grande volume de demanda poderá trazer benefícios perceptíveis logo de início, validando ou desvalidando a hipótese inicial.

Outro fator impactado pelo prazo e valor do frete é a avaliação do cliente em relação ao pedido, como podemos ver através da tabela abaixo, as regiões com maior prazo e maior valor de frete possuem uma avaliação média menor do que as outras.

Filtrando as avaliações com valor abaixo de 3 em uma escala de 0 a 5, podemos analisar as palavras mais citadas nos comentários de avaliações e dessa forma perceber que o frete e termos relacionados a ele é de fato muito presentes nessas avaliações negativas.

Dessa forma, uma estratégia focada em melhores condições de frete para regiões, promovendo melhores condições de frete e por consequência uma maior penetração de mercado e melhor satisfação do cliente, se prova uma das estratégias válidas para escalar o negócio.

Ferramentas utilizadas no projeto: KNIME, PowerBI, Excel, SQL, R Studio e Adobe Illustrator.

Links

Linkedin

Código da análise em R

Parte 1 do projeto

--

--

Matheus Buniotto

Compartilho um pouco dos meus estudos e projetos com dados! Atualmente trabalho como analista de Dados e BI com foco em marketing e produto.