Free cookie consent management tool by TermsFeed Policy Generator
  • SQL Server Vídeo
  •    26 visualizações da página
  •   1884 visualizações do vídeo
  • 2024, agosto 03, sábado

#055 Como Identificar os Outliers dos dados no SQL Server

Apresentamos nesse vídeo com reduzir o impacto dos valores extremos em uma tendência central identificando os outliers dos dados utilizando o SQL Server.

Iremos conhecer as técnicas:  

1. Expressão de Tabela Comum (CTE):

  • Uma Expressão de Tabela Comum (CTE) é uma consulta temporária nomeada que você pode referenciar dentro de uma instrução SELECT, INSERT, UPDATE ou DELETE. Ela facilita a escrita e a leitura de consultas complexas. Exemplo:

    WITH CTEExample AS (
     SELECT Col1, Col2
     FROM YourTable
     WHERE SomeCondition
    )
    SELECT *
    FROM CTEExample;
    

2. Consultar registros de tabela (SELECT):

  • O SELECT é usado para recuperar dados de uma ou mais tabelas em um banco de dados. Exemplo básico:

    SELECT Column1, Column2
    FROM YourTable
    WHERE SomeCondition;
    

3. Calcular Quartil, Mediana, Interquartil e Outliers (PERCENTILE_CONT):

  • O PERCENTILE_CONT é usado para calcular valores percentis, útil para análises estatísticas. Exemplo:

    SELECT
     PERCENTILE_CONT(0.25) WITHIN GROUP (ORDER BY YourColumn) AS Quartile1,
     PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY YourColumn) AS Median,
     PERCENTILE_CONT(0.75) WITHIN GROUP (ORDER BY YourColumn) AS Quartile3
    FROM YourTable;
    

4. Calcular limites superior e inferior (UPPER FENCE, LOWER FENCE):

  • Os limites superior e inferior são frequentemente utilizados para identificar outliers. Eles podem ser calculados usando os quartis obtidos anteriormente.

5. Obter e adicionar novo visual Box Plot e configurar no Power BI:

  • No Power BI, vá para a aba "Visualizações" e adicione o visual "Box plot" à sua página. Configure-o selecionando as colunas apropriadas para os eixos.

6. Combinar duas tabelas (CROSS APPLY):

  • O CROSS APPLY é usado para combinar duas tabelas, similar a INNER JOIN, mas com algumas diferenças. Exemplo:

    SELECT *
    FROM Table1
    CROSS APPLY Table2
    WHERE SomeCondition;
    

7. Coluna condicional (CASE, WHEN, ELSE):

  • A declaração CASE é utilizada para criar colunas condicionais. Exemplo:

    SELECT
     Column1,
     CASE
        WHEN Column2 > 10 THEN 'High'
        WHEN Column2 > 5 THEN 'Medium'
        ELSE 'Low'
     END AS Priority
    FROM YourTable;
    

8. Identificar os outliers dos registros (Power BI):

  • Use as ferramentas gráficas do Power BI para visualizar e identificar os outliers no Box Plot adicionado anteriormente. Isso permitirá uma análise visual fácil.

   

Este contéudo contém
  • Conteúdo Vídeo
  • Idioma Português
  • Duração 11m 5s
  • Legenda Não

  • Tempo de leitura 1 min 35 seg

avatar
Fabio Santos

Cientista de Dados e Consultor de Soluções Digitais e Analíticas


  • Compartilhe

Youtube Channel

@fabioms

Inscreva-se agora