Free cookie consent management tool by TermsFeed Policy Generator
  •  Video
  •    26 page views
  •   2017 video views
  • 2025, August 16, Saturday

#055 Como Identificar os Outliers dos dados no SQL Server

Apresentamos nesse vídeo com reduzir o impacto dos valores extremos em uma tendência central identificando os outliers dos dados utilizando o SQL Server.

Iremos conhecer as técnicas:

1\. Expressão de Tabela Comum (CTE):

  • Uma Expressão de Tabela Comum (CTE) é uma consulta temporária nomeada que você pode referenciar dentro de uma instrução SELECT, INSERT, UPDATE ou DELETE. Ela facilita a escrita e a leitura de consultas complexas. Exemplo:

WITH CTEExample AS (

SELECT Col1, Col2

FROM YourTable

WHERE SomeCondition

)

SELECT *

FROM CTEExample;

2\. Consultar registros de tabela (SELECT):

  • O SELECT é usado para recuperar dados de uma ou mais tabelas em um banco de dados. Exemplo básico:

SELECT Column1, Column2

FROM YourTable

WHERE SomeCondition;

3\. Calcular Quartil, Mediana, Interquartil e Outliers (PERCENTILE\_CONT):

  • O PERCENTILE\_CONT é usado para calcular valores percentis, útil para análises estatísticas. Exemplo:

SELECT

PERCENTILE_CONT(0.25) WITHIN GROUP (ORDER BY YourColumn) AS Quartile1,

PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY YourColumn) AS Median,

PERCENTILE_CONT(0.75) WITHIN GROUP (ORDER BY YourColumn) AS Quartile3

FROM YourTable;

4\. Calcular limites superior e inferior (UPPER FENCE, LOWER FENCE):

  • Os limites superior e inferior são frequentemente utilizados para identificar outliers. Eles podem ser calculados usando os quartis obtidos anteriormente.

5\. Obter e adicionar novo visual Box Plot e configurar no Power BI:

  • No Power BI, vá para a aba "Visualizações" e adicione o visual "Box plot" à sua página. Configure-o selecionando as colunas apropriadas para os eixos.

6\. Combinar duas tabelas (CROSS APPLY):

  • O CROSS APPLY é usado para combinar duas tabelas, similar a INNER JOIN, mas com algumas diferenças. Exemplo:

SELECT *

FROM Table1

CROSS APPLY Table2

WHERE SomeCondition;

7\. Coluna condicional (CASE, WHEN, ELSE):

  • A declaração CASE é utilizada para criar colunas condicionais. Exemplo:

SELECT

Column1,

CASE

WHEN Column2 > 10 THEN 'High'

WHEN Column2 > 5 THEN 'Medium'

ELSE 'Low'

END

AS Priority

FROM YourTable;

8\. Identificar os outliers dos registros (Power BI):

  • Use as ferramentas gráficas do Power BI para visualizar e identificar os outliers no Box Plot adicionado anteriormente. Isso permitirá uma análise visual fácil.

This content contains
  • Content Video
  • Language Portuguese
  • Duration 11m 5s
  • Subtitles Não

  • Reading time 1 min 33 seg

avatar
Fabio Santos

Data Scientist and Consultant for Digital and Analytics Solutions


  • Share

Youtube Channel

@fabioms

Subscribe now