Como mapear colunas dinamicamente no Azure Data Factory para ajustar a correspondência entre as colunas de origem e destino
Azure Data Factory (ADF) é um serviço de orquestração de dados na nuvem que permite criar, agendar e gerenciar pipelines de dados. Vamos abordar cada um dos tópicos mencionados:
https://dadosabertos.mec.gov.br/pnp?start=0
Passo a passo:
Exemplo:
{ "name": "ArrayOfValues", "type": "Array", "value": [ "Value1", "Value2", "Value3" ] }
{ "name": "fileName", "type": "String" }
"source": { "type": "AzureDataLakeStoreSource", "storeSettings": { "type": "AzureDataLakeStoreReadSettings", "recursive": true } }
"activities": [ { "name": "ReadJSONActivity", "type": "Copy", "inputs": [ { "referenceName": "AzureDataLakeStorageLinkedService", "type": "DatasetReference", "parameters": { "fileName": "example.json" } } ], "outputs": [ { "referenceName": "OutputDataset", "type": "DatasetReference" } ], "typeProperties": { "source": { "type": "JsonSource" }, "sink": { "type": "AzureBlobSink" }, "enableStaging": false } } ]
"sink": { "type": "SqlServerSink", "writeBatchSize": 10000, "writeBatchTimeout": "00:05:00" }
{"type": "TabularTranslator", "mappings": [ {"source": {"name": "Ano"},"sink": {"name": "Ano"}}, {"source": {"name": "UO"},"sink": {"name": "UO"}}, {"source": {"name": "Ação"},"sink": {"name": "Ação Governo"}}, {"source": {"name": "GND"},"sink": {"name": "GND"}}, {"source": {"name": "Despesas Liquidadas"},"sink": {"name": "Liquidacoes Totais"}} ]}
Esses passos e exemplos ilustram como realizar diversas operações com Azure Data Factory, desde o armazenamento e extração de dados até o mapeamento de colunas e utilização de atividades específicas.
Cientista de Dados e Consultor de Soluções Digitais e Analíticas
@fabioms