Asignación dinámica de columnas en Azure Data Factory para ajustar la coincidencia entre las columnas de origen y de destino
Azure Data Factory (ADF) es un servicio de orquestación de datos en la nube que permite crear, programar y administrar canalizaciones de datos. Vamos a cubrir cada uno de los temas mencionados:
https://dadosabertos.mec.gov.br/pnp?start=0
Paso a paso:
Ejemplo:
{ "name": "ArrayOfValues", "type": "Matriz", "valor": [ "Valor1", "Valor2", "Valor3" ] }
{ "nombre": "nombreDeArchivo", "type": "Cadena" }
Tutorial:
"source": { "type": "AzureDataLakeStoreSource", "storeSettings": { "type": "AzureDataLakeStoreReadSettings", "recursivo": verdadero } }
paso a paso:
"actividades": [ { "name": "ReadJSONActivity", "type": "Copiar", "entradas": [ { "referenceName": "AzureDataLakeStorageLinkedService", "type": "DatasetReference", "parámetros": { "fileName": "example.json" } } ], "salidas": [ { "referenceName": "OutputDataset", "type": "DatasetReference" } ], "typeProperties": { "fuente": { "type": "JsonSource" }, "fregadero": { "type": "AzureBlobSink" }, "enableStaging": false } } ]
"sink": { "type": "SqlServerSink", "writeBatchSize": 10000, "writeBatchTimeout": "00:05:00" }
{"type": "TabularTranslator", "asignaciones": [ {"source": {"name": "Año"},"sink": {"name": "Año"}}, {"source": {"name": "OU"},"sink": {"name": "OU"}}, {"source": {"name": "Acción"},"sink": {"name": "Acción de Gobierno"}}, {"source": {"name": "GND"},"sink": {"name": "GND"}}, {"source": {"name": "Gastos liquidados"},"sink": {"name": "Liquidaciones totales"}} ]}
Estos pasos y ejemplos ilustran cómo realizar diversas operaciones con Azure Data Factory, desde el almacenamiento y la extracción de datos hasta la asignación de columnas y el uso de actividades específicas.
Científico de datos y consultor de soluciones digitales y analíticas
@fabioms