Estrazione Auction [Python]

Un tutorial su come estrarre step by step le serie temporali Auction con l'SDK Python.

Artesian ti permette di avere un accesso semplice allo storico dei dati .

Vediamo passo passo come procedere.

Obiettivo

Estrarre i dati di un Auction Time Serie Market Data.

I dati e i link di riferimento sono fittizi, creati appositamente per questo case. In Artesian è possibile estrarre qualsiasi dato che sia riconducibile a una Time Serie.

Vediamo passo per passo come procedere.

Importazione delle librerie e configurazione di Artesian

La prima cosa da fare per poter utilizzare tutte le funzionalità di Artesian è autenticarsi. Per fare ciò dobbiamo importare la libreria di base più una serie di moduli che saranno necessari per istanziare l’autenticazione verso Artesian (linea 4 dello script) e successivamente per leggere i dati.

Una volta importate le librerie necessarie, possiamo configurare Artesian, inserendo il link necessario e l’api-key.

Per poter estrarre questi due dati importanti, si può far riferimento al tutorial di riferimento “Come Configure Artesian Python SDK“. 

Terminata la configurazione di Artesian, possiamo configurare il Query Service (linea 6)

				
					from Artesian import ArtesianConfig
from Artesian.Query import QueryService

cfg = ArtesianConfig("https://arkive.artesian.cloud/{tenantName}/", "{api-key}")

qs = QueryService(cfg)
				
			


La creazione dell'estrazione Auction

Una volta configurato Artesian e il Query Service, possiamo iniziare a pensare a quali dati vogliamo estrarre e a come li vogliamo estrarre.

L’informazione di base da avere per poter effettuare una estrazione da Artesian è l’ID o una lista di ID relativa ai Market Data di interesse, questa può essere facilmente ottenuta tramite la UI.

Parametri fondamentali da decidere

Una volta ottenuti gli ID che ci interessa estrarre possiamo iniziare a valutare come li vogliamo estrarre. I parametri fondamentali da decidere sono:

Il Time Range di estrazione: Artesian mette a disposizione varie possibilità, per ognuna di esse va considerato che il riferimento temporale di fine estrazione è sempre esclusivo. Per questo specifico esempio, consideriamo l’AbsoluteDateRange(“2022-03-13”, “2022-03-14”).

La TimeZone di estrazione del dato: può essere selezionata a seconda del proprio interesse, Artesian si occuperà di convertire i dati se necessario.

Una volta stabiliti i parametri della nostra estrazione e conclusa con il comando “execute()” possiamo printare i rissultati in terminal.

 

				
					q = qs.createAuction() \
    .forMarketData([100084890,100084891,100084892]) \
    .inAbsoluteDateRange("2022-03-13","2022-03-14") \
    .inTimeZone("CET") \
    .execute()

print(q)
				
			

Altre opzioni per l'estrazione dei dati

 

Relativamente alla selezione dei range di estrazione, Artesian supporta le seguenti opzioni: 

AbsoluteDateRange” è un arco di tempo determinato assoluto (es.:  dal “2018-08-01” al “2018-08-13” ti permetterà di estrarre i dati dal “2018-08-01” al “2018-08-12”)

RelativePeriod” rappresenta un arco di tempo relativo, precedente o successivo ad oggi (es.: Considerando che oggi sia il “2021-03-31” richiedere il period “P-5D” significherà estrarre i dati dal “2021-03-26” al “2021-03-30”. Richiedendo il period “P5D” significherà estrarre i dati dal “2021-03-31” al “2021-04-04”). Per la sintassi è possibile fare riferimento allo standard ISO8601, oltre al semplice “RelativePeriod” è possibile usare il “RelativePeriodRange” (es: da “P-5D” a “P5D” estrarrà i dati dal “2021-03-26” al “2021-04-04”).

				
					   .inAbsoluteDateRange("2022-03-06","2022-03-07")
   .inRelativePeriod("P5D")
   .inRelativePeriodRange("P-3D","P10D")
        
				
			


Alternativa all'estrazione in SDK

In alternativa all’estrazione in SDK, possiamo estrarre i dati direttamente da portale in formato Excell.

 

Basta eseguire l’operazione una sola volta per poi averla completamente riproducibile e automatizzata nel nostro workflow.

Questo non solo permette di risparmiare tempo, ma permette anche di ridurre al minimo gli errori umani dati dall’eseguire operazioni ripetute su grandi moli di dati o su diversi file Excel. 

Un vantaggio innegabile che ci consente di focalizzarci sull’analisi del dato invece che sulla sua gestione e ottimizzazione.