Estrazione Market Assessment [Python]

Un tutorial su come estrarre step by step le serie temporali Market Assessment con l'SDK Python.

Artesian ti permette di avere un accesso semplice allo storico dei dati .

Vediamo passo passo come procedere.

Obiettivo

Estrarre i dati di un Market Assessment Time Serie Market Data.

I dati e i link di riferimento sono fittizi, creati appositamente per questo case. In Artesian è possibile estrarre qualsiasi dato che sia riconducibile a una Time Serie.

Vediamo passo per passo come procedere.

Importazione delle librerie e configurazione di Artesian

La prima cosa da fare per poter utilizzare tutte le funzionalità di Artesian è autenticarsi. Per fare ciò dobbiamo importare la libreria di base più una serie di moduli che saranno necessari per istanziare l’autenticazione verso Artesian (linea 4 dello script) e successivamente per leggere i dati.

Una volta importate le librerie necessarie, possiamo configurare Artesian, inserendo il link necessario e l’api-key.

Per poter estrarre questi due dati importanti, si può far riferimento al tutorial di riferimento “Come Configure Artesian Python SDK“. 

Terminata la configurazione di Artesian, possiamo configurare il Query Service (linea 6)

				
					from Artesian import ArtesianConfig
from Artesian.Query import QueryService

cfg = ArtesianConfig("https://arkive.artesian.cloud/{tenantName}/", "{api-key}")

qs = QueryService(cfg)
				
			


La creazione dell'estrazione Market Assessment

Una volta configurato Artesian e il Query Service, possiamo iniziare a pensare a quali dati vogliamo estrarre e a come li vogliamo estrarre.

L’informazione di base da avere per poter effettuare una estrazione da Artesian è l’ID o una lista di ID relativa ai Market Data di interesse, questa può essere facilmente ottenuta tramite la UI.

Parametri fondamentali da decidere

Una volta ottenuti gli ID che ci interessa estrarre possiamo iniziare a valutare come li vogliamo estrarre. I parametri fondamentali da decidere sono:

Il Time Range di estrazione: Artesian mette a disposizione varie possibilità, per ognuna di esse va considerato che il riferimento temporale di fine estrazione è sempre esclusivo. Per questo specifico esempio, consideriamo l’AbsoluteDateRange(“2022-03-01”, “2022-03-02”).

La TimeZone di estrazione del dato: può essere selezionata a seconda del proprio interesse, Artesian si occuperà di convertire i dati se necessario.

Il Prodotto che si vuole estrarre: Artesian permette di usare la nomenclatura Assoluta, nel caso si sia interessato a un prodotto specifico (es: “Apr-20”) o la nomenclatura relativa, nel caso in cui si voglia avere sempre l’ultimo prodotto scambiato (es: “M+1”). Per un dettaglio maggiore sulla sintassi da usare per i prodotti consigliamo di utilizzare la UI e simulare una estrazione con essa.

Una volta stabiliti i parametri di base della nostra estrazione, la si può lanciare e visionare i dati ottenuti. 

				
					q = qs.createMarketAssessment() \
    .forMarketData([100077106,100077102]) \
    .forProducts(["M+1"])\
    .inTimeZone("CET")\
    .inAbsoluteDateRange("2022-03-13","2022-03-14")\
    .execute()

print(q)
				
			

Altre opzioni per l'estrazione dei dati

Relativamente alla selezione dei range di estrazione, Artesian supporta le seguenti opzioni: 

AbsoluteDateRange” è un arco di tempo determinato assoluto (es.:  dal “2018-08-01” al “2018-08-13” ti permetterà di estrarre i dati dal “2018-08-01” al “2018-08-12”)

RelativePeriod” rappresenta un arco di tempo relativo, precedente o successivo ad oggi (es.: Considerando che oggi sia il “2021-03-31” richiedere il period “P-5D” significherà estrarre i dati dal “2021-03-26” al “2021-03-30”. Richiedendo il period “P5D” significherà estrarre i dati dal “2021-03-31” al “2021-04-04”). Per la sintassi è possibile fare riferimento allo standard ISO8601, oltre al semplice “RelativePeriod” è possibile usare il “RelativePeriodRange” (es: da “P-5D” a “P5D” estrarrà i dati dal “2021-03-26” al “2021-04-04”).

RelativeInterval” è un arco di tempo “rolling” a dimensione fissa. Le possibili opzioni sono: “RollingWeek”, “RollingMonth”, “RollingQuarter” o “RollingYear” ovvero gli ultimi 7, 30, 90, 365 giorni di dati (con il giorno in corso incluso);  “WeekToDate”, “MonthToDate”, “QuarterToDate” o “YearToDate” ovvero considerando dal giorno in corso a inizio settimana, mese o anno. 

				
					
   .inAbsoluteDateRange("2022-03-13","2022-03-14")
   .inRelativeInterval(RelativeInterval.RollingWeek) 
   .inRelativePeriod("P5D")
   .inRelativePeriodRange("P-3D","P10D")
				
			

 

Oltre a quelle menzionate precedentemente, Artesian offre anche la possibilità di applicare un filling ai dati in modo da gestire eventuali dati mancanti.  Le possibili opzioni sono:

FillNull() : un’operazione di default che ritorna nell’estrazione anche i valori vuoti (null).

FillNone() : un’operazione che non ritorna nell’estrazione i valori vuoti (null).

FillLatestValue(“P5D”) : un’operazione che ritorna nell’estrazione l’ultimo valore disponibile rispetto al periodo indicato nella chiamata, in questo caso “5” giorni indietro.

FillCustomValue() : un’operazione che applica nell’estrazione un valore custom al posto dei valori mancanti (null). Questi valori possono essere applicati al prezzo di settlement, al prezzo di apertura, di chiusura, al prezzo più alto, più basso, al volume pagato, al volume venduto e al volume totale.

				
					
   .withFillNull()
   .withFillNone()
   .withFillLatestValue("P5D")
   .withFillCustomValue(
        settlement=10.0,
        open=20.0,
        close=30.0,
        high=40.0,
        low=50.0,
        volumePaid=65.0,
        volumeGiven=70.0,
        volume=90.0)\
				
			

Alternativa all'estrazione in SDK

In alternativa all’estrazione in SDK, possiamo estrarre i dati direttamente da portale in formato Excell.

Altre opzioni per l'estrazione dei dati

Basta eseguire l’operazione una sola volta per poi averla completamente riproducibile e automatizzata nel nostro workflow.

Questo non solo permette di risparmiare tempo, ma permette anche di ridurre al minimo gli errori umani dati dall’eseguire operazioni ripetute su grandi moli di dati o su diversi file Excel. 

Un vantaggio innegabile che ci consente di focalizzarci sull’analisi del dato invece che sulla sua gestione e ottimizzazione.