Come usare il Cell Splitter in Knime

Questo nodo sfrutta un carattere di delimitazione specificato dall’utente per suddividere il contenuto di una colonna selezionata in più parti. È possibile specificare se l’output è costituito da una o più colonne, da una sola colonna contenente una lista o da una sola colonna contenente un set (in cui vengono rimossi i duplicati a differenza della lista).

Esempi di caratteri di delimitazione:  . ; / “  “ etc…

Come usare il cell splitter:

  • Situazione iniziale: Una tabella contenente una colonna che rappresenta nome e cognome
  • Aprire il pannello di configurazione del Cell Splitter e selezionare la colonna che si vuole suddividere (employee_name) :
  • Definire il carattere di delimitazione che ci permetterà di suddividere la colonna (Uno spazio vuoto in questo caso) :

Di default l’impostazione “Remove leading and trailing white space chars“ rimane attivata, tale proprietà permette di eliminare eventuali spazi vuoti che potrebbero essere presenti prima o dopo i caratteri delle colonne di output.

Di fianco alla colonna selezionata è possibile attivare la funzione che elimina la colonna di origine dopo averla suddivisa. Per mostrare al meglio le varie operazioni, in questo caso rimarrà disattivata.

  • Sezione di personalizzazione dell’output:

Come descritto nell’introduzione, è possibile definire 3 tipi di output:

  • Una lista
  • Un set
  • Nuove colonne

L’impostazione di default è come quella della schermata superiore: definendo nuove colonne come tipo di output e usando l’impostazione “Guess size and column types” che permetterà al software di indovinare il numero di colonne richieste per l’output.

  • È comunque possibile definire manualmente la quantità di colonne che desideriamo in output usando “Set array size”:

In questo caso sarà compito dell’utente capire quanti elementi è possibile estrarre dalla colonna iniziale, a meno di esigenze specifiche è consigliabile usare l’impostazione automatica “Guess size and column types”.

  • Eseguire il nodo Cell Splitter
  • Questo è il risultato finale:

 Possiamo osservare che sono presenti due nuove colonne derivanti dalla nostra colonna iniziale : “employee_name_Arr[0]”, “employee_name_Arr[1]”

Il nome è stato correttamente suddiviso in due colonne, separandole sulla base del carattere di separazione deciso inizialmente.

Ogni nuova colonna generata, sarà rinominata come:

 il nome della colonna inziale + _Arr[x]

Dove x definisce il numero della sezione.

Conclusione:

Il nodo Cell Splitter risulta indicato ogni qualvolta si riscontri la necessità di suddividere il contenuto di una colonna sulla base di un carattere di delimitazione.

La sua funzionalità di definizione automatica del numero di colonne di output risulta efficace e permette di velocizzarne l’utilizzo.

articoli correlati

GroupBy in Knime

Nel caso in cui si vogliano fare delle aggregazioni in Knime possiamo utilizzare il nodo GroupBy. Questo nodo crea una riga per ogni valore delle

l’IF statements su KNIME

In questo articolo vi spiegherò come fare degli if statements con tre differenti nodi: il Math Formula, il Rule Engine ed il Column Expression. L’obiettivo

Come usare il Cell Splitter in Knime

Questo nodo sfrutta un carattere di delimitazione specificato dall’utente per suddividere il contenuto di una colonna selezionata in più parti. È possibile specificare se l’output

meeting, calendar, saturday-273857.jpg

KNIME: Extract Date&Time Fields

KNIME è un software per eseguire data cleaning, preparation, analisi, reportistica e moltissimo altro! Per fare tutto questo si avvale di un’infinità di nodi, ognuno

Double Gauges Chart in Power BI

In questo articolo vedremo come realizzare un grafico particolare, che chiameremo double gauges chart. Nel corso dell’ultima settimana abbiamo avuto modo di lavorare con un

© 2023 The Information Lab Ltd. All rights reserved.