giovedì 28 aprile 2016

Java - leggere tutti i file di una directory e scriverne il contenuto su file

Stessa identica cosa dello script in perl solo in java. Ho usato delle librerie esterne (per il log) e qualche classe in piu' (di utilita' etc).

Se non avete voglia di rileggervi i requisiti erano questi: La richiesta e' questa: leggere un x numero di files (non specificato) la cui estensione non e' nota e buttare tutto su un unico file. Inoltre e' richiesto di non metterci troppo tempo negli sviluppi e non c'e' richiesta di raffinatezze grafiche o robe cosi' (aka seghe mentali).

Di conseguenza ho eliminato del tutto l'interazione con l'utente (salvo un file di log)



Tre packages. Forse possono sembrare un eccesso per un progetto cosi' piccolo, ma fidatevi non e' cosi'. Avere una buona organizzazione mentale, e' fondamentale per tenere in ordine nei progetti, e questo e' indifferente che il progetto abbia 3 classi o 3000. Deve essere un processo automatico. Cosi' come i commenti. I packages:

  • file: contiene le classi che si occupano dei file, in questo caso chi legge/scrive
  • main: contiene la classe che esegue materialmente il codice (il main)
  • util: contiene le classi di utilita'

La Classe FileManager

Si occupa di leggere e scrivere i file, ha 4 metodi:

  • getListFile(file): che restituisce tutto quello che contiene la directory passata come parametro
  • readFile(File): legge il contenuto di un file e lo restituisce sotto forma di lista di stringhe
  • writeFile (String, List): legge il contenuto di una lista di file (passata come parametro e li scrive in un nuovo file (il cui nome e' passato come parametro)
  • write(BufferedWriter, List): usa un buffered writer passato come parametro per scrivere la lista passata (questo consente di scrivere piu' file in un unico stream e chiudere suddetto stream solo alla fine

La Classe EntryPoint

C'e' poco da dire, prende il path locale e lo passa al file manager, inoltre logga (come info) i vari file scritti e gli eventuali errori (come error) usando gli appositi metodi della classe LoggingUtil

La Classe LoggingUtil

ha 3 metodi statici.

  • getLogger(): per avere un'istanza del logger - se il log e' null lo istanzia perima di restituirlo
  • info(String): scrive la stringa come info
  • error(String, Throwable): scrive un error con il messaggio e lo stacktrace
A proposito di getLogger(): usa un basic configurator per prendere caricare il file log4j.properties, e' necessario usare un file appender da dare in pasto al log, altrimenti non avrete alcun file.

La Classe Utility

Non c'e' molto perche' non mi serviva molto, ho due metodi

  • formatDate(Date, String): formatta la data in stringa usando il pattern specificato
  • getActualTime(): prende la data attuale e formatta prendendo solo ora minuti e secondi separati da :

Il progetto Java e' piu' complesso, a parita' di risultato, e anche piu' pesante in termini di dimensioni (400KB rispetto ai 2 del perl) e anche di prestazioni. Ma ha il vantaggio che quasi tutti hanno una JRE installata e ha la possibilita' di crescere se viene creata un'interfaccina in swing per chiedere quali file mergiare e dove salvare il file mergiato (e come chiamarlo). Ma questo viene meno ai principi di semplicita' e velocita' di svilluppo che erano stati richiesti.

Perl - leggere tutti i file di una directory e scriverne il contenuto su file


Oggi niente Java, oggi perl. (Si non vi preoccupate l'ho fatto anche in java, solo che mi ispirava farlo anche in perl, visto che manipolare file e' la sua specialita' per cui vi propongo prima questo e poi quello).

La richiesta e' questa: leggere un x numero di files (non specificato) la cui estensione non e' nota e buttare tutto su un unico file. Inoltre e' richiesto di non metterci troppo tempo negli sviluppi e non c'e' richiesta di raffinatezze grafiche o robe cosi' (aka seghe mentali).

Di conseguenza ho deciso di ignorare totalmente l'input utente, lo script prende in considerazione la directory dalla quale viene eseguito, legge tutti i file ad eccezione di quelli che finiscono in jar, log, perl e che cominciano per "mergedFile" (che e' quello di output) e scrive tutto in un file che si chiama mergedFile_data(ora).txt. Inoltre produce un file che si chiama mergedFileLog_data(ora).log dove scrive i vari file letti (giusto per avere un riscontro di averli letti tutti)


Un po' di dettagli:

use Cwd; Cwd e' una libreria per ottenere il path corrente e poi lo infilo in $dir my $dir = getcwd

@months = qw( Gen Feb Mar Apr MaG Giu Log Ago Set Ott Nov Dic ); creo un array col nome dei mesi nel mio caso in italiano... my ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime(); inizializzo un po'di variabili da localtime

my $file_to_write = "mergedFile_$year$months[$mon]$mday($hour$min).txt"; my $log_to_write = "mergedFileLog_$year$months[$mon]$mday($hour$min).log"; creo altre due variabili una per il file da scrivere e una per il log

#apro la directory da leggere opendir(DIR, $dir) or die $!; #apro il file da scrivere (in append) open(my $fh, '>>', $file_to_write) or die "Could not open file '$file_to_write' $!"; #apro il log da scrivere (sempre in append) open(my $log, '>>', $log_to_write) or die "Could not open file '$log_to_write' $!"; apro il tutto (o muori)

nel doppio ciclo scansiono la directory corrente per ogni file while (my $file = readdir(DIR))
salto se non e' un file next unless (-f "$dir/$file");
salto se inizia per mergedFile o finisce per jar, log o pl
next if ($file =~ m/^\mergedFile/ || $file =~ m/\.jar/ || $file =~ m/\.log/ || $file =~ m/\.pl/);

scrivo sul log il file che sto leggendo e lo apro say $log "leggendo: $file\n"; open (INPUT, $file) || next print "can't open $file: $!";

while (< INPUT >) { chomp; # appendo $_ sul file say $fh "$_"; } leggo il file e lo scrivo sull'altro

Se vi interessa eseguire perl:

  • Su linux e' nativo
  • Su windows potete scaricare strawberry perl da qui

Se vi interessa un editor perl (oltre a npp o gedit che vanno benissimo) potete usare PADRE