ToolBox Logo  home  up


Piccolo Cane

posta


 
 
 
Salvare una pagina - Archiviare un sito
 
 
  Internet sta diventando sempre più simile a un insieme di canali televisivi: si clicca di qua e di là, attratti da grafica ed effetti speciali, più alla ricerca di svago che di informazioni. Questa sembra una tendenza inevitabile, perseguita per allargare la base degli utilizzatori, ma è contraria all'idea iniziale di internet come mezzo ideale per ricercare tutte le informazioni significative per i propri interessi, rese disponibili per via elettronica.
 
  Questa considerazione aiuta forse a capire un incredibile "buco" di tutti i browser, anche delle ultime versioni dei due più diffusi: mancano del tutto delle modalità semplici per salvare le pagine così come esse appaiono quando si è in linea (notizia dell'ultima ora: sembra che Microsoft introdurrà la suddetta funzione in Internet Explorer 5!).
  Infatti il comando Save As di Netscape, ma anche di quasi tutti i suoi concorrenti, prevede due opzioni: salvare la pagina come file html o come testo semplice. La seconda salva il testo visibile sulla pagina, e in alcuni casi, come quello di Navigator, lo fa cercando di dare una formattazione che assomigli alla pagina visualizzata. La prima salva il codice del file html così come ricevuto dal browser. Questo può essere ancora utile per studiare il codice, e fino a poco tempo fa permetteva anche di visualizzare direttamente la pagina relativa.
  Ora però le pagine senza grafica sono un'eccezione e, soprattutto, visto che questa è utilizzata per gli strumenti di navigazione (bottoni, etc.), quanto si riesce a vedere senza le immagini è spesso insufficiente per farsi un'idea dell'originale. Per non parlare del caso in cui proprio la grafica è l'elemento importante. Si deve pensare quindi che per i produttori di browser la possibilità di salvare i documenti su disco, così centrale per tutte le altre applicazioni, sia del tutto trascurabile.
 
   Un modo facile per salvare pagine singole è in realtà offerto quando il browser è associato ad un editor di pagine web, come nel caso di Netscape Navigator 2 o 3 nella versione Gold, della suite Netscape Communicator, o come infine nel caso di Microsoft Internet Explorer 4 con associato Front Page Express.
  In questo caso, passando la pagina dal browser all'editor, si può approfittare del fatto che quest'ultimo può salvarla con tutta la grafica associata. Per fare questo di solito salva le immagini nella stessa cartella del file html, modificando i link del file che si riferiscono ad esse (perché spesso file html e immagini si trovano in cartelle differenti sul server).
  Questo va benissimo per una pagina singola. Spesso però si è interessati a più pagine tra loro collegate, e, salvandole tutte nella stessa cartella di solito si perdono i collegamenti tra esse, sempre per il motivo che sul server erano in cartelle differenti.
 
  Una soluzione "acrobatica", che può funzionare per pochi file, o, meglio, per poche cartelle, è semplicemente quella di riprodurre manualmente la struttura delle cartelle del server, visibile sulla barra della locazione, e di salvare i file nei posti corrispondenti: non è comoda, ma è pur sempre più facile che la correzione manuale dei link se si salva tutto nella stessa cartella. In questo modo si evitano anche le "collisioni" di nome, tipicamente più file che si chiamano index.htmll.
 
  L'idea di riprodurre sul disco locale la struttura di cartelle del server permetterebbe di risolvere facilmente il problema del salvataggio di più file.
  Piuttosto che indicare con che nome salvare il file si dovrebbe indicare in che cartella riprodurre la struttura originale: la difficoltà tecnica sarebbe nulla (l'unico problema, quello di ritrovare il file, sarebbe aggirabile con un semplice bookmark) e il costo in spazio minimo (poche cartelle). Ma, a nostra conoscenza, esiste un solo browser (coreano!) che tenta di applicare questo metodo, senza peraltro riuscirci!
 
  Esiste tuttavia un modo facile e senza costi per avere su disco le pagine che ci interessano: tenerli nella cache del browser. Per questo dovete innanzitutto leggere la pagina dedicata alla cache. Se l'avete fatto, capirete facilmente che per avere il tanto difficile (nelle altre modalità) salvataggio delle pagine basta solo ... non cancellare la cache!
  L'obiezione che questa ingrosserebbe indefinitamente è facilmente aggirabile. Si può infatti pensare di utilizzare un browser (del quale si cancellerebbe periodicamente la cache) per l'esplorazione, ed un altro per la conservazione definitiva delle pagine importanti, di solito un'esigua minoranza. Quando nell'esplorazione si trova qualcosa di interessante, si passa ad utilizzare il browser "definitivo".
 
  Non è nemmeno necessario cambiare browser. Infatti, per esempio con Netscape Navigator 4 si ha la possibilità di registrarsi come utenti diversi:
basta, oltre al precostituito Default, creare un altro profilo, chiamato, diciamo, Backup, destinato alle copie definitive.
 
  Questo sistema non ha controindicazioni particolari, tranne che per il fatto che per errore si potrebbe cancellare la cache. A questo si può ovviare nel modo solito, facendo un backup dei file di cache.
  Le prestazioni non dovrebbero risentirne più di tanto. Netscape Navigator, per esempio, per gestire la cache tiene un file di dati (fat.db) delle dimensioni di circa 1/10 dei file in cache, quindi ci si può aspettare che possa gestire decentemente cache fino a 100 MB, considerando che la RAM media attualmente supera sempre di molto i 10 MB.
  Un problema organizzativo sarebbe ancora quello di come accedere ai file, perché in questo caso non si potrebbe entrare nelle "sottocartelle" della cache: la risposta è ancora quella data sopra, basta cioè utilizzare dei bookmark o, il che è lo stesso, delle pagine indice create appositamente da noi.
  Il sistema delle cartelle, o directory (che in questo caso è anche nome più trasparente poiché significa elenco (di indirizzi) ) in fondo è solo il metodo nativo del sistema operativo per avere dei link tra i vari file, ed è naturale che con il prevalere di risorse html diventi trascurabile. Tra l'altro è proprio la cosa che viene ora in evidenza con la possibilità data da Microsoft in Windows 98 di personalizzare ogni cartella con una pagina html.
 
  Naturalmente tutti i modi esposti sono quanto si può fare evitando di acquistare un browser off-line, che è appunto concepito per queste cose.