Le caratteristiche del linguaggio html
Html sta per Hyper Text Markup Language, ovvero linguaggio ipertestuale basato su Tag (marcatori) ed è il linguaggio utilizzato per realizzare pagine web. La versione di linguaggio che stiamo utilizzando ai nostri giorni è essenzialmente la stessa che funzionava qualche anno fa, agli albori di Internet.
Ciò che è evoluto rendendo sempre più potenti le funzionalità offerte dall’Html sono i browser, i programmi di navigazione. L’evoluzione di questi programmi ha fatto sì che l’interprete delle istruzioni html fosse sempre più preciso e con risultati grafici di elevata qualità. Un altro passo che ha segnato fortemente la storia della comunicazione web è l’omologazione cui si è giunti, che nel corso del tempo (con il rilascio delle varie versioni dei programmi da parte delle case produttrici) ha reso le prestazioni del linguaggio Html pressoché identiche, indipendente mente dalla piattaforma impiegata (Unix, Linux, Microsoft, Mac ecc.) Proprio grazie a questo il linguaggio Html è diventato un linguaggio multipiattaforma (ovvero platform independent)
L’Interprete
II linguaggio Html è un linguaggio interpretato. Ciò significa che le istruzioni della pagina sono contenute all’interno di file in formato testo sul server web e quando vengono inviate al programma di navigazione (il browser), questo le interpreta. In base al significato assegnato a ciascuna istruzione o sequenza di istruzioni viene creata la visualizzazione della pagina in cui saranno collocate le immagini e gli altri oggetti, anch’essi inviati dal server alla pagina in un momento successivo.
La pagina html quindi contiene tutto il testo e le informazioni necessarie a creare la pagina html così come viene visualizzata.
E’ importante avere chiaro il funzionamento dell’interprete (che è un componente del browser), per capire le sequenze della comunicazione fra browser e server web.
- Quando l’utente scrive l’indirizzo del sito web (http://www…) il browser, attraverso la connessione Internet individua il server a cui deve essere inviata la richiesta della pagina desiderata. Quando ricercando un sito non indichiamo una specifica pagina, sarà il server web a decidere di inviarci la sua home page, ovvero la pagina predefinita per la navigazione (solitamente si tratta di una pagina con un nome convenzionale come default.htm, index.htm, home.htm ecc.)
- II server web su cui risiede fisicamente la pagina viene individuato decodificando il suo indirizzo fisico a partire dall’indirizzo simbolico che abbiamo digitato nel browser (http://www…) ed avvalendosi della rete mondiale dei server dns, appositamente destinata alla risoluzione dei nomi di dominio.
- Quando il server web in questione riceve una richiesta da un client remoto (l’utente che naviga connesso a Internet), avvia con questo una connessione, predisponendosi ad iniziare uno specifico scambio di informazioni.
- La prima cosa trasmessa al client (il browser con cui stiamo navigando) è l’intero contenuto della pagina html.
- II browser client riceve la pagina ed inizia ad interpretarne il contenuto; oltre che predisporre l’impaginazione di testi ed oggetti all’interno della finestra, il browser “sa” anche quanti elementi devono essere inviati dal server web (immagini, applet, componenti ecc.) per completare la pagina.
- Quando il server ha completato l’invio della pagina html inizia a trasferire in sequenza tutti gli oggetti restanti che ne fanno parte.
- Man mano che il browser client riceve gli oggetti, provvede a posizionarli in base alle istruzioni che ha trovato nella pagina html appena ricevuta
Sarà proprio in base a come sono organizzati i contenuti della pagina, che l’interprete si comporterà di conseguenza.Se ad esempio la pagina utilizza una funzione javascript, destinata ad essere utilizzata durante la fase di caricamento, questa non potrà essere inserita al fondo del codice html — seppure si tratti di un’operazione corretta — perché verrà generato un errore imprevisto; l’interprete cercherà di utilizzare una funzione quando questa non è stata ancora ricevuta. In questo caso potremo ovviare all’inconveniente spostando la funzione javascript nelle prime righe della pagina. La capacità di individuare questo genere di problemi e risolverli è possibile proprio se si conosce la procedura seguita dal server per inviare le pagine al client. Senza dimenticare che tutto ciò naturalmente avviene nel giro di pochissimi secondi.
Una caratteristica essenziale dell’interprete Html è che può contenere non solo istruzioni, ovvero marcatori (Tag) riconosciuti dal linguaggio, ma anche tag sconosciuti.
Ciò consente di gestire facilmente, anche in futuro, aggiunte al linguaggio, garantendo possibilità di espansione praticamente illimitate. Le istruzioni non riconosciute vengono semplicemente ignorate, a meno che nel computer non sia presente un componente in grado di utilizzarle in modo opportuno. In questo modo una pagina Html può contenere qualsiasi Tag che ne espanda le funzionalità.
Un esempio particolarmente interessante è fornito dai motori di ricerca.
Ciascun motore di ricerca è in grado di riconoscere una serie di parole chiave, che saranno utilizzate per creare altrettanti collegamenti ad una determinata pagina web; sarà sufficiente inserirle in un tag particolare all’interno della pagina. Queste informazioni non saranno utilizzate dall’interprete del browser client ma i motori di ricerca che esploreranno automaticamente e periodicamente il nostro sito (una volta che questo sia stato registrato) saranno in grado di utilizzare le parole chiave ed aggiornare gli indici dei propri database.