INTRODUZIONE A INTERNET
per studenti universitari


Dr. Giorgio F. Signorini
Dipartimento di Chimica
Università di Firenze
$\triangleright$signo@chim.unifi.it

$\triangleright$http://www.chim.unifi.it/ signo


November 15, 2004


Tramite Internet, due host possono comunicare in vari modi:



\includegraphics{connections.eps}



I server di HTTP formano un sottospazio di Internet:



\includegraphics{www.eps}



World Wide Web

L'accesso è basato su un meccanismo richiesta/risposta (client/server)

Server:
il computer dove stanno i documenti, con un programma per trasmetterli usando il protocollo HTTP
Client:
il vostro computer, con un programma per ricevere i documenti usando il protocollo HTTP, e per visualizzarli (il navigatore o ``browser'').


Aspetti principali:


I documenti presenti su WWW sono generalmente ipertesti.


HTML

HyperText Markup Language

È standard stabilito ``a posteriori'' da un Consorzio di società (W3C, 1994). Ultimo (12/1999): HTML 4.01. Sta venendo sostituito da XHTML (più formale)

È un linguaggio di programmazione che viene interpretato dal vostro browser. L'aspetto del documento può variare, a seconda del browser. Un maggiore controllo sull'aspetto del documento si ottiene con le ``schede di stile'' ( style sheets ) introdotte con HTML 4.


URI o URL

Per identificare un documento (o più in generale, una ``risorsa'') si usa un indirizzo: Uniform Resource Identifier (oppure: Locator)



http:// www.unifi.it /universita/biblioteche
1 2 3


  1. schema di accesso della risorsa (protocollo)
  2. host su cui sta la risorsa
  3. percorso per accedere alla risorsa su quell'host


NOTA



http:// www.unifi.it /universita/biblioteche
1 2 3


1 e 2:
non c'è distinzione tra maiuscole e minuscole
3:
contiene nomi di directory (cartelle) e file, che in generale fanno distinzione tra maiuscole e minuscole
quindi l'URI precedente si può anche scrivere

ma NON


Generalizzazione:

WWW è un enorme insieme di risorse interconnesse, distribuite in tutto il mondo, accessibili via Internet tramite un URI


GLOSSARIO DI TERMINI COMUNI

``Pagina'':
un singolo documento, individuato da un URI
  • Poiché le pagine sono interconnesse, ad una stessa pagina si può arrivare da vie differenti.

  • Una pagina può essere sia punto di arrivo che punto di partenza.

  • Alcune pagine sono più ``periferiche'' (es. capitoli di un libro), altre sono più ``di passaggio'' (es. elenco di biblioteche)

``sito'':
un server, o la sua pagina principale, o l'insieme dei documenti presenti su un server, o una parte di questo insieme che costituisce una struttura omogenea
``Home page'':
pagina che costituisce un punto di partenza specifico (di una persona, un'organizzazione, un argomento).
``Portale'':
punto di partenza generico. Un ISP ha sempre un portale che contiene come minimo un catalogo per soggetto e un motore di ricerca


IL BROWSER

Il navigatore (``browser'' ) è il programma cliente che permette di accedere al WWW, interagendo con i server attraverso HTTP ed altri protocolli come FTP (cfr. gli schemi di un URI)

p.es.: Netscape/Mozilla, Internet Explorer, Opera, Lynx, konqueror, ...

Browser diversi sono equivalenti tra loro, ma non uguali:

  • conformi a livelli HTML diversi
  • riconoscono, o no, elementi HTML non-standard
  • poiché HTML non stabilisce strettamente come deve essere riprodotto un certo elemento (es. un titolo), ma solo la sua funzione nel testo, l'aspetto del documento può variare da un navigatore all'altro

Spesso contengono altre funzioni (ad es. un programma utente per la posta elettronica)


Uso di un browser WWW

Funzioni utili:



ESEGUIRE PROGRAMMI IN WWW: (A) SUL CLIENTE

  1. La pagina HTML può contenere istruzioni in un linguaggio interpretato dal browser (JavaScript o VBScript)

    questi linguaggi consistono essenzialmente in funzioni assenti da HTML, che permettono ad es. di scrivere la data di oggi, aprire una nuova finestra, etc.

  2. Oppure può contenere un riquadro in cui eseguire un programma scaricabile (``applet''), scritto in linguaggio Java.

    Caratteristiche di Java:

    • indipendente dalla piattaforma (hw e sw) cliente

    • contiene funzioni che sfruttano la rete

    • è progettato per essere innocuo verso il computer

    L'applet Java viene eseguito sul cliente: lo scambio con il server è solo il trasferimento del testo del programma.


ESEGUIRE PROGRAMMI IN WWW: (B) SUL SERVER

Funzionamento: certe risorse sul server, invece di essere inviate direttamente al cliente, prima eseguono un programma, il cui risultato è un documento HTML che viene trasmesso al cliente.

Ad esempio: la ricerca su un database.

http://opac.unifi.it/opac/short?author=alighieri http://opac.unifi.it/opac/short?author=alighieri

Tipicamente, l'URI contiene un ``?'' dopo il quale vengono i parametri da passare al programma del server.

I linguaggi di programmazione più diffusi sono:


In HTTP (a differenza di altri protocolli applicativi, come FTP), le connessioni vengono generalmente chiuse una volta che una richiesta è stata soddisfatta.

Il server si ``dimentica'' della precedente transazione.

Questo è ideale per il WWW, in cui le pagine molto spesso contengono dei link a pagine ospitate da altri server: è meglio ``liberare'' un server appena ci ha fornito una pagina.

A volte però è utile conservare memoria delle transazioni precedenti.

Lo si fa dal lato del cliente. Ci sono tipi due meccanismi


CACHE DEL BROWSER:
la cache è una memoria del vostro computer su cui sono registrate le ultime pagine che avete aperto con quel browser
serve per non doverle ricaricare tutte le volte, magari da un sito poco raggiungibile

attenzione! dopo un po' è bene che le pagine ``scadano'', perché l'informazione potrebbe non essere più aggiornata (es. la homepage di un quotidiano)


PROXY:
un proxy HTTP è un server esterno che tiene sul suo disco la cache vostra e di altri utenti.
Serve quando la stessa pagina è visitata spesso da un gruppo di utenti diversi

Si può configurare questo servizio in modo tale che alcune pagine (che cambiano spesso) NON siano accedute tramite proxy, ma direttamente


COOKIE:
dati sintetici inviati da un server HTTP ad un browser che lo sta consultando, per essere salvati sul disco del cliente e letti dal server in una successiva connessione
Un cookie è per esempio un modo per:

Preoccupati della riservatezza? Ricordate che un cookie non contiene più informazione su di voi di quella che comunque avete già dato al server!


BIBLIOGRAFIA: WWW



Footnotes

... (7.1.1.4)[*]
riferimento alle abilità richieste per la patente europea di guida del computer (ECDL), [cfr. http://www.aicanet.it/ecdl/ecdl.htm]