TI/Internet pasywnie

Z Brain-wiki

TI/ WWW

Jedną z podstawowych funkcji internetu jest funkcja informacyjna. Dostęp do niej mamy poprzez WWW — World Wide Web. Jak większość rzeczy w informatyce, początki WWW wywodzą się ze środowiska fizyków. We wczesnych latach 90-tych w CERN zbudowano (konkretnie zrobił to Tim Bernes-Lee) na potrzeby wewnętrzne prototyp systemu informacyjnego umożliwiającego wygodny dostęp do różnorodnych danych tej organizacji. I po kilku latach używał tego cały świat.

Wskazywanie zasobów WWW

World Wide Web składa się ze stron internetowych — hipertekstów, w których możemy wędrować po hiperłączach. Tylko skąd właściwie wiadomo jak wskazywać konkretne witryny internetowe?

Z pomocą przychodzi nam URL — Uniform Resource Locator, sposób identyfikacji zasobów dostępnych w internecie, NIE tylko stron WWW!

URL

Uniform Resource Locator, czyli Uniwersalny Lokalizator Zasobów, to globalnie jednoznaczna identyfikacja pliku (lub usługi) i sposobu dostępu. Najczęściej spotykamy się z adresami URL wpisywanymi w przeglądarce. Przyjrzyjmy się jak wygląda standardowy adres wpisywany w pole przeglądarki:

http://www.fuw.edu.pl/

Można go podzielić na dwie części: "http://" specyfikuje nam protokół zgodnie z jakim program, jakim jest przeglądarka internetowa, ma pobierać dane, "www.fuw.edu.pl" to adres serwera na którym pobierany zasób się znajduje.

Czyli w ogólności, URL składa się, kolejno od lewej, z:

  • rodzaju usługi/zasobu (np.FTP, HTTP, HTTPS)
  • adresu komputera — serwera na którym zasób jest dostępny (IP lub symbolicznego)
  • ścieżki dostępu do pliku

Na przykład ftp://brain.fuw.edu.pl/pub/plik.txt oznacza, że plik o nazwie plik.txt (rozszerzenie .txt sugeruje tekst ASCII) znajduje się w katalogu /pub komputera brain.fuw.edu.pl i jest dostępny za pośrednictwem usługi ftp. Ftp to file transfer protocol, czyli protokół transferu plików. Dostęp do tego pliku (oczywiście przez Internet) możemy uzyskać za pomocą specjalnego programu-klienta ftp, ale jak w przypadku większości usług wystarczy też po prostu wpisać URL w polu przeglądarki, w którym wpisujemy adresy stron WWW.

Inny przykład URL to http://brain.fuw.edu.pl/~durka/infor.html.

W tym przypadku /~durka to standardowe oznaczenie katalogu domowego (home directory) użytkownika durka — konkretnie części tego katalogu, zawierającej pliki dostępne przez WWW. Znajduje się w nim plik infor.html, dostępny przez usługę http, czyli Hypertext Transfer Protocol — służący do pobierania dokumentów hipertekstowych jakimi są zasoby WWW. Dokładną definicję protokoły HTTP można przeczytać w dokumencie RFC 2616.

Dygresja: Co to są dokumenty RFC?

Przy projektowaniu tak dużego tworu jakim jest internet, ustalaniu obowiązujących standardów, potrzeba też ustandaryzowanej metody robienia tego. Czymś takim są dokumenty RFC — Request for Comments. Zawierają techniczne szczegóły obejmujące wszelkie zagadnienia związane z sieciami komputerowymi. Każdy dokument ma unikalny numer. Dokumenty nie mają mocy oficjalnej, ale na ogół usankcjonowanie czegoś oficjalnie jako standard poprzedzone jest powstaniem dokumentu RFC.

Historycznie, idea pisania takich dokumentów powstała jeszcze przy poprzedniku internetu — sieci Advanced Research Projects Agency Network.

URL c.d.

Większość przeglądarek akceptuje niekompletne URL, nie wymagając podania przedrostka http://.

Dalej występuje nazwa komputera, składająca się z kilku nazw oddzielonych kropkami. W pełnej nazwie komputera powinny występować, kolejno od prawej:

  • symbol kraju: pl, de, uk itd. — nie dotyczy USA,
  • rodzaj instytucji: com — firma, edu — uczelnia, gov — rządowa itd.,
  • nazwa instytucji,
  • nazwa komputera (często www)

Na przykład czytany od prawej adres www.fuw.edu.pl mówi nam, że komputer znajduje się w Polsce (pl), należy do uczelni (edu) określającej się jako fuw (Fizyka, Uniwersytet Warszawski), wreszcie jest serwerem WWW.


HTML: język WWW

Podstawy składni

Materiały do samodzielnej nauki składni HTML i CSS:

Materiały na temat dobrych praktyk projektowania stron WWW i nie tylko:

Podstawowa struktura dokumentu HTML:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html lang="pl">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Tytuł strony</title>
</head>

<body>
    Treść strony.
</body>

</html>