TI/Internet pasywnie

Z Brain-wiki

TI/WWW

Jedną z podstawowych funkcji internetu jest funkcja informacyjna. Dostęp do niej mamy poprzez WWW — World Wide Web. Jak większość rzeczy w informatyce, początki WWW wywodzą się ze środowiska fizyków. We wczesnych latach 90-tych w CERN zbudowano (konkretnie zrobił to Tim Bernes-Lee) na potrzeby wewnętrzne prototyp systemu informacyjnego umożliwiającego wygodny dostęp do różnorodnych danych tej organizacji. I po kilku latach używał tego cały świat.

Wskazywanie zasobów WWW

World Wide Web składa się ze stron internetowych — hipertekstów, w których możemy wędrować po hiperłączach. Tylko skąd właściwie wiadomo jak wskazywać konkretne witryny internetowe?

Z pomocą przychodzi nam URL — Uniform Resource Locator, sposób identyfikacji zasobów dostępnych w internecie, NIE tylko stron WWW!

URL

Uniform Resource Locator, czyli Uniwersalny Lokalizator Zasobów, to globalnie jednoznaczna identyfikacja pliku (lub usługi) i sposobu dostępu. Najczęściej spotykamy się z adresami URL wpisywanymi w przeglądarce. Przyjrzyjmy się jak wygląda standardowy adres wpisywany w pole przeglądarki:

http://www.fuw.edu.pl/

Można go podzielić na dwie części: "http://" specyfikuje nam protokół zgodnie z jakim program, jakim jest przeglądarka internetowa, ma pobierać dane, "www.fuw.edu.pl" to adres serwera na którym pobierany zasób się znajduje.

Czyli w ogólności, URL składa się, kolejno od lewej, z:

  • rodzaju usługi/zasobu (np.FTP, HTTP, HTTPS)
  • adresu komputera — serwera na którym zasób jest dostępny (IP lub symbolicznego)
  • ścieżki dostępu do pliku

Na przykład ftp://brain.fuw.edu.pl/pub/plik.txt oznacza, że plik o nazwie plik.txt (rozszerzenie .txt sugeruje tekst ASCII) znajduje się w katalogu /pub komputera brain.fuw.edu.pl i jest dostępny za pośrednictwem usługi ftp. Ftp to file transfer protocol, czyli protokół transferu plików. Dostęp do tego pliku (oczywiście przez Internet) możemy uzyskać za pomocą specjalnego programu-klienta ftp, ale jak w przypadku większości usług wystarczy też po prostu wpisać URL w polu przeglądarki, w którym wpisujemy adresy stron WWW.

Inny przykład URL to http://brain.fuw.edu.pl/~durka/infor.html.

W tym przypadku /~durka to standardowe oznaczenie katalogu domowego (home directory) użytkownika durka — konkretnie części tego katalogu, zawierającej pliki dostępne przez WWW. Znajduje się w nim plik infor.html, dostępny przez usługę http, czyli Hypertext Transfer Protocol — służący do pobierania dokumentów hipertekstowych jakimi są zasoby WWW.

Większość przeglądarek akceptuje niekompletne URL, nie wymagając podania przedrostka http://.

Dalej występuje nazwa komputera, składająca się z kilku nazw oddzielonych kropkami. W pełnej nazwie komputera powinny występować, kolejno od prawej:

  • symbol kraju: pl, de, uk itd. — nie dotyczy USA,
  • rodzaj instytucji: com — firma, edu — uczelnia, gov — rządowa itd.,
  • nazwa instytucji,
  • nazwa komputera (często www)

Na przykład czytany od prawej adres www.fuw.edu.pl mówi nam, że komputer znajduje się w Polsce (pl), należy do uczelni (edu) określającej się jako fuw (Fizyka, Uniwersytet Warszawski), wreszcie jest serwerem WWW.


HTML: język WWW

Materiały do samodzielnej nauki składni HTML można łatwo znaleźć w Internecie, np. http://www.w3schools.com/html/

Podstawowa struktura dokumentu HTML:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html lang="pl">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Tytuł strony</title>
</head>

<body>
    Treść strony.
</body>

</html>