PPy3/TematyDodatkowe

Z Brain-wiki

Tematy dodatkowe

Błędy i wyjątki

Każdy programista popełnia błędy — jest to nieunikniona część tej działalności.

  • Są błędy, które można nazwać banalnymi: literówka w nazwie lub słowie kluczowym, zapomniany dwukropek, niedomknięte nawiasy, itp.
  • Są bardziej podstępne błędy logiczne: gdy algorytm, którego zapisem ma być tworzony kod, po prostu nie robi dokładnie tego, co nam się wydaje.
  • I w końcu są sytuacje wyjątkowe: gdy w toku pracy programu zachodzą nieoczekiwane okoliczności — użytkownik podał błędną nazwę pliku z danymi, zawartość tego pliku nie jest zgodna z oczekiwaniami programu, połączenie sieciowe ulega przerwaniu w trakcie pobierania lub przesyłania danych, itp.

Wszystkie te sytuacje nazywa się wyjątkami, i tym samym słowem określa się mechanizm, jakiego wiele współczesnych języków programowania (w tym Python) dostarcza programiście, aby mu pomóc określić działania jakie program miałby podjąć w sytuacjach wyjątkowych. Wyjątkowość takich sytuacji generalnie polega na tym, że w przypadku ich wystąpienia program po prostu nie może kontynuować przewidzianego toku działania:

  • błąd w składni programu oznacza, że kod nie daje się zinterpretować w sposób jednoznaczny; najlepsze co można zrobić, to w momencie wykrycia błędu przerwać działanie i spróbować dostarczyć programiście (w formie komunikatu) informację ułatwiającą określenie i naprawienie błędu;
  • błędne działanie algorytmu można np. spróbować wykrywać za pomocą tzw. asercji (polecenie assert) badających, czy pewne warunki, jakie powinny być spełnione przez dane przetwarzane w programie są istotnie spełnione;
  • wyjątki powstałe na skutek okoliczności zachodzących w trakcie działania programu, uniemożliwiających jego normalną kontynuację, można spróbować przewidzieć i przygotować program do odpowiedniego zareagowania, czyli obsługi wyjątku. Na przykład, można spróbować ponowić jeszcze raz (lub kilka razy) próbę łączności sieciowej, i poddać się dopiero po określonej liczbie niepowodzeń; natomiast w sytuacji błędu wynikającego z podania przez użytkownika programu niewłaściwych argumentów uruchomienia, warto postarać się o przekazanie użytkownikowi komunikatu informującego go w sposób dla niego zrozumiały, o właściwym sposobie uruchamiania programu.

Błędy składniowe i podobne

Jak wspomniano powyżej, w przypadku napotkania błędu składniowego w kodzie programu interpreter natychmiast przerwie wykonywanie programu i wypisze komunikat. Komunikaty te warto czytać uważnie — w większości przypadków znajduje się w nich cała informacja konieczna dla naprawienia błędu. Przykład: usiłujemy uruchomić program błąd.py, którego treść to

x = (2 + 3) 4
print x

Wynik pierwszej próby to:

$ python3 błąd.py 
  File "błąd.py", line 1
    x = (2 + 3) 4
                ^
SyntaxError: invalid syntax

Z komunikatu całkiem jasno wynika, że napotkany został błąd składni (SyntaxError), że wykryto ten błąd w linijce 1, a nawet dokładnie — że miejscem, w którym interpreter stwierdził, że ma do czynienia z nieprawidłowy kodem, było wystąpienie cyfry 4 po zamykającym nawiasie. Po prostu zapomnieliśmy, że — inaczej niż w powszechnie stosowanej notacji matematycznej — w Pythonie aby uzyskać mnożenie, konieczne jest napisanie jawnie znaku operatora (gwiazdki).

Po naprawieniu tej pomyłki próbujemy jeszcze raz, i wynik to:

$ python3 błąd.py 
  File "błąd.py", line 2
    print x
          ^
SyntaxError: Missing parentheses in call to 'print'. Did you mean print(x)?

Tutaj już jaśniej być nie może; interpreter nie tylko wskazał nam dokładne miejsce wystąpienia błędu, ale nawet dokładnie opisał, jak go naprawić.

Oczywiście nie zawsze interpreter będzie w stanie wskazać nam błąd aż tak precyzyjnie. Jako przykład weźmy następujący plik:

x, y, z = 3, 4, 5
print(max(x, y, z)
print(X * y * z)

i wynik jego uruchomienia:

$ python3 błąd.py 
  File "błąd.py", line 3
    print(X * y * z)
        ^
SyntaxError: invalid syntax

Dlaczego został wytknięty błąd składniowy w linijce 3? Przecież to w linijce 2 zapomnieliśmy zamknąć jeden z nawiasów.

Otóż jeżeli z końcem linii Python stwierdza, że nie wszystkie dotąd otwarte nawiasy zostały zamknięte, to traktuje to jako oznaczające, że kolejną linijkę należy potraktować jako ciąg dalszy bieżącej. I w tym przypadku dopiero napotykając w kolejnej linijce nazwę print — a nie np. przecinek, albo nawias zamykający — stwierdza, że coś musi być nie tak. Miejsce wykrycia błędu niestety nie zawsze się będzie pokrywało z miejscem jego faktycznego wystąpienia.

Po poprawce, czyli zamknięciu nawiasu na linii 2, próbujemy jeszcze raz — z wynikiem

python3 błąd.py 
5
Traceback (most recent call last):
  File "błąd.py", line 3, in <module>
    print(X * y * z)
NameError: name 'X' is not defined

I tym razem chyba jest wszystko jasne: pojawiła się nazwa X, z którą wcześniej nie związano żadnej wartości. Po prostu przez pomyłkę napisaliśmy X wielką literą zamiast małą.

Te przykłady pokazują, że przy wykorzystaniu treści wypisywanych komunikatów proces usunięcia z programu błędów składniowych i formalnych może być dość szybki i bezbolesny.

Pojawiły się w komunikatach określenia: SyntaxError, NameError. Są to przykłady nazw tzw. klas wyjątków, czyli ogólnie rozumianych kategorii błędów, jakie są sygnalizowane. Wkrótce spotkamy dalsze klasy wyjątków, takie jak: TypeError - związana z przekazaniem wielkości niewłaściwego typu, czy ValueError - gdy nie typ. ale wartość wielkości, na której usiłuje się operować, jest niewłaściwa dla danej operacji. Dowiemy się również, dlaczego klasy wyjątków są przydatne — pomimo tego, iż dla ludzkich oczu zwykle bardziej przydatna jest słowna informacja uszczegółowiająca (to co pojawia się po nazwie klasy wyjątku i dwukropku).

Asercje

Polecenie assert ma następującą postać:

assert wyrażenie1
# lub:
assert wyrażenie1, wyrażenie2

i jest to jak widać polecenie proste (nie zawierające bloku poleceń z wcięciem).

Jego działanie jest takie, że: obliczona zostanie wartość wyrażenie1; jeżeli jest ona prawdziwa, nie dzieje się nic (następuje natychmiastowe przejście do kolejnej linijki kodu). Jeżeli okaże się fałszywa, zostanie zasygnalizowany wyjątek, klasy AssertionError, co domyślnie przerywa wykonywanie programu i powoduje wypisanie odpowiedniego komunikatu. Jeżeli zastosujemy drugą postać, obliczona zostanie również wartość wyrażenie2 i wypisana (dokładniej: jej reprezentacja napisowa) jako część komunikatu.

Przyjęło się stosować asercje jako sposób kontroli poprawności działania programu — w tym sensie, aby wykluczyć sytuacje „niemożliwe", tj. powstałe w wyniku błędu programisty. Ze względu na prostotę składni warto też z nich korzystać w kodzie służącym do testowania poprawności innego kodu (czyli np. w funkcjach testujących, czy inne, bardziej złożone funkcje dają poprawne wyniki w prostych sytuacjach próbnych).

Wyjątki w trakcie pracy programu

Wyjątki występujące w trakcie pracy programu można przechwycić i obsłużyć za pomocą następującej konstrukcji (polecenia złożonego):

try:
    # operacje mogące spowodować wyjątek
except (KlasaWyjątku1, KlasaWyjątku2, ...):
    # co zrobić jeśli wyjątek jednej z tych klas wystąpił
else: 
    # co zrobić jeśli nie było wyjątku
finally:
    # co zrobić w KAŻDYM przypadku
  • bloki else: i finally: są nieobowiązkowe, tj. możemy je pominąć (wraz z odp. linijką wprowadzającą)
  • w bloku except: można podać jedną klasę wyjątku (wtedy zbędne są nawiasy), lub żadnej — wtedy przechwycimy każdy wyjątek; jeśli jednak chcemy, jak w przykładzie, wymienić więcej niż jedną klasę, to nawiasy są konieczne
  • skuteczne przechwycenie wyjątku sprawia, że wykonanie programu nie ulegnie przerwaniu w punkcie jego wystąpienia, tyko będzie kontynuowane, również po opuszczeniu bloku try:
  • można jednak spowodować, aby po wykonaniu czynności obsługi wyjątku, wyjątek został niejako wznowiony; wystarczy w bloku except: wywołać instrukcję raise. Dla większości klas wyjątków skutkuje to zakończeniem programu
  • instrukcję raise można wywołać również w dowolnym innym punkcie programu, powinna wówczas w niej wystąpić nazwa klasy wyjątku, jaki chcemy wywołać.

Przykłady:

CDN.

Trochę więcej o klasach i obiektach

Warto sobie zdawać sprawę, że każda wartość występująca w programie pythonowym jest obiektem — a więc jest wyposażona w zestaw atrybutów i metod. Dotyczy to nie tylko kolekcji (list, słowników, ...), obiektów takich jak otwarte pliki (wynik wywołania funkcji open()), napisów — ale również np. liczb, czy to całkowitych, czy zmiennoprzecinkowych (i zespolonych, o których nie było tutaj mowy).

Przykładowo:

(17).bit_length()
 5
(17).bit_count()
 2

Co to właściwie znaczy?

Dla liczby 17 wywołaliśmy najpierw metodę, który mówi nam jaka jest długość w bitach reprezentacji dwójkowej tej liczby (17 == 0b10001), a następnie metodę, zwracającą liczbę ustawionych (tj. równych jeden) bitów w tej reprezentacji. Nawiasy okrągłe są konieczne, ponieważ kropka po cyfrach oznaczałaby, że mamy do czynienia z zapisem liczby zmiennoprzecinkowej. Inaczej mówiąc, byłyby niepotrzebne gdybyśmy mieli do czynienia z nazwą oznaczającą liczbę całkowitą, a nie z jej zapisem dziesiętnym.

Każdy obiekt w Pythonie jest instancją pewnej klasy. Przykłady klas to: int (liczby całkowite), str (napisy), list (listy), bool (wartości logiczne), i wiele innych. Klasa to inaczej typ obiektów; charakteryzuje ona zestaw atrybutów i metod związanych z obiektami danej klasy.

Zazwyczaj różnych obiektów będących instancjami danej klasy może być wiele, potencjalnie nieskończenie wiele. Są jednak wyjątki. Np. klasa bool posiada jedynie dwie instancje: (True i False). A obiekt None jest wręcz jedyną instancją swojej klasy.

Niektóre klasy są ,,szczególnymi przypadkami" innych klas — mówi się, że klasa C dziedziczy z klasy B, lub że jest podklasą klasy B. Oznacza to tyle, że instancje klasy C posiadają wszystkie atrybuty i metody jakie posiadają instancje klasy B, ale być może pewne dodatkowe — a być może niektóre z nich zostały w jakiś sposób zmodyfikowane. Przykładowo, klasa bool stanowi podklasę klasy int; jej jedyne instancje, True i False, to ,,tak naprawdę" liczby (odpowiednio) 1 i 0 ,,w przebraniu". Są one więc również instancjami klasy int i można do nich stosować te same operacje (np. arytmetyczne) co do liczb całkowitych.

Jeszcze inaczej: jeżeli klasa C jest podklasą klasy B, to każda instancja klasy C jest zarazem instancją klasy B — można to sprawdzić za pomocą funkcji isinstance(obiekt, klasa).

Same klasy są również obiektami, instancjami klasy o nazwie type. Wywołana jako funkcja, type(obiekt) zwraca klasę danego obiektu.

Poza tym,że Python posiada całkiem sporo klas, czyli typów obiektów, wbudowanych — sporą część z nich, chociaż nie wszystkie, omówiliśmy w poprzednich rozdziałach — to jest wiele dalszych klas zdefiniowanych w bibliotece standardowej, do których można uzyskać dostęp importując odpowiednie moduły; oczywiście jest też bogactwo modułów i bibliotek poza biblioteką standardową. Większość z nich można znaleźć w dedykowanym ,,magazynie", https://pypi.org/. Pisząc kod w Pythonie można również definiować własne klasy; temat ten został pominięty w tym wstępnym kursie, ale na pewno zasługuje on na pierwsze miejsce w jego dalszym ciągu, kursie dla średnio zaawansowanych.

CDN

O generatorach

W jednym z poprzednich rozdziałów poznaliśmy wyrażenia generatorowe. Przypomnijmy, że stanowią one uproszczony zapis iteracji, pozwalający na uniknięcie w wielu prostych przypadkach pętli for i tworzenia zmiennych pomocniczych. Przykładowo:

 kwadraty = (x**2 for x in range(100))

tworzy generator, produkujący w iteracji kwadraty kolejnych liczb naturalnych (od 0 do 99).

Poważnym ograniczeniem wyrażeń generatorowych jest to, że można ich używać do przekształcenia jednego obiektu iterowalnego w drugi — w tym przypadku, ciągu liczb naturalnych w ciąg ich kwadratów, natomiast nie ma jak za pomocą wyrażenia generatorowego stworzyć obiektu iterowalnego ,,od zera". Można to uzyskać, stosując ogólniejszą konstrukcję:

 def gen_kwadraty(start=0):
     k = start
     while True:
         yield k**2
         k += 1

 kwadraty = gen_kwadraty()

To, co napisałem powyżej przypomina bardzo definicję funkcji; jedyną różnicą na poziomie składni jest wystąpienie w definicji słowa yield (i brak wystąpienia słowa return). W istocie gen_kwadraty można uważać za funkcję — której wywołanie zwraca generator: obiekt, którego iteracja dostarczy kwadratów kolejnych liczb naturalnych, począwszy od liczby start, argumentu wywołania, o domyślnej wartości zero. Zauważmy, że w budowie definicji nie użyliśmy obiektu range; użyliśmy za to jawnej pętli while, niejako opakowując ją w generator. Co więc w ten sposób zyskujemy?

Przede wszystkim wielką elastyczność. W pokazanym przykładzie zysk jest niewielki, ale w definicji generatora możemy użyć jakiejkolwiek bądź reguły tworzenia kolejnych elementów iteracji. Nie potrzebujemy utworzyć ich wszystkich zanim zaczniemy z nich korzystać — tak jak byłoby w przypadku, gdybyśmy gen_kwadraty zdefiniowali jako funkcję zwracającą listę kwadratów kolejnych liczb. Co więcej, iteracja zapewniona przez gen_kwadraty może nam dostarczyć dowolnie wielu elementów (oczywiście w realnym komputerze po dostatecznie długim czasie osiągnięto by liczby, których wielkość przekroczyłaby pojemność dostępnej pamięci operacyjnej). Decyzja o tym, kiedy przerwać iterację pozostawiona jest ,,użytkownikowi", tzn. kodowi odwołującemu się do obiektu kwadraty.



poprzednie | strona główna | dalej

--RobertJB (dyskusja) 14:26, 27 mar 2018 (CEST)