TI/Pracownia wykorzystania zasobów internetowych/BAZY MIEJSC FUNKCYJNYCH, MOTYWÓW, DOMEN I RODZIN BIAŁKOWYCH

Z Brain-wiki

PROSITE

(http://expasy.org/prosite/; user manual: http://expasy.org/prosite/prosuser.html)

Zadanie 1

Wejdź na stronę EXPASY (http://expasy.org/). Wybierz ScanProsite w Tools&Software lub PROSITE (w Databases) i wejdź w ScanProsite. Wpisz P12259' w okienku po lewej stronie (Swiss-Prot accession numer), odhacz “Exclude motifs with a high probability of occurrence”, zaznacz ”Do not scan profiles” i wciśnij START THE SCAN.

  1. Jakiego białka dotyczy wyszukana sekwencja?
  2. Ile uzyskałaś/eś wszystkich wyników wyszukiwania? Ile wśród nich to motywy o wysokim prawdopodobieństwie występowania?
  3. Jakie charakterystyczne motywy zostały zidentyfikowane dla naszej sekwencji? Jeśli istnieją, obejrzyj ich strukturę 3D.
  4. Jakie domeny zawiera i do jakiej rodziny białek należy?
  5. Jaka wygląda wzór sekwencyjny dla motywu Coagulation factors 5/8 type C domain (FA58C) signature 1?
    Oznaczenia: x – dowolny aminokwas, [] – różnorodność, () – powtórzenia, {} – wykluczenie
  6. Przyjrzyj się motywowi dotyczącemu N-myristoylation site. Czy jest możliwe, by motyw ten znajdował się w naszej sekwencji?

Zadanie 2

Przeprowadź w PROSITE wyszukiwanie profili i wzorów (patterns) dla poniższej sekwencji (zaznacz „Exclude motifs with a high probability of occurrence”):

MERCGAVVSCVFAVILVLQLGLTPIMAQQEQQIGIAGKEVILSCKAINNQKDGTCTWKYK
YKEVSSTIISFSKAQVFKGKAPMTHRSELNSNSKKLKVSDLSLDDAGIYTCACYSPVVSI
SLHVFKLTISSNGHFLTNEDLELTLMQNSSHSQPHLSIKLFNINNDIVTTEILQEEAPQK
YILKLKQLKAIDSGTWMCHVYSNSPSINQNISFDVKVLGFEKERLEIIYTTVGNTAILSW
RLNFRKIKWKEGFTGKLNWEPQGNTAIHELLNFSVTTHQELHKTKKSNHIWFEISEGKTD
GTMDVKIPKVQLNHSGQYKCQLEINGRRTESVRALVVMQVTAIPAGPLSRGGKMTLLCQV
SGPLPSNAHLLWERVNGTQMEMKKSKQHEAKVEVNVSAPGLWNCHLVEDNNKKISLNYTV
EEAHVWNSYAVIGIIIGASVLVIGLACMCIITGMRWQRRRKRARRMAQAKQYLLEKKTCQ
CQRRMYK
  1. Jaką domenę/domeny zostały zidentyfikowane dla powyższej sekwencji? Czy występują w nich mostki disiarczkowe? Jeśli tak, to między którymi aminokwasami?
  2. Wejdź do opisu profilu. Co na ich podstawie możesz powiedzieć o poszukiwanym białku?
  3. Używając bazy UniProt zidentyfikuj powyższą sekwencję. Jakiego białka dotyczy? Z jakiego pochodzi organizmu?
  4. Używając bazy PROSITE odpowiedz, jak wiele ludzkich białek zawiera domenę zidentyfikowaną w punkcie A) powtórzoną co najmniej czterokrotnie? Przy wyszukiwaniu posłuż się charakterystycznym numerem profilu (ACCESSION NUMBER), zastosuj odpowiedni filtr (TAXONOMY – homo sapiens), a w części „Output” w „Show only sequences with at least ___ hit(s)” wpisz odpowiednią liczbę.

INTERPRO (http://www.ebi.ac.uk/interpro/)

Zadanie 1

Wejdź na stronę InterPro (http://www.ebi.ac.uk/interpro/)

  1. Jakie bazy możesz przeszukiwać? Wskazówka: wejdź w zakładkę InterPro Scan.
  2. Wpisz w okienku wyszukiwania O15075 (UniProt accession numer). Ile różnych pozycji bazy InterPro (ale nie indywidualnych sygnatur) otrzymałaś/eś? Ile domen możesz wyróżnić w sekwencji?
  3. Kliknij na link IPR000719, aby zobaczyć opis dotyczący tej pozycji. Jak jest nazwa domeny? Ile i jakie sygnatury składają się na tę domenę? W ilu białkach występują te sygnatury? W jakiego typu organizmach występuje ta domena?
  4. Wróć na stronę z wynikami wyszukiwania i przejdź do części Structural Features. Dla jakiego fragmentu białka znana jest struktura 3D? Jakiej domenie odpowiada?
  5. Obejrzyj tę domenę używając AstexViewer (ikonka Ikonka.png przy strukturze domeny w SCOP lub CATCH). Jaka jest struktura drugorzędowa domeny? Ile widzisz ligandów i jakie? Z jakimi residuami tworzą wiązania wodorowe?

Zadanie 2

Używając InterPro Scan wyszukaj charakterystyczne motywy w poniżej sekwencji:

MDVFSFGQGN NTTASQEPFG TGGNVTSISD VTFSYQVITS LLLGTLIFCA VLGNACVVAA
IALERSLQNV ANYLIGSLAV TDLMVSVLVL PMAALYQVLN KWTLGQVTCD LFIALDVLCC
TSSILHLCAI ALDRYWAITD PIDYVNKRTP RRAAALISLT WLIGFLISIP PMLGWRTPED
RSDPDACTIS KDHGYTIYST FGAFYIPLLL MLVLYGRIFR AARFRIRKTV RKVEKKGAGT
SLGTSSAPPP KKSLNGQPGS GDWRRCAENR AVGTPCTNGA VRQGDDEATL EVIEVHRVGN
SKEHLPLPSE SGSNSYAPAC LERKNERNAE AKRKMALARE RKTVKTLGII MGTFILCWLP
FFIVALVLPF CESSCHMPAL LGAIINWLGY SNSLLNPVIY AYFNKDFQNA FKKIIKCKFC R
  1. Określ, które pozycje bazy InterPro dotyczą domen, rodzin, miejsc itp. Jakie są powiązania między nimi?
  2. W ilu sekwencjach występują? W jakich organizmach?
  3. Która z pozycji jest najbardziej specyficzna?