
Laboratorium EEG/CSP: Różnice pomiędzy wersjami
m (→W raporcie:) |
|||
| (Nie pokazano 6 pośrednich wersji utworzonych przez tego samego użytkownika) | |||
| Linia 72: | Linia 72: | ||
Narysuj chmury punktów (amplituda źródła 1 vs amplituda źródła 2) osobno dla warunków | Narysuj chmury punktów (amplituda źródła 1 vs amplituda źródła 2) osobno dla warunków | ||
baseline i ERP — przed transformacją CSP i po niej. Co zmieniło się w kształcie chmur? | baseline i ERP — przed transformacją CSP i po niej. Co zmieniło się w kształcie chmur? | ||
| + | |||
| + | Wykreśl także wizualizację przebiegów czasowych sygnałów X i sygnałów S uzyskanych po rozmieszaniu. | ||
;Zadanie 3 (obowiązkowe): Interpretacja wartości własnych | ;Zadanie 3 (obowiązkowe): Interpretacja wartości własnych | ||
| Linia 98: | Linia 100: | ||
Czym różnią się te dwie wersje? W jakich sytuacjach eksperymentalnych | Czym różnią się te dwie wersje? W jakich sytuacjach eksperymentalnych | ||
druga wersja mogłaby być bardziej uzasadniona? | druga wersja mogłaby być bardziej uzasadniona? | ||
| + | |||
====Szkielet kodu do uzupełnienia==== | ====Szkielet kodu do uzupełnienia==== | ||
| Linia 130: | Linia 133: | ||
baseline_ind = find(t < 0.5); | baseline_ind = find(t < 0.5); | ||
ERP_ind = find(t >= 0.5); | ERP_ind = find(t >= 0.5); | ||
| + | |||
| + | R_B = zeros(N_chan, N_chan); | ||
| + | R_E = zeros(N_chan, N_chan); | ||
%% Zadanie 1: Oblicz średnie macierze kowariancji | %% Zadanie 1: Oblicz średnie macierze kowariancji | ||
| + | % korzystając z funkcji srednia_kowariancja(X, ind) | ||
| + | |||
% Dla każdego powtórzenia r: | % Dla każdego powtórzenia r: | ||
% - wytnij fragment sygnału X(r,:,baseline_ind) i analogicznie ERP | % - wytnij fragment sygnału X(r,:,baseline_ind) i analogicznie ERP | ||
| Linia 139: | Linia 147: | ||
% Na końcu podziel przez N_rep | % Na końcu podziel przez N_rep | ||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | + | ||
| + | |||
%% Zadanie 2: Rozwiąż uogólnione zagadnienie własne | %% Zadanie 2: Rozwiąż uogólnione zagadnienie własne | ||
| Linia 198: | Linia 199: | ||
title('Po CSP') | title('Po CSP') | ||
legend('baseline','ERP') | legend('baseline','ERP') | ||
| + | %% Wizualizacja przebiegów czasowych X i S | ||
| + | % TUTAJ: | ||
%% Zadanie 4 (dla chętnych): zmień macierz P powyżej i powtórz analizę | %% Zadanie 4 (dla chętnych): zmień macierz P powyżej i powtórz analizę | ||
| Linia 600: | Linia 603: | ||
Zob. [[#Filtry przestrzenne dla SSEP|Filtry przestrzenne dla SSEP]] poniżej. | Zob. [[#Filtry przestrzenne dla SSEP|Filtry przestrzenne dla SSEP]] poniżej. | ||
| − | ==Filtry przestrzenne dla SSEP == | + | ==Filtry przestrzenne dla SSEP== |
| − | === Teoria=== | + | ===Teoria=== |
| − | |||
| − | + | Ciekawa koncepcja filtra przestrzennego dla SSEP zaprezentowana jest tu: http://www.eurasip.org/Proceedings/Eusipco/Eusipco2009/contents/papers/1569193209.pdf | |
| − | + | Pokrótce można ją rozumieć podobnie do tego co robiliśmy rozważając filtry przestrzenne CSP z tym, że dla SSEP oraz innych potencjałów wywołanych stanu ustalonego możemy skorzystać z dodatkowych informacji dotyczących poszukiwanych źródeł. Wiemy mianowicie, że powinny one oscylować z częstością bodźca i być może jej harmonicznych. | |
| − | W | + | Przyda nam się macierz <math>S</math> zbudowana tak, że w kolejnych kolumnach znajdują się sinusy i cosinusy kolejnych częstości harmonicznych. Wektory te unormujemy, żeby miały energię równą 1. Innymi słowy macierz <math>S</math> zbudowana jest z wersorów rozpinających przestrzeń, w której powinien znajdować się sygnał SSEP. |
| − | <source lang = matlab> | + | |
| − | % Fs - częstość próbkowania | + | W Matlabie możemy taką macierz zbudować tak: |
| − | % numberOfSamples - długość sygnału w próbkach | + | |
| + | <source lang="matlab"> | ||
| + | % Fs - częstość próbkowania | ||
| + | % numberOfSamples - długość sygnału w próbkach | ||
% numberOfHarmonics - liczba harmonicznych, które chcemy włączyć do analizy | % numberOfHarmonics - liczba harmonicznych, które chcemy włączyć do analizy | ||
| − | t = (0:1:numberOfSamples - 1)/Fs; | + | t = (0:1:numberOfSamples - 1) / Fs; |
S = zeros(numberOfSamples, 2*numberOfHarmonics); | S = zeros(numberOfSamples, 2*numberOfHarmonics); | ||
| Linia 625: | Linia 630: | ||
</source> | </source> | ||
| + | Aby w badanym sygnale znaleźć składowe odpowiadające SSEP musimy rzutować sygnał <math>X</math> (macierz sygnałów ''kanały × próbki'') na przestrzeń rozpiętą przez <math>S</math>: | ||
| + | :<math>A = X S</math> | ||
| + | Macierz <math>A</math> zawiera współczynniki będące iloczynami skalarnymi sygnałów i wersorów — mówią one o tym jak dużo sinusa bądź cosinusa o danej częstości jest w pierwotnym sygnale. Komponenty SSEP zawarte w sygnale <math>X</math> odzyskujemy tak: | ||
| + | :<math>\mathrm{SSEP} = A S^T</math> | ||
| + | |||
| + | Modelujemy rejestrowany sygnał jako: | ||
| + | :<math>X = \mathrm{SSEP} + Y</math> | ||
| + | gdzie: | ||
| + | :<math>Y = X - \mathrm{SSEP}</math> | ||
| + | to wszystkie komponenty sygnału, które nas nie interesują. | ||
| + | |||
| + | Filtr przestrzenny, który chcemy zbudować powinien maksymalizować stosunek wariancji <math>\mathrm{SSEP}</math> do wariancji <math>Y</math>. Macierz kowariancji powinna być uśredniona po powtórzeniach, a kowariancja sygnału w każdym powtórzeniu powinna być znormalizowana przez jej ślad. Dalej stosujemy technikę znaną z CSP: maksymalizację ilorazu Rayleigha przez rozwiązanie uogólnionego zagadnienia własnego dla macierzy kowariancji <math>\mathrm{SSEP}</math> i <math>Y</math>. | ||
| + | |||
| + | ===Zadanie: implementacja funkcji cosSinCSP=== | ||
| + | |||
| + | Dane do zadania: [[Plik:PrzykladoweDaneSSVEP.mat.gz]]. | ||
| + | Pełny przykład z danymi z eksperymentu SSEP: [[Plik:SSVEP_demo_csp.tar.gz]] | ||
| + | |||
| + | Zaimplementuj funkcję <code>cosSinCSP</code> zgodnie z poniższym szkieletem. | ||
| + | Prawidłowo zaimplementowana funkcja wraz ze skryptem demonstracyjnym poniżej | ||
| + | powinna generować rysunek: [[Plik:Rys_SSVEP_demo.png|400px|podpis grafiki]] | ||
| + | |||
| + | <source lang="matlab"> | ||
| + | function [W, Lambda] = cosSinCSP(signal, stimulationFrequency, numberOfHarmonics, Fs) | ||
| + | % cosSinCSP - filtr przestrzenny dla sygnałów SSEP | ||
| + | % | ||
| + | % Wejście: | ||
| + | % signal - dane EEG, wymiary: powtórzenia × kanały × próbki | ||
| + | % stimulationFrequency - częstość stymulacji w Hz | ||
| + | % numberOfHarmonics - liczba harmonicznych do uwzględnienia | ||
| + | % Fs - częstość próbkowania w Hz | ||
| + | % | ||
| + | % Wyjście: | ||
| + | % W - macierz filtrów przestrzennych (kanały × kanały), filtry w kolumnach | ||
| + | % Lambda - macierz diagonalna wartości własnych | ||
| + | |||
| + | [numberOfTrials, numberOfChannels, numberOfSamples] = size(signal); | ||
| + | |||
| + | %% KROK 1: Zbuduj macierz referencyjną S (sinusy i cosinusy harmonicznych) | ||
| + | % S ma wymiary: próbki × 2*numberOfHarmonics | ||
| + | % Każda kolumna to jeden wersor (unormowany sinus lub cosinus). | ||
| + | % Wróć do sekcji Teoria powyżej i przełóż tamten kod na tę funkcję. | ||
| + | |||
| + | % TUTAJ | ||
| + | |||
| + | %% KROK 2: Oblicz średnie macierze kowariancji C_SSEP i C_Y | ||
| + | % Dla każdego powtórzenia wytnij sygnał x (kanały × próbki), | ||
| + | % rozłóż go na składową SSEP i resztę Y zgodnie z równaniami z sekcji Teoria, | ||
| + | % oblicz macierze kowariancji obu składowych, znormalizuj przez ślad | ||
| + | % i uśrednij po powtórzeniach. | ||
| − | + | C_SSEP = zeros(numberOfChannels, numberOfChannels); | |
| − | + | C_Y = zeros(numberOfChannels, numberOfChannels); | |
| − | |||
| − | |||
| − | + | for trial = 1:numberOfTrials | |
| − | :< | + | x = squeeze(signal(trial, :, :)); % kanały × próbki |
| − | + | ||
| − | : | + | % TUTAJ: oblicz SSEP i Y |
| − | : | + | |
| + | % TUTAJ: oblicz kowariancje, znormalizuj, dodaj do C_SSEP i C_Y | ||
| + | end | ||
| + | |||
| + | % TUTAJ: podziel C_SSEP i C_Y przez numberOfTrials | ||
| + | |||
| + | %% KROK 3: Rozwiąż uogólnione zagadnienie własne | ||
| + | % Znajdź filtry przestrzenne maksymalizujące stosunek mocy SSEP do mocy Y. | ||
| + | % Analogia z CSP: jakie macierze wstawiłeś do eig() tam? | ||
| + | |||
| + | % TUTAJ: [W, Lambda] = ... | ||
| + | |||
| + | end | ||
| + | </source> | ||
| + | |||
| + | ;Wskazówka do interpretacji wyników: | ||
| + | Filtr związany z największą wartością własną daje komponent | ||
| + | o największym stosunku mocy SSEP do mocy tła. | ||
| + | Sprawdź na widmach Welcha czy odpowiada on składowej | ||
| + | z wyraźnym pikiem przy częstości stymulacji. | ||
| + | |||
| + | {{hidden begin|title=Rozwiązanie — pokaż dopiero po samodzielnej próbie}} | ||
| + | <source lang="matlab"> | ||
| + | function [W, Lambda] = cosSinCSP(signal, stimulationFrequency, numberOfHarmonics, Fs) | ||
| + | |||
| + | [numberOfTrials, numberOfChannels, numberOfSamples] = size(signal); | ||
| + | |||
| + | %% KROK 1: Macierz referencyjna S | ||
| + | t = (0:1:numberOfSamples-1) / Fs; | ||
| + | S_ref = zeros(numberOfSamples, 2*numberOfHarmonics); | ||
| + | |||
| + | for harmonicNumber = 1:numberOfHarmonics | ||
| + | c = cos(2*pi*stimulationFrequency*harmonicNumber*t); | ||
| + | s = sin(2*pi*stimulationFrequency*harmonicNumber*t); | ||
| + | S_ref(:,(harmonicNumber-1)*2 + 1) = c/norm(c); | ||
| + | S_ref(:,(harmonicNumber-1)*2 + 2) = s/norm(s); | ||
| + | end | ||
| + | |||
| + | %% KROK 2: Średnie macierze kowariancji | ||
| + | C_SSEP = zeros(numberOfChannels, numberOfChannels); | ||
| + | C_Y = zeros(numberOfChannels, numberOfChannels); | ||
| + | |||
| + | for trial = 1:numberOfTrials | ||
| + | x = squeeze(signal(trial, :, :)); % kanały × próbki | ||
| + | A = x * S_ref; % projekcja na przestrzeń SSEP | ||
| + | SSEP = A * S_ref'; % rekonstrukcja składowej SSEP | ||
| + | Y = x - SSEP; % reszta | ||
| + | |||
| + | tmp = cov(SSEP'); | ||
| + | C_SSEP = C_SSEP + tmp/trace(tmp); | ||
| + | |||
| + | tmp = cov(Y'); | ||
| + | C_Y = C_Y + tmp/trace(tmp); | ||
| + | end | ||
| − | + | C_SSEP = C_SSEP / numberOfTrials; | |
| − | + | C_Y = C_Y / numberOfTrials; | |
| − | + | %% KROK 3: Uogólnione zagadnienie własne | |
| − | + | [W, Lambda] = eig(C_SSEP, C_Y); | |
| − | W | ||
| − | |||
| − | |||
| + | end | ||
| + | </source> | ||
| + | {{hidden end}} | ||
| − | <source lang = matlab> | + | ===Skrypt demonstracyjny i analiza wyników=== |
| + | |||
| + | <source lang="matlab"> | ||
% wczytujemy dane | % wczytujemy dane | ||
load('PrzykladoweDaneSSVEP.mat'); | load('PrzykladoweDaneSSVEP.mat'); | ||
| Linia 653: | Linia 761: | ||
[numberOfTrials numberOfChannels numberOfSamples] = size(X.data); | [numberOfTrials numberOfChannels numberOfSamples] = size(X.data); | ||
namesOfChannels = X.channels; | namesOfChannels = X.channels; | ||
| − | + | ||
| − | |||
| − | |||
numberOfHarmonics = 3; | numberOfHarmonics = 3; | ||
| − | signal = X.data; % ( | + | signal = X.data; % powtórzenie × kanał × próbki |
| − | + | ||
| + | [W, Lambda] = cosSinCSP(signal, X.stimulation, numberOfHarmonics, X.sampling); | ||
| + | |||
| + | %% Odtworzenie sygnałów źródłowych | ||
S = zeros(size(signal)); | S = zeros(size(signal)); | ||
| − | |||
for powt = 1:size(signal,1) | for powt = 1:size(signal,1) | ||
| − | S(powt,:,:) = W'*squeeze(signal(powt,:,:)); | + | S(powt,:,:) = W' * squeeze(signal(powt,:,:)); |
end | end | ||
| − | + | ||
| − | figure('Name',['Stymulacja: ',num2str(X.stimulation),' Hz']) | + | %% Widma Welcha: kanały oryginalne vs źródła CSP |
| − | for i =1:numberOfChannels | + | figure('Name', ['Stymulacja: ', num2str(X.stimulation), ' Hz']) |
| − | + | for i = 1:numberOfChannels | |
| − | + | subplot(2, numberOfChannels, i) | |
| − | subplot(2, | + | PP = 0; |
| − | PP=0; | ||
for rep = 1:numberOfTrials | for rep = 1:numberOfTrials | ||
x = squeeze(signal(rep,i,:)); | x = squeeze(signal(rep,i,:)); | ||
| − | [Pxx,ff] = pwelch(x, X.sampling, 1, X.sampling, X.sampling); | + | [Pxx, ff] = pwelch(x, X.sampling, 1, X.sampling, X.sampling); |
| − | PP =PP + Pxx; | + | PP = PP + Pxx; |
end | end | ||
| − | plot(ff(ff<60),PP(ff<60)) | + | plot(ff(ff<60), PP(ff<60)) |
title(namesOfChannels{i}) | title(namesOfChannels{i}) | ||
| − | + | ||
| − | + | subplot(2, numberOfChannels, numberOfChannels+i) | |
| − | + | PP = 0; | |
| − | subplot(2, | ||
| − | PP=0; | ||
for rep = 1:numberOfTrials | for rep = 1:numberOfTrials | ||
s = squeeze(S(rep,i,:)); | s = squeeze(S(rep,i,:)); | ||
| − | [Pss,ff]=pwelch(s, X.sampling, 1, X.sampling, X.sampling); | + | [Pss, ff] = pwelch(s, X.sampling, 1, X.sampling, X.sampling); |
| − | PP =PP + Pss; | + | PP = PP + Pss; |
end | end | ||
| − | plot(ff(ff<60),PP(ff<60)) | + | plot(ff(ff<60), PP(ff<60)) |
title(['źródło CSP: ', num2str(i)]) | title(['źródło CSP: ', num2str(i)]) | ||
| + | xlabel(['\lambda = ', num2str(Lambda(i,i), '%.2f')]) | ||
end | end | ||
| + | |||
| + | %% KROK 4: Mapki topograficzne | ||
| + | % Zidentyfikuj komponent z największą wartością własną. | ||
| + | % Narysuj dwie mapki przy użyciu funkcji topoplot() z pakietu EEGLAB: | ||
| + | % | ||
| + | % (a) Filtr przestrzenny: wagi z jakimi kanały EEG składają się na ten komponent. | ||
| + | % Wskazówka: filtr to kolumna macierzy W. | ||
| + | % | ||
| + | % (b) Topografia źródła: z jakimi wagami komponent dociera do poszczególnych elektrod. | ||
| + | % Wskazówka: topografia zawarta jest w wierszach macierzy odwrotnej do W — | ||
| + | % przypomnij sobie analogiczny krok z analizy CSP dla P300. | ||
| + | % | ||
| + | % Czym różnią się te dwie mapki? Którą łatwiej interpretować fizjologicznie? | ||
| + | |||
| + | % TUTAJ: [~, idx] = max(diag(Lambda)); | ||
| + | % TUTAJ: topoplot(...) % filtr | ||
| + | % TUTAJ: topoplot(...) % topografia | ||
</source> | </source> | ||
Aktualna wersja na dzień 11:05, 14 kwi 2026
Laboratorium_EEG/BSS
Spis treści
- 1 Plan zajęć
- 2 Sesja 1: Ślepa separacja źródeł i CSP — wprowadzenie
- 3 Sesja 2: CSP dla P300 — dane realne
- 4 Sesja 3: CSP dla P300 — interpretacja i separacja cech
- 5 Sesja 4: Filtry przestrzenne dla SSEP — cosSinCSP
- 6 Sesja 5: ICA — teoria i wydobywanie interesującego komponentu
- 7 Sesja 6: ICA — artefakty i synteza metod
Plan zajęć
Materiał realizowany jest w ciągu 3 tygodni (6 spotkań po ~2,5 h).
| Sesja | Temat | Kluczowe sekcje na tej stronie |
|---|---|---|
| 1 | Wykład BSS + CSP; ćwiczenie symulacyjne | Ślepa separacja źródeł, Common Spatial Pattern, Ćwiczenie symulacyjne |
| 2 | Dane P300: wczytanie, cięcie epok, wizualizacja ERP, implementacja CSP | Analiza wstępna, Analiza CSP |
| 3 | Mapki topograficzne; separacja cech | Analiza CSP (cd.), Wybór i separacja cech |
| 4 | cosSinCSP jako uogólnienie CSP; dane SSVEP | Filtry przestrzenne dla SSVEP |
| 5 | Wykład ICA; komponenty alfa | ICA jako filtr przestrzenny, Komponenty alfa |
| 6 | Artefakty (ICLabel/MARA); synteza CSP/cosSinCSP/ICA | Identyfikacja artefaktów |
Sesja 1: Ślepa separacja źródeł i CSP — wprowadzenie
- Czas
- ~60 min wykład + ~90 min ćwiczenie symulacyjne
Zajęcia wprowadzają do problemu filtracji przestrzennej sygnałów EEG. Punktem wyjścia jest ogólny problem ślepej separacji źródeł (BSS), z którego CSP wyłania się jako szczególny przypadek dla dwóch warunków eksperymentalnych. Filtry przestrzenne omawiane na tych zajęciach stanowią fundament klasycznych metod BCI (P300, SSVEP, motor imagery) oraz są bezpośrednim odpowiednikiem warstw przestrzennych w sieciach neuronowych takich jak ShallowConvNet i EEGNet — do tej analogii wrócimy w sesji 6.
- Zakres wykładu
- model generatywny EEG: [math]x(t) = As(t)[/math], macierz kowariancji, idea diagonalizacji
- BSS jako ogólny problem separacji źródeł
- CSP jako szczególny przypadek: dwa warunki eksperymentalne, iloraz Rayleigha, uogólnione zagadnienie własne
- interpretacja filtrów i topografii źródeł
- Ćwiczenie symulacyjne
Zob. Ćwiczenie symulacyjne w sekcji CSP poniżej.
Ćwiczenie symulacyjne
Zadania do samodzielnej realizacji
Poniższy kod dostarcza gotowej infrastruktury: generacji sygnałów, macierzy mieszającej i wizualizacji. Zadaniem jest samodzielna implementacja kluczowych kroków analizy CSP.
- Zadanie 1 (obowiązkowe)
- Obliczenie macierzy kowariancji
Napisz funkcję srednia_kowariancja(X, ind), która dla danej tablicy sygnałów X
(wymiary: powtórzenia × kanały × próbki) i wektora indeksów czasowych ind
zwraca średnią macierz kowariancji uśrednioną po powtórzeniach.
Dla każdego powtórzenia zastosuj funkcję cov i znormalizuj wynik przez jego ślad (trace).
Sprawdź wynik porównując z macierzami R_B i R_E obliczonymi w dostarczonym kodzie.
- Zadanie 2 (obowiązkowe)
- Implementacja CSP
Korzystając z funkcji eig oraz macierzy kowariancji obliczonych w zadaniu 1,
wyznacz macierz filtrów przestrzennych W i odpowiadające im wartości własne.
Odtwórz sygnały źródłowe dla wszystkich powtórzeń.
Narysuj chmury punktów (amplituda źródła 1 vs amplituda źródła 2) osobno dla warunków
baseline i ERP — przed transformacją CSP i po niej. Co zmieniło się w kształcie chmur?
Wykreśl także wizualizację przebiegów czasowych sygnałów X i sygnałów S uzyskanych po rozmieszaniu.
- Zadanie 3 (obowiązkowe)
- Interpretacja wartości własnych
Wartości własne znajdują się na przekątnej macierzy Lambda.
Który filtr najbardziej różnicuje warunki baseline i ERP?
Jaki jest związek między wartością własną a separacją widoczną na wykresach punktowych?
- Zadanie 4 (dla chętnych)
- Wpływ macierzy mieszającej
W dostarczonym kodzie macierz P (filtr przestrzenny) wynosi:
P = [1 2; 1.5 1.3]
Zmień ją kolejno na macierz bliską jednostkowej (np. P = [1 0.1; 0.1 1])
oraz na macierz z dużymi elementami pozadiagonalnymi (np. P = [1 5; 4 1]).
Jak zmienia się kształt chmury punktów przed transformacją CSP?
Czy CSP poprawnie oddziela źródła w obu przypadkach?
- Zadanie 5 (dla chętnych)
- Wpływ szumu
W kodzie szum jest wyłączony: n = 0*randn(size(tmp)).
Usuń mnożnik 0* i zbadaj jak poziom szumu wpływa na separację źródeł.
Przy jakim stosunku sygnału do szumu CSP przestaje skutecznie rozdzielać warunki?
- Pytanie do dyskusji
Dostarczony kod używa eig(R_E, R_B).
Alternatywą jest eig(R_E, (R_E+R_B)/2).
Czym różnią się te dwie wersje? W jakich sytuacjach eksperymentalnych
druga wersja mogłaby być bardziej uzasadniona?
Szkielet kodu do uzupełnienia
Poniższy szkielet zawiera gotową infrastrukturę symulacji.
Uzupełnij brakujące fragmenty oznaczone komentarzem % TUTAJ
zgodnie z zadaniami 1–3. Pełny kod referencyjny dostępny jest poniżej
— zajrzyj do niego dopiero po samodzielnej próbie.
%% Parametry symulacji — nie modyfikuj tej sekcji
Fs = 100;
T = 1;
t = 0:1/Fs:T-1/Fs;
N_rep = 100;
N_chan = 2;
s = zeros(N_rep, N_chan, length(t));
X = zeros(N_rep, N_chan, length(t));
P = [1 2; 1.5 1.3]; % filtr przestrzenny (prawdziwy)
A = P^(-1); % topografia źródeł
for r = 1:N_rep
s1 = sin(2*pi*11*t + pi/2) + 0.02*randn(size(t));
s2 = exp(-((t-0.8)/0.05).^2) + 0.01*randn(size(t));
s(r,1,:) = s1;
s(r,2,:) = s2;
tmp = squeeze(s(r,:,:));
n = 0*randn(size(tmp)); % Zadanie 5: zmień 0* na 1* aby włączyć szum
X(r,:,:) = A*tmp + n;
end
baseline_ind = find(t < 0.5);
ERP_ind = find(t >= 0.5);
R_B = zeros(N_chan, N_chan);
R_E = zeros(N_chan, N_chan);
%% Zadanie 1: Oblicz średnie macierze kowariancji
% korzystając z funkcji srednia_kowariancja(X, ind)
% Dla każdego powtórzenia r:
% - wytnij fragment sygnału X(r,:,baseline_ind) i analogicznie ERP
% - oblicz macierz kowariancji funkcją cov() — pamiętaj o transpozycji
% - znormalizuj przez ślad (funkcja trace())
% - dodaj do sumy
% Na końcu podziel przez N_rep
%% Zadanie 2: Rozwiąż uogólnione zagadnienie własne
% Użyj funkcji eig(A,B) gdzie A=R_E, B=R_B
% W wyniku otrzymasz macierz wektorów własnych W (w kolumnach)
% i macierz Lambda z wartościami własnymi na przekątnej
% TUTAJ: [W, Lambda] = ...
disp('Wartości własne (przekątna Lambda):')
disp(diag(Lambda))
%% Zadanie 2 cd.: Odtwórz sygnały źródłowe
% Dla każdego powtórzenia r zastosuj filtr: S(r,:,:) = W' * X(r,:,:)
S = zeros(N_rep, N_chan, length(t));
for r = 1:N_rep
% TUTAJ: S(r,:,:) = ...
end
%% Zadanie 3: Wizualizacja — chmury punktów przed i po CSP
x_base_k1 = X(:,1,baseline_ind);
x_base_k2 = X(:,2,baseline_ind);
x_ERP_k1 = X(:,1,ERP_ind);
x_ERP_k2 = X(:,2,ERP_ind);
s_base_k1 = squeeze(S(:,1,baseline_ind));
s_base_k2 = squeeze(S(:,2,baseline_ind));
s_ERP_k1 = squeeze(S(:,1,ERP_ind));
s_ERP_k2 = squeeze(S(:,2,ERP_ind));
figure(1); clf
subplot(1,2,1)
plot(x_base_k1(:), x_base_k2(:), 'b.'); hold on
plot(x_ERP_k1(:), x_ERP_k2(:), 'r.');
axis equal; xlim([-2 2]); ylim([-2 2])
xlabel('Kanał 1'); ylabel('Kanał 2')
title('Przed CSP')
legend('baseline','ERP')
subplot(1,2,2)
plot(s_base_k1(:), s_base_k2(:), 'b.'); hold on
plot(s_ERP_k1(:), s_ERP_k2(:), 'r.');
axis equal
xlabel('Źródło 1'); ylabel('Źródło 2')
title('Po CSP')
legend('baseline','ERP')
%% Wizualizacja przebiegów czasowych X i S
% TUTAJ:
%% Zadanie 4 (dla chętnych): zmień macierz P powyżej i powtórz analizę
%% Zadanie 5 (dla chętnych): włącz szum (zmień 0* na 1* w linii z n=...)
% symulowany eksperyment składa się z sinusoidy udającej alfę spoczynkową i
% funkcji Gaussa udającego potencjał wywołany
% źródła te są symulowane niezależnie a potem mieszane przez macierz A
% symulujemy źródła
% s1 - symuluje alfę
% s2 - symuluje "potencjał wywołany" (ERP)
%ustawiamy parametry do symulacji sygnałów
Fs = 100;
T = 1;
t = 0:1/Fs:T-1/Fs;
N_rep = 100;
N_chan = 2;
s = zeros(N_rep,N_chan, length(t));
X = zeros(N_rep,N_chan, length(t));
% filtr przestrzenny - z takimi wagami trzeba wziąść kanały EEG aby odzyskać sygnały źródłowe
P = [1 2
1.5 1.3];
% topografie - z takimi wagami źródła dokładają się do poszczególnych elektrod
A = P^(-1);
for r =1:N_rep % tworzymy kolejne realizacje "eksperymentu"
s1 = sin(2*pi*11*t +pi/2+ 0*2*pi*rand())+ 0.02*randn(size(t)); % źródło alfa
s2 = exp(-((t-0.8)/0.05).^2)+ 0.01*randn(size(t)); % źródło ERP
s(r,1,:) = s1;
s(r,2,:) = s2;
tmp = squeeze(s(r,:,:));
n = 0*randn(size(tmp));
X(r,:,:) = A*tmp +n; % rzutujemy sygnały źródłowe na elektrody s -> x
end
% wycinamy warunki
% baseline_ind to indeksy pierwszej połowy każdego powtórzenia "baseline"
% ERP_ind to indeksy drugiej połowy każdego powtórzenia zawierająca "ERP"
baseline_ind = find(t<0.5);
ERP_ind = find(t>=0.5);
x_baseline_kan_1 = X(:,1,baseline_ind);
x_baseline_kan_2 = X(:,2,baseline_ind);
x_ERP_kan_1 = X(:,1,ERP_ind);
x_ERP_kan_2 = X(:,2,ERP_ind);
% liczymy średnie macierze kowariancji:
R_E = zeros(N_chan,N_chan);
R_B = zeros(N_chan,N_chan);
for r =1:N_rep
B = squeeze(X(r,:,baseline_ind));
tmp =cov(B');
R_B = R_B + tmp./trace(tmp);%B*B' ;
E = squeeze(X(r,:,ERP_ind));
tmp = cov(E');
R_E = R_E + tmp./trace(tmp);%E*E' ;
end
R_B = R_B/N_rep;
R_E = R_E/N_rep;
% rozwiązujemy uogólnione zagadnienie własne
[W,Lambda]=eig(R_E,R_B); % możliwa jest też optymalizacja wzg. średniej macierzy kowariancji (R_B+R_A)/2);
% odzyskujemy sygnały źródeł
for r =1:N_rep
S(r,:,:) = W'*squeeze(X(r,:,:));
end
% pobieramy wycinki odpowiadające obu częściom eksperymentu z estymowanych
% źródeł
s_baseline_estymowany_kan1 = squeeze( S(:,1,baseline_ind));
s_baseline_estymowany_kan2 = squeeze( S(:,2,baseline_ind));
s_ERP_estymowany_kan1 = squeeze(S(:,1,ERP_ind));
s_ERP_estymowany_kan2 = squeeze(S(:,2,ERP_ind));
%%%%%%%%%%%%%% Ilustracje %%%%%%%%%%%%%%%%%%%%%%%
% ilustracja sygnałów mierzonych
figure(1);clf
subplot(2,2,1);
plot(t(baseline_ind),(squeeze(X(:,1,baseline_ind)))','b'); hold on
plot(t(ERP_ind),(squeeze( X(:,1,ERP_ind)))','r'); hold off
xlabel('elektroda 1')
title('ilustracja sytuacji pomiarowej -\newline znane są potencjały na elektrodach w dwóch warunkach eksperymentalnych')
subplot(2,2,3);
plot(t(baseline_ind),(squeeze(X(:,2,baseline_ind)))','b'); hold on
plot(t(ERP_ind),(squeeze( X(:,2,ERP_ind)))','r'); hold off
xlabel('elektroda 2')
subplot(1,2,2)
plot(x_baseline_kan_1(:),x_baseline_kan_2(:),'b.');
hold on
plot(x_ERP_kan_1(:),x_ERP_kan_2(:),'r.');
xlim([-2,2])
ylim([-2,2])
axis equal
% wektor własny odpowiadający największej wartości własnej jest
% kierunkiem najbardziej różnicującym warunki eksperymentalne
disp('wartości własne znajdują się na przekątnej macierzy Lambda')
disp(Lambda)
% rysujemy wersory jednostkowe w kierunkach wektorów własnych
w1 = W(:,1);
w1 = w1/norm(w1);
w2 = W(:,2);
w2 = w2/norm(w2);
line([0, w1(1) ],[0,w1(2)],'Color',[0,0.3,0])
text(w1(1),w1(2),'wektor własny 1')
line([0, w2(1) ],[0,w2(2)],'Color',[1,0,1])
text(w2(1),w2(2),'wektor własny 2')
xlabel('Amplituda na elektrodzie 1')
ylabel('Amplituda na elektrodzie 2')
legend('baseline','ERP')
% Ilustracja estymowanych źródeł
figure(2);clf
subplot(2,2,1);
plot(t(baseline_ind),(squeeze(S(:,1,baseline_ind)))','b');hold on
plot(t(ERP_ind),(squeeze(S(:,1,ERP_ind)))','r');hold off
xlabel('estymowane zrodlo 1')
title('ilustracja estymacji -\newline estymowane są potencjały źródeł w dwóch warunkach eksperymentalnych')
subplot(2,2,3);
plot(t(baseline_ind),(squeeze(S(:,2,baseline_ind)))','b');hold on
plot(t(ERP_ind),(squeeze(S(:,2,ERP_ind)))','r');hold off
xlabel('estymowane zrodlo 2');
subplot(1,2,2)
plot(s_baseline_estymowany_kan1(:),s_baseline_estymowany_kan2(:),'b.');
hold on
plot(s_ERP_estymowany_kan1(:),s_ERP_estymowany_kan2(:),'r.');
xlabel('Amplituda estym. źródła 1')
ylabel('Amplituda estym. źródła 2')
legend('baseline','ERP')
Sesja 2: CSP dla P300 — dane realne
- Czas
- ~150 min (jedno spotkanie)
Pracujemy z danymi kalibracyjnymi z eksperymentu P300. Celem sesji jest przejście pełnego pipeline'u: od surowych danych do odtworzonych źródeł CSP.
- Zakres
- wczytanie danych kalibracyjnych, identyfikacja znaczników T i NT
- cięcie epok (−200 do +800 ms), usuwanie trendu liniowego
- montaż względem połączonych uszu
- wizualizacja ERP w układzie topograficznym
- obliczenie macierzy kowariancji RT i RNT, normalizacja przez ślad
- rozwiązanie uogólnionego zagadnienia własnego:
[W, Lambda] = eig(R_T, R_NT) - odtworzenie sygnałów źródłowych:
S = W'*EEG - przegląd estymowanych źródeł w dwóch warunkach
- Materiały
Zob. Analiza wstępna i Analiza CSP poniżej.
Sesja 3: CSP dla P300 — interpretacja i separacja cech
- Czas
- ~150 min (jedno spotkanie)
Kontynuacja analizy CSP. Celem sesji jest interpretacja wyników w kategoriach fizjologicznych oraz ocena separowalności klas w przestrzeni cech opartej na mocy sygnału.
- Zakres
- mapki topograficzne filtra przestrzennego i topografii źródła (funkcja
topoplotz pakietu EEGLAB) - związek wartości własnych z siłą różnicowania warunków T i NT
- wykresy punktowe mocy: oś X — moc składowej z największą wartością własną, oś Y — moc kolejnej składowej; jeden punkt = jedno powtórzenie
- uśrednianie po 2, 4, 6, 8 i 10 realizacjach — obserwacja poprawy separacji wraz z liczbą uśrednień
- dyskusja: utożsamianie komponentów CSP z fizjologicznymi źródłami jest ryzykowne; komponenty maksymalizują kontrast między warunkami, niekoniecznie odpowiadają izolowanym generatorom
- Materiały
Zob. Analiza CSP i Wybór i separacja cech poniżej.
Analiza wstępna
%% KROK 1: Wczytanie danych
% ReadManager to pomocnicza klasa do odczytu plików w formacie OpenBCI.
% Przyjmuje trzy pliki: XML z metadanymi, RAW z próbkami i TAG ze znacznikami zdarzeń.
nazwaPliku = 'p_6301423_calibration_p300.obci';
nameOfXMLFile = strcat(nazwaPliku, '.xml');
nameOfTagFile = strcat(nazwaPliku, '.tag');
namesOfDataFiles = strcat(nazwaPliku, '.raw');
rm = ReadManager(nameOfXMLFile, namesOfDataFiles, nameOfTagFile);
% Pobieramy podstawowe parametry nagrania
numberOfChannels = rm.get_param('number_of_channels');
namesOfChannels = rm.get_param('channels_names');
samplingFrequency = rm.get_param('sampling_frequency');
% Pobieramy listę wszystkich znaczników zdarzeń z nagrania
tagsStruct = rm.get_tags();
%% KROK 2: Identyfikacja znaczników Target i Non-Target
% Każdy znacznik typu 'blink' odpowiada jednemu mignięciu w eksperymencie P300.
% Pole 'index' mówi który symbol mignął, pole 'target' który symbol był oczekiwany.
% Jeśli index == target to było to mignięcie docelowe (Target), w przeciwnym razie
% Non-Target.
targetTimeStamps = [];
NonTargetTimeStamps = [];
for structNumber = 1:length(tagsStruct)
if strcmp(tagsStruct(structNumber).name, 'blink')
index = tagsStruct(structNumber).children.index;
target = tagsStruct(structNumber).children.target;
if index == target
targetTimeStamps = [targetTimeStamps tagsStruct(structNumber).start_timestamp];
else
NonTargetTimeStamps = [NonTargetTimeStamps tagsStruct(structNumber).start_timestamp];
end
end
end
%% KROK 3: Wczytanie i filtrowanie sygnału
samples = double(rm.get_samples());
samples = samples(1:8,:); % odrzucamy kanały bez EEG
numberOfChannels = 8;
% Filtr dolnoprzepustowy Czebyszewa 2. rodzaju — odcięcie 25 Hz
[b, a] = cheby2(6, 80, 25/(samplingFrequency/2), 'low');
for ch = 1:numberOfChannels
samples(ch,:) = filtfilt(b, a, samples(ch,:));
end
%% KROK 4: Montaż względem średniej (common average reference)
% Odejmujemy od każdego kanału średnią ze wszystkich kanałów w danej chwili.
% Jest to prostsze i bardziej ogólne niż montaż względem połączonych uszu.
M = -ones(numberOfChannels, numberOfChannels) / numberOfChannels;
M = M + eye(numberOfChannels) * (numberOfChannels+1) / numberOfChannels;
samples = 0.0715 * M * samples;
%% KROK 5: Cięcie epok
PRE = -0.2;
POST = 0.8;
wycinek = floor(PRE*samplingFrequency : POST*samplingFrequency);
TargetSignal = zeros(length(targetTimeStamps), numberOfChannels, length(wycinek));
NonTargetSignal = zeros(length(NonTargetTimeStamps), numberOfChannels, length(wycinek));
for trialNumber = 1:length(targetTimeStamps)
trigerOnset = floor(targetTimeStamps(trialNumber) * samplingFrequency);
tenWycinek = wycinek + trigerOnset;
if tenWycinek(1) > 0 && tenWycinek(end) <= size(samples,2)
tmpSignal = samples(:, tenWycinek);
tmpSignal = detrend(tmpSignal')'; % usuwanie trendu liniowego
TargetSignal(trialNumber,:,:) = tmpSignal;
end
end
for trialNumber = 1:length(NonTargetTimeStamps)
trigerOnset = floor(NonTargetTimeStamps(trialNumber) * samplingFrequency);
tenWycinek = wycinek + trigerOnset;
if tenWycinek(1) > 0 && tenWycinek(end) <= size(samples,2)
tmpSignal = samples(:, tenWycinek);
tmpSignal = detrend(tmpSignal')';
NonTargetSignal(trialNumber,:,:) = tmpSignal;
end
end
% Oś czasu w milisekundach — przyda się do rysowania
times = (wycinek / samplingFrequency) * 1000;
%% KROK 6: Wizualizacja ERP w układzie topograficznym
% Oblicz potencjały wywołane (ERP) jako średnie po powtórzeniach
ERP_T = squeeze(mean(TargetSignal, 1)); % wymiary: kanały × czas
ERP_NT = squeeze(mean(NonTargetSignal, 1));
% TUTAJ: narysuj ERP_T i ERP_NT dla każdego kanału w subplotach
% ułożonych w siatce odpowiadającej przybliżonym pozycjom elektrod.
% Na każdym subplocie nałóż oba warunki różnymi kolorami.
% Oś X: czas w ms (użyj wektora times), oś Y: amplituda w µV.
% Zadbaj o legendę i tytuły z nazwami kanałów (namesOfChannels).
%% KROK 7: Obliczenie średnich macierzy kowariancji
% Dla każdego powtórzenia oblicz macierz kowariancji funkcją cov(),
% znormalizuj przez jej ślad (trace()), a następnie uśrednij po powtórzeniach.
% Pamiętaj: cov() oczekuje macierzy próbki × kanały, czyli potrzebujesz transpozycji.
R_T = zeros(numberOfChannels, numberOfChannels);
R_NT = zeros(numberOfChannels, numberOfChannels);
for r = 1:length(targetTimeStamps)
% TUTAJ: wytnij r-te powtórzenie T, oblicz kowariancję, znormalizuj, dodaj do R_T
end
for r = 1:length(NonTargetTimeStamps)
% TUTAJ: wytnij r-te powtórzenie NT, oblicz kowariancję, znormalizuj, dodaj do R_NT
end
% TUTAJ: podziel R_T i R_NT przez odpowiednie liczby powtórzeń
%% KROK 8: Rozwiązanie uogólnionego zagadnienia własnego
% Szukamy filtrów przestrzennych W maksymalizujących stosunek mocy
% w warunku T względem NT: eig(R_T, R_NT)
% W kolumnach W znajdują się filtry, na przekątnej Lambda — wartości własne.
% TUTAJ: [W, Lambda] = ...
disp('Wartości własne (przekątna Lambda):')
disp(diag(Lambda))
%% KROK 9: Odtworzenie sygnałów źródłowych
% Dla każdego powtórzenia zastosuj filtr przestrzenny:
% s(r,:,:) = W' * x(r,:,:)
% Pamiętaj o wymiarach — squeeze() może być pomocne.
S_T = zeros(size(TargetSignal));
S_NT = zeros(size(NonTargetSignal));
for r = 1:size(TargetSignal, 1)
% TUTAJ: S_T(r,:,:) = ...
end
for r = 1:size(NonTargetSignal, 1)
% TUTAJ: S_NT(r,:,:) = ...
end
%% KROK 10: Wizualizacja estymowanych źródeł
% Narysuj średnie przebiegi źródeł (ERP w przestrzeni CSP) dla obu warunków.
% Ułóż subploty w prostokątnej siatce — jeden subplot na każde źródło.
% Dla którego źródła różnica między T i NT jest największa?
% Czy odpowiada to źródłu z największą wartością własną?
ERP_S_T = squeeze(mean(S_T, 1));
ERP_S_NT = squeeze(mean(S_NT, 1));
% TUTAJ: narysuj ERP_S_T i ERP_S_NT w subplotach
ZADANIE: Analiza CSP
Przegląd badań o P300: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2715154/
Link do Read menager [1]
- Wykonać analizę CSP wzmacniającą potencjał P300.
- Zaprezentować średnią ze wszystkich kanałów źródłowych z warunku target (jeden kolor) i non-target (inny kolor) w subplotach ułożonych w prostokątnej siatce. Zaobserwować, dla którego kanału średnie różnią się najbardziej. Czy jest związek tego kanału z wartościami własnymi?
- Dla kanału najbardziej różnicującego wykonać mapki topograficzne wektorów odpowiadających:
- filtrowi przestrzennemu
- rzutu topograficznego źródła na elektrody.
Wybór i separacja cech
- Przedstaw na rysunkach nałożone na siebie pojedyncze realizacje z warunków target i non-target po rzutowaniu na wektor [math]w[/math] odpowiadający największej i kolejnej wartości własnej.
- Przedstaw wykresy punktowe takie, że na jednej osi jest moc sygnału (suma kwadratów wartości próbek w wybranym zakresie czasu) odpowiadającego największej wartości własnej, a na drugiej osi kolejnej (mniejszej) wartości własnej; jeden punkt reprezentuje jedno powtórzenie.
- Wykonaj serię wykresów jak w poprzednim punkcie dla uśrednień sygnałów kolejno po 2, 4, 6, 8 i 10 realizacjach:
- Liczymy potencjał wywołany dla danej liczby powtórzeń.
- Następnie podnosimy wartości próbek do kwadratu
- i sumujemy je w wybranym zakresie czasu.
- Zaobserwuj jak zmienia się separacja w grupach target i non-target.
Sesja 4: Filtry przestrzenne dla SSEP — cosSinCSP
- Czas
- ~150 min (jedno spotkanie)
Sesja wprowadza metodę cosSinCSP jako naturalne uogólnienie CSP o wiedzę dziedzinową dotyczącą sygnału SSEP. W klasycznym CSP dwa warunki eksperymentalne definiują dwie macierze kowariancji. W cosSinCSP rolę jednej z macierzy przejmuje projekcja sygnału na przestrzeń sinusów i cosinusów częstości stymulacji i jej harmonicznych. Formalizm ilorazu Rayleigha i uogólnionego zagadnienia własnego pozostaje identyczny.
Dane używane na tych zajęciach pochodzą z eksperymentu SSEP z archiwum — bez sesji rejestracyjnej. Na wykresach widma sygnału przed transformacją CSP dominuje artefakt sieciowy 50 Hz, który praktycznie zasłania odpowiedź na stymulację. Zadaniem jest sprawdzenie czy cosSinCSP potrafi ten sygnał wydobyć.
- Zakres
- idea cosSinCSP: macierz S złożona z sinusów i cosinusów harmonicznych, projekcja sygnału na przestrzeń SSEP i resztę Y
- implementacja funkcji
cosSinCSPw MATLAB - analiza danych archiwalnych: widma Welcha dla kanałów oryginalnych i źródeł CSP — porównanie SNR przed i po transformacji
- prezentacja filtrów przestrzennych i topografii źródeł
- Materiały
Zob. Filtry przestrzenne dla SSEP poniżej.
Filtry przestrzenne dla SSEP
Teoria
Ciekawa koncepcja filtra przestrzennego dla SSEP zaprezentowana jest tu: http://www.eurasip.org/Proceedings/Eusipco/Eusipco2009/contents/papers/1569193209.pdf
Pokrótce można ją rozumieć podobnie do tego co robiliśmy rozważając filtry przestrzenne CSP z tym, że dla SSEP oraz innych potencjałów wywołanych stanu ustalonego możemy skorzystać z dodatkowych informacji dotyczących poszukiwanych źródeł. Wiemy mianowicie, że powinny one oscylować z częstością bodźca i być może jej harmonicznych.
Przyda nam się macierz [math]S[/math] zbudowana tak, że w kolejnych kolumnach znajdują się sinusy i cosinusy kolejnych częstości harmonicznych. Wektory te unormujemy, żeby miały energię równą 1. Innymi słowy macierz [math]S[/math] zbudowana jest z wersorów rozpinających przestrzeń, w której powinien znajdować się sygnał SSEP.
W Matlabie możemy taką macierz zbudować tak:
% Fs - częstość próbkowania
% numberOfSamples - długość sygnału w próbkach
% numberOfHarmonics - liczba harmonicznych, które chcemy włączyć do analizy
t = (0:1:numberOfSamples - 1) / Fs;
S = zeros(numberOfSamples, 2*numberOfHarmonics);
for harmonicNumber = 1:numberOfHarmonics
c = cos(2*pi*stimulationFrequency*harmonicNumber*t);
s = sin(2*pi*stimulationFrequency*harmonicNumber*t);
S(:,(harmonicNumber - 1)*2 + 1) = c/norm(c);
S(:,(harmonicNumber - 1)*2 + 2) = s/norm(s);
end
Aby w badanym sygnale znaleźć składowe odpowiadające SSEP musimy rzutować sygnał [math]X[/math] (macierz sygnałów kanały × próbki) na przestrzeń rozpiętą przez [math]S[/math]:
- [math]A = X S[/math]
Macierz [math]A[/math] zawiera współczynniki będące iloczynami skalarnymi sygnałów i wersorów — mówią one o tym jak dużo sinusa bądź cosinusa o danej częstości jest w pierwotnym sygnale. Komponenty SSEP zawarte w sygnale [math]X[/math] odzyskujemy tak:
- [math]\mathrm{SSEP} = A S^T[/math]
Modelujemy rejestrowany sygnał jako:
- [math]X = \mathrm{SSEP} + Y[/math]
gdzie:
- [math]Y = X - \mathrm{SSEP}[/math]
to wszystkie komponenty sygnału, które nas nie interesują.
Filtr przestrzenny, który chcemy zbudować powinien maksymalizować stosunek wariancji [math]\mathrm{SSEP}[/math] do wariancji [math]Y[/math]. Macierz kowariancji powinna być uśredniona po powtórzeniach, a kowariancja sygnału w każdym powtórzeniu powinna być znormalizowana przez jej ślad. Dalej stosujemy technikę znaną z CSP: maksymalizację ilorazu Rayleigha przez rozwiązanie uogólnionego zagadnienia własnego dla macierzy kowariancji [math]\mathrm{SSEP}[/math] i [math]Y[/math].
Zadanie: implementacja funkcji cosSinCSP
Dane do zadania: Plik:PrzykladoweDaneSSVEP.mat.gz. Pełny przykład z danymi z eksperymentu SSEP: Plik:SSVEP demo csp.tar.gz
Zaimplementuj funkcję cosSinCSP zgodnie z poniższym szkieletem.
Prawidłowo zaimplementowana funkcja wraz ze skryptem demonstracyjnym poniżej
powinna generować rysunek:
function [W, Lambda] = cosSinCSP(signal, stimulationFrequency, numberOfHarmonics, Fs)
% cosSinCSP - filtr przestrzenny dla sygnałów SSEP
%
% Wejście:
% signal - dane EEG, wymiary: powtórzenia × kanały × próbki
% stimulationFrequency - częstość stymulacji w Hz
% numberOfHarmonics - liczba harmonicznych do uwzględnienia
% Fs - częstość próbkowania w Hz
%
% Wyjście:
% W - macierz filtrów przestrzennych (kanały × kanały), filtry w kolumnach
% Lambda - macierz diagonalna wartości własnych
[numberOfTrials, numberOfChannels, numberOfSamples] = size(signal);
%% KROK 1: Zbuduj macierz referencyjną S (sinusy i cosinusy harmonicznych)
% S ma wymiary: próbki × 2*numberOfHarmonics
% Każda kolumna to jeden wersor (unormowany sinus lub cosinus).
% Wróć do sekcji Teoria powyżej i przełóż tamten kod na tę funkcję.
% TUTAJ
%% KROK 2: Oblicz średnie macierze kowariancji C_SSEP i C_Y
% Dla każdego powtórzenia wytnij sygnał x (kanały × próbki),
% rozłóż go na składową SSEP i resztę Y zgodnie z równaniami z sekcji Teoria,
% oblicz macierze kowariancji obu składowych, znormalizuj przez ślad
% i uśrednij po powtórzeniach.
C_SSEP = zeros(numberOfChannels, numberOfChannels);
C_Y = zeros(numberOfChannels, numberOfChannels);
for trial = 1:numberOfTrials
x = squeeze(signal(trial, :, :)); % kanały × próbki
% TUTAJ: oblicz SSEP i Y
% TUTAJ: oblicz kowariancje, znormalizuj, dodaj do C_SSEP i C_Y
end
% TUTAJ: podziel C_SSEP i C_Y przez numberOfTrials
%% KROK 3: Rozwiąż uogólnione zagadnienie własne
% Znajdź filtry przestrzenne maksymalizujące stosunek mocy SSEP do mocy Y.
% Analogia z CSP: jakie macierze wstawiłeś do eig() tam?
% TUTAJ: [W, Lambda] = ...
end
- Wskazówka do interpretacji wyników
Filtr związany z największą wartością własną daje komponent o największym stosunku mocy SSEP do mocy tła. Sprawdź na widmach Welcha czy odpowiada on składowej z wyraźnym pikiem przy częstości stymulacji.
function [W, Lambda] = cosSinCSP(signal, stimulationFrequency, numberOfHarmonics, Fs)
[numberOfTrials, numberOfChannels, numberOfSamples] = size(signal);
%% KROK 1: Macierz referencyjna S
t = (0:1:numberOfSamples-1) / Fs;
S_ref = zeros(numberOfSamples, 2*numberOfHarmonics);
for harmonicNumber = 1:numberOfHarmonics
c = cos(2*pi*stimulationFrequency*harmonicNumber*t);
s = sin(2*pi*stimulationFrequency*harmonicNumber*t);
S_ref(:,(harmonicNumber-1)*2 + 1) = c/norm(c);
S_ref(:,(harmonicNumber-1)*2 + 2) = s/norm(s);
end
%% KROK 2: Średnie macierze kowariancji
C_SSEP = zeros(numberOfChannels, numberOfChannels);
C_Y = zeros(numberOfChannels, numberOfChannels);
for trial = 1:numberOfTrials
x = squeeze(signal(trial, :, :)); % kanały × próbki
A = x * S_ref; % projekcja na przestrzeń SSEP
SSEP = A * S_ref'; % rekonstrukcja składowej SSEP
Y = x - SSEP; % reszta
tmp = cov(SSEP');
C_SSEP = C_SSEP + tmp/trace(tmp);
tmp = cov(Y');
C_Y = C_Y + tmp/trace(tmp);
end
C_SSEP = C_SSEP / numberOfTrials;
C_Y = C_Y / numberOfTrials;
%% KROK 3: Uogólnione zagadnienie własne
[W, Lambda] = eig(C_SSEP, C_Y);
end
Skrypt demonstracyjny i analiza wyników
% wczytujemy dane
load('PrzykladoweDaneSSVEP.mat');
[numberOfTrials numberOfChannels numberOfSamples] = size(X.data);
namesOfChannels = X.channels;
numberOfHarmonics = 3;
signal = X.data; % powtórzenie × kanał × próbki
[W, Lambda] = cosSinCSP(signal, X.stimulation, numberOfHarmonics, X.sampling);
%% Odtworzenie sygnałów źródłowych
S = zeros(size(signal));
for powt = 1:size(signal,1)
S(powt,:,:) = W' * squeeze(signal(powt,:,:));
end
%% Widma Welcha: kanały oryginalne vs źródła CSP
figure('Name', ['Stymulacja: ', num2str(X.stimulation), ' Hz'])
for i = 1:numberOfChannels
subplot(2, numberOfChannels, i)
PP = 0;
for rep = 1:numberOfTrials
x = squeeze(signal(rep,i,:));
[Pxx, ff] = pwelch(x, X.sampling, 1, X.sampling, X.sampling);
PP = PP + Pxx;
end
plot(ff(ff<60), PP(ff<60))
title(namesOfChannels{i})
subplot(2, numberOfChannels, numberOfChannels+i)
PP = 0;
for rep = 1:numberOfTrials
s = squeeze(S(rep,i,:));
[Pss, ff] = pwelch(s, X.sampling, 1, X.sampling, X.sampling);
PP = PP + Pss;
end
plot(ff(ff<60), PP(ff<60))
title(['źródło CSP: ', num2str(i)])
xlabel(['\lambda = ', num2str(Lambda(i,i), '%.2f')])
end
%% KROK 4: Mapki topograficzne
% Zidentyfikuj komponent z największą wartością własną.
% Narysuj dwie mapki przy użyciu funkcji topoplot() z pakietu EEGLAB:
%
% (a) Filtr przestrzenny: wagi z jakimi kanały EEG składają się na ten komponent.
% Wskazówka: filtr to kolumna macierzy W.
%
% (b) Topografia źródła: z jakimi wagami komponent dociera do poszczególnych elektrod.
% Wskazówka: topografia zawarta jest w wierszach macierzy odwrotnej do W —
% przypomnij sobie analogiczny krok z analizy CSP dla P300.
%
% Czym różnią się te dwie mapki? Którą łatwiej interpretować fizjologicznie?
% TUTAJ: [~, idx] = max(diag(Lambda));
% TUTAJ: topoplot(...) % filtr
% TUTAJ: topoplot(...) % topografia
Sesja 5: ICA — teoria i wydobywanie interesującego komponentu
- Czas
- ~150 min (jedno spotkanie)
Sesja wprowadza analizę składowych niezależnych (ICA) jako trzecie podejście do problemu ślepej separacji źródeł — obok BSS/CSP i cosSinCSP. Kluczowa różnica: CSP szuka kierunków maksymalizujących kontrast wariancji między warunkami (kryterium drugiego rzędu), ICA szuka składowych niezależnych statystycznie, maksymalizując niegaussowość (kryterium wyższego rzędu). ICA nie wymaga dwóch warunków eksperymentalnych — działa na jednym stacjonarnym sygnale.
- Zakres wykładu (~40 min)
- model generatywny ICA: [math]\mathbf{x} = \mathbf{D}\mathbf{s}[/math], założenie niegaussowości składowych
- negoentropia i algorytm FastICA
- porównanie z CSP: kiedy ICA, kiedy CSP
- ograniczenia: liczba próbek a liczba kanałów ([math]kN^2[/math]), niejednoznaczność kolejności i skali komponentów
- Zakres ćwiczenia (~80 min)
- wczytanie danych do EEGLAB, edycja lokalizacji elektrod
- filtrowanie górnoprzepustowe (FIR, 0,5 Hz), zmiana referencji
- obliczenie ICA na całym sygnale
- identyfikacja komponentów zawierających rytm alfa: topografia, widmo, przebieg czasowy
- usunięcie komponentów niezawierających alfy, odtworzenie sygnału na elektrodach
- porównanie wyników między co najmniej trzema uruchomieniami ICA: czy komponenty są powtarzalne?
- Materiały
Zob. ICA jako filtr przestrzenny i Wydobywanie interesujących komponentów poniżej.
ICA jako filtr przestrzenny
Definicja
Independent Component Analysis (ICA) jest metodą statystycznej analizy sygnałów, która dokonuje dekompozycji wielokanałowych zapisów na składowe niezależne w sensie statystycznym. Dwie składowe s1 i s2 są niezależne jeżeli wiedza o wartości s1 nie daje żadnych informacji o możliwych wartościach s2. ICA może być wyrażona przez prosty model generatywny:
- x = Ds
- gdzie x = {x1, x2, ..., xn} jest zmierzonym n kanałowym sygnałem, D jest macierzą mieszającą zaś s = {s1, s2, ..., sn} jest aktywnością n źródeł. Podstawowym założeniem dotyczącym s jest to, że si są statystycznie niezależne. Aby wyestymować model musimy też założyć, że składowe mają niegaussowskie rozkłady wartości (Hyvärinen, 2000).
Dodatkowo model ten zakłada następujące fakty:
- Sygnał jest liniową mieszaniną aktywności źródeł
- Sygnały pochodzące z każdego ze źródeł są niezależne od pozostałych
- Źródła oraz proces ich mieszania są stacjonarne, tzn, ich momenty statystyczne nie zależą od czasu
- Energie (wariancje) źródeł nie mogą być wyznaczone jednoznacznie. Dzieje się tak ponieważ pomnożenie amplitudy i-tego źródła może być uzyskane poprzez przemnożenie albo si albo przez przemnożenie i-tej kolumny macierzy D. Naturalnym rozwiązaniem tej niejednoznaczności jest wprowadzenie konwencji, że komponenty są normowane tak aby miały wariancję 1: E[(si)2] = 1.
- Kolejność komponentów jest dowolna. Bo jeśli w ten sam sposób zmienimy kolejność komponentów w s i kolumn w D to dostaniemy dokładnie ten sam sygnał x.
Głównym wyzwaniem w analizie ICA jest estymacja macierzy mieszającej D. Gdy jest ona znana to komponenty mogą być wyliczone w następujący sposób:
- s = D−1x
Estymacja
Znalezienie niezależnych komponentów może być rozważane w świetle Centralnego Twierdzenia Granicznego jako poszukiwanie komponentów o możliwie nie gaussowskim rozkładzie. Aby zrozumieć to podejście prześledźmy heurystykę zaproponowaną przez (Hyvärinen, 2000). Dla prostoty załóżmy, że poszukiwane źródła niezależne mają identyczne rozkłady. Zdefiniujmy
y = wTx.
Zauważmy, że jeśli
w
jest jedną z kolumn macierzy
D−1,
to y jest jednym z poszukiwanych komponentów. Zamieniając zmienne
z = DTw
możemy napisać
y = wTx = wTDs = zTs.
Uwidacznia to fakt, że y jest liniową kombinacją składowych si z wagami danymi przez zi.
Z centralnego twierdzenia granicznego wynika, że suma niezależnych zmiennych losowych ma bardziej gaussowski charakter niż każda z tych zmiennych osobno. Liniowa kombinacja staje się najmniej gaussowska gdy z ma tylko jeden element niezerowy. W tym przypadku y jest proporcjonalny do si. Zatem problem estymacji modelu ICA może być sformułowany jako problem znalezienia takiego wektora w, który maksymalizuje niegaussowskość
y = wTx.
Maksymalizacja niegaussowskości y daje jeden niezależny komponent odpowiadający jednemu z 2n maksimów (bo mamy si i −si) w krajobrazie optymalizacyjnym. Aby znaleźć wszystkie niezależne komponenty musimy znaleźć wszystkie maksima. Ponieważ komponenty są nieskorelowane, to poszukiwania kolejnych komponentów można kontynuować w podprzestrzeni ortogonalnej do już znalezionych komponentów.
Obliczenia
Intuicyjna heurystyka poszukiwania najbardziej niegaussowskich składowych może być użyta do wyprowadzenia różnych funkcji kosztu, których optymalizacja daje model ICA, np. kurtoza.
[math]kurt(y) = E\{y^4\} - 3(E{y^2})^2[/math]
Inną miarą gassowskości jest neg-entropia, którą można wyprowadzić z entropii: Entropia jest miarą średniego zdziwienia wynikiem obserwacji zmiennej losowej: [math]H(Y) = - \sum_i P(Y= a_i) \log(P(Y=a_i)) [/math]
Negentropia jest zdefiniowana:
[math] J(y) = H(y_{gauss}) -H(y)[/math] gdzie [math] y_{gauss} [/math] jest gassuwską zmienną losową o takiej samej kowaiancji jak [math] y [/math].
Negentropia jest skomplikowana obliczeniow, więc w praktyce używana jest formuła przybliżona:
[math] J(y) \varpropto [E\{G (y)\} - E\{G(\nu)\}][/math]
[math]\nu [/math] jest zmienną losową ze standardowego rozkładu normalnego , a G są pewnymi niekwadratowymi funkcjami.
W algorytmie FastICA extremum negentropii jest znajdowane w procedurze bazującej na optymalizacji Netwona. (szczegóły np.: sekcja 6 w https://www.cs.helsinki.fi/u/ahyvarin/papers/NN00new.pdf)
Procedura wykorzystywana w eeglabie („runica”, Makeig 1996) dąży do minimalizacji informacji wzajemnej. Oba podejścia są w przybliżeniu równoważne (Hyvärinen, 2000), chociaż owo przybliżenie dla sygnałów elektrofizjologicznych nie zostało to jeszcze w pełni wyeksplorowane.
Dla sygnałów o niskiej wymiarowości i spełniających dokładnie założenia ICA wszystkie powszechnie wykorzystywane algorytmy dają niemal identyczne wyniki.
- Bardzo ważna uwaga
- ogólną zasadą jest, że jeśli estymujemy N stabilnych komponentów (z N-kanałowych danych) to musimy dysponować kN2 punktami danych w każdym kanale, gdzie N2 jest liczbą elementów w macierzy D, którą ICA próbuje wyestymować, k jest liczbą całkowitą. Nie ma dobrych oszacowań teoretycznych na wielkość k, z praktycznych obserwacji wynika, że rośnie ona z liczbą kanałów.
Możliwe zastosowania
Najczęściej ICA jest stosowana jako narzędzie do:
- usuwania artefaktów z sygnałów EEG (ruchy oczu i mięśnie)
- wydobywania składowych do dalszej analizy (Onton, 2006)
- jako analiza wstępna do lokalizacji źródeł (Grau, 2007).
- ICA jest także stosowana w analize sygnałów EKG i EMG.
Bibliografia
Bazowa praca:
- A. Hyvärinen. Fast and Robust Fixed-Point Algorithms for Independent Component Analysis. IEEE Transactions on Neural Networks 10(3):626-634, 1999 http://www.cs.helsinki.fi/u/ahyvarin/papers/TNN99_reprint.pdf
Nieco prościej opisana wersja z przykładami:
- Hyvärinen, A. and Oja, E. (2000). Independent component analysis: Algorithms and applications. Neural Networks, 13(4-5):411–430.
https://www.cs.helsinki.fi/u/ahyvarin/papers/NN00new.pdf
- Grau, C., Fuentemilla, L., Marco-Pallars, J. (2007). Functional neural dynamics underlying auditory event-related n1 and n1 suppression response. Neuroimage, 36(6):522–31.
- Makeig, S., Bell, A., Jung, T.-P., Sejnowski,T. (1996). Independent component analysis of electroencephalographic data. W: Touretzky, D., Mozer, M., and Hasselmo, M., editors, Advances in Neural Information Processing Systems, volume 8, pages 145–151. MIT Press, Cambridge, MA.
- Onton, J., Makeig, S. (2006). Information-based modeling of event-related brain dynamics. Prog Brain Res., 159:99–120.
- Tutorial: http://sccn.ucsd.edu/wiki/Chapter_09:_Decomposing_Data_Using_ICA
- http://sccn.ucsd.edu/~arno/indexica.html
- http://cis.legacy.ics.tkk.fi/aapo/papers/IJCNN99_tutorialweb/
ZADANIE: Wydobywanie interesujących komponentów
Dane do tej części ćwiczeń proszę pobrać i rozpakować w swoim katalogu: http://www.fuw.edu.pl/~jarekz/LabEEG/Dane_do_ICA_alfa.tar.gz
Pochodzą one z eksperymentu, w którym osoba badana siedziała z zamkniętymi oczami słuchając nagrania czytanego spokojnym głosem. Metadane opisujące sygnał znajdują się w pliku Miro.xml, zaś lokalizacje elektrod w pliku Miro-10-20-Cap.locs.
Proszę:
- wczytać dane do eeglaba
- wyedytować lokalizację elektrod
- usunąć kanały nie zawierające EEG
- zmienić referencje na średnią z kanałów A1 i A2
- przefiltrować filtrem FIR górnoprzepustowym z częstością odcięcia 0,5 Hz
- obejrzeć wstępnie przygotowane dane
- policzyć ICA na całym sygnale
- obejrzeć właściwości otrzymanych komponentów
- Czy są wśród nich takie, które zawierają znaczny udział rytmu alfa?
- Jaka jest ich topografia?
- usunąć wszystkie komponenty nie zawierające alfy
- odtworzyć z tych komponentów sygnał na elektrodach
- wykonać dekompozycję ICA kilkukrotnie (co najmniej 3) i porównać wyniki
- Czy uzyskiwane komponenty są powtarzalne?
- Swoje wyniki porównać też z sąsiednimi grupami.
Sesja 6: ICA — artefakty i synteza metod
- Czas
- ~150 min (jedno spotkanie)
Pierwsza część sesji poświęcona jest praktycznemu zastosowaniu ICA do usuwania artefaktów z danych EEG przy użyciu automatycznych klasyfikatorów komponentów (ICLabel, MARA). Druga część syntetyzuje całość materiału z bloku filtrów przestrzennych: BSS/CSP, cosSinCSP i ICA są trzema odpowiedziami na ten sam ogólny problem separacji źródeł, różniącymi się założeniami i kryterium optymalizacji.
- Zakres ćwiczenia — artefakty (~75 min)
- wczytanie danych Arousal do EEGLAB, usunięcie kanałów nieEEG
- obliczenie ICA, przegląd topografii komponentów
- identyfikacja artefaktów ocznych i mięśniowych
przy użyciu wtyczek ICLabel i MARA
- porównanie sygnału przed i po usunięciu komponentów artefaktowych
- Zakres syntezy (~45 min)
- tabela porównawcza CSP / cosSinCSP / ICA:
założenia, dane wejściowe, kryterium optymalizacji, kiedy stosować
- związek filtrów przestrzennych z architekturami sieci neuronowych:
warstwa depthwise conv w ShallowConvNet i EEGNet jako wyuczony odpowiednik macierzy W z CSP — szczegóły w CSP a sieci neuronowe poniżej
- omówienie raportów, pytania
- Materiały
Zob. Identyfikacja artefaktów poniżej.
ZADANIE: Identyfikacja artefaktów
Proszę pobrać dane:
- http://www.fuw.edu.pl/~jarekz/LabEEG/Arousal-10-20-Cap.locs
- http://www.fuw.edu.pl/~jarekz/LabEEG/Arousal1.set
- http://www.fuw.edu.pl/~jarekz/LabEEG/Arousal1.fdt
Pochodzą one z eksperymentu w którym osoba badana czytała słowa o różnych właściwościach wzbudzania emocji.
- wczytaj je do eeglaba
- wczytaj lokalizację kanałów z pliku Arousal-10-20-Cap.locs
- obejrzyj przebiegi czasowe
- odrzuć kanał z diodą (21) i z GSR (20)
- zrób dekompozycję ICA
- obejrzyj topografię komponentów
- zidentyfikuj komponenty odpowiadające mruganiu i aktywności mięśniowej.
- UWAGA
- Aktualnie do wykrywania komponentów artefaktowych warto posłużyć się wtyczkami do eeglaba dostępnymi przez stronę:
https://sccn.ucsd.edu/eeglab/plugin_uploader/plugin_list_all.php
- ICLabel
- MARA
W raporcie:
- zaprezentuj fragmenty sygnału zawierającego artefakty oczne i mięśniowe przed i po zastosowaniu czyszczenia poprzez usuwanie komponentów zdominowanych przez artefakty.
- zaprezentuj topografię i przebiegi czasowe komponentów zidentyfikowanych jako artefakty oczne i mięśniowe.
-->