1. Modele opisu efektywności hybrydyzacji
1.1. Wstęp Praca ta została zainspirowana pracą [1] autorstwa Doeke Hekstra, Alexandra Taussiga, Marcelo Magnasco oraz Felixa Naefa. W pracy tej opisany jest model Langmuira, oraz jego zastosowanie w estymacji stężenia pikomolarnego transkryptów mRNA w badaniach mikromacierzy typu U95 firmy Affymetrix. W badaniach nad tym modelem okazało się, iż nie jest on zbyt dobrze dopasowany do danych kalibracyjnych przygotowanych przez firmę Affymetrix.
Zrodziło to potrzebę zaproponowania modelu, który dokładniej opisywałby zależności pomiędzy stężeniem transkryptów a intensywnością świecenia poszczególnych komórek mikromacierzy. Poniższa praca opisuje taki model wraz z uzasadnieniem przewagi nad modelem Langmuira. Kryterium do porównania obu modeli jest ocena błędu predykcji rzeczywistego stężenia na podstawie obserwowanej intensywności świecenia.
1.2. Kilka słów o mikromacierzach.
Mikromacierze są techniką pozwalającą na mierzenie ekspresji dziesiątek tysięcy genów w komórce jednocześnie. Ze względu jednak na sposób działania informację o poziomie ekspresji danego genu jest zależna od składu nukleodytowego danego genu. Przez to nie jest możliwe bezpośrednie porównanie poziomów ekspresji różnych genów, możliwe jest jedynie porównanie poziomów ekspresji tego samego genu w różnych eksperymentach.
Informacją o poziomie ekspresji genu w komórce jest jasność świecenia zhybrydyzowanych komplementarnych transkryptów danego genu. Im więcej genu jest obecne w komórce, tym więcej go hybrydyzuje z mikromacierzą i przez to widoczny będzie bardziej intensywny sygnał świetlny [2].
W pracy [1] zaproponowano opis zależności pomiędzy stężeniem a intensywnością świecenia i składem zasadowym sond. Taka zależność pozwala na wyznaczenie bezwzględnego stężenia transkryptów mRNA w komórce, oraz na porównywanie tego stężenia pomiędzy różnymi genami. Informacja na temat liczby transkryptów danego genu w komórce jest bardzo istotna i daje duże możliwości wykorzystania.
1.3. Model LangmuiraW pracy [1] zaproponowano następującą zależność pomiędzy intensywnością a stężeniem pikomolarnym.
Gdzie i to indeks transkryptu, j numer sondy dla transkryptu i, to intensywność świecenia sondy o numerze j transkryptu i, to stężenie transkryptu i-tego. Współczynniki

to nieznane stałe specyficzne dla każdej sondy. Współczynniki te mają określoną interpretacje fizyczną. Współczynnik a określa jak liczba zhybrydyzowanych z mikromacierzą transkryptów wpływa na jasność świecenia danej komórki. Współczynnik b to stężenie pikomolarne transkryptów genu i potrzebne aby sonda j została połowicznie wysycona. Współczynnik d to sygnał świetlny biorący się z niespecyficznej hybrydyzacji innych transkryptów. Dodatkowo współczynniki

od składu chemicznego sondy zależą w następujący sposób.
Gdzie

to liczba zasad typu A, G i C w rozpatrywanej sondzie. Współczynniki

i C to nieznane parametry wspólne dla wszystkich sond, które należy oszacować na podstawie danych kalibracyjnych.
Wadą tego modelu jest niestabilna estymacja współczynników

gdy zależność pomiędzy stężeniem i intensywnością przypomina zależność liniową. W przeprowadzonych badaniach 50% obiektów ze zbioru kalibracyjnego wykazywało tendencje do liniowej zależności intensywności świecenia do stężenia transkryptu (w obserwowanym zakresie zmienności stężenia), przez co dla wielu sond estymatory współczynników

były silnie obciążone. Spowodowało to obciążenie estymatora intensywności. Aby zniwelować ten problem zaproponowaliśmy inny model określany na potrzeby tej pracy modelem wykładniczym.
1.4. Model Wykładniczy Na podstawie obserwacji zachowania intensywności jako funkcji stężenia transkryptów w komórce zaproponowano następujący model.
Indeksy poszczególnych współczynników mają takie samo znaczenie jak w przypadku modelu Langmuira, jednak zależność współczynników

od składu chemicznego sond jest opisana poniższym wzorem.
Oczywiście współczynniki i C to nieznane parametry, które należy wyestymować, są to inne współczynniki niż w przypadku modelu Langmuira. Wielkości

to liczby zasad typu A, G i C w rozpatrywanej sondzie.
Model wykładniczy dużo lepiej dopasował się do danych kalibracyjnych, porównanie tych dopasowań zostanie umieszczone w kolejnym rozdziale.
W przypadku modelu Langmuira współczynniki

posiadały określoną interpretację fizyczną, dla modelu wykładniczego interpretacja tych współczynników już nie jest taka oczywista.