BioSapiens
Celem BioSapines jest głębsze poznanie informacji zakodowanej w genomie
ludzkim za pomocą nowoczesnych metod bioinformatycznych oraz danych
eksperymentalnych. Sieć stworzy Europejski Wirtualny Instytut Adnotacji
Gnomów. Partnerzy sieci będą zaangażowani w poprawę jakości badań
bioinformatycznych w Europie poprzez skoncentrowany wysiłek, unikanie
duplikowania czynności badawczych, wspólne spotkania, warsztaty i
konferencje oraz skoordynowaną pracę badawczą. Ważnym aspektem programu
jest wzmożenie współpracy między jednostkami obliczeniowymi i
eksperymentalnymi poprzez ukierunkowany program analizy genomu
skoncentrowany na istotnych problemach biologicznych. Adnotacje i
Analizy stworzone przez sieć będą opublikowane i udostępnione w formie
serwisów internetowych. Do tego celu zostanie wykorzystany system
rozproszonej adnotacji (distributed annotation system DAS), który
wykorzysta nowe osiągnięcia w zakresie „grid’ów” obliczeniowych. Celem
sieci jest również stworzenie Europejskiej Szkoły Bioinformatyki. Celem
szkoły jest edukacja bioinformatyków, którzy byliby w stanie wprowadzić
najwyższe standardy w eksploatacji i wykorzystaniu informacji
genetycznej organizmów. Szkoła będzie prowadzić kursy na wszystkich
szczeblach i będzie otwarta dla wszystkich chętnych. Europejscy naukowcy
są tradycyjnie bardzo aktywną grupą działającą w dziedzinie adnotacji
genów i białek a Ensembl i SWISS-PROT (teraz UniProt) są najważniejszymi
źródła informacji z tej branży używanymi na całym świecie. Wiele metod
używanych przy adnotacji gnomów, sekwencji i struktur genów i białek
oraz do analizy szlaków metabolicznych i sygnałowych zostało stworzonych
w Europie. Sieć BioSapiens będzie dalej podwyższać kompetencje i
konkurencyjność Europy poprzez nowe odkrycia, wzmożoną integrację,
edukację oraz polepszenie i usprawnienie metod obliczeniowych. Sieć
zwiększy rolę Europy w eksploatacji informacji genetycznej. Głównym
celem integracji polskiej jednostki w Sieć doskonałości było
umożliwienie wykorzystania ekspertyzy i unikalnych metod przewidywania
struktury białek opracowanych przez Instytut BioInfoBank. Budżet całego
projektu to 12 milionów Euro. Projekt realizuje następujące obszary
priorytetowe: 1) zdrowie i życie, 2) technologie informacyjne.
(http://www.ebi.ac.uk/biosapiens/)
GeneFun
Odszyfrowanie informacji zawartej w sekwencjach genomowych, rozumiane
jako poznanie funkcji genów i białek stanowi wielkie wyzwanie ery
post-genomowej. Obecnie gros przyporządkowań funkcji do nowo
zsekwencjonowanych genomów, uzyskuje się przy użyciu bioinformatycznych
narzędzi, przewidujących funkcję genu na podstawie podobieństwa jego
sekwencji do [sekwencji] innych genów o znanej funkcji. Uznanym faktem
jest, iż te pierwotne, bazujące na podobieństwie sekwencji, procedury
przyporządkowania funkcji są częstokroć niedokładne i podatne na błędy.
Dalsze ich stosowanie bez jasnego i jawnego określenia granicy ich
użyteczności prowadziłoby do nienaprawialnej propagacji błędów, która
mogłaby zagrozić postępowi wiedzy biologicznej. Z drugiej strony, stają
się dostępne różnorakie nowe zbiory danych i zasobów [do ich analizy].
Dostarczają one informacji kontekstowej o biologicznej funkcji genów,
głównie o fizycznych i funkcjonalnych interakcjach pomiędzy genami i
białkami, jak również o całych procesach i sieciach [regulacyjnych].
Równolegle funkcjonujące światowe inicjatywy w dziedzinie genomiki
strukturalnej, dostarczają o wiele lepszego obrazu motywów
strukturalnych przyjmowanych przez białka, oraz interakcji pomiędzy
nimi. Dostępność tych dodatkowych i nowych danych tworzy nie mającą
precedensu okazję do stworzenia metod dla inkorporacji danych
funkcjonalnych wyższego poziomu w ramy procesu adnotowania sekwencji [annotation
pipeline]. Celem projektu GENEFUN jest odpowiedź na dwa wyżej wspomniane
zagadnienia. Czynnik błędów w adnotacji sekwencji zostanie opanowany
przez rozwój kryteriów oceny wiarygodności adnotacji obecnie dostępnych
w bazach danych. Kryteria te zostaną wykorzystane do przydzielenia
współczynników wiarygodności i włączone w przyszłe, ustandaryzowane
procesy adnotacji sekwencji. W kwestii inkorporacji adnotacji wyższego
poziomu w adnotacje funkcjonalne, zostaną połączone informacja o
strukturze i sekwencji w celu identyfikacji nie-liniowych cech sekwencji
(np. miejsc interakcji). Podobnie zintegrowane zostaną dostępne i nowo
utworzone metody przewidywania funkcji na podstawie informacji
kontekstowej i wyższego poziomu (architektura domenowa białek,
interakcje białko-białko, kontekst genomowy jak np. uszeregowanie
genów). Aby osiągnąć te cele kilka europejskich grup z dużym
doświadczeniem w tworzeniu nowych metod i prowadzeniu analiz w zakresie
genomiki porównawczej, bioinformatyki zorientowanej na strukturę i
systemy, oraz w informatyce, podjęło współpracę z grupą
eksperymentatorów z Kanady, znaną ze swych wybitnych osiągnięć na polu
strukturalnej i funkcjonalnej genomiki. Oczekiwane wyniki projektu
GENEFUN to: ulepszone procedury przewidywania funkcji na bazie
podobieństwa sekwencji, zbiór procedur do przewidywania (w
zautomatyzowany sposób) nie-liniowych cech funkcjonalnych na podstawie
sekwencji i struktury 3D, oraz przetestowane pod względem efektywności
procedury predykcji cech funkcjonalnych związanych z kontekstem. Duży
nacisk zostanie położony na stworzenie protokołów postępowania
łączących, w optymalny sposób, wyniki [analiz przy użyciu] większej
liczby metod. W szczególności, zostaną stworzone i udostępnione
społeczności naukowej serwery sieciowe, zarówno oparte na pojedynczych
procedurach jak i ich zestawach. Narzędzia te będą popularyzowane w
społeczności naukowej na drodze otwartych warsztatów i sesji
treningowych. Rozwinięte narzędzia powinny stanowić ważki wkład w dzieło
poprawy adnotacji in silico funkcji genów, a co za tym idzie wywrzeć
istotny efekt na cały sektor biotechnologiczny, w znacznym stopniu
bazujący na wspomnianych adnotacjach. Projekt realizuje następujące
obszary priorytetowe: 1) zdrowie i życie, 2) ekologia, 3) technologie
informacyjne.
DataGenom
Chiralność jest kluczowym czynnikiem efektywności wielu leków, co
powoduje, że coraz ważniejsza staje się produkcja poszczególnych
enancjomerów związków chiralnych. Kataliza enzymatyczna w
przeciwieństwie do syntezy chemicznej oferuje wysoką enancjoselektywność
i regioselektywność w syntezie związków chiralnych. Dane molekularne są
niebywałym źródłem enzymów do bio-katalizy. W celu pełnego wykorzystania
potencjału tego źródła konieczne jest opracowanie nowych efektywnych
metod ich pozyskiwania. Projekt DataGenome skupia się na wyszukiwaniu
nowych enzymów z publicznych i komercyjnych genomów bakteryjnych (w
szczególności nowych dehydrogenaz alkoholowych i monooksygenaz), oraz
identyfikowania kluczowych aminokwasów w celu opracowania innowacyjnych
procesów syntezy asymetrycznej. Projekt wykorzystuje analizę genomową,
klonowanie, ekspresję, produkcję enzymów i inżynierię białkową do
enzymatycznej produkcji związków chiralnych. Projekt wykorzystuje dużą
ilość danych wyjściowych w celu przeszukania jak największej ilości
genów uzyskując w ten sposób wysoką wydajność w wyborze enzymów będących
najlepszymi kandydatami. Unikalne połączenie ekspertyzy i planowania
badań umożliwi wysoką skuteczność udoskonalania nowych biokatalizatorów.
Szczególny nacisk zostanie położony na efektywną analizę
bioinformatyczną by zminimalizować wykorzystanie bardziej wymagającej
„mokrej” analizy laboratoryjnej, a także rozwoju zoptymalizowanych
wektorów ekspresyjnych w celu efektywnej ekspresji genów i produkcji
enzymów. Racjonalna inżynieria białek oraz ukierunkowana ewolucja
molekularna zostanie wykorzystana w celu otrzymania efektywniejszych
enzymów, nowych preferencji substratowych lub rozszerzonej selektywności
w kierunku określonych enancjomerów. Wybrane enzymy zostaną
przetestowane w istniejących lub nowych procesach bio-katalitycznych w
celu produkcji związków chiralnych o zastosowaniu terapeutycznym w
leczeniu schorzeń takich jak AIDS, nowotwory, czy choroba Alzheimera.
Głównym wkładem jednostki polskiej bioinformatycznej jest opracowanie i
zastosowanie nowych metod do przewidywania specyficzności substratowej
enzymów. Projekt realizuje następujące obszary priorytetowe: 1) nowe
materiały, 2) ekologia, 3) technologie informacyjne.
SEPSDA
Posiadanie specyficznych i efektywnych przeciwwirusowych lekarstwa oraz
nowoczesnych narzędzi diagnostycznych jest konieczne do walki z ludzkim
koronawirusem wywołującym nietypowe zapalenie płuc (ang. Severe Acute
Respiratory Syndrome, SARS). Chińsko-Europejski projekt dotyczący
przeciwwirusowego leczenia oraz diagnozowania choroby SARS (ang. The
Sino-European Project on SARS Diagnostics and Antivirals, SEPSDA) jest
zintegrowanym przedsięwzięciem stosującym nowoczesną biotechnologię, w
celu stworzenia potencjalnych przeciwwirusowych lekarstw i opracowania
udoskonalonych metod diagnostycznych. Projekt SEPSDA połączył siły i
umiejętności wiodących naukowców z Niemiec, Danii, Polski i Chin, którzy
prowadząc badania nad SARS uzyskali znakomite, opublikowane osiągnięcia
w dziedzinie biologii molekularnej, a dotyczące ludzkiego koronawirusa.
Kilka z opracowanych związków o potencjalnych właściwościach
leczniczych, jak również pierwszy, oparty na przeciwciałach zestaw do
diagnozowania choroby SARS zostały stworzone przez członków projektu
SEPSDA. Cztery spośród uczestniczących w projekcie laboratoriów to
największe, czołowe, chińskie pracownie, które wniosły unikatowe próbki
pochodzące od chińskich pacjentów na różnych etapach choroby.
Serologiczne badania z pewnością doprowadzą do udoskonalenia metod
diagnostycznych. Analiza genów koronawirusa na poziomie nukleotydowym
oraz aminokwasowym za pomocą sekwencyjnych i zaawansowanych narzędzi
bioinformatycznych oznaczy genetyczną zmienność wirusa. Bioinformatyczne
badania wyselekcjonują również nowe białka wirusa, których zablokowanie
może dać pozytywne efekty w leczeniu przeciwwirusowym. W projekcie
SEPSDA postawiono sobie za cel określenie trójwymiarowej struktury
wszystkich rozpuszczalnych białek lub całych ich domen. To
strukturalno-genomowe podejście dostarczy podstaw do wirtualnego
przesiewania dużych baz danych małych związków w celu odnalezienia
substancji o potencjalnych właściwościach wpływania na funkcje białek
wirusa lub białek komórek gospodarza, które z nimi współdziałają.
Wykorzystane w realizacji projektu bazy danych zawierają między innymi
struktury związków chemicznych używanych w tradycyjnej chińskiej
medycynie. Wyselekcjonowani kandydaci na aktywne inhibitory zostaną
przetestowani na liniach komórkowych, a następnie udoskonaleni
chemicznie. Związki te po opatentowaniu zostaną zaoferowane utworzonej w
przyszłości platformie przemysłowej zajmującej się chorobą SARS.
Platforma ta powinna spowodować utworzeniem trwałej współpracy pomiędzy
konsorcjum SEPSDA i przemysłem farmaceutycznym. Projekt realizuje
następujące obszary priorytetowe: 1) nowe materiały, 2) zdrowie i życie,
3) technologie informacyjne.
MicrobeArray
W ostatnich latach poznano sekwencje wielu genomów mikroorganizmów
zaangażowanych w rozwój chorób o dużym znaczeniu dla zdrowia
publicznego. Wraz z poznaniem całego zestawu genów danego organizmu
możliwe stają się analizy wszystkich białek (proteomu) danego
mikroorganizmu chorobotwórczego. W ostatniej dekadzie rozwinięto także
technologie służące do wysokowydajnej produkcji znacznych ilości
izolowanych i rekombinowanych białek. Dodatkowo wraz z rozwojem analiz z
wykorzystaniem mikromacierzy (ang. microarray) powstały, zwalidowane już
dziś klinicznie, metody służące do wykrywania obecności w surowicy
przeciwciał przeciwko antygenom określonych patogenów. Odkrycia te dają
możliwość badania naturalnej odpowiedzi immunologicznej przeciwko całym
proteomom różnych mikroorganizmów. Połączenie informacji dotyczących
genomu z narzędziami biologii molekularnej i immunologii pozwalają pomóc
w identyfikacji tych antygenów, które mogą być użyte w diagnostyce
serologicznej zakażeń i immunizacji (szczepienia ochronne). Podczas
realizacji projektu MicrobeArray planowany jest rozwój narzędzi do
identyfikacji mikrorganizmów o dużym znaczeniu medycznym – zarówno z
powodu trudności w identyfikacji zakażeń przy użyciu tradycyjnych metod
mikrobiologii lekarskiej, jak i znacznych różnic w postępowaniu
terapeutycznym specyficznym dla danego zakażenia (M. pneumoniae, C.
pneumoniae, L. pneumophila, coronavirus spp and P. falciparum). Antygeny
tych groźnych patogenów otrzymane przy użyciu metod inżynierii
genetycznej, jako rekombinowane białka, lub zestawy nakładających się
syntetycznych peptydów, naniesione będą na mikromacierze. Surowica
pobrana od osób z potwierdzonym przebytym zakażeniem danym patogenem
będzie badana pod kątem interakcji z analizowanymi antygenami w celu
identyfikacji nowych markerów diagnostycznych, czy wysoko immunogennych
białek przydatnych przy wytwarzaniu szczepionek. Ten projekt znacząco
zwiększy zasób własności intelektualnej małych i średnich
przedsiębiorstw i przyczyni się do zwiększenia umiejętności i wiedzy
jednostek badawczych. Planowany w czasie realizacji projektu rozwój
technologii wysoko wydajnej ekspresji białek, oprogramowania
analitycznego, syntezy białek na powierzchni mikromacierzy oraz
czytników mikromacierzy pozwoli na stworzenie unikatowej integralnej
platformy o wysokim potencjale zarówno komercyjnym, jak i naukowym.
Dodatkowo wyniki projektu MicrobeArray mogą pomóc w rozszerzeniu naszej
wiedzy na temat funkcjonowania humoralnej odpowiedzi immunologicznej
człowieka, jego interakcji z ogółem antygenów patogenu – przyczyniając
się w ten sposób do wydajniejszego projektowania rekombinowanych
szczepionek na podstawie dostępnych sekwencji genomowych.
Diatomics
Diatomics jest wieloośrodkowym projektem
realizowanym przez kilkanaście laboratoriów naukowych i wdrożeniowych w
ramach Szóstego Projektu Ramowego Komisji Europejskiej dla zrozumienia
biologii okrzemek za pomocą metod genomiki funkcjonalnej.
Analizowane gatunki roślin jednokomórkowych należą do organizmów
kosmopolitycznych i zamieszkują akweny morskie niemal całego globu. Jako
model do analiz biologii okrzemek został wybrany gatunek Phaeodactylum
tricornutum. Organizm ten posiada kilka cech czyniących go bardzo
interesującym przedmiotem analiz, m.in. w odróżnieniu od innych okrzemek
posiada możliwość rozmnażania płciowego oraz w stosunku do niego
istnieje możliwość stosowania technik transformacji genetycznej.
Poznanie dokładnej biologii P.tricornutum będzie dodatkowo wspomagane
przez informacje zebrane w czasie analizy genomu innego gatunku okrzemek
- Thalassiosira pseudonana.
Projekt skupia się na wykorzystaniu informacji dotyczącej budowy genomów
dwóch tych gatunków okrzemek morskich dla pełniejszego poznania
funkcjonowania roślin. Organizmy te stanowią dużą część biomasy
ekosystemów morskich i są odpowiedzialne za eliminacje znacznej części
dwutlenku węgla z atmosfery Ziemi. Za podstawowe cele obrano dokładną
charakteryzację procesów metabolicznych asymilacji dwutlenku węgla oraz
makroelementów - zwłaszcza azotu i fosforu przez okrzemki. Dodatkowo
projekt skupia się na analizie regulacji cyklu komórkowego okrzemek,
próbując scharakteryzować mechanizmy odpowiedzialne za regulację
występowania tzw. kwitnienia wód. Projekt obejmuje także dokładne
studium ekspresji genów okrzemek w odpowiedzi na zmiany środowiska
naturalnego.
Jako cel poboczny, w ramach projektu Diatomics planowana jest próba
wytworzenia nowych transgenicznych odmian ryżu japońskiego,
zawierających zidentyfikowane w ramach pierwszej części projektu geny
korzystnie wpływające na sprawność fotosyntetyczną okrzemek.
Poprzez wykorzystanie publicznie dostępnych metod analizy sekwencyjnej
oraz własnych technologii z dziedziny bioinformatyki, mających na celu
przygotowanie opisu funkcji poszczególnych białek z kręgu pakietów
tematycznych projektu, umożliwione zostanie racjonalne zaplanowanie
dalszych eksperymentów z użyciem technik biologii molekularnej i
biologii komórki. Dokładna analiza funkcji białek zidentyfikowanych w
genomach analizowanych organizmów pozwoli na postawienie hipotez
roboczych odnośnie odmienności funkcjonowania poszczególnych procesów
biologicznych w okrzemkach względem typowych modeli genetycznych
organizmów roślinnych (rzodkiewnik - A.thaliana, ryż - O.sativa).
Dodatkowo w ramach projektu przewidziana jest systematyczne opracowanie
zagadnienia transporterów błonowych substancji odżywczych do komórek
analizowanych roślin. Problem ten wymaga opracowania metod identyfikacji
specyficzności kanałów przezbłonowych, poprzez wykorzystanie metod
analizy strukturalnej segmentów przezbłonowych i próbę określenia jakie
właściwości musi spełniać jon lub cząsteczka, żeby przedostać się
poprzez dany kanał.
Oprócz analiz poszczególnych rodzin białkowych, w ramach projektu w
dalszym ciągu będą rozwijane narzędzia porównywania rodzin białek,
znajdujące zastosowanie w analizie struktury i funkcji. Dla potrzeb
projektu dokonana zostanie walidacja baz danych sekwencji rodzin białek
specyficznych dla roślin. Dotychczas rozwijane metody były
optymalizowane dla sekwencji bakteryjnych (jako przykład białek głównie
jednodomenowych) oraz sekwencji białek kręgowców (jako model białek
wielodomenowych, typowych dla organizmów wyższych).
ELM
Celem projektu jest
analiza sekwencji białek eukariotycznych oraz poszukiwanie w ich
sekwencjach krótkich motywów funkcjonalnych (ELM’ów). Motywy takie
odgrywają kluczową rolę w procesach zachodzących pomiędzy białkami i są
odpowiedzialne za sygnały przekazywane w ramach dużych sieci
sygnałowych. Poznanie tych motywów umożliwi zrozumienie niektórych
aspektów oddziaływania pomiędzy białkami i pomoże zrozumieć procesy
zachodzące w komórkach eukariotycznych. Pod koniec projektu powstnie
baza danych ELM’ów (liniowych motywów eukariotycznych), która będzie w
sposób ciągły rozszerzona o instancje motywów wraz z odpowiednimi
opisami.
Stworzony czasie projektu filtr „ab-initio” będzie sprawdzał
kompatybilność sekwencji (segmentu białka) z badaną strukturą. Filtr
będzie bazować na liście konformacji fragmentów wyciętych ze struktur
białkowych. Konformacje będą poklastrowane przy użyciu informacji
strukturalnej i sekwencyjnej. Każdy klaster będzie zawierał fragmenty
podobne sekwencyjnie i strukturalnie. Filtr ab-initio będzie dzielił
białko na nakładające się na siebie fragmenty. Każdy fragment będzie
porównany z listą wcześniej przygotowanych klastrów fragmentów.
Porównanie odbędzie się za pomocą podobieństwa sekwencji lub
podobieństwa profili sekwencji. Najbardziej podobne klastry zostaną
przypisane fragmentom. Zbiór podobnych klastrów posłuży do oceny
preferencji konformacyjnych badanego fragmentu. Średnia konformacja oraz
jej odchylenie będą obliczone. Konformacje będą porównane z wymogami
poszczególnych badanych proteaz. Wiele miejsc proteolitycznych można
opisać jako giętkie i posiadające małą liczbę zakonserwowanych
aminokwasów. W przypadku kiedy jest znane tylko jedno miejsce proteolizy
dla danej proteazy (tak jak w przypadku koagulacji krwi) ocena
różnorodności konformacji jest niemożliwa. Jednak w innych przypadkach
zakładamy, że specyfikacje strukturalne będą mogły być dodane do procesu
filtrowania wykonywanego przez system poszukiwania ELM’ów. Filtr
ab-initio mógłby pomagać innym filtrom również przy poszukiwaniu innych
motywów niż motywy limitowanej proteolizy. Partner 6 jest odpowiedzialny
za wpisanie motywów limitowanej proteolizy do bazy danych ELM.
MiFriend
Celem projektu jest
analiza genomu i metabolizmu bakterii P. putida KT2440 oraz
przystosowanie jej do celów oczyszczania środowiska. Zadanie realizowane
przez BioInfoBank to przede wszystkim automatyczna analiza genomu
bakterii oraz szczegółowa analiza strukturalna i funkcjonalna wybranych
rodzin genów / białek i udostępnienie pozyskanej wiedzy szerokiej
społeczności akademickiej. .
Białka z proteomu P. putida KT2440 zostaną zanalizowane pod kątem
struktury drugorzędowej i oraz przeprowadzone zostanie uliniowienie
sekwencji białek homologicznych w specjalnie stworzonej bazie danych.
Dopasowane sekwencje zostaną przepisane na profile i zapamiętane w celu
późniejszego porównania ich z innymi profilami za pomocą czułych metod
detekcji podobieństwa sekwencyjnego. Baza danych będzie zawierać
rezultaty przewidywania struktury trzeciorzędowej białek uzyskane za
pomocą wybranych metod. Baza danych będzie umożliwiała manualną
adnotację struktury oraz funkcji białek bakterii. Adnotacje będą
zawierały informacje o tym czy bazują na informacji eksperymentalnej czy
na przewidywaniach. Baza danych będzie również zawierać informacje o
ekspresji genów otrzymane w ramach projektu w innych współpracujących
laboratoriach. Zmiany w ekspresji będą użyte do analizy funkcji białek.
Baza danych umożliwi grupowanie białek na podstawie podobieństwa
sekwencyjnego i strukturalnego. Baza danych będzie dostępna przez
Internet aby umożliwić zdalną modyfikację informacji oraz udostępnić
informacje szerokiej rzeszy użytkowników.
Geny odpowiedzialne za reakcje bakterii na stres będą poddane
szczegółowej analizie. Sekwencje odpowiednich białek, produktów tych
genów, będą użyte do poszukiwania sekwencji homologicznych,. W
zależności od istotności statystycznej znalezionych podobieństw,
przewidywania bedę adnotowane jako bardziej lub mniej pewne. W przypadku
kiedy analizowany gen będzie można zaklasyfikować do ciekawej rodziny,
zostanie przeprowadzona analiza filogenetyczna, która umożliwi lepszą
ocenę funkcjonalnych możliwości białka. Ewentualne przewidywanie
struktury będzie użyte do planowania badań eksperymentalnych.
Analiza powyższa będzie przeprowadzona również dla białek i genów
wchodzących w skład peryferyjnych szlaków katabolicznych bakterii.
Szczególny nacisk zostanie położony na analizę genów odpowiedzialnych za
katabolizm toksycznych związków z rodziny nitrotoluenu i styrenu.
Sekwencja każdego białka bakterii zostanie wykorzystana do stworzenia
profilu sekwencyjnego. Profile zostaną porównane do profili znanych
rodzin białkowych. Zakładamy, że takie porównanie doprowadzi do
znalezienia najbardziej odległych zależności między rodzinami białek,
które są wykrywalne aktualnymi metodami. Te zależności będą użyte do
inferencji funkcji. W przypadkach, kiedy taka inferencja okaże się
niemożliwa, zostanie przeprowadzona analiza strukturalna białek (w
niektórych ciekawych przypadkach również manualnie), aby zawęzić
spektrum możliwych funkcji.
|