O projekcie
Centralne Laboratorium Kryminalistyczne Policji (CLKP) jako lider reprezentujący konsorcjum w składzie: Warszawski Uniwersytet Medyczny (WUM), Uniwersytet Jagielloński (UJ), Pomorski Uniwersytet Medyczny (PUM) oraz firma ARDIGEN uzyskało dofinansowanie z Narodowego Centrum Badań i Rozwoju na realizację projektu o akronimie SMAFT (Soil Microbiome Analysis Forensic Tool), którego zadaniem jest wykorzystanie potencjału mikrobiomu gleby w kryminalistyce (DOB-BIO10/03/01/2019).
Ze względu na łatwość przenoszenia na butach, odzieży, narzędziach czy pojazdach gleba jest szczególnie cennym materiałem dowodowym pozwalającym łączyć podejrzanego lub przedmiot z określonym miejscem. Niestety, często informacje uzyskane za pomocą rutynowych analiz gleby, prowadzonych głównie w oparciu o jej cechy fizyko-chemiczne, nie pozwalają na weryfikację hipotez śledczych. Z tego powodu podejmowane są próby opracowywania metod identyfikacji gleby opartych na analizie DNA zasiedlających ją mikroorganizmów. Szacuje się, że w 1 gramie suchej gleby znajduje się średnio: 10 miliardów wirusów, 10 miliardów bakterii i archeonów (w tym 100 milionów promieniowców), po 1 milionie grzybów i glonów, 100 tysięcy pierwotniaków i 100 nicieni. Dodatkowo gleba może zawierać także fragmenty roślin a także inne niż nicienie bezkręgowce oraz pozakomórkowe kwasy nukleinowe. Wydaje się, że tak ogromna „biblioteka” DNA, w połączeniu z nowoczesnymi technologiami sekwencjonowania może w przyszłości okazać się równie przydatna do porównywania śladów gleby czy określania miejsca jej pochodzenia jak profile ludzkiego DNA do ustalania związku między śladami biologicznymi a podejrzanym. Obecnie dowody w postaci DNA mikrobiomu gleby nie są wykorzystywane rutynowo ani w dochodzeniach ani w sądach. Aby zmienić taki stan rzeczy konieczne jest wykazanie, że wnioskowanie statystyczne prowadzone w oparciu o analizy DNA mikrobiomu gleby jest wystarczająco rygorystyczne aby mogło być uznane przez sądy za dowód o odpowiednich podstawach naukowych. Według autorytetów w dziedzinie nauk kryminalistycznych potwierdzenie wiarygodności i skuteczności analiz mikrobiomu może być osiągnięte poprzez prowadzenie badań na odpowiednio licznych pulach próbek, tworzenie baz danych mikrobiomów pochodzących z różnych środowisk prowadzone w oparciu o jasno określone i dobrze udokumentowane procedury, doskonalenie narzędzi bioinformatycznych oraz poznanie dynamiki zmian czasowych i przestrzennych mikrobiomów.
Założenia projektu SMAFT, którego celem jest opracowanie innowacyjnego narzędzia do kryminalistycznej analizy mikrobiomu gleby, uwzględniają przedstawione powyżej wytyczne. Dane uzyskane z sekwencjonowania blisko 1000 próbek DNA mikrobiomów gleby będą podstawą do stworzenia systemu SMAFT, umożliwiającego identyfikację oraz ustalenie miejsca pochodzenia próbki gleby. Uzyskane z wykorzystaniem systemu SMAFT informacje będą mogły kierunkować, a tym samym przyśpieszać śledztwa w sprawach kryminalnych jak i związanych z atakami terrorystycznymi. System będzie mógł być także wykorzystywany w badaniach bioróżnorodności.
Badania zaplanowane w ramach projektu SMAFT podzielone są na etapy:
Zebranie 960 próbek gleby, po 240 w okresie jesiennym, zimowym, wiosennym i letnim z 80 różnych lokalizacji na terenie Polski (po 3 w każdym miejscu).
Wyboru miejsc pobrań próbek gleby dokonano na podstawie analizy informatycznej danych z pomiarów wykonanych we wszystkich stacjach hydrologiczno-meteorologicznych zlokalizowanych na terenie całej Polski obejmujących okres ostatnich 20 lat. Etap ten obejmuje również opracowanie szczegółowej metodyki pobierania próbek gleby, ich zabezpieczania i opisywania, wyznaczania miejsc pobrań i ich dokumentowania oraz transportu do laboratorium w odpowiednich warunkach.
Izolacja DNA mikrobiomu z gleby.
Przed przystąpieniem do realizacji zadania przeprowadzono badania pozwalające wytypować najskuteczniejszą metodę izolacji DNA z gleby w odniesieniu do ilości, czystości i jakości otrzymanego izolatu.
Przygotowanie bibliotek NGS z uzyskanych izolatów DNA.
W celu uzyskania jak najlepszej jakości bibliotek, o pożądanej długości fragmentów zoptymalizowano procedurę tworzenia bibliotek, zarówno na etapie fragmentacji DNA jak i amplifikacji. Długości fragmentów przygotowanych bibliotek będzie weryfikowana za pomocą elektroforezy kapilarnej, a stężenie DNA w bibliotekach oznaczane metodą fluorymetryczną.
Sekwencjonowanie WGS (WGS, ang. whole genome sequencing) z zastosowaniem technologii SBS firmy Illumina® wykorzystującej sekwenator najnowszej generacji NovaSeq 6000 Illumina®.
Zaplanowano uzyskanie od 80 do 100 milionów par odczytów 150 nukleotydowych fragmentów przypadających na pojedynczą próbkę gleby.
Analiza danych.
Otrzymane w etapie 4 dane będą analizowane za pomocą różnych narzędzi bioinformatycznych. Celem analizy jest wyłonienie optymalnego zestawu markerów (panelu identyfikacyjnego), który umożliwi ocenę składu mikrobiomu w próbce nieznanego pochodzenia i pozwoli na przyporządkowanie jej do określonej lokalizacji.
Opracowanie, optymalizacja i walidacja celowanej metody NGS do analizy mikrobiomu gleby.
Testowanie próbek będzie prowadzone w oparciu o wyselekcjonowane sekwencje genomowe zdefiniowane na etapie piątym. Sprawdzona zostanie kompatybilność wyników sekwencjonowania próbek gleby otrzymanych na etapie czwartym (głębokie sekwencjonowanie) z wynikami sekwencjonowania uzyskanymi dla opracowanego na tym etapie testu (sekwencjonowanie celowane) przeprowadzonego za pomocą kilku metod sekwencjonowania o średniej przepustowości. Wybrana zostanie optymalna technologia sekwencjonowania, która zostanie poddana walidacji, ze szczególnym uwzględnieniem specyfiki i ograniczeń występujących przy analizach kryminalistycznych.
Stworzenie systemu informatycznego do analizy i interpretacji wyników uzyskiwanych za pomocą testu genetycznego i wybranej technologii NGS.
Dane uzyskane z sekwencjonowania DNA mikrobiomów gleby zostaną umieszczone w bazie danych będącej elementem tworzonego systemu, stanowiąc „mapę” mikrobiomów gleb Polski. Dodatkowo w powstającym systemie zostanie zaimplementowane narzędzie do efektywnego przeszukiwania zasobów bazy i interpretacji wyników analiz. Uzyskiwane przy pomocy testu wyniki sekwencjonowania DNA wyizolowanego z próbki gleby o nieznanym pochodzeniu będą za pomocą stworzonego oprogramowania porównywane z bazą i przypisywane do najbardziej prawdopodobnej lokalizacji na mapie Polski. Ostatecznie powstanie kompletny system predykcyjny zawierający test identyfikujący społeczności bakteryjne mikrobiomu gleby i oprogramowanie pozwalające na interpretację otrzymanych za pomocą testu danych.
Testowanie skuteczności działania stworzonego programu przy zachowaniu warunków zbliżonych do rzeczywistych oraz przygotowanie procedur SOP umożliwiających korzystanie z opracowanego systemu.
Przeprowadzona zostanie ocena parametrów i poprawności działania programu. Dodatkowo opracowane zostaną wytyczne, procedury i instrukcje niezbędne do prowadzenia badań predykcyjnych i analiz porównawczych próbek DNA wyizolowanych z gleby a wykonywanych za pomocą systemu SMAFT.
Produktem końcowym projektu SMAFT będzie kompletny system predykcyjny przeznaczony do identyfikacji i ustalania miejsca pochodzenia próbek gleby na podstawie składu ich mikrobiomu.