Python - zajęcia 1

Python - zajęcia 1
Photo by National Cancer Institute / Unsplash

Python - po co i na co?

W swojej pracy zajmuję się między innymi analizami bioinformatycznymi, łącząc wiedzę biologiczną z narzędziami informatycznymi. Szczególnie interesuje mnie rozwijanie własnych skryptów w języku Python, które pozwalają na automatyzację analiz, przetwarzanie danych oraz tworzenie nowych rozwiązań wspierających badania naukowe.

Szczególnie interesuje mnie:

  • analiza danych NGS drugiej generacji (Illumina),
  • analiza danych NGS trzeciej generacji (PacBio, Oxford Nanopore).

Python pozwala pisać skrypty, które automatyzują żmudne etapy: filtrowanie, konwersje formatów, uruchamianie pipeline’ów.
Dzięki bibliotekom Python rozumie pliki biologiczne; np. Biopython - sekwencje FASTA, GenBank, pysam - umożliwia pracę z plikami BAM, pandas - szybka obróbka tabel.
Analizy PacBio często wymagają używania różnych programów. Python jest świetny do integracji: wywołuje te programy, łączy w jeden workflow, pozwala je automatyzować i powtarzać na wielu próbkach.

Przykłady analiz, którymi jestem zainteresowana:

  • Filtracja odczytów po jakości i długości,
  • Mapowanie odczytów do sekwencji referencyjnej,
  • Analiza wariantów (SNV, indel, CNV),
  • Wizualizacja danych transkryptomicznych (RNA-seq),
  • Tworzenie własnych narzędzi bioinformatycznych.

Co jeszcze?

Myślę, że Python może pomóc mi również w:

  • wizualizacji danych - matplotlib, seaborn czy plotly ułatwiają tworzenie czytelnych wykresów do publikacji i prezentacji.
  • zarządzaniu literaturą - skrypty w Pythonie mogą sortować pliki PDF artykułów, generować spisy literatury.
  • i wielu innych... Sky is the limit. No, frontend is the limit ;)