Python - zajęcia 1
Python - po co i na co?
W swojej pracy zajmuję się między innymi analizami bioinformatycznymi, łącząc wiedzę biologiczną z narzędziami informatycznymi. Szczególnie interesuje mnie rozwijanie własnych skryptów w języku Python, które pozwalają na automatyzację analiz, przetwarzanie danych oraz tworzenie nowych rozwiązań wspierających badania naukowe.
Szczególnie interesuje mnie:
- analiza danych NGS drugiej generacji (Illumina),
- analiza danych NGS trzeciej generacji (PacBio, Oxford Nanopore).
Python pozwala pisać skrypty, które automatyzują żmudne etapy: filtrowanie, konwersje formatów, uruchamianie pipeline’ów.
Dzięki bibliotekom Python rozumie pliki biologiczne; np. Biopython - sekwencje FASTA, GenBank, pysam - umożliwia pracę z plikami BAM, pandas - szybka obróbka tabel.
Analizy PacBio często wymagają używania różnych programów. Python jest świetny do integracji: wywołuje te programy, łączy w jeden workflow, pozwala je automatyzować i powtarzać na wielu próbkach.
Przykłady analiz, którymi jestem zainteresowana:
- Filtracja odczytów po jakości i długości,
- Mapowanie odczytów do sekwencji referencyjnej,
- Analiza wariantów (SNV, indel, CNV),
- Wizualizacja danych transkryptomicznych (RNA-seq),
- Tworzenie własnych narzędzi bioinformatycznych.
Co jeszcze?
Myślę, że Python może pomóc mi również w:
- wizualizacji danych - matplotlib, seaborn czy plotly ułatwiają tworzenie czytelnych wykresów do publikacji i prezentacji.
- zarządzaniu literaturą - skrypty w Pythonie mogą sortować pliki PDF artykułów, generować spisy literatury.
- i wielu innych... Sky is the limit. No, frontend is the limit ;)