Temel Kavramlar

Massive Bioinformatics

30/09/2024

 

N
O
P
Q
R
S
T
U/Ü
V
Y

 

A

Adaptör

Adaptör, DNA sekansının uçlarına ligasyon veya rapid kimyası ile bağlanan ve nanoporlardan geçerek okunacak DNA sekansının ipliklerinin ayrılmasında rol oynayan, ilgili dizinin nanopordan geçiş hızını belirleyen motor proteinlerini taşıyan bir oligonükleotit dizisidir.

 

Alfa çeşitlilik

Alfa çeşitliliği, belirli bir alan veya habitattaki çeşitliliği ifade eder. Genellikle tür zenginliği(species richness) ve tür çeşitliliği (species diversity)açısından ölçülür. Bir numunedeki toplam farklı tür sayısına tür zenginliği, numunedeki mikroorganizmaların bulunma miktarlarına göre dağılımına ise tür çeşitliliği denir.

Ana Koordinatlar Analizi (PCoA)

Metrik çok boyutlu ölçekleme adıyla da bilinen PCoA, iki ya da üç boyutlu geometrik uzayda (Öklid uzayı olarakta isimlendirilebilinir) cisimlerin benzerlik veya farklılıklarını gösterir. Çalışma prensibi, belirlenen öğenin iki ya da üç boyutlu uzayda bir konuma sahip olması ve tür/nesne göreceli bulunma açısından benzerlik ve farkılıkların hesaplanmasıdır. PCoA grafiğinin yorumlanması, esas olarak, belirlenen öğelerin diğer uzak öğelerden ziyade kendisine yakın olan öğelerle daha fazla benzerlik özelliği taşımasına dayanır.

 

Annotasyon

Genom anotasyonu, sekans verilerine anlam verme olarak adlandırılabilir. Genom anotasyonunda, genlerin yerleri belirlenir ve ardından kodlama bölgeleri ve işlevleri belirlenir. İlk olarak genomun proteinleri kodlamayan kısımları tanınır ve önceki bilgi sayesinde genom üzerindeki elementler tanımlanarak gen tahmini yapılır, son olarak bu elementlere kesin fonksiyonlar atanır.

 

Antibiyotik Direnç Genleri

Bakterilerde antibiyotik direnci çeşitli mekanizmalarla sağlanabilir. Bunlar; antibiyotikleri metabolize eden enzimlerin üretilmesi, pompalar yardımıyla hücreden ilacın dışarı atılması, antibiyotiğin hücresel hedefinde bağlanmayı engelleyici modifikasyonlar olması, ilacın etkinliğini bypass edecek başka bir yolağın aktive edilmesi ve ilacın hücreye gireceği transmembran porlarının elimine edilmesidir. Bu değişikleri regüle eden genlere antibiyotik direnç genleri denir.

 

B

BAM

BAM (İkili Hizalama Haritası) dosyaları, bir referans genoma hizalanmış tüm okumaları içeren dosyalardır. BAM dosyaları bir başlık bölümü ve bir hizalama bölümü içerir. BAM dosyalarının başlık bölümü tüm dosya hakkında bilgi içerirken, hizalamalar bölümü okumaların adını, nükleotid dizisini, okuma kalitesini ve hizalama bilgilerini içerir.

 

Barkodlama

Barkodlama, barkod dizisi olarak adlandırılan oligonükleotit dizilerinin, hedef DNA sekanslarının uçlarına bağlanması sayesinde çok sayıda örneğin havuzlanmasını ve aynı anda dizileme cihazında okunmasını olanaklı kılan bir yöntemdir. Birden fazla barkodlu örnek havuzlanarak dizilemenin tek bir akış hücresinde gerçekleştirilmesini sağlar.

 

Baz çağırma (Basecalling)

Oxford Nanopore dizileme platformunda, DNA ve RNA’lar nanoporlardan geçerken bir elektrik sinyali oluşturur. Bu elektrik sinyalini sinir ağı (neural network) kullanarak ATGC bazlarına dönüştürme işlemine “basecalling” denir. Bu işlem için Guppy gibi araçlar kullanılır.

 

Benign

İyi huylu, benin. Bir genetik varyasyon ya da hücre ve dokunun hastalığa yol açmadığını belirtir.

 

Beta çeşitlilik

Beta çeşitliliği için farklı türde tanımlamalar ve hesaplamalar mevcut olmakla birlikte, genellikle farklı iki habitattan elde edilen örnekler arasındaki tür çeşitliliği olarak ifade edilmektedir. Örneğin iki farklı göldeki mikroorganizmalar karşılaştırmak istendiğinde, beta çeşitlilik analizi yapılır.

 

BLAST

BLAST, query olarak adlandırılan bilinmeyen bir DNA/RNA nükleotid dizisi ya da amino asit dizisinin NCBI gibi veri tabanlarındaki referans sekanslarla karşılaştırılması için kullanılan bir algoritmadır. Bu işlemin amacı araştırma konusu olan sekansın hangi türlere yakın olduğunun tespiti ya da direkt tür tanısıdır.

 

BRIG

Referans alınan genom ile örnek genom arasındaki benzerliği eş merkezli halkalar şeklinde görsel sağlayan ücretsiz erişim sağlayan bir platformdur. Oluşturulan eş merkezli halkalarda BLAST karşılaştırmaları, yüzdelik tanımlaması baz alınarak renklendirilir. Eş merkezli halkalar, iki ya da daha fazla cismin aynı merkezi ya da aynı ekseni paylaşmasına denir. Oluşturulan resimlerde, hizalanmış ortalama değer (read coverage), çakışan tekrarlı bölgeler (collapsed repeats), kesim noktaları (assembly breakpoints) gibi özelleştirilmiş ve/veya açıklamalı bilgiler içerebilir.

 

C

Contig

Bir contig, örtüşen küçük DNA parçalarının “bitişik” durumudur. Örtüşen DNA parçalarının daha uzun bir diziye birleştirilmesiyle oluşturulur. Diziler önce contig’lere ve son olarak da tam bir genomik diziye birleştirilir.

 

Covarage (kaplam/kapsam)

Yeni nesil sekanslama çalışmalarında “referans genom kaplamı”, bir örnek için alınan toplam okumaların veya tek bir nükleotit sekansın, hizzalandığı referans genomun ne kadarlık bir kısmını aydınlattığının yüzde cinsinden göstergesidir. “Depth of coverage (kapsam)” ise seçilen nükleotid dizisindeki her bir bazın (spesifik bir bazın) ortalama okuma sayısını ifade eder. Ortalama kapsam değeri, seçilen bölgedeki okuma sayısının bölgenin uzunluğuna bölünmesiyle elde edilir ve incelenen bölgedeki her bir nükleotid için ortalama okuma sayısını gösterir.

 

D

De Novo Assembly (Flye)

Flye, ONT ve PacBio tarafından oluşturulan tek molekül dizileme okumalarının işlenmesinde kullanılan bir de novo birleştirme aracıdır. Flye de novo birleştiricisi, 16S projelerinden memeli ve bitki genomları gibi büyük genomlara kadar çok çeşitli veri setlerinde kullanılabilir. Flye programlaması, kullanıcıların ham ONT veya PacBio verilerini karşıya yüklemelerini ve bunları cilalı kontigler olarak almalarını sağlayan tam bir pakettir. Flye, tekrar grafikleri oluşturur ve bunları yüksek kaliteli ve bitişik montajlar olarak birleştirir.

 

Dendrogram

Dendrogram hiyerarşik kümelendirme sonucu elde edilen veri gruplarının ağaç şeklinde sunulan grafikleridir. Ağaçtaki her bir dal bir adım hiyerarşik kümelendirme sonucu elde edilen grubu temsil eder.

 

Depth

Yeni nesil sekanslama çalışmalarında depth terimi, çalışılan bölgede bulunan tek bir nükleotidin total okunma sayısını belirtmek için kullanılır. Allel depth, seçilen nükleotidin varyasyonlarının kaç okumada tespit edildiğini gösterir. Allel frekansı terimi ise allel depth değerinin total depth değerine bölünmesi ile elde edilir.

Dizi Hizalama

Dijital PCR (dPCR), olağanüstü duyarlılık ve özgüllük ile doğru nükleik asit için yeni bir tekniktir. PCR’nin üçüncü versiyonu olarak da bilinir, numuneyi rastgele küçük hacimli bölmelere ayırarak mutlak miktar belirlemeye izin verir, burada ayrı bölmelerin her birinde reaksiyon, bir hedef molekülün varlığına bağlı olarak 1 veya 0 olarak belirlenir. PCR-pozitif yanıtların miktarı, hedef DNA’nın ilk kopya sayısını ve konsantrasyonunu belirlemek için kullanılır. Bu teknoloji, kopya sayısı varyasyonunun, yaygın olmayan mutasyonların ve eser DNA’nın saptanmasında uygulanabilir, minimum sayıda numune kullanılarak gerçekleştirilebilir ve pre-amplifikasyondan kaynaklanan hatayı ortadan kaldırarak güvenilir sonuçlar verir.

Dizi Hizalama

DNA veya protein dizilerinin iki temsilinin, en benzer elemanları yan yana olacak şekilde düzenlenmesine hizalama denir. Biyoinformatikle ilgili birçok iş, başarılı hizalamalara bağlıdır.

 

DNA Metilasyonu

Bir moleküle metil (-CH3) grubunun eklenmesidir. DNA metilasyonu, sitozin nükleotidine bir metil grubunun kovalent bağlanması sonucu 5-metilsitozin (5mC) molekülünün oluşmasıdır. DNA metilasyonu normal gelişimde büyük önemi olan bir epigenetik düzenleme tipidir ve bulunduğu konuma göre başta gen ekspresyonunun düzenlenmesi olmak üzere farklı moleküler işlevleri bulunur.

 

E

Ekzon

Eksonlar DNA veya RNA moleküllerinin amino asit kodlamak için bilgi içeren bölümleridir. Pre-mRNA, hem ekson hem de intron içerir, ancak mRNA olgunlaşması sırasında kodlamayan intronlar kesilir ve sadece kodlayan ekson dizileri olgun mRNA üzerinde kalır.

Evrensel Primerler

Sekanslanmak üzere vektör içine yerleştirilen DNA parçasının hemen öncesinde, vektör DNA’sına komplementer olarak dizayn edilmiş primerlerdir. Vektör-spesifik olduklarından, aynı tip vektör içine ligasyonu yapılmış tüm DNA parçalarının okumasında bu primerlerden faydalanılır.

 

F

Fast5

Bu dosya formatı, ONT platformu kullanılarak yapılan dizileme sonucunda üretilen ham sinyal verisini içermektedir. FAST5 dosya formatı, hiyerarşik Veri Formatı 5’i (HDF5) temel alır. Fast5 dosyasındaki ana veriler, nanoporlardan saniyede binlerce kez alınan ölçümler sonucunda oluşan ve “dalgalı çizgiler” olarak görünen verileri içerir.

 

Fastq

Fastq, dizileme sonucunda oluşturulan başka bir dosya biçimidir. Nanopor dizilemede Fast5 dosyaları Guppy ile Fastq’a dönüştürülür. Fastq dosyası, her bir okuma için 4 satır bilgi içerir. İlk satır, başlık ve okuma hakkında bilgi içerir. İkinci satır dizinin kendisini içerir. Üçüncü satır ek bilgiler veya yalnızca “+” işareti içerir. Son olarak, dördüncü sıra, dizideki her bir baza karşılık gelen kalite skorunu göstermektedir.

 

G

Germline mutasyonları

Bu mutasyonlar sperm ya da yumurta hücresinde olan ve doğrudan ebeveynlerden çocuklara aktarılan mutasyonlardır. Embriyo gelişimi esnasında bu mutasyon tüm hücrelerde taşınır ve soydan soya aktarılır. Tüm kanserlerin yaklaşık %5-10’u germline mutasyonları sonucu gelişir ve bu kanserler herediter kanser sendromları olarak da adlandırılır.

 

H

Hipotez testi

Bir popülasyon parametresini veya bir popülasyon olasılık dağılımını incelemek için bir örnekten alınan verileri kullanan bir tür istatistiksel çıkarımı ifade eder. İlk olarak, parametre veya dağıtım özelliği hakkında geçici bir varsayım oluşturulur. Bu ilk geçici varsayım, 0 hipotez olarak adlandırılır ve H0 ile gösterilir. Sıfır hipotezinin zıt anlamı olan alternatif bir hipotez (Ha ile gösterilir) üretilir. Hipotez test prosedürü, H0’ı reddetmek için örnek verileri kullanmayı içerir. H0 reddedilebilirse, istatistiksel sonuç sayesinde alternatif hipotez Ha doğru olarak ifade edilebilir.

 

Histon

DNA’nın paketlenmesinde yapısal iskelet (scaffold) görevi gören küçük, bazik ve yüksek oranda korunmuş proteinlerdir. Yaklaşık 150 baz çifti uzunluğunda bir DNA parçası histon oktomerinin etrafına sarılarak kromatin yapısının alt birimi olan nüklozomları oluşturur. Histonlar, metilasyon, asetilasyon, fosforilasyon gibi translasyon sonrası modifikasyonlar ile gen aktivitesini düzenlerler.

 

Histon Asetilasyonu

Histon oktomerlerine asetil grubunun eklenmesidir. Asetil koenzimA’dan koparılan asetil grubunun histonlara transferi sonucunda, genellikle kromatinlerin aktif ökromatin yapısına geçmesi ile ilişkilendirilir.

 

Histon Metilasyonları

Histon oktomerlerine metil grubunun eklenmesidir. Histonlarda mono-di-tri metilasyon gözlemlenmektedir. Metil işaretinin sayısı ve konumuna bağlı olarak bu düzenlemeler gen ekspresyonunda artışa ya da genin susturulmasına sebep olabilir.

 

I

İkincil Metabolitler

Bir organizmanın gelişiminde veya çoğalmasında birincil dereceden etkisi bulunmayan ancak organizmaya selektif avantaj sağlayabilmek için üretilen bileşiklerdir. Örneğin; rekabet ettikleri diğer organizmaların gelişimlerini engelleyici yönden aktiviteleri olabilir. İkincil metabolitler antibiyotik üretimi gibi birçok medikal olarak önemli bileşiğin ana kaynağını oluştururlar.

Intron

İntronlar genlerin amino asit kodlayamayan bölümleridir. Sadece ökaryotlar intron bölgelerini içerir, prokaryotlarda ise çok nadiren bulunur. pre-mRNA işlemesi esnasında intron bölgeleri olgun mRNA’den silinirler. İntronlar translasyona katılmamasına rağmen, örkaryotlarda alternatif splicing, gen ifadesini düzenleme, mRNA taşınmasının kontrolü gibi fonksiyonlara sahiptirler.

 

K

Kalite Skoru

Kalite skoru, Phred skoru olarak da bilinen sekanslanan bir bazın ne kadar doğrulukta sekanslandığını belirten ve sekanslama cihazı tarafından üretilen bir değerdir. Bu değer, biyoinformatiksel analizlerin ileriki adımlarda dikkate alınır. Logaritmik bir değerdir, örneğin 30 phred skora sahip bir baz %99,90 oranında doğru okunmuştur.

Kırpma

Sıralama veri analizi hattındaki ilk adım, bir sıralayıcı tarafından oluşturulan okuma sıralarını değiştiren okuma kırpmadır. Ham okuma dizilerinde yaptığı değişiklikler, analiz hattının sonraki aşamalarının tümü üzerinde bir etkiye sahip olabilir.

Konsensus Genom

Bir konsensüs dizisi, ilişkili, hizalanmış dizileri temsil eden bir DNA, RNA veya protein dizisidir. Benzer sekansların konsensüs sekansı çeşitli şekillerde tanımlanabilir, ancak her lokasyondaki en yaygın nükleotit(ler) veya amino asit(ler) genellikle kullanılır.

 

M

Malignant

Kötü huylu, malin. Bir genetik varyasyon ya da hücre ve dokunun hastalığa yol açabileceğini belirtir.

 

O

Okuma Haritalaması

Sıralama ile elde edilen okumaların her birinin karşılık gelen referans genomu ile karşılaştırılması işlemine okuma haritalaması denir. Her okuma ile referans genom arasında bir veya daha fazla hizalama elde edilebilir.

ORF (Open Reading Frame)

Açık okuma çerçevesi. Stop kodon içermeyen ancak protein yapısındaki aminoasit bilgisini içeren DNA dizisidir. Özellikle prokaryotlarda açık okuma çerçevesi bilgisi ile kodlayan genlere ait dizi bilgisi elde edilebilir ve biyoinformatik analizlerde gen bölgelerinin öngörülmesinde önemli rol oynar.

p


Primer

Primer, DNA sentezi için bir başlangıç noktası sağlayan kısa bir nükleik asit dizisidir. Sekanslama primerleri, dizileme reaksiyonunun başlamasını sağlayan primerlerdir.

Probe

Bir probe, bir numune genomunda tamamlayıcı dizisini aramak için kullanılan tek iplikli bir DNA veya RNA dizisidir. Probe, probe dizisinin tamamlayıcı dizisi ile hibritleşmesine izin veren koşullar altında numune ile temas edecek şekilde yerleştirilir.

PCR

Polimeraz zincir reaksiyonu (PCR), belirli bir DNA örneğinin tamamının veya bir kısmının milyonlarca veya milyarlarca kopyasını hızla üretmek için yaygın olarak kullanılan bir yöntemdir. Bilim insanlarının, derinlemesine bir araştırma yapabilmesi için küçük bir DNA örneğini alıp onu (veya bir kısmını) çok fazla sayıda amplifiye etmesine olanak tanır.

Q

QPCR

Gerçek zamanlı PCR olarak da bilinen QPCR, floresan boyalar yardımıyla hedeflenen genomik bölgeyi amplifiye etmek için kullanılan bir yöntemdir. Bu tekniğin klasik PCR’dan temel farkı, amplifiye edilen amplikonların gerçek zamanlı olarak ölçülmesidir. Temel prensip, amplikonlara bağlanan floresan boyaların hassas dedektörler tarafından algılanmasına dayanmaktadır.

 

R

Referans Haritalama

Okumaların ilgili organizmanın referans genomuna haritalandırılması anlamına gelir. Bu süreçte, sekanslama platformlarından gelen okumalar, hedef referans genomunun karşılık gelen konumlarına hizalanır. Bu şekilde, ilgili organizmanın genomunun haritası oluşturulabilir.

S

Shotgun metagenomik

Bu dizileme yönteminin amacı, topluluk bileşimini ve işlevini aydınlatmak için bir topluluktaki hedeflenmemiş hücrelerin genomlarını sıralamaktır. Bu yöntem, büyük mikrobiyal toplulukların varlığının yaygınlığı nedeniyle çok çeşitli alanlarda kullanılır. Örneğin, toprak mikrobiyotasının incelenmesi, bitki patojenlerinin anlaşılmasında ve tedavi edilmesinde ilerlemeler sağlamıştır.

 

Somatik mutasyonlar

Bir insanın hayatı süresince, tek bir hücresinde çeşitli dış etkenlerin etkisiyle oluşan DNA hasarı sonucu ortaya çıkan mutasyonlardır. Sonradan gelişen bu mutasyonlar ebeveynlerden çocuklara aktarılan mutasyonlar değildirler. Görüldüğü hücre ve hücrenin çevresinde değişikliğe sebep olan bu mutasyonlar sonucu gelişen kanserlere sporadik kanserler denir.

 

T

TBA (Temel Bileşen Analizi)

Bir örnek setinde birden fazla değişken temel alınarak örnekler arasında karşılaştırmalar yapılabilir. Veri setindeki veriler, eksenlerin değişkenleri temsil ettiği koordinat sistemlerinde temsil edilebilirler. Boyutluluğu yüksek bir veri setinin analizi karmaşık olacağı için bu durumu gidermek amacıyla Temel Bileşen Analizi (TBA) vasıtasıyla boyut indirgemesi gerçekleştirilebilir. TBA, örnek setindeki varyansın maksimum olduğu bir vektörün ilk eksen olarak temel alınıp çizilmesiyle başlar. Bu eksen, verilerin uzaklıklarının karelerinin ortalamasının minimum olduğu bir doğru ya da verilerin dik izdüşümlerinin oluşturacağı doğru üzerindeki en uzak iki veri arasındaki mesafenin maksimum olduğu bir doğru olarak çizilir. Ardından, çizilen ilk eksene dik olup varyansın maksimum olduğu ikinci bir eksen çizilir. Bu prensip kendisinden önce çizilen eksenlere ortogonal olacak ve maksimum varyansa sahip olacak eksenlerin çizilmesiyle devam eder. Bu eksenler temel bileşenler olarak adlandırılır. Analizin karmaşıklığı, düşük yüzdeli varyans kaybı ile boyut indirgemesi yoluyla minimize edilmiş olur.

 

Telomer

Kromozomların uçlarında yer alan, DNA’yı degredasyon ve füzyon gibi mekanizmalardan koruyan DNA-protein yapılarıdır. Özellikle hücresel yaşlanma telomerlerin önemi bilinmektedir. Replikasyon esnasında DNA uçlarının tam olarak kopyalanamaması sonucu telomerler giderek kısalır.

Tümör Mutasyon Yükü (TMY)

Bir tümör hücresinin genomundaki kodlayan bölge başına düşen mutasyon sayısı olarak tanımlanır. TMB’si yüksek olan tümörlerin immün checkpoint inhibitör terapilerine daha iyi yanıt verdiği bilinmektedir.

Tüm Genom Sekanslama

Tüm genom sekanslama(WGS), bir organizmanın DNA dizisinin tamamını veya neredeyse tamamını bir kerede belirleme tekniğidir. Kullanılabilir bilgileri çıkarmak için karmaşık biyoinformatik çalışmaların gerekli olduğu büyük miktarda ham veri üretir. Çalışma, testin amacına bağlı olarak tüm genoma (tüm genom analizi, WGA), ekzoma (tüm ekzom analizi), bir gen alt kümesine odaklanabilir.

 

U/Ü

UTR bölgesi

Çevrilmeyen bölge (Untranslated Region). Mesajcı RNA’ların (mRNA) 3’ ve 5’ bölgelerinde bulunan ve proteine çevrilmeyen bölgelerdir. Bu bölgeler mRNA’nın stabilitesini, fonksiyonunu ve lokalizasyonunu kontrol ederek mRNA’nın translasyonunu regüle ederler.

Üst Alem (Domain):

Taksonomideki en yüksek derece olan üst alem, bir organizmayı tanımlamak için kullanılan en geniş biyolojik sınıftır. Üç temel üst alem tanımlanmıştır: Bakteri, Arkea ve Ökarya.

 

V

Varyans-polimorfizm-mutasyon

Kalıtım materyalinde (DNA/RNA) görülen her türlü değişiklik varyans olarak adlandırılır. Polimorfizm, popülasyonda yaygın olarak (en az görülen varyansın görülme sıklığı popülasyonun %1’i olmalıdır) görülen ve genellikle hastalıklarla ilişkilendirilmeyen genetik varyasyonlardır. Mutasyon ise polimorfizmden farklı olarak daha nadir ve anormal değişiklikler için kullanılan bir terimdir ve bir mutasyonun popülasyondaki frekansı arttığında polimorfizm olarak değerlendirilebilir.

 

Y

Yüksek Çözünürlüklü Erime (HRM) Analizi

Dijital PCR (dPCR), olağanüstü duyarlılık ve özgüllük ile doğru nükleik asit için yeni bir tekniktir. PCR’nin üçüncü versiyonu olarak da bilinir, numuneyi rastgele küçük hacimli bölmelere ayırarak mutlak miktar belirlemeye izin verir, burada ayrı bölmelerin her birinde reaksiyon, bir hedef molekülün varlığına bağlı olarak 1 veya 0 olarak belirlenir. PCR-pozitif yanıtların miktarı, hedef DNA’nın ilk kopya sayısını ve konsantrasyonunu belirlemek için kullanılır. Bu teknoloji, kopya sayısı varyasyonunun, yaygın olmayan mutasyonların ve eser DNA’nın saptanmasında uygulanabilir, minimum sayıda numune kullanılarak gerçekleştirilebilir ve pre-amplifikasyondan kaynaklanan hatayı ortadan kaldırarak güvenilir sonuçlar verir.