Wat is het verschil tussen FASTA en FASTQ

Inhoudsopgave:

Wat is het verschil tussen FASTA en FASTQ
Wat is het verschil tussen FASTA en FASTQ

Video: Wat is het verschil tussen FASTA en FASTQ

Video: Wat is het verschil tussen FASTA en FASTQ
Video: 10 regels voor intermitterend vasten voor beginners 2024, Juli-
Anonim

Het belangrijkste verschil tussen FASTA en FASTQ is dat FASTA een op tekst gebaseerd formaat is dat alleen nucleotide- of eiwitsequenties opslaat, terwijl FASTQ een op tekst gebaseerd formaat is dat zowel sequentie- als bijbehorende sequentiekwaliteitswaarden opslaat.

Bio-informatica is een vakgebied dat verschillende software gebruikt om biologische gegevens te analyseren en te begrijpen, vooral wanneer de verzameling gegevens complex en groot is. Dit veld combineert biologie, scheikunde, natuurkunde, informatica, informatietechnologie, wiskunde en statistiek om biologische gegevens te analyseren en te interpreteren. FASTA en FASTQ zijn twee sequentieweergaveformaten op het gebied van bio-informatica om sequenties uit te lijnen en te analyseren. In feite is FASTQ een sequentiebestandsformaat dat het FASTA-formaat uitbreidt met de mogelijkheid om de sequentiekwaliteit op te slaan.

Wat is FASTA?

FASTA is uitlijningssoftware voor DNA- en eiwitsequenties. FASTA-software gebruikt het FASTA-formaat. Het is een op tekst gebaseerd formaat dat ofwel nucleotidesequenties ofwel aminozuur(eiwit)sequenties vertegenwoordigt. Hier vertegenwoordigen enkele lettercodes deze beide reeksen. FASTA is een belangrijk hulpmiddel op het gebied van bioinformatica en biochemie. Met dit formaat kunnen reeksnamen en opmerkingen voorafgaan aan de reeksen.

FASTA versus FASTQ in tabelvorm
FASTA versus FASTQ in tabelvorm

Figuur 01: FASTA-reeks

Dit formaat is afkomstig van de FASTA-software en werd in 1985 geïntroduceerd door David J. Lipmann en William R. Pearson. De FASTA-tool heeft in de loop van de tijd veel wijzigingen ondergaan en de nieuwste versie bestaat uit programma's voor eiwit: eiwit, DNA:DNA, eiwit:vertaald DNA (met frameshifts) en geordende of ongeordende peptide-zoekopdrachten. FASTA leest een gegeven nucleotide- of aminozuursequentie en zoekt naar de overeenkomstige sequentiedatabase door lokale sequentie-uitlijning te gebruiken om overeenkomsten van vergelijkbare databasesequenties te vinden.

Wat is FASTQ?

FASTQ is uitlijningssoftware die wordt gebruikt op het gebied van bio-informatica, die zowel een biologische sequentie (meestal nucleotidesequentie) als de bijbehorende kwaliteitsscores opslaat. FASTQ is oorspronkelijk ontwikkeld om een FASTA-geformatteerde reeks en de bijbehorende kwaliteitsgegevens te bundelen door Wellcome Trust Sanger Institute. Met de ontwikkeling op het gebied van bio-informatica werd FASTQ de de facto standaard voor het opslaan van de output van veel high-throughput sequencing-instrumenten.

Het FASTQ-formaat gebruikt vier verschillende regels per reeks. Regel 1 begint met het @-teken en wordt gevolgd door een sequentie-identificatie (vergelijkbaar met een FASTA-titelregel). Regel 2 bestaat uit onbewerkte volgordeletters. In regel 3 begint de reeks met een '+'-teken en wordt optioneel gevolgd door dezelfde reeksidentificatie. Regel 4 codeert de kwaliteitswaarden voor de reeks in regel 2 en moet uit hetzelfde aantal symbolen bestaan als letters in de reeks.

Wat zijn de overeenkomsten tussen FASTA en FASTQ?

  • FASTA en FASTQ zijn hulpmiddelen voor het uitlijnen.
  • Het zijn twee sequentieweergaveformaten.
  • Beide zijn gerelateerd aan het gebied van bio-informatica.
  • Zowel FAST als FASTQ zijn belangrijke hulpmiddelen voor opslag- en sequencingdoeleinden.
  • FASTQ is een uitbreiding van het FASTA-formaat met de mogelijkheid om de sequentiekwaliteit op te slaan.

Wat is het verschil tussen FASTA en FASTQ?

FASTA is een op tekst gebaseerd formaat dat alleen nucleotide- of eiwitsequenties opslaat, terwijl FASTQ een op tekst gebaseerd formaat is dat zowel sequentie- als bijbehorende sequentiekwaliteitswaarden opslaat. Dit is dus het belangrijkste verschil tussen FASTA en FASTQ. Bovendien slaat FASTA sequentiefragmenten op nadat ze in kaart zijn gebracht, terwijl FASTQ sequentiefragmenten opslaat voordat ze in kaart zijn gebracht. Een ander verschil tussen FASTA en FASTQ is dat FASTA uit één beschrijvingsregel bestaat en FASTAQ uit vier regels.

De onderstaande infographic presenteert de verschillen tussen FASTA en FASTQ in tabelvorm voor vergelijking naast elkaar.

Samenvatting – FASTA vs FASTQ

Bioinformatics gebruikt verschillende formaten van sequenties zoals FASTA en FASTQ, enz. FASTA slaat sequentiefragmenten op nadat ze in kaart zijn gebracht, terwijl FASTQ de sequentiefragmenten opslaat voordat ze in kaart worden gebracht. FASTA is een uitlijningssoftware voor DNA- en eiwitsequenties. Het bestaat uit programma's voor eiwit:eiwit, DNA:DNA, eiwit:vertaald DNA (met frameshifts), en geordende of ongeordende peptide-zoekopdrachten. FASTQ is een uitlijningssoftware die wordt gebruikt op het gebied van bio-informatica en slaat zowel een biologische sequentie (meestal nucleotidesequentie) als de bijbehorende kwaliteitsscores op. FASTA bestaat uit één beschrijvingsregel en FASTQ bestaat uit vier regels. Dit vat dus het verschil tussen FASTA en FASTQ samen.

Aanbevolen: