GenBank è una banca dati open access, istituita nel 1982, che riporta tutte le sequenze di nucleotidi e le relative proteine ottenute dopo la loro traduzione. Il database è prodotto e mantenuto dal National Center for Biotechnology Information (NCBI), che è parte dei National Institutes of Health statunitensi, all'interno della International Nucleotide Sequence Database Collaboration (INSDC).[1]
GenBank riceve le proprie informazioni dai risultati ottenuti su oltre 300.000 distinti organismi da laboratori sparsi in tutto il mondo,[2] rappresentando il più importante punto di riferimento nel suo campo di ricerca. La versione 236.0, datata 15 febbraio 2020, contiene oltre 216 milioni di loci e oltre 399 miliardi di basi da più di 216 milioni di sequenze riportate.[3]