㈠ 什麼是生物信息學中的二級資料庫
根據需要從一級資料庫中搜集對象的相關數據集合而成的就是二級資料庫。
像genebank,EMBL這種都是不加選擇的一級資料庫,只要是實驗獲得的,不管什麼東西的序列,哪怕是不完整的序列都能上傳,而且它們的數據也有可能有重復。如果有某個人專門研究細菌的鑒定,需要用到正式被認可的16srDNA序列,為了研究方便,把這些一級資料庫的各個種類細菌的公認標准16srDNA序列的數據進行整理,重新構建了一個資料庫,這就是所謂的二級資料庫。如果不構建,直接用一級資料庫做blast,就會得出很多未被承認甚至不完整的序列,還要人工一個個看過去,找出公認的標准序列,這樣就很麻煩。我舉得例子在現實中就是韓國的EzTaxon。