【Python怎么處理vcf文件?Python如何讀取vcf文件數據】vcf是一種非常特殊的文件類型,它的實際名稱為突變識別文件,只有在基因組工作之中才會去生成該類型的文件 。那么在python程序內也是可以對這種類型的文件進行讀取等處理操作,下文所要來介紹的內容就是,python處理vcf文件并且讀取其內容的方法 。

1.python標準庫以及內置模塊之中是沒有該類型文件處理方法可以使用,所以需要選擇安裝PyVCF這個第三方模塊才可以,打開命令行或者終端窗口后執行如下命令即可:
pip install PyVCF2.那么讀取vcf文件則是用這個模塊之中Reader()方法,此方法里面需要傳入文件路徑這一個參數就可以了,而返回的對象不是平常打開文件時的文件對象 。而是一個可迭代對象,因為該方法會構建出一個有明確合理結構的可迭代對象,代碼如下所示:
import vcfvcf_reader = vcf.Reader(filename=r'D:\test\example.hc.vcf.gz')for record in vcf_reader: print(record.CHROM)那么就可以使用for循環迭代遍歷該對象將其中的數據都取出來進行查看,而可以去輸出的屬性有很多 。分別為染色體名稱CHROM、位點在染色體的位置POS、突變的rs號ID、參考基因組在該位點上的堿基REF、在該位點的測序結果ALT、位點的測序質量QUAL、過濾信息FILTER、位點的一些測試指標INFO、基因型信息FORMAT 。那么這些數據和信息只需要使用prin函數再加上遍歷對象點屬性名即可將其打印輸出 。
以上就是關于“Python怎么處理vcf文件?Python如何讀取vcf文件數據”的全部內容了,希望對你有所幫助 。



微信掃碼,學習更方便

現在報名贈100例知識點合集

猜你喜歡
- Python畫三次函數圖像怎么做?Python如何繪制三次函數圖像
- Python畫并列柱狀圖代碼是什么?Python怎么繪制并列柱狀圖
- 做滑雞絲技巧 滑雞絲怎么做
- python如何查看mat格式的文件?python查看mat格式文件的方法
- python中numpy.arange函數如何使用?numpy.arange()函數的使用方法
- 怎么做牛肉好嚼 具體做的步驟是什么
- python切片可以作為占位符使用嗎?python切片作為占位符使用方法
- 怎么辨別海苔的好壞 海苔的好壞如何區別
- 熟蘋果怎么煮 煮熟蘋果方法
- 蒸肉餅怎么做好吃 蒸肉餅做法
