作业帮 > 综合 > 作业

第一个文件是基因名称,第二个文件包括基因名和基因序列,需要根据第一个文件的基因名提取基因序列

来源:学生作业帮 编辑:搜搜考试网作业帮 分类:综合作业 时间:2024/06/16 04:35:26
第一个文件是基因名称,第二个文件包括基因名和基因序列,需要根据第一个文件的基因名提取基因序列
我有两个文件.第一个是基因名称文件,第二个包括基因名称和基因序列,是以FAS格式保存的,而且第二个文件不仅包括了第一个所有的基因,同时还有其他基因.我想用从第二个文件中提取第一个文件中的所有基因名称的序列,并用以下格式保存
>基因名称
序列
>基因名称2
序列
第一个文件是基因名称,第二个文件包括基因名和基因序列,需要根据第一个文件的基因名提取基因序列
DNAMAN比对可以确定两者同源性,也就是说这样可以知道第一个文件中的序列在第二个文件的位置和一些相关信息.
如果有担心遗漏的话DNASTAR等软件搜索CDS然后在NCBI上比对一下就可以大体上知道是那些基因,当然如果该基因未被研究并标记的话就查不到了.
如果是基因组学或者转录组学方法的数据结果的话也有专门的软件支持,只是不太明白你的数据是如何得出的,文库?转录组?重测序?你要做的是基因注释还是就分类呢?