开放阅读框

Open Reading Frame
定义:

开放阅读框(ORF)是指在DNA或RNA序列中,由起始密码子(AUG)开始、以终止密码子(UAA、UAG或UGA)结束的一段连续编码序列。一个ORF对应一个潜在蛋白质产物的编码区。在病毒基因组注释中,ORF预测是确定病毒编码蛋白质种类的第一步——SARS-CoV-2基因组约29903 nt含有至少12个已确认的ORF,编码结构蛋白(S、E、M、N)和非结构蛋白(nsp1-16)及辅助蛋白。

ORF是病毒基因组注释的核心概念。SARS-CoV-2最引人注目的ORF之一是ORF8——该基因在不同SARS相关冠状病毒间高度变异,SARS-CoV-2的ORF8与蝙蝠冠状病毒RaTG13仅有约30%氨基酸同源性。ORF8能下调MHC-I表达帮助病毒免疫逃逸,但Delta变异株流行后期ORF8发生提前终止突变(Q27*)——这可能提示ORF8在特定免疫环境下的选择压力变化。ORF8的功能和演化史是病毒溯源研究中一个至今未被完全解答的问题。