DNA序列分类摘要本问题是一个“有人管理分类问题”。 首先分别列举出20个学习样本序列中1字符串、2字符串、3字符串出现的频率,构成含41个变量的基本特征集,接着用主成分分析法从中提取出4个特征。然后用Fisher线性判别法进行分类,得出了所求20个人工制造序列及182个自然序列的分类结果如下:20个人工序列:22, 23,25,27,29,34,35,36,37为A类,其余为B类。182个自
DNA序列分类 摘要 本问题是一个有人管理分类问题 首先分别列举出20个学习样本序列中1字符串2字符串3字符串出现的频率构成含41个变量的基本特征集接着用主成分分析法从中提取出4个特征然后用Fisher线性判别法进行分类得出了所求20个人工制造序列及182个自然序列的分类结果如下:20个人工序列:22 2325272934353637为A类其余为B类182个自然序列:14810272
DNA序列分类 摘要 本问题是一个有人管理分类问题. 首先分别列举出20个学习样本序列中1字符串2字符串3字符串出现的频率构成含41个变量的基本特征集接着用主成分分析法从中提取出4个特征.然后用Fisher线性判别法进行分类得出了所求20个人工制造序列及182个自然序列的分类结果如下:20个人工序列:22 2325272934353637为A类其余为B类.182个自然序列:14810272
DNA序列分类 摘要 本问题是一个有人管理分类问题 首先分别列举出20个学习样本序列中1字符串2字符串3字符串出现的频率构成含41个变量的基本特征集接着用主成分分析法从中提取出4个特征然后用Fisher线性判别法进行分类得出了所求20个人工制造序列及182个自然序列的分类结果如下:20个人工序列:22 2325272934353637为A类其余为B类182个自然序列:1481027293
2000年全国大学生数学建模竞赛A题 DNA序列分类?2000年6月人类基因组计划中DNA全序列草图完成预计2001年可以完成精确的全序列图此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的天书这本大自然写成的天书是由4个字符ATCG按一定顺序排成的长约30亿的序列其中没有断句也没有标点符号除了这4个字符表示4种碱基以外人们对它包含的内容知之甚少难以读懂破译这部世界上最巨量信息的天书
A类______________B类_______________出题人: 北京工业大学 孟大志立意: 源于科学实际 解法充分开放本题取材于DNA结构的研究结构的含义这里结构指的是DNA序列中重复出现的有特征的片段 这种重复出现形成了规律.题目中特别举出了三种结构为例.四种碱基的丰度三字符串对蛋白质的编码DNA序列的长程相关性A题将DNA结构的研究具体化为不同序列的分类(中国科技大学)将序列看作信
DNA序列分类模型重庆市数学建模竞赛一等奖王 勇 莫志锋 秦力顼(1999级自动化学院)[摘要] 本文根据题中所给两个已知类别的DNA序列进行结构特征分析从中提取信息和构造分类模型对未知类别的DNA序列进行分类我们构造了三个分类模型它们分别是:特征密码子概率分布判别模型图论最小支撑树模型和向量空间直观判别模型后两种分类结果几乎一致判别率在90左右误判率控制在()范围问题一结果为:模型一的
DNA序列的分类方法摘 要:本文通过对20个已知类别的DNA序列进行统计分析由浅入深进行研究建立了五种DNA序列分类的模型模型一利用单个碱基在序列中的含量不同提出单碱基分类标准模型二根据碱基cg的百分比之和与碱基at的百分比之和的比值进行分类模型三根据各序列中氨基酸分布不同引入分类参数得到分类标准模型四把DNA序列中氨基酸含量分布转化为空间向量的距离关系对未知类别的DNA相对于不同类别集合的距离进
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级DNA序列分类模型研究 2000年6月人类基因组计划中DNA全序列草图完成 2004年10月绘制了精确的全序列图标志着生命科学登月计划又向前迈出一步从此人类拥有了一部记录着自身生老病死及遗传进化全部信息的天书 DNA作为一种遗传物质早已在50多年前就被发现它是由4种碱基:腺嘌呤(A) 胞嘧呤C)
第31 卷第1 期
违法有害信息,请在下方选择原因提交举报